P A U LO ES T A T ÍS TIC A A FO N S O A P LICA D A LO P ES e EX C ELÊN CIA E M GES T Ã O Estatística Aplicada a Laboratórios NOTAS COMPLEMENTARES ANVISA – Agência Nacional de Vigilância Sanitária Brasília, D.F. 30 de maio a 01 de junho de 2005 http://www.estatistica.org Rua Voluntários da Pátria, 474/401 - Humaitá endereço eletrônico: [email protected] 22270-010 - Rio de Janeiro - RJ telefone: (21) 2535-5536 / fax: (21)2286-9877 / celular:(21) 9-627-0648 Estatística aplicada a laboratórios p. 1 A. Ementa 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. A Estatística na Vigilância Sanitária e nas normas ABNT ISO/IEC. Introdução aos métodos estatísticos para a tomada de decisão. Procedimentos para um estudo estatístico. Início de um estudo: retirada de uma amostra. Estatística Descritiva (E.D.): medidas de representatividade (tendência central) e de dispersão. Um valor extremo, em relação ao seu conjunto, pode ser considerado válido? (assunto também conhecido como "rejeição de dispersos"). Ainda E.D.: o z-escore. Continuando com a Estatística Descritiva: apresentando os valores observados em uma tabela e em um gráfico. Inferência Estatística (I.E.): questão de confiança e risco de errar. Introdução às Probabilidades, a segunda ferramenta para a Inferência. A primeira parte da I.E.: testes de hipóteses. ANOVA: Análise da Variância A segunda parte da I.E.: estimando parâmetros da população. I.E., começando a estimar: qual a média da população? I.E., teste de hipóteses: repetitividade e reprodutibilidade. I.E., teste de hipóteses: diagrama de Youden. I.E., teste de hipóteses: usando tudo o que foi visto nos gráficos de controle. Começando na Matemática e acabando na Inferência Estatística: descobrindo a "melhor" de todas as retas (chamam de "regressão linear "). Um outro olhar: Estatística Robusta Incerteza de medição B. Carga horária total 24 horas/aula. C. Objetivo Proporcionar o conhecimento dos conceitos estatísticos básicos necessários ao entendimento e à interpretação dos requisitos das Resoluções referentes à Vigilância Sanitária, bem como os específicos da norma ABNT ISO/IEC 17025: 2001, tornando os Analistas capazes de compreender e analisar os resultados para uma correta tomada de decisão. D. Metodologia Exposição dialogada dará suporte aos debates, estudos de caso, vivências e exercícios. E. Bibliografia recomendada • • • • ABNT ISO/IEC Guia 43-1: 1999, Ensaios de proficiência por comparações interlaboratoriais Parte 1: Desenvolvimento e operação de programas de ensaio de proficiência. ABNT ISO/IEC Guia 43-2: 1999, Ensaios de proficiência por comparações interlaboratoriais Parte 2: Seleção e uso de programas de ensaio de proficiência por organismos de credenciamento de laboratórios. ABNT ISO/IEC 17025: 2001, Requisitos gerais para competência de laboratórios de ensaio e calibração. LOPES, Paulo Afonso. Probabilidades e Estatística – conceitos, modelos, aplicações em Excel. Rio de Janeiro: Reichmann&Affonso Editores, 3ª reimpressão, 2003. Currículo resumido do Instrutor Paulo Afonso Lopes é Doutor em Pesquisa Operacional pelo Florida Institute of Technology, Mestre em Engenharia de Produção pela COPPE/UFRJ, Estatístico pela Escola Nacional de Ciências Estatísticas (CONRERJ 5975) e Engenheiro pelo Instituto Militar de Engenharia. Sua experiência profissional inclui docência em cursos de graduação e pós-graduação no Brasil e no exterior, palestras em universidades americanas e consultoria a diversas empresas. Certified Quality Auditor (CQA), Certified Quality Engineer (CQE) e Certified Reliability Engineer (CRE pela American Society of Quality (ASQ). Autor do livro “Probabilidades e Estatística”, também editado em espanhol pela Prentice-Hall, e de artigos em revistas científicas e anais de congressos nacionais e internacionais. Professor Visitante da University of Wisconsin-La Crosse e Professor Adjunto do Florida Institute of Technology, Estados Unidos. Consultor da UNESCO e Avaliador do INMETRO e da ANVISA. As opiniões aqui expressas são de responsabilidade do autor e não refletem necessariamente a visão da ANVISA sobre o assunto. Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 2 1. A Estatística na Vigilância Sanitária e nas normas ABNT ISO/IEC São inúmeros os usos da Estatística no âmbito da Vigilância Sanitária. Por exemplo, na Resolução - RE nº 894, de 29 de maio de 2003 (1D.O.U. 02/06/2003), encontramos o seguinte trecho: • • 14. Tratamento estatístico: 14.1. apresentar desenho de estudo, conforme o "GUIA PARA PLANEJAMENTO E EXECUÇÃO DA ETAPA ESTATÍSTICA DE ESTUDOS DE BIODISPONIBILIDADE RELATIVA/ BIOEQUIVALÊNCIA"; 14.2. justificar o tamanho da amostra no estudo; A Norma ABNT ISO/IEC Guia 43-1: 1999, Ensaios de proficiência por comparações interlaboratoriais, na sua Parte 1: Desenvolvimento e operação de programas de ensaio de proficiência, apresenta as seguintes afirmações a respeito da Estatística: • “os anexos a esta Parte da ABNT ISO/IEC Guia 43 fornecem diretrizes estatísticas para o tratamento de dados obtidos em programas de ensaios de proficiência.” - Prefácio (p. 1). • “Amostragem – por exemplo, quando indivíduos ou organizações são solicitados a coletar amostras para análises subseqüentes.” - NOTA f) do item 3.6. • “valor disperso - parte de um grupo de valores que é inconsistente com as outras partes daquele grupo (também definido na ISO 5725-1).” - item 3.16. • “resultados extremos - valores dispersos e outros valores que sejam grosseiramente inconsistentes com outras partes do grupo de dados." item 3.17. • "Estes resultados podem ter uma profunda influência em sumários estatísticos, tais como a média e o desvio padrão.” - Nota do item 3.17. • “técnicas estatísticas robustas - técnicas para minimizar a influência que resultados extremos podem ter sobre estimativas de média e desvio padrão." - item 3.18. • "Estas técnicas admitem menor peso para os resultados extremos, ao invés de eliminar estes resultados do grupo de dados.” - Nota do item 3.18. • “Programas de ensaios interlaboratoriais envolvem subamostras selecionadas aleatoriamente de uma fonte de material .... É essencial que o lote de itens de ensaio fornecido aos participantes em cada rodada seja suficientemente homogêneo, para que quaisquer resultados posteriormente identificados como extremos não sejam atribuídos a qualquer variabilidade significativa do item de ensaio.” - item 4.3. Mais ainda, a norma ABNT ISO/IEC 17025: 2001 afirma, no item 5.9, que "O laboratório deve ter procedimentos de controle da qualidade para monitorar a validade dos ensaios e calibrações realizados. Os dados resultantes devem ser registrados de forma que as tendências sejam detectáveis e, quando praticável, devem ser aplicadas técnicas estatísticas para a análise crítica dos resultados." Desse modo, justifica-se que os Analistas saibam corretamente interpretar os resultados apresentados pelos organismos a serem avaliados. 2. Introdução aos métodos estatísticos para a tomada de decisão 1. Para que estudar Estatística? 2. Campos da Estatística 3. Prática inicial do EXCEL • • • • • • iniciar o aplicativo células: • • inclusão: • • identificação célula ativa números texto identificação do “Colar Função” e estudo do seu potencial identificação da Ferramenta “Análise de Dados”: Atenção: após digitar os dados, escolher uma célula diferente para os resultados Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 3 3. Procedimentos para um estudo estatístico 1. Formular um plano para coleta dos dados: conhecida a natureza da avaliação, identificar os prováveis elementos a coletar, restringindo a pesquisa aos dados de interesse. 2. Identificar as variáveis mais importantes. 3. Coletar os dados. 4. Identificar o melhor modelo estatístico e utilizá-lo. 5. Analisar os resultados. 6. Relatar as conclusões de modo que todos entendam. 4. Início de um estudo: retirada de uma amostra 1. Conceito de amostra: usualmente, significa um determinado item, ao passo que, para a Estatística, significa um conjunto de itens. 2. Tamanho da amostra: deve ser o maior que se puder conseguir. Ponderar com o custo de uma decisão errada. 3. Dois tipos de amostragem: aleatória simples e sistemática. 4. Cuidado: a amostra deve ser representativa da população Resolução RDC nº 12, de 02 de janeiro de 2001 2.CRITÉRIOS PARA O ESTABELECIMENTO DE PADRÕES MICROBIOLÓGICOS SANITÁRIOS EM ALIMENTOS. Os critérios para estabelecimento de padrão microbiológico podem ser considerados isoladamente ou em conjunto conforme a seguir: 2.4.Plano de Amostragem para a determinação do número e tamanho de unidades de amostras a serem analisadas. 3.DEFINIÇÕES Para efeito deste regulamento adota-se as seguintes definições: 3.2.Amostra indicativa: é a amostra composta por um número de unidades amostrais inferior ao estabelecido em plano amostral constante na legislação específica. 3.3.Amostra representativa: é a amostra constituída por um determinado número de unidades amostrais estabelecido de acordo com o plano de amostragem. 3.7.Unidade amostral: porção ou embalagem individual que se analisará, tomado de forma totalmente aleatória de uma partida como parte da amostra geral. 5.8. Planos de amostragem 5.8.1. Para fins de aplicação de plano de amostragem entende-se: a) m: é o limite que, em um plano de três classes, separa o lote aceitável do produto ou lote com qualidade intermediária aceitável. b) M: é o limite que, em plano de duas classes, separa o produto aceitável do inaceitável. Em um plano de três classes, M separa o lote com qualidade intermediária aceitável do lote inaceitável. Valores acima de M são inaceitáveis Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 4 c) n: é o número de unidades a serem colhidas aleatoriamente de um mesmo lote e analisadas individualmente. Nos casos nos quais o padrão estabelecido é ausência em 25g, como para Salmonella sp e Listeria monocytogenes e outros patógenos, é possível a mistura das alíquotas retiradas de cada unidade amostral, respeitando-se a proporção p/v (uma parte em peso da amostra, para 10 partes em volume do meio de cultura em caldo). d) c: é o número máximo aceitável de unidades de amostras com contagens entre os limites de m e M (plano de três classes). Nos casos em que o padrão microbiológico seja expresso por "ausência", c é igual a zero, aplicase o plano de duas classes. 5.8.2. Tipos de plano a) Duas classes: quando a unidade amostral a ser analisada pode ser classificada como aceitável ou inaceitável, em função do limite designado por M, aplicável para limites qualitativos. b) Três classes: quando a unidade amostral a ser analisada pode ser classificada como aceitável, qualidade intermediária aceitável ou inaceitavél, em função dos limites m e M. Além de um número máximo aceitável de unidades de amostra com contagem entre os limites m e M, designado por c. As demais unidades, n menos c, devem apresentar valores menores ou iguais a m. Nenhuma das unidades n pode apresentar valores superiores ao M. 5.8.3. Situações de aplicação dos planos de amostragem: 5.8.3.1. Para os produtos relacionados no Anexo I do presente Regulamento no caso de avaliação de lotes e ou partidas, adotam-se os planos estatísticos mínimos (planos de três classes), conforme constam no referido Anexo. 5.8.3.2. Nos casos onde o plano estatístico mencionado no item anterior não conferir a proteção desejada, devidamente justificada, pode-se recorrer a complementação de amostra, conforme as referências indicadas no item 5.1. destes Procedimentos. 5.8.3.3. Quando nos pontos de venda ou de qualquer forma de exposição ao consumo, o lote ou partida do produto alimentício estiver fracionado ou de alguma forma não disponível na sua totalidade ou quando o número total de unidades do lote for igual ou inferior a 100 (cem) unidades, ou ainda, o produto estiver a granel, pode-se dispensar a amostragem estatística e proceder a colheita de uma amostra indicativa, aplicando-se o plano de duas classes. 5.8.3.4. Quando da existência do plano de duas classes onde o c igual a zero, o resultado positivo de uma amostra indicativa é interpretado para todo o lote ou partida. O mesmo se aplica quando for detectada a presença de toxinas em quantidades suficientes para causar doença no consumidor. 5. Estatística Descritiva: medidas de representatividade (tendência central) e de dispersão 1. Medidas de representatividade (tendência central) • MÉDIA ARITMÉTICA amostral, X • MEDIANA amostral, Md • MODA amostral, Mo EXCEL: "Colar função"/ MÉDIA EXCEL: "Colar função"/ MÉD EXCEL: "Colar função"/ MODO Æ NÃO usar o EXCEL 2. Medidas de dispersão absoluta • AMPLITUDE TOTAL ordenação de valores: EXCEL, ícone A↓ Z ou "Dados"/Classificar... Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios • p. 5 VARIÂNCIA amostral, s2 Uma versão modificada para calcular a variância da amostra é s2 = ∑ n X i2 − i =1 (∑ n Xi i =1 ) 2 n n −1 EXCEL: "Colar função/VAR" • DESVIO-PADRÃO amostral, s EXCEL: "Colar função/DESVPAD" 4. Medida de dispersão relativa • COEFICIENTE DE VARIAÇÃO1: 5. Comentários a respeito de cálculos manuais, com a calculadora e com o Excel. 6. As medidas mais importantes da Estatística Descritiva são: a média aritmética e o desvio-padrão. 6. Um valor extremo, em relação ao seu conjunto, é válido? (assunto também conhecido como "rejeição de dispersos") Antes de se interpretar uma série de resultados obtidos a partir de uma ou mais amostras, é necessário verificar a existência de valores que, eventualmente, possam ser considerados como discrepantes dos demais (chamados dispersos), ou seja, valores que muito provavelmente não pertençam ao mesmo conjunto de resultados. A única base confiável para rejeição ocorre quando já se sabe que alguns erros específicos de medição ou transcrição de resultados tenham sido cometidos na obtenção de um resultado duvidoso. Para os demais casos, uma ampla variedade de testes estatísticos tem sido sugerida para determinar se uma observação deve ser rejeitada. Entretanto, não há um critério único que possa ser usado para decidir se um valor suspeito pode ser devido a erro acidental ou ser resultado de uma variação aleatória. Na prática, com todos essas opções, o importante é usar sempre o mesmo critério ao longo de todo o trabalho. Existem várias maneiras de verificar se um ou mais valores podem ser considerados dispersos, e entre os mais comuns encontra-se o seguinte, possível de realizar com os conhecimentos até agora: 1. retirar o maior valor e o menor valor do conjunto de n resultados; 2. com os (n-2) valores restantes, calcular a média e o desvio-padrão amostrais; 3. calcular a região de não-rejeição, limitada por X ± 3s; 4. verificar se os valores extremos podem ser considerados, ou não, como pertencendo ao conjunto de dados; 5. recalcular a média e o desvio-padrão amostrais desse novo conjunto; 6. calcular a região de não-rejeição, agora com novos limites: X ± 2s; 7. considerar como resultados válidos apenas aqueles que estejam dentro desta nova região de não-rejeição. 7. Ainda E.D.: o z-escore A média aritmética tornou-se um clássico ponto de referência para comparações. Entretanto, analisando-se apenas a média, vê-se que a decisão pode ser tomada apenas com base nessa medida absoluta, sem considerar-se a posição relativa de um determinado em valor em relação a 1 para alguns autores de língua inglesa, também conhecido como RSD (relative standard deviation), desviopadrão relativo. O CV é razoável somente quando o desvio-padrão é estritamente proporcional à média aritmética; se o desviopadrão é constante em uma faixa extensa dos níveis da propriedade sendo observada, o CV é, neste caso, ilusório; outra desvantagem é que seu valor não é muito útil quando a média é próxima do valor zero. Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 6 todos os resultados. O que fazer para comparar dois grupos distintos, em que o primeiro pode ter média elevada e pequena dispersão e o segundo, média pequena e elevada dispersão. Dados absolutos podem ser transformados em valores relativos, uma escala de resultados-padrão com média zero e desvio-padrão 1, resultando no chamado z-score, calculado pela seguinte expressão: valor relativo = z-score = escore-z = valor - média aritmética desvio padrão A despeito dessas dificuldades, as escalas padronizadas fornecem melhores comparações do que as baseadas em dados brutos. 8. Continuando com a Estatística Descritiva: apresentando os valores observados em uma tabela e em um gráfico OBSERVAÇÃO IMPORTANTE: Quando se tem os dados originais, todos os cálculos devem ser feitos com eles. A construção de tabelas, nos dias de hoje, tem o objetivo de facilitar a apresentação dos resultados, não sendo recomendada para cálculos. Usar os valores da tabela era natural nos milênios passados, quando não existiam os modernos recursos computacionais. 9. Inferência estatística: questão de confiança e risco de errar 1. Inferência Estatística: a) Testes de Hipóteses: afirma-se algo a respeito da população, e vai-se verificar se é verdade. b) Estimação: nada se sabe a respeito da população 2. TODA AFIRMAÇÃO DEVE VIR ACOMPANHADA DE UM GRAU DE CERTEZA (ou confiança). 3. Toda decisão tem um risco, que é a probabilidade associada a uma decisão errada. 4. Nível de significância: nome de grife para o conhecido "erro". O nível de significância é representado pela letra grega α (usualmente expresso em porcentagem, (αx100)%; complementar ao nível de significância, tem-se o nível de confiança, representado por (1 - α)x100%; indicam, respectivamente, probabilidades de erro (risco associado à decisão) e de certeza nas inferências estatísticas. 10. Introdução às probabilidades, a segunda ferramenta para a Inferência 1. O que é probabilidade: • conceito experimental: regularidade estatística • conceito clássico: intuitivo • conceito axiomático a) b) • após observar o experimento inúmeras vezes, verifica-se o comportamento do fenômeno: para que repetir o experimento sempre que se quiser verificar o resultado? modelos matemáticos a partir dos resultados da parte experimental. OBSERVAÇÃO: para melhor compreensão pelas pessoas, as probabilidades devem ser expressas em porcentagens. Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 7 11. A primeira parte da I.E.: testes de hipóteses 1. 2. 3. 4. 5. O que são: Região de rejeição e região de não-rejeição. Tipos de testes: unilateral e bilateral. Estrutura clássica de um teste: • formular a hipótese nula • formular a hipótese alternativa • decidir o tipo de distribuição estatística • escolher o risco que deseja assumir (denominado nível de significância) • determinar as regiões de rejeição e de não rejeição • verificar onde o valor amostral se encontra e decidir Termos equivalentes: a) Estatisticamente significante = Rejeitar a hipótese nula = O valor amostral não é compatível com o valor da hipótese nula = A variação amostral não é uma explicação razoável da discrepância entre os valores da hipótese nula e os valores amostrais b) Não estatisticamente significante = Não rejeitar a hipótese nula = O valor amostral é compatível com o valor da hipótese nula = A variação amostral é uma explicação razoável da discrepância entre os valores da hipótese nula e os valores amostrais 6. Conceito moderno: o valor-p. 12. ANOVA: Análise da Variância Realização de uma ANOVA, fator único. 13. A segunda parte da I.E.: estimando parâmetros da população A maior utilidade da Estatística é ajudar a formular conclusões sobre uma população baseadas em informações limitadas. Normalmente, os parâmetros de um processo ou de um produto, tais como a temperatura média de um forno ou comprimento médio de um componente são desconhecidos, podendo ser necessário estimar o valor desses parâmetros. Na estimativa pontual, um valor numérico simples é obtido como uma estimativa do parâmetro da população. Na estimativa por intervalo, um intervalo é determinado tal que exista alguma probabilidade de que o verdadeiro valor do parâmetro esteja contido nele. Estimativas por intervalos são também chamadas de intervalos de confiança. I - Estimativas Pontuais Uma estimativa pontual consiste de um valor numérico único, usado para fazer uma inferência sobre um parâmetro desconhecido do processo, produto ou serviço. Por exemplo, para estimar a média de uma população, pode-se selecionar uma amostra de 100 elementos e calcular a média amostral; se este valor for 27, a estimativa pontual da média da população é, portanto, 27. II - Estimativas por Intervalo A idéia do intervalo de confiança é um refinamento da estimativa pontual. Nesta, afirmava-se que: valor do parâmetro = valor da amostra Todavia, dificilmente o valor da amostra será igual ao da população, mais ainda porque este último é desconhecido. Desse modo, considera-se uma variação em torno do valor amostral e, assim, pode-se escrever que o parâmetro se situa entre dois limites, ou seja valor do parâmetro = valor da amostra ± "variação" Essa variação é diretamente proporcional à dispersão da população (quanto mais dispersa a população, maior será a variação entre as amostras) e à confiança dos resultados (se se desejar um intervalo de confiança que contenha o verdadeiro valor do parâmetro, este intervalo deve ser o maior possível), mas inversamente proporcional ao tamanho da amostra (quanto maior a amostra, mais se aproxima da população e a estimativa fica mais precisa, com menor variação). Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 8 Quanto maior o intervalo de confiança, mais confiante se está de que o intervalo realmente conterá o verdadeiro valor do parâmetro. Por outro lado, quanto maior o intervalo, menos informação obtém-se para esse mesmo parâmetro. Na situação desejável, obtém-se um intervalo relativamente pequeno com uma confiança elevada. Para um tamanho fixo de amostra e para a mesma variância, quanto maior o nível de confiança, maior o intervalo de confiança. É importante enfatizar que toda afirmação deve vir acompanhada de um grau de certeza (ou confiança), o quanto se está certo ao comunicar aquela informação. A interpretação desse enfoque é a seguinte: se um grande número de intervalos de confiança forem construídos a partir de amostras independentes da mesma população, então espera-se que uma porcentagem desses intervalos contenha o valor verdadeiro do parâmetro da população. Entendendo realmente o conceito de intervalo de confiança Algumas estimativas intervalares podem incluir e outras não o verdadeiro valor do parâmetro da população. Quando se retira uma amostra e se calcula um intervalo de confiança, não se sabe, realmente, se o parâmetro da população se encontra naquele intervalo calculado. O importante é reconhecer que se está utilizando um método com (1-α)% de probabilidade de sucesso: em uma seqüência muito grande de repetições, (1-α)% dos intervalos assim construídos abrangerão o verdadeiro valor do parâmetro da população, embora não se saiba exatamente quanto ele valha. Por exemplo, ao desejar-se um intervalo de confiança de 90% para estimar a média de uma população, uma amostra pode fornecer um intervalo entre (48,5, 51,5). Embora se desconheça o verdadeiro valor da média da população, se 100 desses intervalos forem construídos a partir de 100 amostras, deve-se esperar que 90 desses intervalos contenham o verdadeiro valor da média da população. Entretanto, não se sabe quais intervalos conterão o parâmetro da população. 14. I.E., começando a estimar: qual a média µ da população? Para tanto, retira-se uma amostra de tamanho n e calcula-se a média aritmética X e o desvio-padrão amostral s., aplicando-se a expressão: Limites de confiança do parâmetro µ ∈ X ± ts n Ao se retirar uma amostra de tamanho n, calcula-se X e s. Como determinar o valor de "t"? 15. I.E., teste de hipóteses: repetitividade e reprodutibilidade Duas medidas de precisão (incerteza) chamadas REPETITIVIDADE e REPRODUTIBILIDADE têm sido usadas para descrever a variabilidade de métodos de ensaio. A repetitividade e a reprodutibilidade são dois valores extremos, sendo a repetitividade a mínima variabilidade entre resultados e a reprodutibilidade a máxima variabilidade entre resultados. A repetitividade é representada pelo símbolo r e a reprodutibilidade pelo símbolo R. Convém enfatizar que tanto uma quanto outra têm unidades. I - REPETITIVIDADE (também conhecida como REPÊ) A Repetitividade se refere a ensaios executados sob condições que são tão constantes quanto possíveis, chamadas condições de repetitividade. Os resultados de ensaios mutuamente independentes são obtidos com o mesmo método de ensaio, de material idêntico, por um mesmo laboratório, por um mesmo operador e usando o mesmo equipamento em intervalos de tempo pequenos. O desvio-padrão do resultado de ensaio obtido sob condições de repetitividade denomina-se desviopadrão de repetitividade. É um parâmetro de dispersão da distribuição dos resultados de ensaios. Com o desvio-padrão de repetitividade, calcula-se o chamado valor de repetitividade r; a partir dos dois resultados de ensaios obtidos sob condições de repetitividade, calcula-se o módulo da diferença Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 9 entre eles. A probabilidade de que esta diferença seja menor do que o valor de repetitividade r é igual a 95%. II - REPRODUTIBILIDADE (também conhecida como REPRÔ) A Reprodutibilidade se refere a ensaios executados sob condições variadas, chamadas de condições de reprodutibilidade. Os resultados são obtidos com o mesmo método de ensaio e material idêntico, mas em laboratórios diferentes, com diferentes operadores e usando equipamentos diferentes, sendo os ensaios executados com grandes intervalos de tempo entre um e outro. O desvi-padrão do resultado de ensaio obtido sob condições de reprodutibilidade denomina-se desvio-padrão de reprodutibilidade. É um parâmetro de dispersão da distribuição dos resultados de ensaios. Com o desvio padrão de reprodutibilidade, calcula-se o chamado valor de reprodutibilidade R: a partir dos dois resultados de ensaios obtidos sob condições de reprodutibilidade, calcula-se o módulo da diferença entre eles. A probabilidade de que esta diferença seja menor do que o valor de reprodutibilidade R é igual a 95%. Exemplo Observe, agora, uma definição de reprodutibilidade, segundo a Norma XYZ4 de uma empresa avaliada: 6.7. Reprodutibilidade NORMA 1 - A diferença entre dois resultados individuais e independentes, obtidos por dois operadores, operando em laboratórios diferentes a partir de uma mesma amostra submetida ao ensaio, não deve ultrapassar ..... em valor absoluto. Exercício/exemplo Suponha-se que os índices calculados tenham sido R= 0,03 e r= 0,02. Um laboratório, efetuando duas repetições, obteve em um ensaio os valores 0,17 e 0,18. A diferença 0,01 é aceitável e as duas análises são válidas, porque essa diferença é menor que r; caso se obtivesse 0,17 e 0,20, a diferença 0,03 é inaceitável, e um dos valores deve ser rejeitado; não havendo informações mais específicas, a rejeição deve ser do valor mais afastado da média. Considere-se agora que o laboratório 1 obteve 0,18 e o laboratório 5 obteve 0,20. A diferença 0,02 é inferior a R = 0,03 e os dois valores são aceitáveis. No caso de ser necessário rejeitar um resultado, este deve ser o mais disperso, como no caso da repetitividade. RESOLUÇÃO-RE Nº 899, DE 29 DE MAIO DE 2003 2.4. Precisão A precisão é a avaliação da proximidade dos resultados obtidos em uma série de medidas de uma amostragem múltipla de uma mesma amostra. Esta é considerada em três níveis. 2.4.1. Repetibilidade (precisão intra-corrida): concordância entre os resultados dentro de um curto período de tempo com o mesmo analista e mesma instrumentação. A repetibilidade do método é verificada por, no mínimo, 9 (nove) determinações, contemplando o intervalo linear do método, ou seja, 3 (três) concentrações, baixa, média e alta, com 3 (três) réplicas cada ou mínimo de 6 determinações a 100% da concentração do teste; 2.4.2. Precisão intermediária (precisão inter-corridas): concordância entre os resultados do mesmo laboratório, mas obtidos em dias diferentes, com analistas diferentes e/ou equipamentos diferentes. Para a determinação da precisão intermediária recomenda-se um mínimo de 2 dias diferentes com analistas diferentes. 2.4.3. Reprodutibilidade (precisão inter-laboratorial): concordância entre os resultados obtidos em laboratórios diferentes como em estudos colaborativos, geralmente aplicados à padronização de metodologia analítica, por Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 10 exemplo, para inclusão de metodologia em farmacopéias. Estes dados não precisam ser apresentados para a concessão de registro. A precisão de um método analítico pode ser expressa como o desvio padrão ou desvio padrão relativo (coeficiente de variação) de uma série de medidas. A precisão pode ser expressa como desvio padrão relativo (DPR) ou coeficiente de variação (CV%), segundo a fórmula, em que, DP é o desvio padrão e CMD, a concentração média determinada. O valor máximo aceitável deve ser definido de acordo com a metodologia empregada, a concentração do analito na amostra, o tipo de matriz e a finalidade do método, não se admitindo valores superiores a 5%. Convém relembrar que R e r são índices intimamente ligados à precisão de resultados de medições. É importante, portanto, que esses índices sejam expressos de modo correto para que não se perca de vista o significado físico que deve ser associado a esses números. O objetivo metrologicamente desejável (porém difícil) é reduzir os valores de R e r, necessitando maior controle em todo o processo. Deve haver esforço para reduzir os erros em cada um dos laboratórios, em cada repetição e também em cada amostra. Como o processo é lento, deve-se considerar os índices R e r como índices dinâmicos, sujeitos a reavaliações e revisões. Nas fases iniciais do processo, pode haver muita instabilidade, mas ao longo do tempo espera-se que essa instabilidade diminua. É preciso cuidado com um índice com valor muito pequeno, o qual pode cair em descrédito por ser muito difícil a sua obtenção. É lógico, portanto, iniciar a utilização desses índices com valores maiores (toleram-se variações em faixa ampla de valores) que possam gradativamente serem reduzidos. 16. I.E., teste de hipóteses: Diagrama de Youden I - Elipse de Confiança A interpretação do programa interlaboratorial pode ser feita através do estudo estatístico entre duas variáveis, utilizando uma técnica gráfica, baseada na elaboração de um diagrama de dispersão dos resultados, associados a uma região de confiança (elipse). Esta técnica permite que uma interpretação dos resultados seja feita por meio de uma visualização simples e rápida, embora não forneça os parâmetros de repetitividade e reprodutibilidade. Para cada uma das propriedades analisadas em um programa interlaboratorial é feito o diagrama, onde cada laboratório é representado por um ponto, cuja abcissa é a média das medições obtidas pelo laboratório para a amostra A e a ordenada é a média das medições do mesmo laboratório para a amostra B. Para duas variáveis, tem-se não mais um intervalo de confiança, mas sim uma região de confiança com a forma de elipse, denominada elipse de confiança. A elipse é traçada de tal modo que a probabilidade de um ponto se situar dentro da elipse é igual a 100x(1-α)%. A dispersão dos pontos ao longo do eixo maior está associada aos erros sistemáticos, enquanto que ao longo do eixo menor está associada aos erros aleatórios. Como se supõe que os valores se comportam segundo a distribuição de deM-L-G (nos relatórios pode aparecer o texto "as distribuições são gaussianas"), ao se combinar as duas medidas, o gráfico resultante é uma elipse, cujo centro tem como abcissa a média de todas as medidas da amostra A e como ordenada a média de todas as medidas da amostra B. A elipse é traçada com base na confiança que se deseja apresentar a conclusão. II - Interpretação dos resultados: a) para os pontos dentro da elipse de confiança • se a dispersão é uniforme em uma elipse com eixo maior a 45o em relação eixo das abcissas, então o desempenho dos laboratórios pode ser considerado satisfatório; Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios • p. 11 se a dispersão é uniforme em uma elipse com eixo maior tendendo à posição vertical ou à horizontal, não é possível afirmar que os laboratórios apresentam desempenho satisfatório, porque existem problemas com uma das amostras, A ou B. Estes problemas podem estar relacionados à falta de homogeneidade etc.; b) para pontos fora da elipse de confiança • afastados do eixo maior da elipse indicam erro aleatório significativo e ocorrem devido à variabilidade dentro do laboratório, podendo ter origem em operador não devidamente treinado, ou erros ocasionais (erro de leitura, erros de cálculo, erro em conversão de valores, erro em transcrição de dados etc.); • próximos ao eixo maior da elipse indicam erros sistemáticos significativos e ocorrem devido a condições adversas do laboratório, podendo ter origem em modificações não permitidas na metodologia ou equipamentos não aferidos ou não calibrados. A dispersão dos pontos ao longo do eixo maior está associada aos erros sistemáticos, enquanto que ao longo do eixo menor está associada aos erros aleatórios. Exemplo 4.2. Elipse de Confiança Os resultados obtidos pelos laboratórios participantes, relativos ao par de amostras A e B permitiram a construção de diagramas de dispersão elaborados em um sistema de eixos cartesianos, onde a escala do eixo X cobre a faixa de resultados referentes à amostra A e do eixo Y, a faixa de resultados da amostra B. Para cada uma das propriedades (ensaios) foi construído um diagrama em que cada laboratório é representado por um ponto. A abcissa do ponto é o resultado de ensaio da amostra A e a ordenada, o resultado de ensaio da amostra B. As retas que passam pelos valores médios de todos os laboratórios dividem o diagrama em quadrantes. Numa situação ideal os pontos devem se encontrar igualmente distribuídos pelos quadrantes; isto acontece somente quando ocorrem erros aleatórios em níveis não significativos, Quando os pontos se encontram mais concentrados nos quadrantes superior direito e inferior esquerdo, significando que os laboratórios tendem a obter valores maiores do que a média para as duas amostras ou valores menores do que a média para ambas amostras do par, isto evidencia ocorrência de erros sistemáticos. A Elipse de Confiança delimita uma região em que qualquer ponto tem a mesma probabilidade P de se situar dentro da elipse. A construção da elipse foi feita utilizando um programa de computador que determina a elipse e a eliminação sucessiva dos pontos dispersos adotando um grau de confiança de 95%. Os tipos de erros que podem ocorrer são função da posição do ponto em relação à elipse e estão representados na Figura 1. Erros sistemáticos ocorrem devido a condições adversas do laboratório, podendo ter origem em modificações não permitidas na metodologia e/ou equipamentos não calibrados. Erros aleatórios ocorrem devido à variabilidade dentro do laboratório podendo ter origem em operador não devidamente treinado e/ou erros ocasionais como: erro de leitura, erro de cálculo, erro em transcrição de dados, etc. Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 12 Figura 1. Exemplo de um gráfico de Youden Exemplo 5.1. Resíduo Peneira de Abertura 75/m (%) De acordo com a NBR XYZ2 o resultado expresso em porcentagem de massa é calculado até os décimos. Tabela 5 LABORATóRIO AMOSTRA A AMOSTRA B F 1 1,1 1,2 O 2 1,2 1,4 O 3 1,2 1,4 O 4 1,7 1,6 O 5 1,5 1,8 O 6 1,2 1,3 O 7 1,0 1,0 O 8 1,4 1,6 O 9 1,3 1,4 O 10 0,6 0,7 O 11 1,2 1,1 O 16 1,4 1,6 O 13 2,0 2,0 O 14 1,8 2,1 O 15 1,5 1,6 O 12 2,3 2,7 * 20 0,6 1,2 * Média Geral 1,34 1,45 Desvio Padrão 0,3418 0,3701 Numero de Observações da Elipse: 15 Numero de Observações Total: 17 o - Laboratórios incluídos no calculo da elipse de 95% de confiança e se encontram dentro dela. * - Laboratórios excluídos da elipse de 95% de confiança. Laboratórios 12 - Erro sistemático significativo. Verificar metodologia, calibração de equipamento, condições ambientais. Laboratórios 20 - Erro aleatório. Verificar operador, erro de leitura, de cálculo, de transcrição. O erro ocorreu na amostra A. Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 13 17. I.E., teste de hipóteses: usando tudo o que foi visto nos gráficos de controle da qualidade A Norma NBR ISO 9000: 2000, Sistemas de gestão da qualidade - Fundamentos e vocabulário define controle da qualidade como parte da gestão focada no atendimento dos requisitos da qualidade (item 3.2.10). - Linha média, limites de controle (superior e inferior) e de advertência (superior e inferior) 18. Começando na Matemática e acabando na Inferência: descobrindo a “melhor” de todas as retas (chamam de "regressão linear") 1. REGRESSÃO: compreende a análise de dados amostrais para saber se e como duas ou mais variáveis estão relacionadas uma com a outra na população. Não implica, necessariamente, em relação de causa e efeito. 2. REGRESSÃO LINEAR • • O modelo matemático: y = a.x + b • • método dos mínimos quadrados elementos básicos: • variáveis: dependente (Y), ou explicada, e independente (X), ou explicativa, esta podendo ser qualitativa ou quantitativa • equação • parâmetros: são as grandezas das relações (coeficientes) EXCEL: "Colar Função"/INCLINAÇÃO e INTERCEPÇÃO RESOLUÇÃO-RE Nº 899, DE 29 DE MAIO DE 2003 2.2. Linearidade É a capacidade de uma metodologia analítica de demonstrar que os resultados obtidos são diretamente proporcionais à concentração do analito na amostra, dentro de um intervalo especificado. 2.2.1. Recomenda-se que a linearidade seja determinada pela análise de, no mínimo, 5 concentrações diferentes. Estas concentrações devem seguir os intervalos da Tabela 3. 2.2.2. Se houver relação linear aparente após exame visual do gráfico, os resultados dos testes deverão ser tratados por métodos estatísticos apropriados para determinação do coeficiente de correlação, intersecção com o eixo Y, coeficiente angular, soma residual dos quadrados mínimos da regressão linear e desvio padrão relativo. Se não houver relação linear, realizar transformação matemática. 2.2.3. O critério mínimo aceitável do coeficiente de correlação (r) deve ser = 0,99. 2.2.4. Deve-se apresentar as curvas obtidas (experimental e a resultante do tratamento matemático). Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 14 19. Estatística robusta A robustez de um estimador é uma medida da sua capacidade de permanecer inalterado sob influência de pequenas variações nos dados. Por exemplo, a mediana é mais robusta que a média aritmética em relação a valores dispersos, tendo em vista que independe deles. O teste de robustez consiste em identificar os dados que podem ter efeito significativo no resultado. • MEDIANA amostral EXCEL: "Colar função"/ MED Usualmente, a mediana é adotada como a medida de tendência central e o intervalo quartílico como medida de dispersão. Para compreensão do intervalo quartílico, é preciso entender o que são percentis (também chamados porcentis). Um percentil é uma medida da posição relativa de uma unidade observacional em relação a todas as outras. O p-ésimo porcentil tem no mínimo p% dos valores abaixo daquele ponto e no mínimo (100 p)% dos valores acima. Por exemplo, se uma altura de 1,80m é o 90o. percentil de uma turma de estudantes, então 90% da turma tem alturas menores que 1,80m e 10% têm altura superior a 1,80m; se o peso de uma pessoa de 75kg é o 40o. percentil de um conjunto de empregados. então 40% dos empregados pesam menos que 75kg e 60% pesam mais. Há inúmeras maneiras de se calcular percentis. Considere a notação X[np]+ , que significa anotar a próxima observação acima de np (onde n é o total de valores e p o percentil em decimais) se np não é inteiro, e a média desta e da observação seguinte se np é inteiro Os colchetes em torno do índice representam a posição daquele valor após os dados terem sido ordenados de modo crescente. Por exemplo, se o conjunto de dados tem 75 observações, então o 25o. percentil é o X[(75) x (0,25)]+ = X[19], isto é, a 19a. menor observação após a ordenação. O 40o. percentil é X[(75) x (0,40)] + = (X(30) + X(31))/2, isto é, a média das 30a. e 31a. observações após a ordenação. Os percentis de números 25, 50 e 75 são chamados, respectivamente, Primeiro Quartil (simbolizado por Q1), Segundo Quartil (Q2, igual à Mediana) e Terceiro Quartil (Q3). Os percentis de números 10, 20, 30, ..., 90 são chamados Decis; tem-se, respectivamente, Primeiro Decil (simbolizado por D1), Segundo Decil (D2), ... e Nono Decil (D9). O 5o. decil é a Mediana. IMPORTANTE: Não se deve confundir percentis com percentagens. Um percentil é relacionado somente com a posição relativa de uma observação quando comparada com os outros valores. Desse modo se um estudante que acerta 75% de um teste, mas cuja nota é o 40o. percentil, significa que somente 40% da turma tiveram nota pior que aquele estudante e 60% saíram-se melhor. Exemplo: Considere as seguintes medidas de uma amostra: 52,0 55,9 56,7 59,4 60,2 54,4 55,9 56,8 59,4 60,3 54,5 56,2 57,2 59,5 60,5 55,7 56,4 57,6 59,8 60,6 55,8 56,4 58,9 60,0 60,8 Há n=25 observações na amostra. Desse modo: • o 50o. percentil é a [25x0,5] = "[12,5-ésima observação]+". Toma-se a 13a. observação (após a ordenação) e assim a medida mediana é igual a 57,2. • o 25o. percentil é a [25x0,25] = "[6,25-ésima observação]+". Toma-se a 7a. observação (após a ordenação) e assim o 25o. percentil é igual a 55,9, que é também o valor de Q3 • o 20o. percentil é a [25x0,2] = "[5a. observação]+". Toma-se a média entre a 5a.e a 6a. observações (após a ordenação) e assim o 20o. percentil é igual a 55,85, que é também o valor de D2 Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 15 EXEMPLO Em determinado relatório, as seguintes expressões apareceram: a) média de três medidas em cada laboratório b) z para métodos robustos = (valor do laboratório - mediana)/amplitude interquartílica normalizada c) z para métodos clássicos = (valor do laboratório - média)/desvio-padrão d) z-escore entre laboratórios = (valor S do laboratório - média dos S)/amplitude interquartílica normalizada dos S, onde S = (valor da 1ª medida + valor da 2ª medida)/ 2 e) z-escore dentro do laboratório = (valor D do laboratório - média dos D)/amplitude interquartílica normalizada dos D, onde D = (valor da 1ª medida - valor da 2ª medida)/ 2 f) gráfico de Youden para escores z robustos: gráfico retangular de pares de escores z robustos, no qual cada laboratório é representado por um X; a abcissa é o valor z da 1ª medida e a ordenada é o valor z da 2ª medida); apresenta-se, usualmente, uma elipse com 5% de probabilidade, onde as amplitudes interquartílicas normalizadas para todas as medidas são calculadas com todos os valores e usadas como desvio-padrão, e os coeficientes de correlação são calculados após eliminarem-se os dispersos na avaliação z. Denomina-se disperso na avaliação z quando ao menos um módulo de um escore z é maior que 3. g) gráfico de Youden para valores encontrados: gráfico retangular de pares de valores, no qual cada laboratório é representado por um X; a abcissa é o valor da 1ª medida e a ordenada é o valor da 2ª medida); apresenta-se, usualmente, uma elipse com 5% de probabilidade, onde as amplitudes interquartílicas normalizadas para todas as medidas são calculadas com todos os valores e usadas como desvio-padrão, e os coeficientes de correlação são calculados após eliminarem-se os dispersos na avaliação Y. Denomina-se disperso na avaliação Y quando laboratório está fora da elipse de 5% de probabilidade. Como o NIQR é calculado? A partir de todos os (Q3 - Q1) de todos os laboratórios, determina-se a média e o dp deles. Então o NIQR = ([Q3-Q1] - média )/dp EXEMPLO NUMÉRICO do relatório APLAC Considere os seguintes extratos de resultados para uma determinada característica de um conjunto de 63 laboratórios. Cada laboratório fez duas medidas, X e Y.: escore z Média Avaliação LAB aritmética robusta clássica robusta X Y X Y X Y Entre Dentro Z Y 1 0,1510 0,4027 -0,660 -0,471 -0,522 -0,283 -0,867 0,000 ... ... ... ... ... ... ... ... ... ... ... 63 0,1610 0,3633 0,660 -3,562 0,273 -2,749 -2,891 4,033 * * (*) disperso segundo este critério Os resultados apresentados foram os seguintes: • Para X: número de resultados = 63 mediana = 0,1560 amplitude interquartílica normalizada (AIN) = 0,0076 Média = 0,1576 Desvio-padrão = 0,0126 Coeficiente de correlação = 0,4035 t x AIN/ n = 0,0019 • Para Y: número de resultados = 63 mediana = 0,4087 amplitude interquartílica normalizada (AIN) = 0,0127 Média = 0,4072 Desvio-padrão = 0,0160 Coeficiente de correlação t x AIN/ n = 0,0033 Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios p. 16 Perguntas: a) para o conjunto de medidas X e Y, indique como foram determinados • o número de resultados • a mediana • a amplitude interquartílica normalizada (AIN) • a média • o desvio-padrão • o coeficiente de correlação • t x AIN/ n b) para o Laboratório 1, indique como foram calculados os valores em negrito Média escore z LAB aritmética robusta clássica robusta X Y X Y X Y Entre Dentro 1 0,1510 0,4027 -0,660 -0,471 -0,522 -0,283 -0,867 0,000 Avaliação Z Y c) para o Laboratório 63, indique como foi decidida a eliminação dele pelos dois critérios de avaliação escore z Média Avaliação LAB aritmética robusta clássica robusta X Y X Y X Y Entre Dentro Z Y 63 0,1610 0,3633 0,660 -3,562 0,273 -2,749 -2,891 4,033 * * Após eliminarem-se dispersos na avaliação z, encontrou-se: • Para X: número de resultados = 57 mediana = 0,1560 amplitude interquartílica normalizada (AIN) = 0,0067 Média = 0,1563 Desvio-padrão = 0,0069 Coeficiente de correlação = 0,3093 t x DP/ n = 0,0018 • Para Y: número de resultados = 57 mediana = 0,4103 amplitude interquartílica normalizada (AIN) = 0,0114 Média = 0,4087 Desvio-padrão = 0,0116 Coeficiente de correlação t x DP/ n = 0,0030 20. Incerteza de medição A metodologia mais difundida para a estimativa da incerteza de medição reconhecida em nível mundial está documentada no “Guia para a Expressão da Incerteza de Medição” Quando uma medição é realizada, este resultado é somente uma aproximação ou estimativa do valor do mensurando. Sendo assim, a expressão completa que representará o valor de tal mensurando deverá incluir a incerteza de medição. A incerteza é um parâmetro associado ao resultado de uma medição e é caracterizada como a dispersão dos valores que podem ser razoavelmente atribuídos ao mensurando, segundo o Guia para a Expressão da Incerteza de Medição. Para estabelecer a estimativa de incerteza de medição é necessário identificar as variáveis que contribuem para incerteza e seus valores. Na medição química podemos citar diversas fontes que contribuem para a estimativa da incerteza como amostragem não representativa, homogeneidade da amostra, soluções padrões de valores inexatos, estabilidade da solução, definição incompleta do mensurando, pesagem, pureza dos reagentes, entre outros. Baseados no método de avaliação os componentes da incerteza podem ser classificados em: • Tipo A, quando a avaliação é realizada pela análise estatística de uma série de observações da grandeza medida, isto é, quando as medições são obtidas sob condições de repetitividade; Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005 Estatística aplicada a laboratórios • p. 17 Tipo B, quando se assume que cada grandeza de entrada tem uma distribuição e um intervalo de dispersão . Essas distribuições podem ser uniforme, retangular, triangular, normal,etc. Uma vez identificadas as fontes de incerteza (tipo A ou B) e consideradas as suas contribuições pode-se estimar a incerteza padrão combinada. A fim de que as incertezas sejam combinadas deve-se calcular a incerteza padrão relativa de cada contribuição que consiste na razão do valor obtido da incerteza padrão pelo valor da variável. A incerteza padrão combinada é a raiz quadrada da soma quadrática das incertezas padrão relativas de todos os componentes que contribuem para estimativa da incerteza de medição. Em geral, é utilizada para expressar a incerteza em um resultado de medição, mas em algumas aplicações comerciais, industriais, regulamentares e quando a segurança e a saúde estão em foco, é às vezes necessário se dar uma incerteza que defina um intervalo em torno do resultado de medição. Neste caso espera-se que este intervalo englobe uma grande porção da distribuição de valores que podem ser razoavelmente ser atribuídos ao mensurado e então é denominada de incerteza expandida (U). A incerteza expandida é obtida quando a incerteza padrão combinada é multiplicada por uma constante k que depende do nível de confiança e o resultado de medição é expresso por y ± U, onde o y corresponde ao mensurando. Por exemplo, da pipeta volumétrica de 1mL número de série ZX 5106 e certificado de calibração RBC 0656/04,, obtém-se os seguintes dados: Valor do volume nominal (mL) 1 Valor do volume medido (média de 05 medições) (mL) 0,9957 Erro (mL) Incerteza expandida do volume medido (mL) Fator de abrangência (K) 0,0043 0,001 2,28 H) Incerteza final de medição O resultado final para cada medição deve ser expresso como [ medição final MF = valor da amostra – valor do branco ] A incerteza da medição do volume do branco (50 mL de água deionizada) é considerada no cálculo final porque se desconta o valor de concentração encontrada para o branco de digestão do valor da concentração encontrada nas amostras. A incerteza-padrão u(MF) final da medição = [u(Amostra FG )]2 + [u(BrancoFG )]2 ou, então, MF com incerteza-padrão u(MF). Deve-se evitar o uso do símbolo ± para relatar a incerteza-padrão. O sinal ± deve ser associado à incerteza expandida, esta sim correspondendo a um determinado nível de confiança, definido pelo fator de cobertura. O resultado final deve ser apresentado com o número de algarismos significativos utilizado pelo equipamento. Resultado final: para a amostra 209P, a concentração de manganês é igual a 0,0153 mg/L ± 0,0034 mg/L, com aproximadamente, 95% de confiança (o valor preciso é 97,72%). BIBLIOGRAFIA LOPES, Paulo Afonso, Probabilidades e Estatística: conceitos, modelos, aplicações em Excel. Reichmann&Affonso Editores, 1999. ABNT/INMETRO. Guia para a Expressão da Incerteza de Medição, terceira edição brasileira em língua portuquesa, 2003. EURACHEM/CITAC Guide. Quantifying Uncertainty in analytical Measurement, 2 edition, 2000. Paulo Afonso Lopes Brasília, 30 de maio a 01 de junho de 2005