P A U LO
ES T A T ÍS TIC A
A FO N S O
A P LICA D A
LO P ES
e EX C ELÊN CIA E M GES T Ã O
Estatística Aplicada
a Laboratórios
NOTAS COMPLEMENTARES
ANVISA – Agência Nacional de Vigilância Sanitária
Brasília, D.F.
30 de maio a 01 de junho de 2005
http://www.estatistica.org
Rua Voluntários da Pátria, 474/401 - Humaitá
endereço eletrônico: [email protected]
22270-010 - Rio de Janeiro - RJ
telefone: (21) 2535-5536 / fax: (21)2286-9877 / celular:(21) 9-627-0648
Estatística aplicada a laboratórios
p. 1
A. Ementa
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
A Estatística na Vigilância Sanitária e nas normas ABNT ISO/IEC.
Introdução aos métodos estatísticos para a tomada de decisão.
Procedimentos para um estudo estatístico.
Início de um estudo: retirada de uma amostra.
Estatística Descritiva (E.D.): medidas de representatividade (tendência central) e de dispersão.
Um valor extremo, em relação ao seu conjunto, pode ser considerado válido? (assunto também
conhecido como "rejeição de dispersos").
Ainda E.D.: o z-escore.
Continuando com a Estatística Descritiva: apresentando os valores observados em uma tabela e em um
gráfico.
Inferência Estatística (I.E.): questão de confiança e risco de errar.
Introdução às Probabilidades, a segunda ferramenta para a Inferência.
A primeira parte da I.E.: testes de hipóteses.
ANOVA: Análise da Variância
A segunda parte da I.E.: estimando parâmetros da população.
I.E., começando a estimar: qual a média da população?
I.E., teste de hipóteses: repetitividade e reprodutibilidade.
I.E., teste de hipóteses: diagrama de Youden.
I.E., teste de hipóteses: usando tudo o que foi visto nos gráficos de controle.
Começando na Matemática e acabando na Inferência Estatística: descobrindo a "melhor" de todas as
retas (chamam de "regressão linear ").
Um outro olhar: Estatística Robusta
Incerteza de medição
B. Carga horária total
24 horas/aula.
C. Objetivo
Proporcionar o conhecimento dos conceitos estatísticos básicos necessários ao entendimento e à interpretação
dos requisitos das Resoluções referentes à Vigilância Sanitária, bem como os específicos da norma ABNT
ISO/IEC 17025: 2001, tornando os Analistas capazes de compreender e analisar os resultados para uma
correta tomada de decisão.
D. Metodologia
Exposição dialogada dará suporte aos debates, estudos de caso, vivências e exercícios.
E. Bibliografia recomendada
•
•
•
•
ABNT ISO/IEC Guia 43-1: 1999, Ensaios de proficiência por comparações interlaboratoriais Parte 1: Desenvolvimento e operação de programas de ensaio de proficiência.
ABNT ISO/IEC Guia 43-2: 1999, Ensaios de proficiência por comparações interlaboratoriais Parte 2: Seleção e uso de programas de ensaio de proficiência por organismos de
credenciamento de laboratórios.
ABNT ISO/IEC 17025: 2001, Requisitos gerais para competência de laboratórios de ensaio e
calibração.
LOPES, Paulo Afonso. Probabilidades e Estatística – conceitos, modelos, aplicações em
Excel. Rio de Janeiro: Reichmann&Affonso Editores, 3ª reimpressão, 2003.
Currículo resumido do Instrutor
Paulo Afonso Lopes é Doutor em Pesquisa Operacional pelo Florida Institute of Technology, Mestre em
Engenharia de Produção pela COPPE/UFRJ, Estatístico pela Escola Nacional de Ciências Estatísticas (CONRERJ 5975) e Engenheiro pelo Instituto Militar de Engenharia. Sua experiência profissional inclui docência em
cursos de graduação e pós-graduação no Brasil e no exterior, palestras em universidades americanas e
consultoria a diversas empresas. Certified Quality Auditor (CQA), Certified Quality Engineer (CQE) e Certified
Reliability Engineer (CRE pela American Society of Quality (ASQ). Autor do livro “Probabilidades e Estatística”,
também editado em espanhol pela Prentice-Hall, e de artigos em revistas científicas e anais de congressos
nacionais e internacionais. Professor Visitante da University of Wisconsin-La Crosse e Professor Adjunto do
Florida Institute of Technology, Estados Unidos. Consultor da UNESCO e Avaliador do INMETRO e da ANVISA.
As opiniões aqui expressas são de responsabilidade do autor e não refletem necessariamente
a visão da ANVISA sobre o assunto.
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 2
1. A Estatística na Vigilância Sanitária e nas normas ABNT ISO/IEC
São inúmeros os usos da Estatística no âmbito da Vigilância Sanitária. Por exemplo, na Resolução - RE nº 894,
de 29 de maio de 2003 (1D.O.U. 02/06/2003), encontramos o seguinte trecho:
•
•
14. Tratamento estatístico:
14.1. apresentar desenho de estudo, conforme o "GUIA PARA PLANEJAMENTO E EXECUÇÃO DA
ETAPA ESTATÍSTICA DE ESTUDOS DE BIODISPONIBILIDADE RELATIVA/ BIOEQUIVALÊNCIA";
14.2. justificar o tamanho da amostra no estudo;
A Norma ABNT ISO/IEC Guia 43-1: 1999, Ensaios de proficiência por comparações interlaboratoriais, na sua
Parte 1: Desenvolvimento e operação de programas de ensaio de proficiência, apresenta as seguintes
afirmações a respeito da Estatística:
•
“os anexos a esta Parte da ABNT ISO/IEC Guia 43 fornecem diretrizes estatísticas para o
tratamento de dados obtidos em programas de ensaios de proficiência.” - Prefácio (p. 1).
•
“Amostragem – por exemplo, quando indivíduos ou organizações são solicitados a coletar
amostras para análises subseqüentes.” - NOTA f) do item 3.6.
•
“valor disperso - parte de um grupo de valores que é inconsistente com as outras partes
daquele grupo (também definido na ISO 5725-1).” - item 3.16.
•
“resultados extremos - valores dispersos e outros valores que sejam grosseiramente
inconsistentes com outras partes do grupo de dados." item 3.17.
•
"Estes resultados podem ter uma profunda influência em sumários estatísticos, tais como a
média e o desvio padrão.” - Nota do item 3.17.
•
“técnicas estatísticas robustas - técnicas para minimizar a influência que resultados
extremos podem ter sobre estimativas de média e desvio padrão." - item 3.18.
•
"Estas técnicas admitem menor peso para os resultados extremos, ao invés de eliminar
estes resultados do grupo de dados.” - Nota do item 3.18.
•
“Programas de ensaios interlaboratoriais envolvem subamostras selecionadas
aleatoriamente de uma fonte de material .... É essencial que o lote de itens de ensaio fornecido aos
participantes em cada rodada seja suficientemente homogêneo, para que quaisquer resultados
posteriormente identificados como extremos não sejam atribuídos a qualquer variabilidade significativa
do item de ensaio.” - item 4.3.
Mais ainda, a norma ABNT ISO/IEC 17025: 2001 afirma, no item 5.9, que "O laboratório deve ter procedimentos
de controle da qualidade para monitorar a validade dos ensaios e calibrações realizados. Os dados resultantes
devem ser registrados de forma que as tendências sejam detectáveis e, quando praticável, devem ser aplicadas
técnicas estatísticas para a análise crítica dos resultados."
Desse modo, justifica-se que os Analistas saibam corretamente interpretar os resultados apresentados pelos
organismos a serem avaliados.
2. Introdução aos métodos estatísticos para a tomada de decisão
1.
Para que estudar Estatística?
2.
Campos da Estatística
3.
Prática inicial do EXCEL
•
•
•
•
•
•
iniciar o aplicativo
células:
•
•
inclusão:
•
•
identificação
célula ativa
números
texto
identificação do “Colar Função” e estudo do seu potencial
identificação da Ferramenta “Análise de Dados”:
Atenção: após digitar os dados, escolher uma célula diferente para os resultados
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 3
3. Procedimentos para um estudo estatístico
1.
Formular um plano para coleta dos dados: conhecida a natureza da avaliação, identificar os prováveis
elementos a coletar, restringindo a pesquisa aos dados de interesse.
2.
Identificar as variáveis mais importantes.
3.
Coletar os dados.
4.
Identificar o melhor modelo estatístico e utilizá-lo.
5.
Analisar os resultados.
6.
Relatar as conclusões de modo que todos entendam.
4. Início de um estudo: retirada de uma amostra
1. Conceito de amostra: usualmente, significa um determinado item, ao passo que, para a Estatística, significa
um conjunto de itens.
2. Tamanho da amostra: deve ser o maior que se puder conseguir. Ponderar com o custo de uma decisão
errada.
3. Dois tipos de amostragem: aleatória simples e sistemática.
4. Cuidado: a amostra deve ser representativa da população
Resolução RDC nº 12, de 02 de janeiro de 2001
2.CRITÉRIOS PARA O ESTABELECIMENTO DE PADRÕES MICROBIOLÓGICOS SANITÁRIOS EM
ALIMENTOS.
Os critérios para estabelecimento de padrão microbiológico podem ser considerados isoladamente ou em
conjunto conforme a seguir:
2.4.Plano de Amostragem para a determinação do número e tamanho de unidades de amostras a serem
analisadas.
3.DEFINIÇÕES
Para efeito deste regulamento adota-se as seguintes definições:
3.2.Amostra indicativa: é a amostra composta por um número de unidades amostrais inferior ao estabelecido em
plano amostral constante na legislação específica.
3.3.Amostra representativa: é a amostra constituída por um determinado número de unidades
amostrais estabelecido de acordo com o plano de amostragem.
3.7.Unidade amostral: porção ou embalagem individual que se analisará, tomado de forma
totalmente aleatória de uma partida como parte da amostra geral.
5.8. Planos de amostragem
5.8.1. Para fins de aplicação de plano de amostragem entende-se:
a) m: é o limite que, em um plano de três classes, separa o lote aceitável do produto ou lote com qualidade
intermediária aceitável.
b) M: é o limite que, em plano de duas classes, separa o produto aceitável do inaceitável. Em um plano de três
classes, M separa o lote com qualidade intermediária aceitável do lote inaceitável. Valores acima de M são
inaceitáveis
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 4
c) n: é o número de unidades a serem colhidas aleatoriamente de um mesmo lote e analisadas individualmente.
Nos casos nos quais o padrão estabelecido é ausência em 25g, como para Salmonella sp e Listeria
monocytogenes e outros patógenos, é possível a mistura das alíquotas retiradas de cada unidade amostral,
respeitando-se a proporção p/v (uma parte em peso da amostra, para 10 partes em volume do meio de cultura
em caldo).
d) c: é o número máximo aceitável de unidades de amostras com contagens entre os limites de m e M (plano de
três classes). Nos casos em que o padrão microbiológico seja expresso por "ausência", c é igual a zero, aplicase o plano de duas classes.
5.8.2. Tipos de plano
a) Duas classes: quando a unidade amostral a ser analisada pode ser classificada como aceitável ou
inaceitável, em função do limite designado por M, aplicável para limites qualitativos.
b) Três classes: quando a unidade amostral a ser analisada pode ser classificada como aceitável, qualidade
intermediária aceitável ou inaceitavél, em função dos limites m e M. Além de um número máximo aceitável de
unidades de amostra com contagem entre os limites m e M, designado por c. As demais unidades, n menos c,
devem apresentar valores menores ou iguais a m. Nenhuma das unidades n pode apresentar valores superiores
ao M.
5.8.3. Situações de aplicação dos planos de amostragem:
5.8.3.1. Para os produtos relacionados no Anexo I do presente Regulamento no caso de avaliação de lotes e ou
partidas, adotam-se os planos estatísticos mínimos (planos de três classes), conforme constam no referido
Anexo.
5.8.3.2. Nos casos onde o plano estatístico mencionado no item anterior não conferir a proteção desejada,
devidamente justificada, pode-se recorrer a complementação de amostra, conforme as referências indicadas no
item 5.1. destes Procedimentos.
5.8.3.3. Quando nos pontos de venda ou de qualquer forma de exposição ao consumo, o lote ou partida do
produto alimentício estiver fracionado ou de alguma forma não disponível na sua totalidade ou quando o número
total de unidades do lote for igual ou inferior a 100 (cem) unidades, ou ainda, o produto estiver a granel, pode-se
dispensar a amostragem estatística e proceder a colheita de uma amostra indicativa, aplicando-se o plano de
duas classes.
5.8.3.4. Quando da existência do plano de duas classes onde o c igual a zero, o resultado positivo de
uma amostra indicativa é interpretado para todo o lote ou partida. O mesmo se aplica quando for
detectada a presença de toxinas em quantidades suficientes para causar doença no consumidor.
5. Estatística Descritiva:
medidas de representatividade (tendência central) e de dispersão
1. Medidas de representatividade (tendência central)
•
MÉDIA ARITMÉTICA amostral, X
•
MEDIANA amostral, Md
•
MODA amostral, Mo
EXCEL: "Colar função"/ MÉDIA
EXCEL: "Colar função"/ MÉD
EXCEL: "Colar função"/ MODO Æ NÃO usar o EXCEL
2. Medidas de dispersão absoluta
•
AMPLITUDE TOTAL
ordenação de valores: EXCEL, ícone A↓ Z ou "Dados"/Classificar...
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
•
p. 5
VARIÂNCIA amostral, s2
Uma versão modificada para calcular a variância da amostra é
s2 =
∑
n
X i2 −
i =1
(∑
n
Xi
i =1
)
2
n
n −1
EXCEL: "Colar função/VAR"
•
DESVIO-PADRÃO amostral, s
EXCEL: "Colar função/DESVPAD"
4. Medida de dispersão relativa
•
COEFICIENTE DE VARIAÇÃO1:
5. Comentários a respeito de cálculos manuais, com a calculadora e com o Excel.
6. As medidas mais importantes da Estatística Descritiva são: a média aritmética e o desvio-padrão.
6. Um valor extremo, em relação ao seu conjunto, é válido?
(assunto também conhecido como "rejeição de dispersos")
Antes de se interpretar uma série de resultados obtidos a partir de uma ou mais amostras, é
necessário verificar a existência de valores que, eventualmente, possam ser considerados como
discrepantes dos demais (chamados dispersos), ou seja, valores que muito provavelmente não
pertençam ao mesmo conjunto de resultados.
A única base confiável para rejeição ocorre quando já se sabe que alguns erros específicos de
medição ou transcrição de resultados tenham sido cometidos na obtenção de um resultado duvidoso.
Para os demais casos, uma ampla variedade de testes estatísticos tem sido sugerida para determinar
se uma observação deve ser rejeitada. Entretanto, não há um critério único que possa ser usado para
decidir se um valor suspeito pode ser devido a erro acidental ou ser resultado de uma variação
aleatória. Na prática, com todos essas opções, o importante é usar sempre o mesmo critério ao longo
de todo o trabalho.
Existem várias maneiras de verificar se um ou mais valores podem ser considerados dispersos, e
entre os mais comuns encontra-se o seguinte, possível de realizar com os conhecimentos até agora:
1. retirar o maior valor e o menor valor do conjunto de n resultados;
2. com os (n-2) valores restantes, calcular a média e o desvio-padrão amostrais;
3. calcular a região de não-rejeição, limitada por X ± 3s;
4. verificar se os valores extremos podem ser considerados, ou não, como pertencendo ao
conjunto de dados;
5. recalcular a média e o desvio-padrão amostrais desse novo conjunto;
6. calcular a região de não-rejeição, agora com novos limites: X ± 2s;
7. considerar como resultados válidos apenas aqueles que estejam dentro desta nova
região de não-rejeição.
7. Ainda E.D.: o z-escore
A média aritmética tornou-se um clássico ponto de referência para comparações. Entretanto,
analisando-se apenas a média, vê-se que a decisão pode ser tomada apenas com base nessa
medida absoluta, sem considerar-se a posição relativa de um determinado em valor em relação a
1
para alguns autores de língua inglesa, também conhecido como RSD (relative standard deviation), desviopadrão relativo.
O CV é razoável somente quando o desvio-padrão é estritamente proporcional à média aritmética; se o desviopadrão é constante em uma faixa extensa dos níveis da propriedade sendo observada, o CV é, neste caso,
ilusório; outra desvantagem é que seu valor não é muito útil quando a média é próxima do valor zero.
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 6
todos os resultados. O que fazer para comparar dois grupos distintos, em que o primeiro pode ter
média elevada e pequena dispersão e o segundo, média pequena e elevada dispersão.
Dados absolutos podem ser transformados em valores relativos, uma escala de resultados-padrão
com média zero e desvio-padrão 1, resultando no chamado z-score, calculado pela seguinte
expressão:
valor relativo = z-score = escore-z =
valor - média aritmética
desvio padrão
A despeito dessas dificuldades, as escalas padronizadas fornecem melhores comparações do que as
baseadas em dados brutos.
8. Continuando com a Estatística Descritiva:
apresentando os valores observados em uma tabela e em um gráfico
OBSERVAÇÃO IMPORTANTE: Quando se tem os dados originais, todos os cálculos devem ser
feitos com eles. A construção de tabelas, nos dias de hoje, tem o objetivo de facilitar a apresentação
dos resultados, não sendo recomendada para cálculos. Usar os valores da tabela era natural nos
milênios passados, quando não existiam os modernos recursos computacionais.
9. Inferência estatística: questão de confiança e risco de errar
1.
Inferência Estatística:
a)
Testes de Hipóteses: afirma-se algo a respeito da população, e vai-se verificar se é verdade.
b)
Estimação: nada se sabe a respeito da população
2.
TODA AFIRMAÇÃO DEVE VIR ACOMPANHADA DE UM GRAU DE CERTEZA (ou confiança).
3.
Toda decisão tem um risco, que é a probabilidade associada a uma decisão errada.
4. Nível de significância: nome de grife para o conhecido "erro".
O nível de significância é representado pela letra grega α (usualmente expresso em
porcentagem, (αx100)%; complementar ao nível de significância, tem-se o nível de confiança,
representado por (1 - α)x100%; indicam, respectivamente, probabilidades de erro (risco
associado à decisão) e de certeza nas inferências estatísticas.
10. Introdução às probabilidades,
a segunda ferramenta para a Inferência
1. O que é probabilidade:
•
conceito experimental: regularidade estatística
•
conceito clássico: intuitivo
•
conceito axiomático
a)
b)
•
após observar o experimento inúmeras vezes, verifica-se o comportamento do
fenômeno: para que repetir o experimento sempre que se quiser verificar o resultado?
modelos matemáticos a partir dos resultados da parte experimental.
OBSERVAÇÃO: para melhor compreensão pelas pessoas, as probabilidades devem ser
expressas em porcentagens.
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 7
11. A primeira parte da I.E.: testes de hipóteses
1.
2.
3.
4.
5.
O que são:
Região de rejeição e região de não-rejeição.
Tipos de testes: unilateral e bilateral.
Estrutura clássica de um teste:
•
formular a hipótese nula
•
formular a hipótese alternativa
•
decidir o tipo de distribuição estatística
•
escolher o risco que deseja assumir (denominado nível de significância)
•
determinar as regiões de rejeição e de não rejeição
•
verificar onde o valor amostral se encontra e decidir
Termos equivalentes:
a) Estatisticamente significante = Rejeitar a hipótese nula = O valor amostral não é compatível com o valor
da hipótese nula = A variação amostral não é uma explicação razoável da discrepância entre os valores da
hipótese nula e os valores amostrais
b) Não estatisticamente significante = Não rejeitar a hipótese nula = O valor amostral é compatível com o
valor da hipótese nula = A variação amostral é uma explicação razoável da discrepância entre os valores da
hipótese nula e os valores amostrais
6.
Conceito moderno: o valor-p.
12. ANOVA: Análise da Variância
Realização de uma ANOVA, fator único.
13. A segunda parte da I.E.: estimando parâmetros da população
A maior utilidade da Estatística é ajudar a formular conclusões sobre uma população baseadas em
informações limitadas. Normalmente, os parâmetros de um processo ou de um produto, tais como a
temperatura média de um forno ou comprimento médio de um componente são desconhecidos,
podendo ser necessário estimar o valor desses parâmetros.
Na estimativa pontual, um valor numérico simples é obtido como uma estimativa do parâmetro da
população. Na estimativa por intervalo, um intervalo é determinado tal que exista alguma
probabilidade de que o verdadeiro valor do parâmetro esteja contido nele. Estimativas por intervalos
são também chamadas de intervalos de confiança.
I - Estimativas Pontuais
Uma estimativa pontual consiste de um valor numérico único, usado para fazer uma inferência sobre
um parâmetro desconhecido do processo, produto ou serviço. Por exemplo, para estimar a média de
uma população, pode-se selecionar uma amostra de 100 elementos e calcular a média amostral; se
este valor for 27, a estimativa pontual da média da população é, portanto, 27.
II - Estimativas por Intervalo
A idéia do intervalo de confiança é um refinamento da estimativa pontual. Nesta, afirmava-se que:
valor do parâmetro = valor da amostra
Todavia, dificilmente o valor da amostra será igual ao da população, mais ainda porque este último é
desconhecido. Desse modo, considera-se uma variação em torno do valor amostral e, assim, pode-se
escrever que o parâmetro se situa entre dois limites, ou seja
valor do parâmetro = valor da amostra ± "variação"
Essa variação é diretamente proporcional à dispersão da população (quanto mais dispersa a
população, maior será a variação entre as amostras) e à confiança dos resultados (se se desejar um
intervalo de confiança que contenha o verdadeiro valor do parâmetro, este intervalo deve ser o maior
possível), mas inversamente proporcional ao tamanho da amostra (quanto maior a amostra, mais se
aproxima da população e a estimativa fica mais precisa, com menor variação).
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 8
Quanto maior o intervalo de confiança, mais confiante se está de que o intervalo realmente conterá o
verdadeiro valor do parâmetro. Por outro lado, quanto maior o intervalo, menos informação obtém-se
para esse mesmo parâmetro. Na situação desejável, obtém-se um intervalo relativamente pequeno
com uma confiança elevada. Para um tamanho fixo de amostra e para a mesma variância, quanto
maior o nível de confiança, maior o intervalo de confiança.
É importante enfatizar que toda afirmação deve vir acompanhada de um grau de certeza (ou
confiança), o quanto se está certo ao comunicar aquela informação. A interpretação desse enfoque é
a seguinte: se um grande número de intervalos de confiança forem construídos a partir de amostras
independentes da mesma população, então espera-se que uma porcentagem desses intervalos
contenha o valor verdadeiro do parâmetro da população.
Entendendo realmente o conceito de intervalo de confiança
Algumas estimativas intervalares podem incluir e outras não o verdadeiro valor do parâmetro da
população. Quando se retira uma amostra e se calcula um intervalo de confiança, não se sabe,
realmente, se o parâmetro da população se encontra naquele intervalo calculado. O importante é
reconhecer que se está utilizando um método com (1-α)% de probabilidade de sucesso: em uma
seqüência muito grande de repetições, (1-α)% dos intervalos assim construídos abrangerão o
verdadeiro valor do parâmetro da população, embora não se saiba exatamente quanto ele valha.
Por exemplo, ao desejar-se um intervalo de confiança de 90% para estimar a média de uma
população, uma amostra pode fornecer um intervalo entre (48,5, 51,5). Embora se desconheça o
verdadeiro valor da média da população, se 100 desses intervalos forem construídos a partir de 100
amostras, deve-se esperar que 90 desses intervalos contenham o verdadeiro valor da média da
população. Entretanto, não se sabe quais intervalos conterão o parâmetro da população.
14. I.E., começando a estimar: qual a média µ da população?
Para tanto, retira-se uma amostra de tamanho n e calcula-se a média aritmética X e o desvio-padrão amostral
s., aplicando-se a expressão:
Limites de confiança do parâmetro µ ∈ X ±
ts
n
Ao se retirar uma amostra de tamanho n, calcula-se X e s. Como determinar o valor de "t"?
15. I.E., teste de hipóteses: repetitividade e reprodutibilidade
Duas medidas de precisão (incerteza) chamadas REPETITIVIDADE e REPRODUTIBILIDADE têm
sido usadas para descrever a variabilidade de métodos de ensaio.
A repetitividade e a reprodutibilidade são dois valores extremos, sendo a repetitividade a mínima
variabilidade entre resultados e a reprodutibilidade a máxima variabilidade entre resultados. A
repetitividade é representada pelo símbolo r e a reprodutibilidade pelo símbolo R. Convém enfatizar
que tanto uma quanto outra têm unidades.
I - REPETITIVIDADE (também conhecida como REPÊ)
A Repetitividade se refere a ensaios executados sob condições que são tão constantes quanto
possíveis, chamadas condições de repetitividade. Os resultados de ensaios mutuamente
independentes são obtidos com o mesmo método de ensaio, de material idêntico, por um mesmo
laboratório, por um mesmo operador e usando o mesmo equipamento em intervalos de tempo
pequenos.
O desvio-padrão do resultado de ensaio obtido sob condições de repetitividade denomina-se desviopadrão de repetitividade. É um parâmetro de dispersão da distribuição dos resultados de ensaios.
Com o desvio-padrão de repetitividade, calcula-se o chamado valor de repetitividade r; a partir dos
dois resultados de ensaios obtidos sob condições de repetitividade, calcula-se o módulo da diferença
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 9
entre eles. A probabilidade de que esta diferença seja menor do que o valor de repetitividade r é igual
a 95%.
II - REPRODUTIBILIDADE (também conhecida como REPRÔ)
A Reprodutibilidade se refere a ensaios executados sob condições variadas, chamadas de
condições de reprodutibilidade. Os resultados são obtidos com o mesmo método de ensaio e material
idêntico, mas em laboratórios diferentes, com diferentes operadores e usando equipamentos
diferentes, sendo os ensaios executados com grandes intervalos de tempo entre um e outro.
O desvi-padrão do resultado de ensaio obtido sob condições de reprodutibilidade denomina-se
desvio-padrão de reprodutibilidade. É um parâmetro de dispersão da distribuição dos resultados de
ensaios.
Com o desvio padrão de reprodutibilidade, calcula-se o chamado valor de reprodutibilidade R: a partir
dos dois resultados de ensaios obtidos sob condições de reprodutibilidade, calcula-se o módulo da
diferença entre eles. A probabilidade de que esta diferença seja menor do que o valor de
reprodutibilidade R é igual a 95%.
Exemplo
Observe, agora, uma definição de reprodutibilidade, segundo a Norma XYZ4 de uma empresa
avaliada:
6.7. Reprodutibilidade
NORMA 1 - A diferença entre dois resultados individuais e independentes, obtidos por dois
operadores, operando em laboratórios diferentes a partir de uma mesma amostra submetida ao
ensaio, não deve ultrapassar ..... em valor absoluto.
Exercício/exemplo
Suponha-se que os índices calculados tenham sido R= 0,03 e r= 0,02.
Um laboratório, efetuando duas repetições, obteve em um ensaio os valores 0,17 e 0,18. A diferença
0,01 é aceitável e as duas análises são válidas, porque essa diferença é menor que r; caso se
obtivesse 0,17 e 0,20, a diferença 0,03 é inaceitável, e um dos valores deve ser rejeitado; não
havendo informações mais específicas, a rejeição deve ser do valor mais afastado da média.
Considere-se agora que o laboratório 1 obteve 0,18 e o laboratório 5 obteve 0,20. A diferença 0,02 é
inferior a R = 0,03 e os dois valores são aceitáveis. No caso de ser necessário rejeitar um resultado,
este deve ser o mais disperso, como no caso da repetitividade.
RESOLUÇÃO-RE Nº 899, DE 29 DE MAIO DE 2003
2.4. Precisão
A precisão é a avaliação da proximidade dos resultados obtidos em uma série de medidas de uma amostragem
múltipla de uma mesma amostra. Esta é considerada em três níveis.
2.4.1. Repetibilidade (precisão intra-corrida): concordância entre os resultados dentro de um curto período de
tempo com o mesmo analista e mesma instrumentação. A repetibilidade do método é verificada por, no mínimo,
9 (nove) determinações, contemplando o intervalo linear do método, ou seja, 3 (três) concentrações, baixa,
média e alta, com 3 (três) réplicas cada ou mínimo de 6 determinações a 100% da concentração do teste;
2.4.2. Precisão intermediária (precisão inter-corridas): concordância entre os resultados do mesmo laboratório,
mas obtidos em dias diferentes, com analistas diferentes e/ou equipamentos diferentes. Para a determinação da
precisão intermediária recomenda-se um mínimo de 2 dias diferentes com analistas diferentes.
2.4.3. Reprodutibilidade (precisão inter-laboratorial): concordância entre os resultados obtidos em laboratórios
diferentes como em estudos colaborativos, geralmente aplicados à padronização de metodologia analítica, por
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 10
exemplo, para inclusão de metodologia em farmacopéias. Estes dados não precisam ser apresentados para a
concessão de registro. A precisão de um método analítico pode ser expressa como o desvio padrão ou desvio
padrão relativo (coeficiente de variação) de uma série de medidas. A precisão pode ser expressa como desvio
padrão relativo (DPR) ou coeficiente de variação (CV%), segundo a fórmula,
em que, DP é o desvio padrão e CMD, a concentração média determinada. O valor máximo aceitável deve ser
definido de acordo com a metodologia empregada, a concentração do analito na amostra, o tipo de matriz e a
finalidade do método, não se admitindo valores superiores a 5%.
Convém relembrar que R e r são índices intimamente ligados à precisão de resultados de medições.
É importante, portanto, que esses índices sejam expressos de modo correto para que não se perca
de vista o significado físico que deve ser associado a esses números.
O objetivo metrologicamente desejável (porém difícil) é reduzir os valores de R e r, necessitando
maior controle em todo o processo. Deve haver esforço para reduzir os erros em cada um dos
laboratórios, em cada repetição e também em cada amostra. Como o processo é lento, deve-se
considerar os índices R e r como índices dinâmicos, sujeitos a reavaliações e revisões. Nas fases
iniciais do processo, pode haver muita instabilidade, mas ao longo do tempo espera-se que essa
instabilidade diminua.
É preciso cuidado com um índice com valor muito pequeno, o qual pode cair em descrédito por ser
muito difícil a sua obtenção. É lógico, portanto, iniciar a utilização desses índices com valores maiores
(toleram-se variações em faixa ampla de valores) que possam gradativamente serem reduzidos.
16. I.E., teste de hipóteses: Diagrama de Youden
I - Elipse de Confiança
A interpretação do programa interlaboratorial pode ser feita através do estudo estatístico entre duas
variáveis, utilizando uma técnica gráfica, baseada na elaboração de um diagrama de dispersão dos
resultados, associados a uma região de confiança (elipse). Esta técnica permite que uma
interpretação dos resultados seja feita por meio de uma visualização simples e rápida, embora não
forneça os parâmetros de repetitividade e reprodutibilidade.
Para cada uma das propriedades analisadas em um programa interlaboratorial é feito o diagrama,
onde cada laboratório é representado por um ponto, cuja abcissa é a média das medições obtidas
pelo laboratório para a amostra A e a ordenada é a média das medições do mesmo laboratório para
a amostra B.
Para duas variáveis, tem-se não mais um intervalo de confiança, mas sim uma região de confiança
com a forma de elipse, denominada elipse de confiança. A elipse é traçada de tal modo que a
probabilidade de um ponto se situar dentro da elipse é igual a 100x(1-α)%. A dispersão dos pontos
ao longo do eixo maior está associada aos erros sistemáticos, enquanto que ao longo do eixo menor
está associada aos erros aleatórios.
Como se supõe que os valores se comportam segundo a distribuição de deM-L-G (nos relatórios
pode aparecer o texto "as distribuições são gaussianas"), ao se combinar as duas medidas, o gráfico
resultante é uma elipse, cujo centro tem como abcissa a média de todas as medidas da amostra A e
como ordenada a média de todas as medidas da amostra B. A elipse é traçada com base na
confiança que se deseja apresentar a conclusão.
II - Interpretação dos resultados:
a) para os pontos dentro da elipse de confiança
• se a dispersão é uniforme em uma elipse com eixo maior a 45o em relação eixo das
abcissas, então o desempenho dos laboratórios pode ser considerado satisfatório;
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
•
p. 11
se a dispersão é uniforme em uma elipse com eixo maior tendendo à posição vertical ou
à horizontal, não é possível afirmar que os laboratórios apresentam desempenho
satisfatório, porque existem problemas com uma das amostras, A ou B. Estes problemas
podem estar relacionados à falta de homogeneidade etc.;
b) para pontos fora da elipse de confiança
• afastados do eixo maior da elipse indicam erro aleatório significativo e ocorrem devido à
variabilidade dentro do laboratório, podendo ter origem em operador não devidamente
treinado, ou erros ocasionais (erro de leitura, erros de cálculo, erro em conversão de
valores, erro em transcrição de dados etc.);
• próximos ao eixo maior da elipse indicam erros sistemáticos significativos e ocorrem
devido a condições adversas do laboratório, podendo ter origem em modificações não
permitidas na metodologia ou equipamentos não aferidos ou não calibrados.
A dispersão dos pontos ao longo do eixo maior está associada aos erros sistemáticos, enquanto que
ao longo do eixo menor está associada aos erros aleatórios.
Exemplo
4.2. Elipse de Confiança
Os resultados obtidos pelos laboratórios participantes, relativos ao par de amostras A e B
permitiram a construção de diagramas de dispersão elaborados em um sistema de eixos
cartesianos, onde a escala do eixo X cobre a faixa de resultados referentes à amostra A e
do eixo Y, a faixa de resultados da amostra B.
Para cada uma das propriedades (ensaios) foi construído um diagrama em que cada
laboratório é representado por um ponto. A abcissa do ponto é o resultado de ensaio da
amostra A e a ordenada, o resultado de ensaio da amostra B.
As retas que passam pelos valores médios de todos os laboratórios dividem o diagrama em
quadrantes. Numa situação ideal os pontos devem se encontrar igualmente distribuídos
pelos quadrantes; isto acontece somente quando ocorrem erros aleatórios em níveis não
significativos, Quando os pontos se encontram mais concentrados nos quadrantes superior
direito e inferior esquerdo, significando que os laboratórios tendem a obter valores maiores
do que a média para as duas amostras ou valores menores do que a média para ambas
amostras do par, isto evidencia ocorrência de erros sistemáticos.
A Elipse de Confiança delimita uma região em que qualquer ponto tem a mesma
probabilidade P de se situar dentro da elipse.
A construção da elipse foi feita utilizando um programa de computador que determina a
elipse e a eliminação sucessiva dos pontos dispersos adotando um grau de confiança de
95%.
Os tipos de erros que podem ocorrer são função da posição do ponto em relação à elipse e
estão representados na Figura 1.
Erros sistemáticos ocorrem devido a condições adversas do laboratório, podendo ter
origem em modificações não permitidas na metodologia e/ou equipamentos não calibrados.
Erros aleatórios ocorrem devido à variabilidade dentro do laboratório podendo ter origem
em operador não devidamente treinado e/ou erros ocasionais como: erro de leitura, erro de
cálculo, erro em transcrição de dados, etc.
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 12
Figura 1. Exemplo de um gráfico de Youden
Exemplo
5.1. Resíduo Peneira de Abertura 75/m (%)
De acordo com a NBR XYZ2 o resultado expresso em porcentagem de massa é calculado até
os décimos.
Tabela 5
LABORATóRIO
AMOSTRA A
AMOSTRA B
F
1
1,1
1,2
O
2
1,2
1,4
O
3
1,2
1,4
O
4
1,7
1,6
O
5
1,5
1,8
O
6
1,2
1,3
O
7
1,0
1,0
O
8
1,4
1,6
O
9
1,3
1,4
O
10
0,6
0,7
O
11
1,2
1,1
O
16
1,4
1,6
O
13
2,0
2,0
O
14
1,8
2,1
O
15
1,5
1,6
O
12
2,3
2,7
*
20
0,6
1,2
*
Média Geral
1,34
1,45
Desvio Padrão
0,3418
0,3701
Numero de Observações da Elipse: 15
Numero de Observações Total: 17
o - Laboratórios incluídos no calculo da elipse de 95% de confiança e se encontram dentro dela.
* - Laboratórios excluídos da elipse de 95% de confiança.
Laboratórios 12 - Erro sistemático significativo. Verificar metodologia, calibração de equipamento,
condições ambientais.
Laboratórios 20 - Erro aleatório. Verificar operador, erro de leitura, de cálculo, de transcrição. O erro
ocorreu
na amostra A.
Paulo Afonso
Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 13
17. I.E., teste de hipóteses:
usando tudo o que foi visto nos gráficos de controle da qualidade
A Norma NBR ISO 9000: 2000, Sistemas de gestão da qualidade - Fundamentos e vocabulário
define controle da qualidade como parte da gestão focada no atendimento dos requisitos da
qualidade (item 3.2.10).
- Linha média, limites de controle (superior e inferior) e de advertência (superior e inferior)
18. Começando na Matemática e acabando na Inferência:
descobrindo a “melhor” de todas as retas (chamam de "regressão
linear")
1. REGRESSÃO: compreende a análise de dados amostrais para saber se e como duas ou mais
variáveis estão relacionadas uma com a outra na população. Não implica, necessariamente, em
relação de causa e efeito.
2. REGRESSÃO LINEAR
•
•
O modelo matemático: y = a.x + b
•
•
método dos mínimos quadrados
elementos básicos:
• variáveis: dependente (Y), ou explicada, e independente (X), ou explicativa,
esta podendo ser qualitativa ou quantitativa
• equação
• parâmetros: são as grandezas das relações (coeficientes)
EXCEL: "Colar Função"/INCLINAÇÃO e INTERCEPÇÃO
RESOLUÇÃO-RE Nº 899, DE 29 DE MAIO DE 2003
2.2. Linearidade
É a capacidade de uma metodologia analítica de demonstrar que os resultados obtidos são diretamente
proporcionais à concentração do analito na amostra, dentro de um intervalo especificado.
2.2.1. Recomenda-se que a linearidade seja determinada pela análise de, no mínimo, 5 concentrações
diferentes. Estas concentrações devem seguir os intervalos da Tabela 3.
2.2.2. Se houver relação linear aparente após exame visual do gráfico, os resultados dos testes deverão ser
tratados por métodos estatísticos apropriados para determinação do coeficiente de correlação, intersecção com
o eixo Y, coeficiente angular, soma residual dos quadrados mínimos da regressão linear e desvio padrão
relativo. Se não houver relação linear, realizar transformação matemática.
2.2.3. O critério mínimo aceitável do coeficiente de correlação (r) deve ser = 0,99.
2.2.4. Deve-se apresentar as curvas obtidas (experimental e a resultante do tratamento matemático).
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 14
19. Estatística robusta
A robustez de um estimador é uma medida da sua capacidade de permanecer inalterado sob
influência de pequenas variações nos dados. Por exemplo, a mediana é mais robusta que a média
aritmética em relação a valores dispersos, tendo em vista que independe deles. O teste de robustez
consiste em identificar os dados que podem ter efeito significativo no resultado.
•
MEDIANA amostral
EXCEL: "Colar função"/ MED
Usualmente, a mediana é adotada como a medida de tendência central e o intervalo quartílico como
medida de dispersão. Para compreensão do intervalo quartílico, é preciso entender o que são
percentis (também chamados porcentis).
Um percentil é uma medida da posição relativa de uma unidade observacional em relação a todas as
outras. O p-ésimo porcentil tem no mínimo p% dos valores abaixo daquele ponto e no mínimo (100 p)% dos valores acima.
Por exemplo, se uma altura de 1,80m é o 90o. percentil de uma turma de estudantes, então 90% da
turma tem alturas menores que 1,80m e 10% têm altura superior a 1,80m; se o peso de uma pessoa
de 75kg é o 40o. percentil de um conjunto de empregados. então 40% dos empregados pesam
menos que 75kg e 60% pesam mais.
Há inúmeras maneiras de se calcular percentis. Considere a notação X[np]+ , que significa anotar a
próxima observação acima de np (onde n é o total de valores e p o percentil em decimais) se np não
é inteiro, e a média desta e da observação seguinte se np é inteiro Os colchetes em torno do índice
representam a posição daquele valor após os dados terem sido ordenados de modo crescente. Por
exemplo, se o conjunto de dados tem 75 observações, então o 25o. percentil é o X[(75) x (0,25)]+ = X[19],
isto é, a 19a. menor observação após a ordenação. O 40o. percentil é X[(75) x (0,40)] + = (X(30) + X(31))/2,
isto é, a média das 30a. e 31a. observações após a ordenação.
Os percentis de números 25, 50 e 75 são chamados, respectivamente, Primeiro Quartil (simbolizado
por Q1), Segundo Quartil (Q2, igual à Mediana) e Terceiro Quartil (Q3).
Os percentis de números 10, 20, 30, ..., 90 são chamados Decis; tem-se, respectivamente, Primeiro
Decil (simbolizado por D1), Segundo Decil (D2), ... e Nono Decil (D9). O 5o. decil é a Mediana.
IMPORTANTE: Não se deve confundir percentis com percentagens. Um percentil é relacionado
somente com a posição relativa de uma observação quando comparada com os outros valores.
Desse modo se um estudante que acerta 75% de um teste, mas cuja nota é o 40o. percentil, significa
que somente 40% da turma tiveram nota pior que aquele estudante e 60% saíram-se melhor.
Exemplo: Considere as seguintes medidas de uma amostra:
52,0 55,9 56,7 59,4 60,2
54,4 55,9 56,8 59,4 60,3
54,5 56,2 57,2 59,5 60,5
55,7 56,4 57,6 59,8 60,6
55,8 56,4 58,9 60,0 60,8
Há n=25 observações na amostra. Desse modo:
• o 50o. percentil é a [25x0,5] = "[12,5-ésima observação]+". Toma-se a 13a. observação (após
a ordenação) e assim a medida mediana é igual a 57,2.
•
o 25o. percentil é a [25x0,25] = "[6,25-ésima observação]+". Toma-se a 7a. observação (após
a ordenação) e assim o 25o. percentil é igual a 55,9, que é também o valor de Q3
•
o 20o. percentil é a [25x0,2] = "[5a. observação]+". Toma-se a média entre a 5a.e a 6a.
observações (após a ordenação) e assim o 20o. percentil é igual a 55,85, que é também o
valor de D2
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 15
EXEMPLO
Em determinado relatório, as seguintes expressões apareceram:
a) média de três medidas em cada laboratório
b) z para métodos robustos = (valor do laboratório - mediana)/amplitude interquartílica normalizada
c) z para métodos clássicos = (valor do laboratório - média)/desvio-padrão
d) z-escore entre laboratórios = (valor S do laboratório - média dos S)/amplitude interquartílica
normalizada dos S, onde S = (valor da 1ª medida + valor da 2ª medida)/ 2
e) z-escore dentro do laboratório = (valor D do laboratório - média dos D)/amplitude interquartílica
normalizada dos D, onde D = (valor da 1ª medida - valor da 2ª medida)/ 2
f) gráfico de Youden para escores z robustos: gráfico retangular de pares de escores z robustos, no
qual cada laboratório é representado por um X; a abcissa é o valor z da 1ª medida e a ordenada é
o valor z da 2ª medida); apresenta-se, usualmente, uma elipse com 5% de probabilidade, onde as
amplitudes interquartílicas normalizadas para todas as medidas são calculadas com todos os
valores e usadas como desvio-padrão, e os coeficientes de correlação são calculados após
eliminarem-se os dispersos na avaliação z. Denomina-se disperso na avaliação z quando ao
menos um módulo de um escore z é maior que 3.
g) gráfico de Youden para valores encontrados: gráfico retangular de pares de valores, no qual cada
laboratório é representado por um X; a abcissa é o valor da 1ª medida e a ordenada é o valor da
2ª medida); apresenta-se, usualmente, uma elipse com 5% de probabilidade, onde as amplitudes
interquartílicas normalizadas para todas as medidas são calculadas com todos os valores e
usadas como desvio-padrão, e os coeficientes de correlação são calculados após eliminarem-se
os dispersos na avaliação Y. Denomina-se disperso na avaliação Y quando laboratório está fora
da elipse de 5% de probabilidade.
Como o NIQR é calculado?
A partir de todos os (Q3 - Q1) de todos os laboratórios, determina-se a média e o dp deles.
Então o NIQR = ([Q3-Q1] - média )/dp
EXEMPLO NUMÉRICO
do relatório APLAC
Considere os seguintes extratos de resultados para uma determinada característica de um conjunto
de 63 laboratórios. Cada laboratório fez duas medidas, X e Y.:
escore z
Média
Avaliação
LAB
aritmética
robusta
clássica
robusta
X
Y
X
Y
X
Y
Entre Dentro
Z
Y
1
0,1510 0,4027 -0,660 -0,471 -0,522 -0,283 -0,867
0,000
...
...
...
...
...
...
...
...
...
...
...
63
0,1610 0,3633 0,660 -3,562
0,273
-2,749 -2,891
4,033
*
*
(*) disperso segundo este critério
Os resultados apresentados foram os seguintes:
• Para X:
número de resultados = 63
mediana = 0,1560
amplitude interquartílica normalizada (AIN) = 0,0076
Média = 0,1576
Desvio-padrão = 0,0126
Coeficiente de correlação = 0,4035
t x AIN/ n = 0,0019
• Para Y:
número de resultados = 63
mediana = 0,4087
amplitude interquartílica normalizada (AIN) = 0,0127
Média = 0,4072
Desvio-padrão = 0,0160
Coeficiente de correlação
t x AIN/ n = 0,0033
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
p. 16
Perguntas:
a) para o conjunto de medidas X e Y, indique como foram determinados
• o número de resultados
• a mediana
• a amplitude interquartílica normalizada (AIN)
• a média
• o desvio-padrão
• o coeficiente de correlação
• t x AIN/ n
b) para o Laboratório 1, indique como foram calculados os valores em negrito
Média
escore z
LAB
aritmética
robusta
clássica
robusta
X
Y
X
Y
X
Y
Entre Dentro
1
0,1510 0,4027 -0,660 -0,471 -0,522 -0,283 -0,867
0,000
Avaliação
Z
Y
c) para o Laboratório 63, indique como foi decidida a eliminação dele pelos dois critérios de
avaliação
escore z
Média
Avaliação
LAB
aritmética
robusta
clássica
robusta
X
Y
X
Y
X
Y
Entre Dentro
Z
Y
63
0,1610 0,3633 0,660 -3,562
0,273
-2,749 -2,891
4,033
*
*
Após eliminarem-se dispersos na avaliação z, encontrou-se:
• Para X:
número de resultados = 57
mediana = 0,1560
amplitude interquartílica normalizada (AIN) = 0,0067
Média = 0,1563
Desvio-padrão = 0,0069
Coeficiente de correlação = 0,3093
t x DP/ n = 0,0018
• Para Y:
número de resultados = 57
mediana = 0,4103
amplitude interquartílica normalizada (AIN) = 0,0114
Média = 0,4087
Desvio-padrão = 0,0116
Coeficiente de correlação
t x DP/ n = 0,0030
20. Incerteza de medição
A metodologia mais difundida para a estimativa da incerteza de medição reconhecida em nível mundial está
documentada no “Guia para a Expressão da Incerteza de Medição”
Quando uma medição é realizada, este resultado é somente uma aproximação ou estimativa do valor do
mensurando. Sendo assim, a expressão completa que representará o valor de tal mensurando deverá incluir a
incerteza de medição.
A incerteza é um parâmetro associado ao resultado de uma medição e é caracterizada como a dispersão dos
valores que podem ser razoavelmente atribuídos ao mensurando, segundo o Guia para a Expressão da
Incerteza de Medição.
Para estabelecer a estimativa de incerteza de medição é necessário identificar as variáveis que contribuem
para incerteza e seus valores. Na medição química podemos citar diversas fontes que contribuem para a
estimativa da incerteza como amostragem não representativa, homogeneidade da amostra, soluções padrões
de valores inexatos, estabilidade da solução, definição incompleta do mensurando, pesagem, pureza dos
reagentes, entre outros. Baseados no método de avaliação os componentes da incerteza podem ser
classificados em:
•
Tipo A, quando a avaliação é realizada pela análise estatística de uma série de observações da
grandeza medida, isto é, quando as medições são obtidas sob condições de repetitividade;
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Estatística aplicada a laboratórios
•
p. 17
Tipo B, quando se assume que cada grandeza de entrada tem uma distribuição e um intervalo de
dispersão . Essas distribuições podem ser uniforme, retangular, triangular, normal,etc.
Uma vez identificadas as fontes de incerteza (tipo A ou B) e consideradas as suas contribuições pode-se estimar
a incerteza padrão combinada. A fim de que as incertezas sejam combinadas deve-se calcular a incerteza
padrão relativa de cada contribuição que consiste na razão do valor obtido da incerteza padrão pelo valor da
variável. A incerteza padrão combinada é a raiz quadrada da soma quadrática das incertezas padrão relativas
de todos os componentes que contribuem para estimativa da incerteza de medição. Em geral, é utilizada para
expressar a incerteza em um resultado de medição, mas em algumas aplicações comerciais, industriais,
regulamentares e quando a segurança e a saúde estão em foco, é às vezes necessário se dar uma incerteza
que defina um intervalo em torno do resultado de medição. Neste caso espera-se que este intervalo englobe
uma grande porção da distribuição de valores que podem ser razoavelmente ser atribuídos ao mensurado e
então é denominada de incerteza expandida (U). A incerteza expandida é obtida quando a incerteza padrão
combinada é multiplicada por uma constante k que depende do nível de confiança e o resultado de medição é
expresso por y ± U, onde o y corresponde ao mensurando.
Por exemplo, da pipeta volumétrica de 1mL número de série ZX 5106 e certificado de calibração RBC 0656/04,,
obtém-se os seguintes dados:
Valor do volume
nominal
(mL)
1
Valor do volume
medido (média
de 05 medições)
(mL)
0,9957
Erro
(mL)
Incerteza expandida
do volume medido
(mL)
Fator de
abrangência
(K)
0,0043
0,001
2,28
H) Incerteza final de medição
O resultado final para cada medição deve ser expresso como
[ medição final MF = valor da amostra – valor do branco ]
A incerteza da medição do volume do branco (50 mL de água deionizada) é considerada no cálculo final
porque se desconta o valor de concentração encontrada para o branco de digestão do valor da concentração
encontrada nas amostras.
A incerteza-padrão u(MF) final da medição =
[u(Amostra FG )]2 + [u(BrancoFG )]2
ou, então,
MF com incerteza-padrão u(MF).
Deve-se evitar o uso do símbolo ± para relatar a incerteza-padrão. O sinal ± deve ser associado à incerteza
expandida, esta sim correspondendo a um determinado nível de confiança, definido pelo fator de cobertura.
O resultado final deve ser apresentado com o número de algarismos significativos utilizado pelo equipamento.
Resultado final: para a amostra 209P,
a concentração de manganês é igual a 0,0153 mg/L ± 0,0034 mg/L,
com aproximadamente, 95% de confiança (o valor preciso é 97,72%).
BIBLIOGRAFIA
LOPES, Paulo Afonso, Probabilidades e Estatística: conceitos, modelos, aplicações em Excel.
Reichmann&Affonso Editores, 1999.
ABNT/INMETRO. Guia para a Expressão da Incerteza de Medição, terceira edição brasileira em língua
portuquesa, 2003.
EURACHEM/CITAC Guide. Quantifying Uncertainty in analytical Measurement, 2 edition, 2000.
Paulo Afonso Lopes
Brasília, 30 de maio a 01 de junho de 2005
Download

Estatística Aplicada a Laboratórios - Notas Complementares