UMA SENHORA TOMA CHÁ…
Diretora:
Suzana Herculano-Houzel
A evolução das coisas úteis
Clipes, garfos, latas, zíperes e
outros objetos do nosso cotidiano
Henry Petroski
Por que o bocejo é contagioso?
E outras curiosidadesda neurociência no cotidiano
Suzana Herculano-Houzel
De cabeça aberta
Conhecendo o cérebro para entender
a personalidade humana
Steven Johnson
Uma senhora toma chá...
Como a estatística revolucionou a ciência no século XX
David Salsburg
Barbies, bambolês e bolas de bilhar
67 breves comentários sobre a fascinante química do dia-a-dia
Joe Schwarcz
david salsburg
UMA SENHORA TOMA CHÁ…
como a estatística revolucionou a ciência no século XX
Tradução:
JOSÉ MAURÍCIO GRADEL
Revisão técnica:
SUZANA HERCULANO-HOUZEL
Instituto de Ciências Biomédicas/UFRJ
Rio de Janeiro
Dedicado a Fran, minha querida esposa há 42 anos. Ao longo de minha carreira, enquanto eu acumulava histórias sobre homens e mulheres que fizeram a revolução estatística, ela insistia em que
eu as reunisse num livro não matemático. Fran, que não tem treinamento matemático, ajudou-me
nas várias revisões, indicando-me os pontos em que minhas explicações não estavam claras. Este livro,
em especial as seções nitidamente compreensíveis, deve-se à sua persistência.
Título original:
The Lady Tasting Tea
(How Statistics Revolutionized Science in the Twentieth Century)
Tradução autorizada da edição norte-americana
publicada em 2002 por Owl Books, um selo de
Henry Holt and Company de Nova York, EUA.
Copyright © 2001, W.H. Freeman and Company
Copyright da edição brasileira © 2009:
Jorge Zahar Editor Ltda.
rua México 31 sobreloja
20031-144 Rio de Janeiro, RJ
tel.: (21) 2108-0808 / fax: (21) 2108-0800
e-mail: [email protected]
site: www.zahar.com.br
Todos os direitos reservados.
A reprodução não-autorizada desta publicação, no todo
ou em parte, constitui violação de direitos autorais. (Lei 9.610/98)
Projeto gráfico: Bruna Benvegnu
CIP-Brasil. Catalogação-na-fonte
Sindicato Nacional dos Editores de Livros, RJ.
Salsburg, David, 1931S17s Uma senhora toma chá...: como a estatística revolucionou a ciência no século XX / David Salsburg;
tradução José Maurício Gradel; revisão técnica Suzana Herculano-Houzel. - Rio de Janeiro: Jorge
Zahar Ed., 2009.
(Ciência da vida comum)
Tradução de: The lady tasting tea
Inclui bibliografia e índice
ISBN 978-85-378-0116-1
1. Ciência - Métodos estatísticos - História. I. Título.
08-5192
CDD 001.422
CDU 001.8
Thou shalt not answer questionnaires
Or quizzes upon World Affairs,
Nor with compliance
Take any test. Thou shalt not sit
With statisticians nor commit
A social science.
W.H. AUDEN*
To understand God’s thoughts, we must study
statistics, for these are the measure of His purpose.
FLORENCE NIGHTINGALE**
* Não responderás a questionários /ou argüição a respeito dos Negócios do Mundo /Não com
aquiescência /Farás qualquer teste. Não sentarás /com estatísticos ou cometerás /uma ciência social.
** Para entender as idéias de Deus, precisamos estudar estatística, porque essa é a medida de
Seu propósito.
sumário
Prefácio à edição brasileira 11
Prefácio 13
1. Uma senhora toma chá...
A natureza cooperativa da ciência 18 | O desenho experimental 19
2. As distribuições assimétricas
O laboratório biométrico de Galton 25 | Correlação e regressão 26 | Distribuições e
parâmetros 27 | O plano da Biometrika 30
3. Querido senhor Gosset
O nascimento do “Student” 37 | O teste t de Student 39
4. Revolver um monte de estrume
Fisher versus Karl Pearson 44 | Fisher, “o fascista” 45 | Métodos estatísticos para
pesquisadores 46 | Rothamsted e experimentos agrícolas 48
5. “Estudos da variação de safras”
“Estudos da variação de safras I” 50 | A generalização da regressão à média de Galton 51 |
Experimentos randomizados controlados 53 | A análise da variância de Fisher 54 |
Graus de liberdade 55 | “Estudos da variação de safras III” 56
6. “O dilúvio de 100 anos”
A distribuição de extremos 60 | Assassinato político 61
7. Fisher triunfante
A visão fisheriana versus a visão pearsoniana da estatística 66 | Os métodos de probabilidade
máxima de Fisher 68 | Algoritmos iterativos 69
8. A dose letal
Análise de probit 74 | Bliss na Leningrado soviética durante o terror stalinista 76
9. A curva em forma de sino
O que é o teorema central do limite? 80 | Viva la muerte! 83 | De Lindeberg-Lévy para as
estatísticas-U 85 | Hoeffding em Berlim 85 | Pesquisa operacional 87
10. Teste da adequação do ajuste
Teoria do caos e adequação do ajuste 90 | O teste de adequação do ajuste de
Pearson 91 | Testar se a senhora pode sentir o gosto diferente do chá 92 |
Uso dos valores de p de Fisher 93 | A educação matemática de Jerzy Neyman 95 |
O estilo de matemática de Neyman 97
11. Testes de hipótese
O que é probabilidade? 101 | A definição freqüentista de probabilidade 103
12. O golpe da confiança
A solução de Neyman 109 | Probabilidade versus grau de confiança 111
13. A heresia bayesiana
Questões relativas à “probabilidade inversa” 115 |
O modelo hierárquico bayesiano 116 | Probabilidade pessoal 118
14. O Mozart da matemática
Kolmogorov, o homem 123 | O trabalho de Kolmogorov na
estatística matemática 125 | O que é probabilidade na vida real? 127 |
Comentário sobre os fracassos da estatística soviética 128
15. Como se fosse uma mosquinha
Trabalhando para K.P. 132 | Trabalho de guerra 134
16. Abolir os parâmetros
Desenvolvimentos posteriores 139 | Problemas não resolvidos 140
17. Quando a parte é melhor que o todo
O New Deal e a amostragem 146 | Jerome Cornfield 149 | Índices econômicos 151
18. Fumar causa câncer?
Existem causa e efeito? 154 | Implicação material 156 | A solução de Cornfield 157 |
O hábito de fumar e o câncer versus o agente laranja 160 | Viés de publicação 161 |
A solução de Fisher 162
19. Se você quiser a melhor pessoa...
As contribuições das mulheres 166 | O desenvolvimento de indicadores
econômicos 168 | As mulheres na estatística teórica 171
20. Apenas um peão de fazenda do Texas
Estatística em Princeton 175 | A estatística e o esforço de guerra 176 |
A estatística na abstração 178
21. Um gênio na família
I.J. Good 181 | Persi Diaconis 185
22. O Picasso da estatística
A versatilidade de Tukey 190
23. Lidando com a contaminação
Box torna-se estatístico 197 | Box nos Estados Unidos 199 | Box e Cox 201
24. O homem que refez a indústria
A mensagem de Deming à gerência sênior 204 |
A natureza do controle de qualidade 207 | Deming e os testes de hipótese 209
25. O conselho da senhora de preto
Estatística na Guinness 212 | Variabilidade inesperada 213 |
Matemática abstrata versus estatística útil 216
26. A marcha das acumuladas
Trabalho teórico inicial 220 | Acumuladas em estudos de insuficiência
cardíaca congestiva 221
27. A intenção de tratar
A formulação de Cox 226 | O enfoque de Box 226 | A visão de Deming 229 |
Os estudos observacionais de Cochran 228 | Os modelos de Rubin 229
28. O computador gira em torno de si mesmo
O lema de Glivenko-Cantelli 232 | O bootstrap de Efron 233 | Reamostragem e outros
métodos com uso intensivo do computador 234 | O triunfo dos modelos estatísticos 235
29. O ídolo com pés de barro
Os estatísticos perdem o controle 239 | A revolução estatística termina
seu trajeto? 240 | Os modelos estatísticos podem ser usados para tomar decisões? 241 |
Qual o significado de probabilidade quando aplicada à vida real? 243 | As pessoas
realmente entendem a probabilidade? 246 | A probabilidade é realmente necessária? 248 |
O que acontecerá no século XXI? 249
Epílogo 250
Linha do tempo 252
Notas 257
Referências bibliográficas 266
Índice remissivo 274
Prefácio
A ciência chegou ao século XIX com a firme visão filosófica de que o Universo
funcionaria como o mecanismo de um imenso relógio. Acreditava-se que havia
um pequeno número de fórmulas matemáticas (como as leis do movimento
de Newton e as leis dos gases de Boyle) capazes de descrever a realidade e
prever eventos futuros. Tudo de que se necessitava para tal predição era um
conjunto completo dessas fórmulas e um grupo de medições a elas associadas,
realizadas com suficiente precisão. A cultura popular levou mais de 40 anos
para se pôr em dia com essa visão científica.
Típico desse atraso cultural é o diálogo entre o imperador Napoleão
Bonaparte e Pierre Simon Laplace nos primeiros anos do século XIX. Laplace
havia escrito um livro monumental e definitivo, no qual descreve como calcular
as futuras posições de planetas e cometas com base em algumas observações
feitas a partir da Terra. “Não encontro menção alguma a Deus em seu tratado,
sr. Laplace”, teria questionado Napoleão, ao que Laplace teria respondido: “Eu
não tinha necessidade dessa hipótese.”
Muitas pessoas ficaram horrorizadas com o conceito de um Universo mecânico, sem Deus, que funcionasse para sempre sem intervenção divina e com
todos os eventos futuros determinados pelos que teriam ocorrido no passado.
De certa forma, o movimento romântico do século XIX foi uma reação a esse
frio e exato uso da razão. No entanto, uma prova dessa nova ciência apareceu
na década de 1840 e deslumbrou a imaginação popular. As leis matemáticas de
Newton foram usadas para prever a existência de mais um planeta – e Netuno
foi descoberto no lugar que as leis previram. Quase todas as resistências ao
Universo mecânico desmoronaram, e essa posição filosófica tornou-se parte
essencial da cultura popular.
Embora Laplace não precisasse de Deus em sua formulação, ele necessitou
de algo que denominou “função erro”. A observação de planetas e cometas a
13
14
Uma senhora toma chá...
partir da Terra não se ajustava com precisão às posições previstas, fato que Laplace e seus colegas cientistas atribuíram a erros nas observações, algumas vezes
atribuíveis a alterações na atmosfera da Terra, outras vezes a falhas humanas.
Laplace reuniu todos esses erros numa peça extra (a função erro), que atrelou
a suas descrições matemáticas. Essa função erro absorveu as imprecisões e
deixou apenas as puras leis do movimento para prever as verdadeiras posições
dos corpos celestes. Acreditava-se que, com medições cada vez mais precisas,
diminuiria a necessidade da função erro. Como ela dava conta de pequenas discrepâncias entre observado e previsto, a ciência do século XIX estava nas garras
do determinismo filosófico – a crença de que tudo é determinado de antemão
pelas condições iniciais do Universo e pelas fórmulas matemáticas que descrevem
seus movimentos.
No final do século XIX, os erros haviam aumentado, em vez de diminuir.
À proporção que as medições se tornavam mais precisas, novos erros se revelavam. O andar do Universo mecânico era trôpego. Falharam as tentativas de
descobrir as leis da biologia e da sociologia. Nas antigas ciências, como física e
química, as leis que Newton e Laplace tinham utilizado mostravam-se meras
aproximações grosseiras. Gradualmente, a ciência começou a trabalhar com
um novo paradigma, o modelo estatístico da realidade. No final do século XX,
quase toda a ciência tinha passado a usar modelos estatísticos.
A cultura popular não conseguiu acompanhar essa revolução científica.
Algumas idéias e expressões vagas (como “correlação”, “probabilidades” e
“risco”) até entraram no vocabulário popular, e a maioria das pessoas está
consciente das incertezas associadas a algumas áreas da ciência, como medicina
e economia, mas poucos não-cientistas têm algum entendimento da profunda
mudança de visão filosófica que ocorreu. O que são esses modelos estatísticos?
Como apareceram? O que significam na vida real? São descrições fidedignas da
realidade? Este livro é uma tentativa de responder a essas perguntas. Ao longo
da narrativa, também iremos abordar a vida de alguns homens e mulheres que
se envolveram nessa revolução.
Ao lidar com essas questões, é necessário distinguir três idéias matemáticas:
aleatoriedade, probabilidade e estatística. Para a maioria das pessoas, aleatoriedade é apenas sinônimo de imprevisibilidade. Um aforismo do Talmude
transmite essa noção popular: “Não se devem procurar tesouros enterrados,
porque tesouros enterrados são encontrados aleatoriamente, e, por definição,
não se pode procurar o que é encontrado aleatoriamente.” Para o cientista moderno, entretanto, existem muitos tipos diferentes de aleatoriedade. O conceito
Prefácio 15
de distribuição probabilística (descrito no Capítulo 2) nos permite estabelecer
limitações à aleatoriedade e nos dá limitada capacidade de prever eventos futuros aleatórios. Assim, para o cientista moderno, eventos aleatórios não são
simplesmente indomados, inesperados e imprevisíveis – sua estrutura pode ser
descrita matematicamente.
Probabilidade é uma palavra atual para um conceito muito antigo. Ele
aparece em Aristóteles, que afirmou: “É da natureza da probabilidade que coisas
improváveis aconteçam.” De início, ela envolve a sensação de alguém a respeito
do que se pode esperar. Nos séculos XVII e XVIII, um grupo de matemáticos,
entre eles duas gerações dos Bernoulli, Fermat, De Moivre e Pascal, trabalhou
numa teoria matemática da probabilidade que começou com jogos de azar.
Eles desenvolveram alguns métodos muito sofisticados para contar eventos
igualmente prováveis. De Moivre conseguiu inserir os métodos de cálculo nessas
técnicas, e os Bernoulli foram capazes de estabelecer alguns profundos teoremas
fundamentais, chamados “leis dos grandes números”. No final do século XIX,
a probabilidade matemática consistia essencialmente em sofisticados truques,
mas lhe faltava uma sólida fundamentação teórica.
Apesar da natureza incompleta da teoria da probabilidade, ela se mostrou
útil para a idéia, que então se desenvolvia, de distribuição estatística. Uma
distribuição estatística ocorre quando consideramos um problema científico
específico. Por exemplo, em 1971, foi publicado pela revista médica inglesa Lancet um artigo da Harvard School of Public Health que analisava se o consumo
de café estaria relacionado ao câncer do trato urinário inferior. O estudo fora
realizado com um grupo de pacientes, alguns dos quais haviam desenvolvido
esse tipo de câncer, enquanto outros sofriam de outras doenças. Os autores
do relatório coletaram dados adicionais sobre esses pacientes, tais como idade,
sexo e história familiar de câncer. Nem todos que bebem café contraem câncer
do trato urinário, e nem todos que apresentam câncer do trato urinário são bebedores de café – assim, alguns fatos contradiziam a hipótese dos pesquisadores.
No entanto, 25% dos pacientes com esse tipo de câncer habitualmente tomavam
quatro ou mais xícaras de café por dia. Apenas 10% dos pacientes sem câncer
bebiam tanto café. Parecia haver alguma evidência a favor da hipótese.
Essa coleta de dados forneceu aos autores uma distribuição estatística. Usando as ferramentas da probabilidade matemática, eles construíram uma fórmula
teórica para aquela distribuição, a “função de distribuição probabilística”, ou
simplesmente função de distribuição, que utilizaram para examinar a questão.
Equivale à função erro de Laplace, mas muito mais complexa. A construção da
16
Uma senhora toma chá...
função de distribuição teórica faz uso da teoria das probabilidades e é empregada
para descrever o que se pode esperar de dados futuros tomados aleatoriamente
do mesmo grupo de pessoas.
O assunto deste livro não é probabilidade e teoria da probabilidade – que são
conceitos matemáticos abstratos. Aqui se trata da aplicação de alguns teoremas
da probabilidade a problemas científicos, o mundo das distribuições estatísticas e funções de distribuição. A teoria da probabilidade sozinha é insuficiente
para descrever os métodos estatísticos, e algumas vezes acontece de os métodos
estatísticos na ciência violarem alguns dos teoremas da probabilidade. O leitor
encontrará a probabilidade perambulando pelos capítulos, empregada, quando
necessária, e ignorada, quando não.
Como os modelos estatísticos da realidade são matemáticos, só podem ser
totalmente compreendidos em termos de fórmulas e símbolos matemáticos.
Tentei aqui algo um pouco menos ambicioso: descrever a revolução estatística
na ciência do século XX por intermédio de algumas das pessoas (muitas delas
ainda vivas) que nela estiveram envolvidas. Tratei muito superficialmente o
trabalho que elas criaram, só para provar como suas descobertas individuais se
encaixaram no quadro geral.
O leitor deste livro não aprenderá o suficiente para se lançar à análise estatística de dados científicos – isso exigiria vários anos de estudos universitários –,
mas espero que ele compreenda algo da profunda mudança da filosofia básica
representada pela visão estatística da ciência. A quem um não-matemático
procura para entender essa revolução na ciência? Acho que, para começar, é
recomendável uma senhora provando chá...
1. Uma senhora toma chá...
Era uma tarde de verão em Cambridge, Inglaterra, no final dos anos 1920. Um
grupo de professores universitários, suas esposas e alguns convidados tomara
lugar a uma mesa no jardim para o chá da tarde. Uma das mulheres insistia
em afirmar que o chá servido sobre o leite parecia ficar com gosto diferente do
que apresentava ao receber o leite sobre ele. As cabeças científicas dos homens
zombaram do disparate. Qual seria a diferença? Não podiam conceber diferença
alguma na química da mistura. Um homem de estatura baixa, magro, de óculos
grossos e cavanhaque começando a ficar grisalho interessou-se pelo problema.
“Vamos testar a proposição”, animou-se. Começou a esboçar um experimento no qual a senhora que insistira haver diferença seria servida com uma
seqüência de xícaras, algumas com o leite servido sobre o chá, e outras com o
chá servido sobre o leite.
Quase posso ouvir alguns leitores menosprezando esse esforço como
momento menor de uma conversa em tarde de verão. “Que diferença faz se a
senhora consegue distinguir uma infusão da outra?”, perguntarão. “Nada existe
de importante ou de grande mérito científico nesse problema”, argumentarão
com desprezo. “Essas cabeças privilegiadas deveriam usar sua poderosa capacidade cerebral para algo que beneficiasse a humanidade.”
Lamento, mas, apesar do que os não-cientistas possam pensar sobre a
ciência e sua importância, minha experiência leva-me a acreditar que a maioria dos cientistas se empenha em suas pesquisas porque está interessada nos
resultados e porque obtém estímulo intelectual com suas tarefas. Raras vezes
os bons cientistas pensam a respeito da importância de seu trabalho. Assim foi
naquela ensolarada tarde em Cambridge. A senhora poderia ou não estar certa
sobre o paladar do chá. A graça estava em encontrar um modo de afirmar se
estava certa, e, sob a direção do homem de cavanhaque, começaram a discutir
como poderiam fazer isso.
17
18
Uma senhora toma chá...
Entusiasmados, vários deles se envolveram no experimento e em poucos
minutos estavam servindo diferentes padrões de infusão sem que a senhora os
pudesse ver. Então, com ar de objetividade, o homem de cavanhaque ofereceulhe a primeira xícara. Ela tomou um pequeno gole e declarou que, naquela, o
leite fora colocado sobre o chá. Ele anotou a resposta sem comentários e lhe
passou a segunda xícara...
A natureza cooperativa da ciência
Ouvi essa história no final dos anos 1960, contada por um homem que lá estivera
naquela tarde, Hugh Smith, cujos trabalhos científicos eram publicados sob o
nome de H. Fairfield Smith. Quando o conheci, era professor de estatística na
Universidade de Connecticut, na cidade de Storrs, onde eu completara meu
doutorado em estatística dois anos antes. Depois de lecionar na Universidade
da Pensilvânia, eu ingressara no Departamento de Pesquisa Clínica da Pfizer,
Inc., uma grande empresa farmacêutica, cujo campus de pesquisa em Groton,
Connecticut, estava a uma hora de carro de Storrs. Na Pfizer, eu lidava com
muitos problemas matemáticos difíceis; na época, era o único estatístico, e
precisava discutir esses problemas e minhas “soluções” para eles.
Trabalhando na Pfizer, eu me dera conta de que poucas pesquisas científicas podem ser desenvolvidas por uma só pessoa; habitualmente elas exigem a
combinação de algumas cabeças pensantes, porque é muito fácil cometer erros.
Quando eu propunha uma fórmula matemática como meio de resolver um
problema, o modelo podia ser inadequado, ou talvez eu tivesse introduzido uma
premissa incorreta sobre a situação, ou a “solução” que eu encontrara poderia
ter sido derivada do ramo errado de uma equação, ou eu poderia ter cometido
um mero erro de cálculo.
Sempre que visitava a universidade em Storrs, para falar com o professor
Smith, ou quando discutia problemas com os cientistas e farmacologistas da
Pfizer, as questões que eu trazia em geral eram bem recebidas. Eles participavam
dessas discussões com entusiasmo e interesse. O que faz a maioria dos cientistas
se interessar por seu trabalho é, quase sempre, o desafio do problema: a expectativa da interação com outros os alimenta enquanto examinam uma questão
e tentam entendê-la.
Download

UMA SENHORA TOMA CHÁ…