ESTATÍSTICA ? PRA QUÊ ? ESTATÍSTICA • No sentido comum – representa uma coleção de dados numéricos: – Resumir o desempenho de um time de futebol durante uma temporada; – Relacionar nascimentos em uma cidade; – Índices PIB, IPC ESTATÍSTICA • Vem do latim “status” = Estado • inicialmente envolvia: – compilações de dados e gráficos representativos dos vários aspectos de um estado ou país. • taxa de mortalidade, • taxa nascimento, • renda, • taxas de desemprego, etc. ESTATÍSTICA • É uma coleção de métodos para: – planejar experimentos, – obter dados, – organizar, – resumir, – analisar – concluir sobre as informações coletadas Estatística • Ramo da matemática que analisa dados estatísticos – Estatística Descritiva – Inferência Estatística • Ouvimos falar em estatísticas: – do movimento da Bolsa de Valores – da Saúde Pública – do crescimento da população, etc. • Essa noção prende-se normalmente apenas à parte de ORGANIZAÇÃO E DESCRIÇÃO dos dados observados. Estatística • Há ainda outro campo de atuação da Estatística que se refere à ANÁLISE E INTERPRETAÇÃO desses dados. • OBJETIVO: – utiliza os conceitos como auxílio nas tomadas de decisão diante de incertezas – justifica cientificamente as decisões Estatística • UTILIZAÇÃO: aplicável a qualquer ramo do conhecimento onde se manipulem dados numéricos: – – – – Física Química Biologia Engenharia Ciências Sociais Ciências Administrativas, etc. Economia Medicina Estatística • Estatística pode ser dividida em duas partes: – .Estatística Descritiva - cuida da: • Organização • descrição dos dados experimentais; – .Estatística Indutiva - cuida da: • análise • interpretação dos dados STRESS • Mecanismo que põe em alerta as funções corporais; • prepara a pessoa para a ação; • PEQUENAS DOSES: melhora desempenho; • CRÔNICO: mal à saúde. STRESS • ESTÁGIOS: • 1) ALERTA: – percepção do perigo; – organismo se prepara para o confronto. – Isto ocorre através de descargas extras de hormônios na corrente sangüínea. – Principal é a adrenalina STRESS • 2. CRÔNICO: – sistema imunológico entra em colapso; – abre espaço à doenças oportunistas; – aumenta risco de males cardíacos e danos às estruturas cerebrais. STRESS - níveis de tensão (médico americano) • • • • • • Morte de filho........................123 pontos Morte de cônjuge...................119 pontos Morte dos pais ou irmãos......101 pontos divórcio................................. 96 pontos doença grave......................... 74 pontos demissão no emprego........... 74 pontos profissões campeãs de stress • 1) policiais e seguranças privados • 2) controladores de vôo e motoristas de ônibus urbano; • 3) executivos, trabalhadores de área de saúde, de atendimento ao público e bancários • 4) jornalistas Usos da Estatística • AARP (Associação Americana de Aposentados) alega que os motoristas mais idosos se envolvem em menor número de acidentes do que os mais jovens. idade nº de acidentes 16 - 19 anos 1.500.000 Mais de 70 anos 540.000 • A alegação da AARP é válida ? Usos da Estatística idade taxa de acidentes 16 - 19 anos 8,6 75 - 79 anos 4,6 80 - 84 anos 8,9 Mais de 85 anos 20,3 • embora os motoristas mais novos tenham maior número de acidentes, os mais velhos apresentam as mais altas taxas de acidente Abusos da Estatística • Segundo Benjamin Disraeli: “Há três tipos de mentira: as mentiras, as mentiras sérias e a estatística” • Outro provérbio: “Os números não mentem; mas os mentirosos forjam os números” • “se torturarmos os dados por bastante tempo, eles acabarão por admitir qualquer coisa” Abusos da Estatística • Andrew Lang (historiador): algumas pessoas usam a estatística como um bêbado usa um poste de iluminação - para servir de apoio e não para iluminar Exemplo: 33% dos acidentes de trânsito envolvem pessoas embriagadas... Portanto, 67% estão completamente sóbrias, Conclusão: devemos, então, dirigir totalmente bêbados ?? Abusos da Estatística • Números precisos: – a área do território brasileiro é de 8.547.403,2574 metros quadrados – a idade de uma peça de museu é de 10 mil e três anos. • Números precisos: (palpites) – Quando o Papa visitou Miami, fontes informaram uma estimativa de 250 mil pessoas. Através de fotos aéreas e grades, estimaram em 150 mil pessoas Abusos da Estatística • Porcentagens distorcidas: – Uma Cia aérea anuncia a melhoria dos serviços. – Houve uma melhora de 100% nos últimos meses em relação à bagagem extraviada. – Não se extravia mais bagagens? • Perguntas tendenciosas – quando as perguntas são feitas de modo a sugerir uma resposta. – Você gosta do refrigerante “X”? – De qual refrigerante você gosta? Abusos da Estatística • Pressão do pesquisador: – Perguntas feitas a indivíduos pesquisados, estes normalmente dão respostas favoráveis à sua autoimagem. – Em uma pesquisa telefônica 94% dos entrevistados responderam que lavam suas mãos após usar um banheiro, mas a observação em lugares públicos confirmaram apenas em 68% dos indivíduos. • Más amostras – métodos inadequados para coleta de dados. – Existem técnicas de amostragem. Estatística • Conceitos fundamentais: – POPULAÇÃO – AMOSTRA População (Universo Estatístico) • conjunto de elementos com pelo menos uma característica comum. • Esta característica deve delimitar quais os elementos que pertencem à população e quais os que não pertencem. • Exemplo:Vamos estudar o desempenho dos estudantes em 2008. – POPULAÇÃO = todos os estudantes de 2008 População • Pode ser: – FINITA: onde o número de unidades a observar pode ser contado e é limitado. Ex • alunos matriculados nas escolas públicas • pessoas portadoras de aparelho telefone celular • pacientes da clínica de fisioterapia/terapia ocupacional “Dom Bosco” de Lins População – INFINITA: onde a quantidade de observação é ilimitada, ou as unidades da população não podem ser contadas. Ex: • conjunto de medidas de determinado comprimento, • gases, líquidos, onde as unidades não podem ser identificadas ou contadas. População - Universo Estatístico • Mas a quem interessa este resultado? • Se o analista dos resultados for o responsável pelo curso FISIOTERAPIA e T.O., será que interessa a ele o desempenho dos alunos de Administração e Ciências Contábeis? • Devemos procurar as características que interessam ao analista dos resultados População - Universo Estatístico • Os alunos da Enfermagem em 2008 • Os alunos da Enfermagem em 2008 que cursam o 3º termo • a cada item, estamos especificando cada vez mais as características das pessoas a serem observadas, restringindo a “população” objeto de nossos estudos. População - Universo Estatístico • uma vez definida as características da POPULAÇÃO – o passo seguinte é o levantamento de dados da População acerca das características objeto de estudo. • Mas será que SEMPRE SERÁ POSSÍVEL possível o levantamento de dados de toda a população que devemos analisar? Fatores que influenciam o levantamento de uma população • TEMPO: as informações devem ser obtidas com rapidez PRECISÃO: as informações devem ser corretas CUSTO: no processo de coleta, sistematização, análise e interpretação, o custo deve ser o menor possível. Amostra • Outros motivos para se tomar uma amostra – Exame de doença contagiosa: o pesquisador poderia infectar-se e começar a transmitir a doença a todos os entrevistados. – Testes destrutivos – exame de sangue de um paciente – trabalho extenso: anotações erradas Amostra • Devemos então delimitar nossas observações a uma parte da população, isto é, a uma amostra proveniente dessa população. • AMOSTRA: É um subconjunto de uma população, necessariamente finito, pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado. Amostra • A Estatística Indutiva tira conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações. • A partir do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo. • Logicamente a indução não traz resultado exato, dando margem a erro. Amostra • A Estatística Indutiva, entretanto, irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade. Amostra • Quanto maior a amostra, mais confiáveis serão as induções ? • erros grosseiros e conclusões falsas podem ocorrer devido a falhas na amostragem. Amostragem • Classificação quanto aos fatores em estudo: – OBSERVACIONAL: o analista não há controle sobre os fatores em estudo. • Ex: Pesquisa eleitoral – DE EXPERIMENTO: o analista têm o controle sobre os fatores em estudo. • O analista pode modificar situações do ambiente de estudo. Utilizado em pesquisas científicas. Variável • Qual a primeira pergunta que se deve fazer quando pretende-se fazer uma pesquisa científica? Qual é a variável que queremos estudar? Variável • portanto, é necessário que se tenham bem definidas quais características deverão ser verificadas. Ex.: Alunos da FITEO. (Universo Estatístico ou População). • Dentro da população, é preciso definir quais as características que nos interessa averiguar. Ex. idade, sexo, estado civil, etc. • A escolha da variável dependerá dos objetivos do estudo estatístico. Variável • é o conjunto de resultados possíveis de um fenômeno. • é a característica ou propriedade da população que está sendo medida. Ex.: – População: moradores de uma cidade – Variável : número de filhos – População: alunos de Administração – Variável : sexo Variável – População: – Variável : • • • • • moradores de um prédio peso CLASSIFICAÇÃO DA VARIÁVEL pode ser: A) QUANTITATIVA A 1 - DISCRETA A.2 - CONTÍNUA B) QUALITATIVA VARIÁVEIS • QUALITATIVAS: quando a variável é não numérica ou definida através de atributos, categorias. Ex: – – – – sexo plano de saúde tipo de doença raça Variáveis • QUANTITATIVA: quando pode ser expressa em números. Ex: – – – – quantidade de valores de notas de uma moeda quantidade de sabores de refresco duração de uma bateria de telefone celular número de ossos existentes em um animal Variáveis Quantitativas • DISCRETAS: – quando os valores podem assumir apenas determinados valores e resultam de uma contagem. – O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável. Ex: • valores das cédulas da moeda brasileira • número de filhos dos casais de Lins Variáveis Quantitativas • CONTÍNUAS – quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor. – Obtido por medição. Ex; • peso de um paciente • altura • tempo de vôo entre duas cidades ESCALA DE MEDIÇÃO DAS VARIÁVEIS • 1. ESCALA NOMINAL: – dão nome a uma categoria ou classe. – Não há hierarquia entre os nomes Ex: procedência - de que cidade (Lins, Promissão, etc.) plano de saúde: UNIMED, São Lucas, etc... ESCALA DE MEDIÇÃO DAS VARIÁVEIS • 2. ESCALA ORDINAL: – dão nome e uma ordem a uma categoria ou classe; Ex: Grau de instrução: 1: sem instrução; 2: primeiro grau; 3: segundo grau, 4: superior; 5: mestre; 6: doutor. • embora 3 seja maior do que 2, não significa que 3 + 2 = 5. • Não é possível quantificar o quanto o nível 3 é melhor do que 2 ou o 4 é melhor do que 3. ESCALA DE MEDIÇÃO DAS VARIÁVEIS • ESCALA INTERVALAR: elimina a limitação da escala ordinal estabelecendo intervalos iguais com o mesmo significado. Ex: na medição de temperatura tanto de 25º a 30º o aumento é de 5º, como o aumento de temperatura tanto de 30º a 35º o aumento é de 5º. Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º da escala de temperatura é arbitrário. • ESCALA PROPORCIONAL: Apresenta um ZERO absoluto. Ex: peso. Peso Zero = ausência de peso. 60 kgs é o dobro de 30 kgs. Variáveis DEPENDENTES E INDEPENDENTES • Variável Independente: – é a que influencia, determina ou afeta outra variável; – referida como fator determinante, condição ou causa para ocorrência de determinada resposta. • Variável dependente: – a sua resposta varia em virtude dos diferentes valores que a variável independente pode assumir; – modificando-se a variável independente, altera-se o valor da variável dependente. Variáveis DEPENDENTES E INDEPENDENTES • Variável Independente (VI): é o antecedente; • Variável dependente(VD): é o conseqüente Variável Independente Idade dos animais Deficiência alimentar Maior pigmentação na pelagem dos animais Variável Dependente comprimento Dific. De aprendizagem Menor adaptação em climas quentes Variáveis DEPENDENTES E INDEPENDENTES • Como detectar se uma variável é dependente ou independente ? • Critério de sucetibilidade à influência: – Variável dependente é alterada ou influenciada pela variável independente: – Ex: dependente: predisposição a problemas cardíacos independente: sexo Variáveis DEPENDENTES E INDEPENDENTES • Critérios para identificar o sentido de influência entre as variáveis dependente e independente ? • 1) Ordem temporal: – o que ocorre depois não pode influenciar o que aconteceu antes. Ex: V. independente V. dependente Amamentação materna Maior resistência a do recém-nascido infecções na infância Hábito de fumar durante a gravidez Peso do recém-nascido Variáveis DEPENDENTES E INDEPENDENTES • 2) Fixidez: em Ciência Biológicas, muitas variáveis podem ser consideradas fixas, ou não saão sujeitas a influências. Ex: – suscetibilidade a certas doenças está associada ao sexo do indivíduo; – variáveis bioquímicas em animais e no homem são dependentes da idade. – Peso do recém-nascido está relacionado com a ordem de nascimento. CO-VARIÁVEIS • Em todo experimento existe: – variável dependente: a ser analisada; – variável independente: • que são fatores que influenciam os resultados da variável dependente; • determinam as condições sob os quais a variável dependente é obtida. CO-VARIÁVEIS • Qualquer outra variável que possa interferir no resultado deve ser mantido constante. • Isto é possível em procedimentos experimentais e não em processos não controlados. • Ex: Comparação de 2 tipos de cirurgias executadas na rotina hospitalar: CO-VARIÁVEIS • Variáveis como: idade e tempo da doença geralmente devem ser consideradas como co-variáveis. • Desta forma a comparação entre tratamentos pode ser efetuada sem que elas interfiram, – mascarando resultados – levando a conclusões erradas • Esta neutralização é obtida através de processos estatísticos adequados • Ex: Comparação da produção de leite entre vacas de uma mesma raça, alimentadas com duas rações diferentes. – O período de lactação que varia ao longo do experimento influencia a produção – esta influência deve ser adequadamente neutralizada, para que os resultados não sejam mascarados, levando a conclusões falsas. CO-VARIÁVEIS CONCLUSÃO CO-VARIÁVEL: é um fator que o pesquisador procura neutralizar intencionalmente em uma investigação, com a finalidade de impedir que interfira na análise da relação entre as variáveis independentes e dependentes Tabela Primitiva • Dado um levantamento de dados estatísticos de uma variável quantitativa, como por exemplo, a altura dos alunos da FITEO em 2004, que tenha dado os seguintes valores (em cm.): • 165 167 172 160 158 175 157 168 174 179 154 160 173 181 155 166 185 172 157 164 170 168 174 155 Tabela Primitiva • Notamos que a tabela não está numericamente organizada. • A esta tabela denominamos TABELA PRIMITIVA. • com os dados dispostos desta maneira é difícil fazer qualquer análise e tirarmos alguma conclusão a respeito deste levantamento. • Para facilitar a análise vamos dispor em uma ordem crescente ou decrescente. ROL • 154 155 155 157 157 158 160 160 164 165 166 167 168 168 170 172 172 173 174 174 175 179 181 185 • Concluímos que a menor estatura é de 154 e a maior é de 185. • A amplitude é de 185 - 154 = 31. • A leitura da tabela fica mais clara. • A esta tabela organizada denominamos ROL. Estatística • Resumindo: • TABELA PRIMITIVA: é a tabela onde o conjunto de elementos não foram numericamente ordenados. • ROL: a tabela onde os dados foram numericamente ordenados de forma crescente ou decrescente. Distribuição de Freqüência • Para facilitar a análise dos dados: – vamos ordenar em colunas colocando o número de vezes que aparece repetido. • TABULAR: é registrar quantas vezes o termo aparece no rol. • Este processo pode ser inconveniente, pois pode gera uma tabela muito extensa pela quantidade de valores diferentes no levantamento de dados Distribuição de Freqüência • Estaturas dos alunos de FITEO-2000 Altura freqüência 154 1 155 2 Altura freqüência 165 1 166 1 157 158 160 2 1 2 167 168 170 1 2 1 154 1 172 2 Fonte: Dados fictícios Distribuição de Freqüência • Estaturas dos alunos de FITEO-2004 Altura freqüência 173 1 174 2 175 179 181 1 1 1 185 1 total 24 Distribuição de Freqüência • Para facilitar a análise dos dados obtidos, agrupar os valores em intervalos de classes (principalmente para variáveis contínuas). • Assim dividimos nossa distribuição em INTERVALOS DE CLASSE • INTERVALO DE CLASSE: agrupar valores. é a forma de Distribuição de Freqüência ALUNOS DA FITEO DO ANO 2004 Altura freqüência 154 158.......... 5 158 162.......... 3 162 166.......... 2 166 170.......... 4 170 174.......... 4 174 178.......... 3 178 182.......... 2 182 186.......... 1 total......... 24 Fonte: Dados fictícios Distribuição de Freqüência • CLASSES DE FREQÜÊNCIA • São intervalos de variação da variável As classes são representadas simbolicamente por “ i ” Assim o intervalo 162 166 define a 3ª classe i = 3 A distribuição é formada por 8 classes Distribuição de Freqüência As classes são: 1ª classe: 2ª classe 3ª classe 4ª classe 5ª classe 6ª classe 7ª classe 8ª classe 154 158 162 166 170 174 178 182 158 162 166 170 174 178 182 186 Distribuição de Freqüência • LIMITES DE CLASSE • São os extremos de cada classe. Temos • li = limite inferior da classe • ls = limite superior da classe • Referente à 3ª classe temos: – 162 – 166 li = 162 inclui limite inferior lS = 166 exclui limite superior Distribuição de Freqüência • • • • • • FREQÜÊNCIA É o número de ocorrências em que uma única característica é observada. FREQÜÊNCIA SIMPLES ou ABSOLUTA (fi) São os valores que representam o número de dados de classe é resultante da contagem. Ex: Na 3ª classe a freqüência foi igual a 2, ou seja duas pessoas têm estatura entre 162 a 166 cm (exclusive). Distribuição de Freqüência • FREQÜÊNCIA ACUMULADA (Fac ou Fi ) • É o valor total (soma) das freqüências dos valores inferiores ao limite superior do intervalo de uma das classes. • FREQÜÊNCIA RELATIVA ( Fr ) • É dado pela razão da freqüência simples e a freqüência total. Fr = freqüência simples (f i) freqüência total Distribuição de Freqüência FREQÜÊNCIA RELATIVA PERCENTUAL (Fr %) Fr % = Fr x 100 PONTO MÉDIO ( PM ) • É o ponto que divide o intervalo de classe em duas partes iguais. PM = li + ls 2 Distribuição de Freqüência AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) • AT=limite superior máximo-limite inferior mínimo • No nosso exemplo AT = 186 - 154 = 32 AMPLITUDE DE UM INTERVALO DE CLASSE (h) h = limite superior da classe - limite inferior da classe h = ls - li