Introdução e Generalidades Júlio Osório 1 Introdução Objectivos 1. Definir Estatística. 2. Descrever as utilizações da Estatística. 3. Caracterizar Estatística Descritiva e Estatística Inferencial. 4. Definir população, amostra, variável, parâmetro e estatístico. 5. Comparar as fontes de dados. 6. Explicar os tipos de dados. 2 Introdução 1 O que é a Estatística? 1. Ramo das Matemáticas Aplicadas: é a Matemática aplicada aos dados da observação e da experimentação. 2. Ciência dos dados: corpo de métodos usados para recolher e interpretar dados de uma investigação científica, e para tirar conclusões em situações em que a incerteza e a variação estão presentes. 3 Introdução O que a Estatística não é: 1. Mera compilação de dados sobre um fenómeno ou situação (“estatísticas” do fenómeno). 2. Técnica especialmente imaginada para justificar opiniões pré-concebidas pelo cientista. 3. Panaceia para remediar experiências mal concebidas ou mal conduzidas. 4. Substituto do raciocínio teórico específico de cada domínio científico de investigação. 4 Introdução 2 A Estatística envolve: A recolha dos dados. A classificação dos dados. A condensação e apresentação dos dados. A redução dos dados. A análise dos dados. A interpretação dos dados. A redacção de conclusões sobre o estudo. 5 Introdução Níveis de Estudo da Estatística Estatística Estatística Matemática Estatística Aplicada 9 Introdução 3 Níveis de Estatística Estudo da Teoria Estatística: ramo das Matemáticas; Estatística Matemática. Estatística Aplicada: aplicação dos procedimentos criados pela Estatística Matemática à análise dos dados obtidos em situações concretas da investigação científica. Este é um curso de Estatística Aplicada! 10 Introdução Campos da Área Estatística Métodos Estatísticos Estatística Descritiva Estatística Inferencial 14 Introdução 4 Estatística Descritiva Dados de Michelson sobre a velocidade da luz no ar 1. Envolve: – Recolha dos dados – Condensação e apresentação dos dados. – Redução dos dados 30 20 Frequência 10 0 299,575 299,675 299,625 • 2. Objectivo: – Descrever os dados. 299,775 299,725 299,875 299,825 299,975 299,925 300,075 300,025 300,125 velocidade da luz (milhares km/s) Ӯ = 24,63 ; s2=2,85 15 Introdução Estatística Inferencial 1. Envolve: – Generalizações dos dados (amostra) para a respectiva fonte (população). – Estimativas e Testes de Hipóteses. População? • 2. Objectivo: –Tomar decisões sobre as características da população. 16 Introdução 5 Conceitos fundamentais 1. População: totalidade dos objectos de interesse. População 2. Variável: característica acerca da qual os indivíduos da população exibem diferenças. 22 3. 4. 5. Amostra: parte da população que é seleccionada para estudo. 21 21 22 24 Amostra Parâmetros: medidas estatísticas respeitantes à população. Estatísticos: medidas estatísticas calculadas na amostra. Introdução 21 23 23 Média da população, µ, é 22,2 23 anos Média amostral, Ӯ, é 23 anos Idade 24 Proveniência dos Dados Fontes de Dados Primárias Experiências Inquéritos Observação Secundárias Publicações 32 Introdução 6 Tipos de Variáveis e Escalas de Medida Variáveis Quantitativas Escala de Intervalo Escala de Razão Qualitativas Escala Nominal Escala Ordinal 38 Introdução O que é a medição? Processo de atribuição de números a objectos ou acontecimentos de acordo com um conjunto bem definido de regras. Implica a utilização de escalas de medida, distintas consoante o tipo de variável que esteja a ser estudado. Os “números” resultantes da medição são os dados, o material “em bruto” que vai ser objecto de tratamento estatístico. 39 Introdução 7 Variáveis Qualitativas Os indivíduos ou objectos que estão a ser estudados apenas podem ser enquadrados numa de um certo número de categorias, definidas com base num atributo. As categorias de um caracter qualitativo têm de ser: – mutuamente exclusivas – colectivamente exaustivas. 40 Introdução Escalas de Medida para Dados Qualitativos Variáveis Qualitativas Escalas Nominais Escalas Ordinais 41 Introdução 8 Escala Nominal Os indivíduos (ou objectos) são enquadrados em categorias que não têm qualquer ordenação lógica (nãoordenadas). Dados dois indivíduos (ou objectos), apenas se pode afirmar se eles são iguais ou diferentes, mas não que um deles é “superior” ou “inferior” ao outro. 42 Introdução Exemplos: Escalas Nominais Dicotomias: – – – – – – masculino/feminino. presente/ausente. jovem/adulto. vivo/morto. solteiro/casado. fumador/não-fumador. Fenótipos genéticos: – côr do cabelo (louro, castanho, branco, preto, etc.) – côr dos olhos (verdes, negros, azuis, castanhos, etc.) Raça: – Caucasiana, Afro-Americana, Asiática, etc. 43 Introdução 9 Escala Ordinal Os indivíduos (ou objectos) são enquadrados em categorias que podem ser ordenadas ou escalonadas de uma forma objectiva e lógica. Dados dois indivíduos (ou objectos), podese afirmar que um deles é “maior”, “menor” ou “mais qualquer coisa” que o outro, sem que todavia consigamos especificar “quanto”. 44 Introdução Exemplos: Escalas Ordinais Postos de carreiras profissionais: – carreira académica (assistente < Prof. Auxiliar < Prof. Associado< Prof.Catedrático). – carreira militar (alferes < tenente < capitão < major <…) Escalas de gravidade de uma patologia: – ausente < suave < moderada < severa < grave < muito grave. Opinião dos estudantes sobre a obrigação do Estágio: – contra < neutro < favor. 45 Introdução 10 Escalas de Medida para Dados Quantitativos Variáveis Quantitativas Escalas de Intervalo Escalas de Razão 46 Introdução Escala de Intervalo Dados dois indivíduos (ou objectos), permite-nos afirmar “quanto” é que um deles é superior/inferior ao outro. Tem uma origem da escala (“ponto zero” ) e uma unidade de graduação da escala convencionados. 47 Introdução 11 Exemplos: Escalas de Intervalo Escalas Celsius e Fahrenheit de medida da temperatura. Na Escala Celsius : – o zero (0ºC) é a temperatura de congelação da água (uma convenção). – A unidade de graduação (ºC) é a centésima parte do intervalo entre as temperaturas de congelação e de ebulição da água (outra convenção). 48 Introdução Escala de Razão Dados dois indivíduos (ou objectos), permite-nos afirmar “quanto” é que um deles é superior/inferior ao outro. Tem uma “ponto zero” verdadeiro (com significado físico). 49 Introdução 12 Exemplos: Escalas de Razão Escala Kelvin de medida das temperaturas absolutas (0ºK indica total ausência de calor, não é uma convenção). outras : – – – – – – alturas. comprimentos. pesos. capacidades. tempo. taxas. 50 Introdução Escala de Intervalo vs. Escala de Razão Escala de Intervalo - a razão entre dois pontos quaisquer não é independente da unidade de medida adoptada: 50ºC/20ºC=1,5 122ºF/68ºF=1,8 Escala de Razão - a razão entre dois pontos quaisquer é independente da unidade de medida adoptada: 75 kg/50 kg=1,5 165,3 libras/110,2 libras=1,5 51 Introdução 13 Classificação das Variáveis Quantitativas Variáveis Quantitativas Discretas Contínuas 52 Introdução • Variáveis Discretas Só assumem determinados valores (existem lacunas entre os valores possíveis). • Variáveis Contínuas Teoricamente, podem assumir qualquer valor de um intervalo real: tudo depende de se dispôr do instrumento de medida com a sensibilidade apropriada. 53 Introdução 14 • Varável Discreta -- Lacunas entre os valores 0 1 2 3 4 5 6 7 • Variável Contínua -- Teoricamente, não há lacunas entre os valores 0 1000 54 Introdução Exemplos: Variáveis Discretas Número de carros estacionados num parque. Número de alunos presentes numa aula. Número de folhas de uma planta. Número de ovos postos por uma galinha. Em geral, os dados de natureza discreta provêm de actos de contagem. 55 Introdução 15 Exemplos: Variáveis Contínuas Nível de colesterol no sangue. Altura de uma pessoa. Produção de alfarroba/hectare de terreno. Tempo necessário para completar o teste de Estatística. Em geral, os dados de natureza contínua provêm de actos de medição. 56 Introdução Natureza do Raciocínio Estatístico Na maior parte dos estudos científicos, é difícil ou até mesmo impossível observar/medir toda a população. Temos então de nos basear em amostras para fazer estimativas ou inferências relativas à população. 57 Introdução 16 Natureza do Raciocínio Estatístico População parâmetros: µ e σ2 seleccionar Amostra estimar descrever calcular estatísticos: Ӯ, s2 58 Introdução Qual a proporção de sementes que vai originar plantas com flores vermelhas e azuis? Uma tulha de madeira com 10 milhões de sementes! 59 Introdução 17 Qual a proporção de sementes que vai originar plantas com flores vermelhas e azuis? 1ª solução: semear todas as sementes e contar as vermelhas e as azuis. Tipo de Resposta: categórica, sem erro, mas trabalhosa, morosa, onerosa e não factível. 60 Introdução Qual a proporção de sementes que vai originar plantas com flores vermelhas e azuis? 2ª solução : semear uma parte (amostra),contar vermelhas e azuis, predizer o que se passará no todo (população). Tipo de Resposta: predição ou avaliação probabilística, rodeada de uma certa margem de erro, mas factível. 61 Introdução 18 Natureza do Raciocínio Estatístico O raciocínio estatístico é de tipo indutivo: – parte ⇒ todo – amostra ⇒ população A prova estatística produz conclusões com um certo grau de incerteza (erro). O Cálculo das Probabilidades é o instrumento de medida do grau de incerteza que rodeia as conclusões da Estatística. 62 Introdução 19