ESTATÍSTICA Prof.: Antonio Edson Martins de Oliveira Fortaleza, 05/11/2015 EMENTA • Fundamentos de Estatística • Conceitos Básicos • Variáveis EMENTA • Distribuições de Freqüência - Dados brutos - Rol - Amplitude total - Número de classes (K) - Amplitude dos dados - Limite das Classes - Pontos Médios (xi) - Freqüências absolutas e freqüências relativas EMENTA • Distribuição de freqüências para variáveis quantitativas discretas • Distribuição de freqüências para variáveis quantitativas contínuas • Curvas de Freqüência • Medidas de Tendência Central - Média - Mediana - Moda EMENTA • Medidas de Dispersão - Amplitude Total - Desvio Médio - Coeficiente de Variação - Variância (δ2) - Desvio Padrão (δ) EMENTA • Probabilidade - Experimentos Determinísticos e Aleatórios - Espaço amostral - Evento EMENTA • Definição Clássica de Probabilidade - Operações com Eventos Aleatórios - Teoria dos Conjuntos * União de conjuntos * Intersecção de conjuntos * Probabilidade Condicional * Independência Estatística * Eventos Mutuamente Exclusivos ou Disjuntos INTRODUÇÃO “Por serem mais precisos do que as palavras, os números são particularmente mais adequados para transmitir as conclusões científicas.” (PAGANO e GAUVRE 2004 ) INTRODUÇÃO No entanto tal como se pode mentir com palavras, pode-se fazer o mesmo com números. INTRODUÇÃO É atribuída ao primeiro ministro Britânico Benjamin Dissaeli a seguinte frase: “Existem 3 tipos de mentiras: mentiras, mentiras condenáveis e estatísticas.” INTRODUÇÃO “É fácil mentir com a estatística, mas é mais fácil mentir sem ela.” INTRODUÇÃO • A Estatística é a ciência que engloba os conceitos de organização, descrição, análise e interpretação dos dados. • É usada e útil para pesquisas onde deseja-se planejamento ótimo, obter indicações de qualidade, coleciona-se informações ou dados, e para auxiliar na interpretação e conclusões sobre o fenômeno em questão. INTRODUÇÃO • Pelo próprio conceito de ciência, a atividade de pesquisa científica deve começar à partir de um problema sobre o fenômeno, e não apenas de observações ou coleta de dados. INTRODUÇÃO A importância da estatística em uma pesquisa: • Fornece meios de planejar experimentos com resultados mais significantes; • Permite uma fenômeno; descrição mais exata do INTRODUÇÃO • Força um raciocínio e procedimentos mais exatos; • Ajuda a resumir um conjunto de resultados de modo claro e conveniente; • Ajuda a obter conclusões gerais, podendo-se inclusive concluir com certo grau de certeza; INTRODUÇÃO • Ajuda a predizer o que acontecerá, sob certas condições laboratoriais; • Ajuda a analisar e identificar fatores causais em eventos complexos e confusos; INTRODUÇÃO • É razoável supor que para fazer a análise e interpretação dos dados observados, deva-se primeiramente proceder à sua organização e descrição. INTRODUÇÃO Podemos dividir a ciência Estatística em duas partes: • Estatística Descritiva, que trabalha com a organização e descrição dos dados experimentais; • Estatística Indutiva ou Inferencial, que cuida de sua análise e interpretação; INTRODUÇÃO • A Estatística Indutiva, cujas técnicas serão objetos deste estudo, utilizam dois conceitos fundamentais: o de população, ou universo, e o de amostra. INTRODUÇÃO amostra população, ou universo INTRODUÇÃO • Uma população ou universo é um conjunto de elementos com pelo menos uma característica comum. Uma amostra é, pois, um subconjunto de uma população, necessariamente finito. INTRODUÇÃO Um estudo estatístico completo que recorra às técnicas da Estatística Indutiva irá envolver também, direta ou indiretamente, tópicos de Estatística Descritiva, Cálculo de Probabilidades e Amostragem Estatística Inferencial Estatística Descritiva ESTATÍSTICA DESCRITIVA • Variáveis É necessário, inicialmente, que se defina qual(is) a(s) características dos elementos que deverá(ão) ser verificada(s). Ou seja, não se trabalha estatisticamente com os elementos existentes, mas com alguma(s) característica(s) desses elementos. ESTATÍSTICA DESCRITIVA • A escolha da variável (ou variáveis) de interesse dependerá dos objetivos do estudo estatístico em questão. Esta característica (variável) poderá ser qualitativa ou quantitativa. ESTATÍSTICA DESCRITIVA • A variável será qualitativa quando resultar de uma classificação por tipos ou atributos, • A variável será quantitativa quando seus valores forem expressos em números. Pode ser subdivida em: quantitativa discreta: pode assumir pertencentes a um conjunto enumerável; apenas valores quantitativa contínua: pode assumir qualquer valor em um certo intervalo de variação. ESTATÍSTICA DESCRITIVA • Exemplos de variável quantitativa: discretas: número de filhos, número de bactérias por litro de leite, número de cigarros fumados por dia. contínuas: peso (balança), altura (régua), tempo (relógio), pressão arterial, idade. ESTATÍSTICA DESCRITIVA • Variáveis qualitativas: nominais: não existe ordenação dentre as categorias. Exemplos: sexo, cor dos olhos, fumante/não fumante, doente/sadio. ordinais: existe uma ordenação entre as categorias. Exemplos: escolaridade (1o, 2o, 3o graus), estágio da doença (inicial, intermediário, terminal), mês de observação (janeiro, fevereiro,..., dezembro). ESTATÍSTICA DESCRITIVA • Para atingir os objetivos da Estatística descritiva, os dados observados são muitas vezes sintetizados e apresentados em formas de tabelas ou gráficos. ESTATÍSTICA DESCRITIVA • Uma das tabelas mais utilizadas na estatística é a distribuição de freqüências. TABELA 1.1 – Número de microrganismos em 50 amostras extraídas de uma lagoa de tratamento de resíduos industriais após a inserção de um novo bactericida durante 5 dias. Tempo (dias) Freqüência (UFC/mL) Freqüência relativa 0 15 0,30 1 10 0,20 2 13 0,26 3 6 0,12 4 3 0,06 5 3 0,06 Total 50 1,00 ESTATÍSTICA DESCRITIVA • Chamamos de distribuição de freqüências à associação das freqüências aos respectivos valores observados. Portanto, a representação acima caracteriza uma. ESTATÍSTICA DESCRITIVA • Do mesmo modo, podemos definir freqüência relativa de um valor observado como sendo a relação: ESTATÍSTICA DESCRITIVA • Verifica-se facilmente que: ESTATÍSTICA DESCRITIVA • A representação gráfica de uma distribuição de freqüência de uma variável quantitativa discreta é denominada gráfico de freqüências ESTATÍSTICA DESCRITIVA • Tomando-se os dados do exemplo anterior podemos calcular as freqüências, freqüências acumuladas e freqüências relativas acumuladas dos diversos valores. Esse cálculo está ilustrado na Tabela: Tempo (dias) Freqüência (UFC/mL) Freq. relativa Freq. Relativa Acumulada 0 15 0,30 0,30 1 10 0,20 0,50 2 13 0,26 0,76 3 6 0,12 0,88 4 3 0,06 0,94 5 3 0,06 1,00 Total 50 1,00 - ESTATÍSTICA DESCRITIVA • Com os dados acima podemos construir o gráfico de freqüências relativas e freqüências relativas acumuladas. ESTATÍSTICA DESCRITIVA • Distribuição de freqüências para variáveis quantitativas contínuas. • as variáveis contínuas, por definição, têm os seus valores definidos num intervalo contínuo dos números reais. ESTATÍSTICA DESCRITIVA • Representação da distribuição de freqüência para a variável contínua "Diâmetro do halo de inibição". Diâmetro (mm) Freqüência Freq. relativa 151 –159 2 0,04 159 – 167 11 0,22 167 – 175 18 0,36 175 – 183 10 0,20 183 – 191 8 0,16 191 - 199 1 0,02 Total 50 1,00 ESTATÍSTICA DESCRITIVA • as freqüências são associadas a intervalos de valores (classes de freqüências) e não mais a valores individuais da variável em estudo. ESTATÍSTICA DESCRITIVA • o polígono de freqüências acumuladas. Ele é construído unindo-se as freqüências acumuladas ao final de cada classe de freqüências. • Pode ser construído também com as freqüências relativas acumuladas e, neste caso, ele se chama polígono de freqüências relativas acumuladas. ESTATÍSTICA DESCRITIVA • Diâmetro (mm) dos halos de inibição de 50 cepas submetidas a bacteriocina nisina inoculadas em placas de Petri. Diâmetro (mm) Cepas <151 0 <159 2 <167 13 <175 31 <183 41 <191 50 ESTATÍSTICA DESCRITIVA • Histograma freqüência acumulada ESTATÍSTICA DESCRITIVA • Curvas de Freqüência Tipos de curvas de freqüência: As curvas de freqüência aparecem, na prática, sob diversas formas características ESTATÍSTICA DESCRITIVA • • Medidas de Tendência Central As medidas mais comuns são: média, mediana, moda Média A média de um conjunto de N números X1;X2;...;XN é representada por Ẋ e definida por: ESTATÍSTICA DESCRITIVA Média De modo geral, para dados agrupados, temos: onde: xi é o ponto médio da classe i; e m é número de classes. ESTATÍSTICA DESCRITIVA Mediana A mediana de um conjunto de números, ordenados em ordem de grandeza, é o valor médio (N impar) ou a média aritmética dos dois valores centrais (N par). Exemplos: {3; 4; 4; 5; 6; 8; 8; 8; 10} tem mediana 6 {5; 6; 7; 9; 11; 12; 13; 17} tem mediana 10 ESTATÍSTICA DESCRITIVA Moda A moda é o valor que ocorre com mais freqüência. A moda pode não existir e, mesmo que exista, pode não ser única. Exemplos: {1; 1; 3; 3; 5; 7; 7; 7; 11; 13} tem moda 7 {3; 5; 8; 11; 13; 18} não tem moda {3; 5; 5; 5; 6; 6; 7; 7; 7; 11; 12} tem duas modas 5 e 7 (bimodal) ESTATÍSTICA DESCRITIVA Medidas de Dispersão O grau ao qual os dados numéricos tendem a dispersar-se em torno de um valor médio chama-se variação ou dispersão dos dados. As medidas mais comuns são: amplitude total, desvio médio, desvio padrão e variância. ESTATÍSTICA DESCRITIVA • Amplitude Total É a diferença entre o maior e o menor valor Exemplos: A amplitude total de {4; 7; 9; 11; 11; 15; 20} é 16