Probabilidade e estatísticaMat013 Professora - Hévilla Nobre Cezar [email protected] Mestre em Matemática Aplicada Universidade Federal de Itajubá – UNIFEI - ICE Ementa Estatística descritiva. Probabilidade. Distribuição de Probabilidade de variáveis. discretas e contínuas. Amostragem. Distribuição de amostras. Estimativa pontual e intervalar. Teste de Hipóteses. Correlação Linear e regressão. Objetivo Dominar os conceitos básicos de estatística e probabilidade, aplicando-os a situações rotineiras na área de trabalho; Usar pacotes gráficos e estatísticos para agilizar os resultados de uma análise de dados. Aprender como tratar estatisticamente os dados provenientes da área de trabalho. Bibliografia Magalhães, M. N. de; Lima, A. C. P., Noções de Probabilidade e Estatística, ed. EDUSP, edição (2004). Bussab, W. O.; Morettin, P.A.,Estatística Básica, Editora Saraiva, 4ª edição (1987). Triola, M.F., Introdução à Estatística, 7ª ou 8ª ed., ed.,LTC. Estatística Definição: é a ciência que investiga os processos de obtenção, organização e análise de dados sobre uma população, e os métodos de tirar conclusões ou fazer predições com base nesses dados. população = universo = espaço amostral Estatística Descritiva X Estatística Inferencial Estatística Estatística Descritiva S Estatística Estatística Descritiva 100 90 80 20 15 70 10 60 5 50 + + 0 classe 1 S Classes 10 - 20 20 - 30 30 - 40 40 - 50 50 - 60 60 - 70 70 - 80 80 - 90 90 - 100 100 - 110 110 - 120 120 - 130 F.A. 2 4 6 12 10 25 12 19 7 5 3 1 106 F.R. 0,02 0,04 0,06 0,11 0,09 0,24 0,11 0,18 0,07 0,05 0,03 0,01 classe 2 • média • moda • mediana • desvio médio • desvio padrão • assimetria Estatística Inferência estatística é a parte da metodologia da Ciência que tem por objetivo a coleta, redução, análise e modelagem dos dados, a partir do que, finalmente, faz-se a inferência para uma população da qual os dados foram obtidos. Importante - fazer previsões a partir das quais se podem tomar decisões. População e amostra População (universo) = conjunto de todos os possíveis valores de uma variável ou característica. Amostra = conjunto de observações extraída de uma população. Tipos de Variáveis Qualitativas – apresentam como possíveis realizações uma qualidade do indivíduo pesquisado Quantitativas – apresentam como possíveis realizações números resultantes de uma contagem ou mensuração Classificação de uma variável Nominal Qualitativa Ordinal Variável Quantitativa Discreta Contínua Software Estatístico Action Excel Minitab Apresentação Gráfica Para variáveis qualitativas Gráficos em barra Gráficos em setores (“pizza”) Apresentação Gráfica Para variáveis quantitativas existe uma variedade de representações gráficas Barras Colunas Gráficos de dispersão Histogramas Gráfico de Setores – para porcentagem 5% 15% 20% 1 2 3 35% 25% 4 5 Distribuição de freqüência Quando se estuda uma variável, o maior interesse é conhecer o comportamento dessa variável, analisando a ocorrência de suas possíveis realizações. Distribuição de freqüência Análise da variável – grau de instrução Grau de Freqüência instrução Fundamenta 9 Médio 8 Superior 3 Total 20 Proporção Porcentagem 0,45 0,40 0,15 45 40 15 1,00 100 Freqüência Freqüência( ni) – número de vezes que ocorre as realizações. Proporção ou freqüência relativa Uma outra medida importante para análise de uma variável, é a proporção de cada realização em relação ao total ni Proporção( f i ) - f i n onde n = número total de realizações Porcentagem A porcentagem é uma medida útil quando se quer comparar resultados de duas pesquisas distintas. Definição: Pi 100 f i Obs: a porcentagem é a freqüência de uma variável em um total de 100 realizações. Exemplo 1 Exemplo1 Exemplo Grau de instrução Freqüência Freqüência relativa Porcentagem Fundamental 9 0.45 45 Médio 8 0.40 40 Superior Total 3 20 0.15 1.000 15 100.00 Gráfico de freqüências freqüência 9 8 7 6 5 4 3 2 1 0 fundamental médio superior Medidas de tendência central Média, Mediana e Moda. Medidas de posição Utilizam-se as medidas de posição para representar o conjunto de dados. As medidas de posição central são: Esperança ou média Mediana Moda Média A Média aritmética de um conjunto de valores é o valor obtido pela soma dos valores dividida pelo número de total de valores do conjunto. x1 ... xn 1 x n n x – valores distintos de uma variável n - total de valores do conjunto n x i i 1 Média Quando os valores possuem freqüências diferentes, definimos a média da seguinte forma: x f1 x1 f 2 x2 ... f n xn n fx i i i 1 Onde, f i é a freqüência relativa xi é o valor da variável Mediana A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão dispostos em ordem crescente (ou decrescente). x n 1 2 m d( X ) x n x n 1 2 2 2 Se n ímpar Se n par Moda A moda de um conjunto de valores é o valor que ocorre com maior freqüência. Se dois valores ocorrem com mesma freqüência máxima, dizemos que o conjunto é bimodal. Se mais de dois valores ocorrem com mesma freqüência máxima, dizemos que o conjunto é multimodal. Exemplo – variável discreta Número Número de filhos 1 0 2 0 3 1 4 1 5 1 6 1 7 2 8 2 9 2 10 3 11 3 12 4 Moda = 1 Mediana = 1+2/2=1.5 Média = 20/12 = 1.666 Exemplo – variável contínua Classes de Salários Ponto médio Freqüência Freqüência relativa [4.00 , 8.00) [8.00 , 12.00) [12.00 , 16.00) [16.00 , 20.00) [20.00 , 24.00) 6.00 10.00 14.00 18.00 22.00 10 12 8 5 1 0,2778 0,3334 0,2222 0,1389 0,0278 Total - 36 1,0000 Moda = 10,00 Mediana = 10,00 Média = 6.00 x 0,2778 + 10.00 x 0,3334 + 14.00 x 0,2222 + 18.00 x 0.1389 + 22.00 x 0,0278 = 11,22 Outras medidas de posição Quartis, Decis e Percentis A média e a moda podem não ser medidas adequadas para representar um conjunto de dados, pois: São afetadas por valores extremos; Apenas com esses dois valores não temos idéia da simetria da distribuição dos dados. Para contornar esses fatos, consideramos outras medidas de posição. Quartis, Decis e Percentis São medidas de posição convenientes para comparar valores dentro de um mesmo conjunto de dados, ou entre conjuntos de dados diferentes. Quartis É uma medida de posição que divide as observações (ordenadas em ordem crescente) em quatro grupos. Dessa forma, temos três quartis denotados por Q1 , Q2 e Q3 . Quartis - separa os 25% inferiores dos 75% superiores dos valores ordenados Q1 Q2 - é a mediana - separa os 75% inferiores dos 25% superiores dos valores ordenados Q3 Decis É uma medida de posição que divide as observações em 10 grupos com cerca de 10% das observações em cada grupo. Demotamos os decis por: D1 - 10%, D2 - 20%, D3 - 30% , D4 - 40%, D5 - 50% , D6 - 60%, D7 - 70%, D8 - 80% e D9 - 90% Percentis Divide os dados em 100 grupos com cerca de 1% em cada grupo. Denotamos por: P1 - 1%, P2 - 2%, , P3 - 3%, ... , P99 99%.