ESTATÍSTICA I Estatística I Definição Antonio A. Crespo define Estatística como : Estatística é uma parte da matemática aplicada que fornece métodos para a coleta, a organização, a descrição, a análise e a interpretação de dados quantitativos e qualitativos, e a utilização desses dados para a tomada de decisão. Análise Exploratória de Dados Introdução População (características) Técnicas de Amostra Amostragem Análise Exploratória Conclusões sobre as características da população AES Inferência Estatística Informações contidas nos dados Análise Exploratória de Dados Utilidade da Estatística na Gestão A Estatística permite: • Resolver problemas mediante a coleta de dados de boa qualidade • Argumentar utilizando dados • Analisar e interpretar dados • Detectar situações fora de controle e outras fontes de dificuldades que requerem atenção e medidas corretivas • Coletar evidências para fins legais •Determinar ociosidade de recursos e eficiência na utilização dos mesmos •Determinar custos de atividades, de produtos, de unidades organizacionais etc •Melhorar a qualidade de dados, desempenhos, decisões, ações, produtos, processos e serviços Análise Exploratória de Dados Algumas Dificuldades com a Estatística • Culturais / Rejeição às "matemáticas" / Contato prematuro inadequado • “Invisibilidade” da Estatística • Armadilha da atividade Método Estatístico O método estatístico, diante da impossibilidade de manter as causas constantes, admite todas as causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. MÉTODO ESTATÍSTICO As fases são : • Coletas de dados : é a obtenção, reunião e registro sistemático de dados, com um objetivo determinado. • Direta : quando é obtida diretamente da fonte e pode ser : - Contínua : Obtida ininterruptamente - Registro de nascimentos, etc. - Periódica : em períodos curtos - Censos - Ocasional : esporadicamente - Surto epidêmico • Indireta : Quando é inferida ( deduzida ) a partir dos elementos conseguidos pela coleta direta - Mortalidade infantil MÉTODO ESTATÍSTICO Crítica dos dados : devem ser criticados à procura de erros grosseiros ou de certos vultos, que possam influir sensivelmente nos resultados como: - Externa : Informante - Interna : dados da coleta Apuração dos dados :é a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação. AES MÉTODO ESTATÍSTICO Exposição dos dados : devem ser apresentados sob forma de tabelas ou gráficos tornando mais fácil e compreensão do objeto de tratamento estatístico Análise dos resultados : É o estudo dos resultados com o objetivo de tirar conclusões sobre o todo (população), a partir de informações fornecidas por parte representativa do todo ( amostra). AES População e Amostra População : é o conjunto de entes portadores de , pelo menos, uma característica comum Amostra : é um subconjunto finito de uma população POPULAÇÃO E AMOSTRA Devido a quantidade excessivamente grande de elementos que constantemente fazem parte da população, trabalhamos com uma amostra. O aspecto comum dentre todas as técnicas existentes é a aleatoriedade, isto é, a igual chance que cada elemento da população deve ter de ser escolhido, as principais: a) Casual Simples - sorteio b) Sistemática - Os elementos já se encontram ordenados e então, sorteamos um número e sistematicamente os outros ficam determinados c) Estratificada - Quando a população esta dividida em estratos de acordo com o fato em estudo Variável Variável - é convencionalmente, o conjunto de resultados possíveis de um fenômeno. Tipos de variáveis: Nominais Qualitativas Ordinais Variáveis Discretas Quantitativas Contínuas Variável Exemplo ( Variáveis em uma ficha cadastral PF ) Variável 1 Número de dependentes Quantitativa, discreta 2 Idade Quantitativa, contínua 3 Local de nascimento Qualitativa, nominal 4 Nível educacional Qualitativa, ordinal 5 6 7 8 AES Tipo Variável DISCRETA - É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna em ordem crescente apenas os valores distintos de série e na segunda coluna colocamos os valores das freqüências simples correspondentes. Devemos optar por uma variável discreta na representação de uma série de valores quando o número de elementos distintos da série for pequeno xi = número de fi = freqüência filhos absoluta 0 1 1 5 2 6 3 10 total 22 Variável CONTÍNUA - É uma representação tabular de um conjunto de valores em que colocamos na primeira coluna faixa de valores agrupados em ordem crescente da série e na segunda coluna coloca os valores das freqüências simples correspondentes. Devemos optar por uma variável contínua na representação de uma série de valores quando o número de elementos distintos da série for grande. xi = número de fi = freqüência filhos absoluta AES 2 /------ 4 4 4 /------ 6 12 6 /------ 8 10 8 /------ 10 4 total 30 Conceitos a serem aplicados - Amplitude total de uma seqüência = é a diferença entre o Limite superior e o Limite inferior de uma seqüência. At = Ls – Li - Intervalo de Classe = é qualquer subdivisão da amplitude total de uma série estatística. 2 /------ 4 - Limite de Classe = cada intervalo de classe fica caracterizado por dois números reais. O menor valor chamado de Limite inferior (Li) da classe e o maior valor chamado de Limite superior (Ls) da classe. 2 = Li e 4 = Ls - Amplitude do intervalo de classe = é a diferença entre o Ls e o Li do intervalo de classe. A = Ls – Li 4-2 = 2 A = 2 - Freqüência simples ou absoluta de uma classe (fi) = é o número de elementos da seqüência que são maiores ou iguais ao Li desta classe e menores que o Ls desta classe. Distribuição de Freqüências Freqüência Relativa (fir%) = é a divisão da freqüência simples deste elemento pelo número total de elementos da série: fir = fi / n onde n ou somatória de fi, é o número total de elementos da série. Ex: fir = 4 / 30 = 0,1333 ou 13,33% Distribuição de Freqüências Freqüência Acumulada direta (fad) = é a soma de fi simples deste elemento com as fi dos elementos que o antecedem. fad = fi1 + fi2 + fi3 ...fin Freqüência acumulada relativa (fr) ou percentual = é a divisão da freqüência acumulada deste elemento pelo número total de elementos da série. AES Distribuição de Freqüências AES xi fi fi % fad Fad % 0 1 3,33 1 3,33 1 5 16,67 6 20,00 2 6 20,00 12 40,00 3 10 33,34 22 73,34 4 4 13,33 26 86,67 5 4 13,33 30 100 Total 30 100 Distribuição de Freqüências xi fi fir% fiac firac% 2 /------ 4 4 13,33 4 13,33 4 /------ 6 12 40,00 16 53,33 6 /------ 8 10 33,34 26 86,67 8 /------ 10 4 13,33 30 100 Total 30 100 Representação Gráfica - Histograma 0,35 0,34 0,3 0,26 Proporção 0,25 0,2 0,16 0,15 0,12 0,1 0,04 0,05 0,04 0,02 0,02 553,5 61,5 0 5,5 13,5 21,5 29,5 37,5 Tributo ( % faturam ento ) 45,5 Representação Gráfica - Histograma Histograma Área = 1.00 ( ou 100% ) Área ~ freqüência ( f ou p ) Classes de mesma amplitude : altura ~ freqüência ( f ou p ) Notas : Histograma é a representação gráfica adequada para o caso de variáveis contínuas Pode ser utilizada para variáveis discretas agrupadas em classes Representação Gráfica Polígono de % acumulada 100 90 80 % acumulada 70 60 50 40 30 20 10 0 1.5 9.5 17.5 25.5 33.5 41.5 Tributo ( % faturamento ) 49.5 57.5 65.5 Representação Gráfica Polígono de % acumulada Mostra a porcentagem de empresas cujo recolhimento de tributos é menor ou igual a um dado valor Podemos ter também: Polígono de freqüências acumuladas Polígono de proporções acumuladas Alguns Padrões de Histogramas Alguns Padrões de Histogramas Alguns Padrões de Histogramas Alguns Padrões de Histogramas Alguns Padrões de Histogramas Alguns Padrões de Histogramas AES Medidas de Tendência Central • Tendência Central de um conjunto de dados é a tendência das medidas destes dados em se acumular em torno de certos valores numéricos. Medidas de Tendência Central • É a soma das medidas dividida pelo número de elementos do conjunto de dados. • Vantagens – reflete cada valor e possui propriedades matemáticas atraentes. • Limitações – é influenciada por valores extremos. Medidas de Tendência Central Exemplo : • Calcule a média dos seguintes grupos de dados: 1, 2, 3, 4, 5 e n 2, 3, 3, 3, 4 x x i 1 n i Medidas de Tendência Central Mediana - Para números aleatórios • É o valor intermediário de um conjunto de medidas colocadas em ordem crescente (ou decrescente). Vantagens - muito interessante para grande massa de dados - divide a área do histograma em partes iguais. - menos suscetível a valores extremos. Limitações – difícil de determinar para grande quantidade de dados. Medidas de Tendência Central Média e Mediana Sua comparação indica a assimetria da distribuição. Média Mediana Medidas de Tendência Central Moda - Para números aleatórios • É a medida que ocorre com maior freqüência no conjunto de dados. – Exemplo: notas de degustadores de vinho: 8, 7, 9, 6, 8, 10, 9, 9, 5, 7. Moda: 9 Medidas de Tendência Central Moda • Vantagens - indica onde os dados tendem a se concentrar. - útil para dados qualitativos (Ex. notas de jurados). - pode haver mais de uma ou não ter sentido (Ex. pesquisa de lazer). • Limitações - não se presta a análise matemática; - pode não ser moda para certos conjuntos de dados. Medidas de Tendência Central Exemplo: • Preferência do produto A (em %) colhida em diversas regiões do Brasil por meio de uma pesquisa de mercado. 56, 63, 64, 65, 66, 69, 71, 57, 64, 66, 64, 65, 66, 66, 68 e 72. N = 16 x = 1042 Média = 65,125 Mediana = 65,5 Moda =66 Medidas de Tendência Central Média Para variáveis discretas • Se os dados estão apresentados na forma de uma variável discreta, utilizamos a média ponderada, considerando as freqüências (fi) como sendo as ponderações dos elementos (xi) correspondentes. xi = número de filhos fi = freqüência absoluta fi * xi 0 1 0 1 5 5 2 6 12 3 10 30 total 22 47 Média = 47 / 22 = 2,14 filhos Medidas de Tendência Central Mediana para variáveis discretas • Para encontrarmos a mediana, dividimos por dois o total das freqüências absolutas ( 22 / 2 = 11) e calculamos a Freqüência acumulada (fiac) • Procuramos qual xi que conta o número (11) na Fi xi = 2 xi = número de filhos fi = freqüência absoluta fiac 0 1 1 1 5 6 Mediana = 2 6 12 (11) 3 10 22 total 22 Mediana = 2 filhos Medidas de Tendência Central Moda para variáveis discretas • Para encontrarmos a moda, basta verificar o elemento xi de maior freqüência (fi). xi = número de filhos fi = freqüência absoluta 0 1 1 5 2 6 Moda = 3 10 total 22 Moda = 3 filhos Medidas de Tendência Central Média para variáveis contínuas Se os dados estão apresentados na forma de uma variável contínua,utilizaremos a média aritmética ponderada, considerando as freqüências (fi) de cada classe ponderando com o ponto médio destas classe. PM = ((Li + LS) / 2) Média = Somatória de PM*fi / somatória de fi 178 / 30 = 5,93 filhos xi = número de filhos Ponto Médio (PM) fi = freqüência absoluta PM * fi 2 /------ 4 3 4 12 4 /------ 6 5 12 60 6 /------ 8 7 10 70 8 /------ 10 9 4 36 30 178 total Medidas de Tendência Central Mediana para variáveis contínuas • Para encontrarmos a mediana, dividimos por dois o total das freqüências absolutas ( 30 / 2 = 15) e calculamos a Freqüência acumulada (fiac) •Procuramos qual xi que conta o número (15) na fiac xi = 4 /---6 Este será o intervalo que usaremos como base para resolvermos a fórmula da mediana. xi = número de filhos fi = freqüência absoluta fiac 2 /------ 4 4 4 4 /------ 6 12 16 (15) 6 /------ 8 10 26 8 /------ 10 4 30 total 30 Medidas de Tendência Central Mediana para variáveis contínuas • Fórmula da Mediana para variáveis contínuas n / 2 fiacant m d Li .h fi Onde : Li = Limite inferior do intervalo de classe 4 n = Total de fi 30 fiacant = freqüência acumulada anterior ao intervalo de classe 4 fi = freqüência do intervalo de classe 12 h = amplitude da classe = Ls – Li 6 – 4 = 2 Medidas de Tendência Central Mediana para variáveis contínuas • Então : 30 / 2 4 md 4 .2 12 m d 5,83 Obs: o valor obtido pela fórmula é um valor aproximado Medidas de Tendência Central Moda para variáveis contínuas • Fórmula da Moda para variáveis contínuas fipost m o Li .h fipost fiant Onde : Li = Limite inferior do intervalo de classe 4 fipost = freqüência absoluta posterior ao intervalo de classe 10 fiant = freqüência absoluta anterior ao intervalo de classe 4 h = amplitude da classe = Ls – Li 6 – 4 = 2 Medidas de Tendência Central Moda para variáveis contínuas Então: 10 mo 4 .2 10 4 m o 5,43 Exercícios de aplicação • A média mínima para aprovação de determinado produto é 5,0 ppm de Ni. Se um analista, obtem os resultados 7,5; 8,0; 3,5; 6,0; 2,5; 2,0; 5,5 e 4,0 nas análises de diversas amostras em questão, pergunta-se: pode ele aprovar o produto? • Calcule a mediana da seguinte distribuição de freqüência: • custos($)450├─550├─650├─750├─850├─950├─1050├─ 1150 • fi 8 10 11 16 13 5 1 Medidas de Dispersão • São medidas estatísticas utilizadas para avaliar o grau de variabilidade ou dispersão, dos valores em torno da média. Servem para medir a representatividade da média. • • • • Desvio Médio Variância Desvio-Padrão Coeficiente de variação Medidas de Dispersão • Desvio Médio = é a média dos desvios dos valores a contar de média. Ignorando-se o sinal de diferença .fi Medidas de Dispersão • Variância = é a média dos quadrados dos desvios dos valores a contar da média, calculada usando-se n-1 em lugar de n, como fator de ajuste. xi x S 2 n 1 2 .fi Medidas de Dispersão • Desvio-padrão = é simplesmente a raiz quadrada positiva da variância. s s 2 Medidas de Dispersão • Coeficiente de variação = trata-se de uma medida relativa de dispersão útil para a comparação em termos relativos do grau de concentração em torno da média de séries distintas. S CV .100 X Medidas de Dispersão xi = número de filhos fi xi * fi xi - x /xi-x/ * fi (xi-x)2 * fi 0 1 0 -2,14 2,14 4,58 1 5 5 -1,14 5,7 6,50 2 6 12 -0,14 0,84 0,12 3 10 30 0,86 8,6 7,40 total 22 47 17,28 18,6 Média=2,14 DM = 0,79 S2 = 0,89 S= 0,94 CV = 43,93% Para variáveis contínuas xi = PM Exercícios de aplicação Probabilidade •Freqüência e probabilidade •Eventos •Definição subjetiva de probabilidade Freqüência é o percentual de ocorrencia de uma determinada observação dentro de uma amostra Resultados do lançamento de um dado (n=10 lançamentos) Resultado do dado Número de ocorrências do resultado (f) Freqüência (f/n) 1 1 0,1 ou 10% 2 0 0 3 1 0,1 ou 10% 4 2 0,2 ou 20% 5 3 0,3 ou 30% 6 3 0,3 ou 30% A medida que a amostra cresce, a freqüência se estabiliza: temos então a probabilidade Resultados do lançamento de um dado n = 50 lançamentos n= Resultado do dado Núm. de ocorrências do resultado (f) Freq. Rela(f/n) Número de ocorrências do resultado (f) Freqüência (f/n) 1 11 0,22 ou 22% 1/6 * n 16,7% 2 6 0,12 ou 12% 1/6 * n 16,7% 3 7 0,14 ou 14% 1/6 * n 16,7% 4 7 0,14 ou 14% 1/6 * n 16,7% 5 7 0,14 ou 14% 1/6 * n 16,7% 6 12 0,24 ou 24% 1/6 * n 16,7% Portanto, a probabilidade pode ser encarada como o limite da freqüência de um determinado evento dentro da população em estudo A freqüência pode ser representada graficamente Representação gráfica dos resultados obtidos no lançamento repetido de um dado (n = número de lançamentos) 0,4 n = 50 n = 10 n = infinito 0,3 0,2 0,1 0,0 1 2 3 4 5 6 1 2 3 4 5 6 1 2 3 4 5 6 Probabilidade • Freqüência e probabilidade • Eventos – Representações gráficas – Compostos – Condicionais – Dependentes e independentes • Definição subjetiva de probabilidade Formas de representação gráfica de eventos Diagrama de árvore Diagrama de Venn A árvore permite a representação exaustiva dos eventos Representação dos eventos possíveis para o sexo de cada criança de um casal que tenha três filhos Criança 1 Criança 2 M M F M F F Criança 3 M F M F M F M F Resultado final M, M, M M, M, F M, F, M M, F, F F, M, M F, M, F F, F, M F, F, F O diagrama de Venn é adequado ao agrupamentos dos eventos de interesse Agrupamento de casais segundo o sexo dos filhos Casais com meninos somente Casais com meninas somente Casais com meninos e meninas A combinação dos diagramas de árvore e de Venn permite representações mais complexas Agrupamento de casais com quatro filhos e pelo menos duas meninas M M F M M F F M M F F M F F M M, M, M, M F M, M, M, F M F M, M, F, M M, M, F, F M, F, M, M M, F, M, F M M, F, F, M F M, F, F, F M F, M, M, M F F, M, M, F M F M F, M, F, M F, M, F, F F, F, M, M F F, F, M, F M F, F, F, M F, F, F, F F M F Agrupamento dos resultados que apresentem ao menos duas meninas. Dependência e independência são termos que obedecem a regras precisas Exemplo de evento independente Probabilidade de ocorrência do número 6 em um lançamento de dado, condicionado ao resultado anterior ter sido 3. Resultado 1 Resultado 2 Probabilidade 3 Lançamento já realizado e resultado conhecido! 1 1/6 2 1/6 3 1/6 4 1/6 5 1/6 6 1/6 •O resultado conhecido do primeiro lançamento não altera a probabilidade de ocorrência do número 6 no segundo lançamento •Mais formalmente, o evento B é independente se: P(B) = P(B | A) Dependência e independência são termos que obedecem a regras precisas Exemplo de evento dependente •Probabilidade de uma pessoa consumir requeijão e manteiga, dado que ela consome manteiga RM = 50 130 •P(RM) = 50/300 = 1/6 200 Requeijão (R) •P(RM | M) = (50/300) / (200/300) = 1/4 Manteiga (M) Não é consumidor: 20 •O resultado conhecido do consumo de manteiga altera a probabilidade de ocorrência do consumo dos dois produtos Mais formalmente, o evento B é dependente se:P(B) P(B | A) Eventos compostos são formados por dois ou mais eventos Exemplos de eventos compostos • Um casal com três crianças ter somente meninos • Um casal com três crianças ter uma ou duas meninas • Um consumidor comprar requeijão e manteiga O termo eventos condicionais indica que a ocorrência de um está condicionada à do outro Descrição do caso • • Uma pesquisa com 300 pessoas, realizada em um supermercado, teve os seguintes resultados: – 130 pessoas consomem requeijão – 200 pessoas consomem manteiga – 50 pessoas consomem os dois produtos – 20 pessoas não consomem nenhum dos dois Sabendo que uma pessoa escolhida ao acaso é consumidora de manteiga, qual é a probabilidade de que ela também consuma requeijão? Manteiga Tabela de respostas Sim Não Total Sim 50 80 130 Não 150 20 170 Requeijão Total 200 100 300 Em casos como esse, uma parte da incerteza já foi eliminada Após a escolha do consumidor RM = 50 130 Requeijão (R) 200 Manteiga (M) Antes da escolha do consumidor RM = 50 200 Manteiga (M) Não é consumidor: 20 •Probabilidade de a pessoa ser consumidora dois produtos: P(RM) = 50/300 = 1/6 Neste caso, a incerteza é total. Você não sabe nada sobre a pessoa que foi escolhida. Portanto, a probabilidade de que ela consuma os dois produtos é simplesmente a freqüência de ocorrência desse tipo de consumidor na amostra •Probabilidade de a pessoa ser consumidora dois produtos, condicionado a ela consumir manteiga: P(RM | M) = 50/200 = 1/4 Sinal “condicionado a” •Neste caso, você sabe que pessoa consome manteiga, portanto os outros grupos de consumidores não devem ser considerados no cálculo. Em outras palavras, uma parte da incerteza foi eliminada. Às vezes, não se pode determinar a probabilidade de um evento, ou pode ser muito demorado e custoso fazê-lo Exemplos de eventos cuja probabilidade de ocorrência não pode ser (facilmente) determinada Evento Comentário • Probabilidade de um time ganhar de outro em uma partida de futebol Probabilidade não pode ser determinada • Probabilidade de o mercado acionário subir amanhã Probabilidade não pode ser determinada • Probabilidade de o lançamento de um novo produto ser um sucesso Probabilidade pode ser estimada através de pesquisa de mercado, porém: Estudo pode ser muito caro Pesquisa não fornece, nem pode fornecer, 100% de certeza sobre o resultado do lançamento do produto Probabilidade • Distribuição de probabilidade • Distribuições descontínuas de probabilidade – Binomial – Poisson • Distribuições contínuas de probabilidade – Normal Probabilidade • Distribuição de probabilidade – Uma distribuição de probabilidade é uma distribuição de freqüências para os resultados de um espaço amostral (isto é, para os resultados de uma variável aleatória). Probabilidade • Distribuições descontínuas de probabilidade – Binomial – Usa-se o termo binomial para designar situações em que os resultados de uma variável aleatória podem ser agrupados em duas classes ou categorias. – A utilização da binomial, exige certas hipótese como: • Há n observações ou provas idênticas • Cada prova tem dois resultados possíveis, um chamado “sucesso” e o outro “fracasso”. • As probabilidades p de sucesso e 1 – p de fracasso permanecem constantes em todas as provas. • Os resultados das provas são independentes uns dos outros. Probabilidade • Distribuições descontínuas de probabilidade – Fórmula da Binomial n-x n x P ( x) p ( sucesso). p ( fracasso) x Onde: n = numero de amostras x = número de sucesso p(s) = percentual de sucesso p (f) = percentual de fracasso Exemplo • Binomial – suponha que 8% dos cachorros-quentes vendidos num estádio de beisebol sejam pedidos sem n-x x mostarda. Se sete pessoas pedem cachorro-quente, determine a probabilidade de que: – Todos queiram mostarda – Apenas um não queira Exemplo a- 0 7 7 P ( x) 0 (0,08).(0,92) = 0,5578 1 b- 6 7 P ( x) 1 (0,08).(0,92) = 0,3396 Probabilidade • Distribuição de probabilidade • Distribuições descontínuas de probabilidade – Poisson – É útil para descrever as probabilidades do número de ocorrências num campo ou intervalo contínuo (em geral tempo ou espaço). – A utilização da Poisson, exige certas hipótese como: • A probabilidade de uma ocorrência é a mesma em todo o campo de observação. • A probabilidade de mais de uma ocorrência num único ponto é aproximadamente zero. • O número de ocorrências em qualquer intervalo é independente do número de ocorrências em outros intervalos. Probabilidade • Distribuição de probabilidade • Distribuições descontínuas de probabilidade – Formula de Poisson e ( )x P( x) x ! Onde: = média x = número de ocorrências e =valor tabelado Exemplo Poisson – Uma mesa telefônica recebe chamadas a razão de 4,6 chamadas por minuto. Determine a probabilidade de cada uma das ocorrências abaixo: 1- Exatamente 2 chamadas 2 -Nenhuma chamada 2 • 1 P( x) 0,0 1 0 1 ( 4,6) ! 2 = 0,1063 0 • 2 P( x) 0,0 1 0 1 ( 4,6) 0 ! = 0,0101 Probabilidade • Distribuições contínuas de probabilidade – Normal – É a mais importante distribuição de probabilidade, sendo aplicada em inúmeros fenômenos e utilizada para desenvolvimento teórico da estatística. – As características das curvas normais são: • A curva normal tem forma de sino • É simétrica em relação a média • Prolonga-se de – infinito a + infinito • Cada distribuição normal fica completamente especificada por sua média e seu desvio padrão; há uma distribuição normal distinta para cada combinação de média e desvio padrão • A área total sob a curva normal é considerado 100% • A área sob a curva entre dois pontos é a probabilidade de uma variável normalmente distribuída tomar um valor entre esses pontos • A área sob a curva entre a média e um ponto arbitrário é função do número de desvios padrões entre a média e aquele ponto. Probabilidade • Distribuições contínuas de probabilidade – Normal Fórmula população amostra ( x x) z s z (x ) Onde: Z= número de desvios padrões a contar da média X = valor arbitrário = o desvio padrão = a média da distribuição normal Exemplo Normal – dado que uma população com média 25 e desvio padrão 2 tem distribuição normal, determine os valores de z para os seguintes valores da população: a) 23,0 (23 25) z 2 z 1,0 Corresponde a 0,3413 ou 34,13% da área sobre a curva normal ou a probabilidade, conforme tabela z b)25,5 (25,5 25) z 2 z 0,1 Corresponde a 0,0398 ou 3,98% da área sobre a curva normal ou a probabilidade, conforme tabela z Desvio padrão : interpretação • Regra de Chebyshev: • Ao menos 3/4 estará dentro de 2 s. • Ao menos 8/9 estará dentro de 3 s. • P/ k>1, ao menos (1-1/k2) das medidas cairá dentro de k desvios-padrão. • Distribuição Normal • Aproximadamente 68% das medidas caem dentro de 1 s. • Aproximadamente 95% das medidas caem dentro de 2 s. • Aproximadamente 99,7% das medidas caem dentro de 3 s. • Aplicações de todos os conceitos estudados em exercícios práticos........