1 3.1 - Espaço amostral e Eventos, Espaço Amostral Equiprovável; 3.2 - Axiomas de APOSTILA DE ESTATÍSTICA probabilidades e propriedades; 3.3 - União de Eventos; 3.4 - Probabilidade Condicional e Eventos independentes; 3.5 - Espaços amostrais não- equiprováveis e experimentos repetidos; 3.6 Teorema de Bayes. 4. DISTRIBUIÇÕES ESPECIAIS: 4.1 - Variáveis aleatórias e função de distribuição de probabilidade; 4.2 - PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA Esperança Matemática; 4.3 - Variância e Desvio Padrão; 4.4 – Distribuições Discretas: Bernoulli, Binomial e Poisson; 4.5 - Distribuição contínua: Normal; 1. INTRUDUÇÃO: 1.1- Conceitos básicos de estatística: Panorama Histórico, Ramos da Estatística, 5. INTERVALOS DE CONFIANÇA. Processos e estudos de um estatístico; 1.2 - Populações estatística e amostras; SISTEMAS 1.3 -Tipos de amostras; 1.4 - Tipos de variáveis; 1.5 - Representação gráfica de dados. 2. DISTRIBUIÇÃO DE FREQUENCIA: DE 2.1 -Tipos de frequências; 2.2 -Rol, Amplitude e intervalos em uma tabela de distribuição de Frequência; INFORMAÇÃO 2.3 - Histogramas e polígonos de frequências; 2.4 - Curvas de frequência acumulada (ogivas); 2.5 - Descrição de dados amostrais, moda; 2.6 - Medidas de tendência central: média aritmética, mediana; 2.7 - Medidas de dispersão: desvio médio, variância, desvio padrão; 2.8 - Outras Centro Universitário da Fundação Educacional de Barretos UNIFEB medidas representativas: quartis e percentis. 3. TEORIA DA PROBABLIDADE: PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 2 SUMÁRIO Atividade 6: Lista de exercícios 4. ......................................................................... 32 1. INTRODUÇÃO. ................................................................................................... 3 Atividade 7: Lista de exercícios 5 (Lista Complementar). ...................................... 32 1.2 População Estatística e Amostras. .................................................................... 7 3.3 União de eventos. .......................................................................................... 33 1.3 Tipos de amostras. .......................................................................................... 12 Atividade 8: Lista de exercícios 6. ......................................................................... 34 1.4 Tipos de variáveis. ........................................................................................... 14 3.4 Probabilidade Condicional e Eventos Independentes. .............................. 34 1.5 Representações gráficas. ................................................................................ 15 Atividade 9: Lista de exercícios 7. ..................................................................... 35 2. DISTRIBUIÇÃO DE FREQUÊNCIA .................................................................. 16 3.5 Espaços amostrais não - equiprováveis e experimentos repetidos. ................ 36 2.1 Tipos de frequências. ...................................................................................... 16 Atividade 10: Lista de exercícios 8. ................................................................... 37 2.2 Rol, Amplitude e Intervalos de uma Tabela de distribuição de frequência. ..... 18 3.6 Teorema de Bayes. ......................................................................................... 38 Atividade 1 - Elaboração de uma tabela de distribuição de frequência. ........ 18 Atividade 11: Lista de exercícios 9. ................................................................... 39 2.3 Histograma e polígonos de frequência. ........................................................... 19 4. DISTRIBUIÇÔES ESPECIAIS. ......................................................................... 39 Atividade 2: Construção do Histograma e polígono de frequência. ............... 19 4.1 Variáveis aleatórias e função de distribuição de probabilidades. .................... 39 2.5 Descrição de dados amostrais. ....................................................................... 21 Atividade 12: Lista de exercícios 10. ..................................................................... 41 2.6 Medidas de Tendência Central (Posição). ....................................................... 22 4.2 Esperança Matemática. ................................................................................... 42 Atividade 3: Lista de Exercícios 1. ..................................................................... 25 Atividade 13: Lista de exercícios 11 ...................................................................... 43 2.7 Medidas de Dispersão. .................................................................................... 27 4.3 Variância e desvio Padrão. .............................................................................. 44 Atividade 4: Lista de Exercícios 2. ..................................................................... 29 Atividade 14: Lista de exercícios 12 ...................................................................... 46 3. TEORIA DA PROBABILIDADE. ....................................................................... 30 4.4 Distribuições teóricas de probabilidades de variáveis aleatórias discretas. ..... 46 3.1 Espaço amostral e Evento, Espaço Amostral Equiprovável. ........................... 30 Atividade 15: Lista de exercícios 13 ...................................................................... 50 . ......................................................................................... 30 4.5 Distribuições teóricas de probabilidades de variáveis aleatórias continuas. .... 50 Espaço Amostral Atividade 16: Lista de exercícios 14 .................................................................. 56 Atividade 5: Lista de exercícios 3. ..................................................................... 31 3.2 Axiomas de Probabilidades e Propriedades. .............................................. 31 PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 3 A palavra Estatística foi cunhada pelo acadêmico alemão Gottfried 1. INTRODUÇÃO. 1.1 A Natureza da Estatística - Panorama Histórico, ramos da estatística, processos e estudos de um estatístico. Achenwall (1719-1772), que foi um notável continuador dos estudos de Hermann Conrig (1606- 1681). Gottfried determinou os objetivos da Estatística e suas relações com as demais ciências. Com a Escola Alemã as tabelas tornaram-se mais Panorama Histórico A origem da palavra Estatística está associada à palavra latina STATUS (Estado). Há indícios de que 3000 anos A.C. já se faziam censos na Babilônia, China e Egito e até mesmo o 4o. livro do Velho Testamento faz referência a uma instrução dada a Moisés, para que fizesse um levantamento dos homens de Israel que estivessem aptos para guerrear. Usualmente, estas informações eram utilizadas para a taxação de impostos ou para o alistamento militar. O Imperador César Augusto, por exemplo, ordenou que se fizesse o Censo de todo o Império Romano. completas, surgiram as representações gráficas e o cálculo das probabilidades, e a Estatística deixou de ser simples catalogação de dados numéricos coletivos para se tornar o estudo de como chegar a conclusões sobre o todo (“população”), partindo da observação de partes desse todo (“amostras”). Atualmente, os estudos estatísticos têm avançado rapidamente e, com seus processos e técnicas, Têm contribuído para a organização dos negócios e recursos do mundo moderno. O que é Estatística? Contudo, mesmo que a prática de coletar dados sobre A Estatística é uma parte da Matemática Aplicada que colheitas, composição a população humana ou de animais, fornece métodos para coleta, organização, descrição, análise e impostos, etc., fosse conhecida pelos egípcios, hebreus, caldeus e interpretação de dados e para a utilização dos mesmos na tomada gregos, e se atribuam a Aristóteles cento e oitenta descrições de de decisões. Estados, apenas no século XVII a Estatística passou a ser considerada disciplina autônoma, tendo como objetivo básico à A Estatística pode ser encarada como uma ciência ou como um método de estudo. descrição dos BENS do Estado. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 4 Duas concepção para a palavra ESTATÍSTICA: futebol, o número de escanteios, o número de faltas cometidas e o No plural (estatística), indica qualquer coleção consistente tempo de posse de bola são dados fornecidos ao telespectador e de dados numéricos, reunidos com a finalidade de fornecer fazem com que a conclusão sobre qual time foi melhor em campo informações acerca de uma atividade qualquer. Pôr exemplo, as se torne objetiva (não que isso implique que tenha sido o estatística demográficas referem-se as dados numéricos sobre vencedor...). O que tem levado a essa qualificação de nossas vidas nascimentos, falecimentos, matrimônios, desquites, etc. no dia a dia? No singular, indica um corpo de técnicas, ou ainda uma Um fator importante é a popularização dos computadores. metodologia técnica desenvolvida para a coleta, a classificação, a No passado, tratar uma grande massa de números era uma tarefa apresentação, a análise e a interpretação de dados quantitativos e custosa e cansativa, que exigia horas de trabalho tedioso. a utilização desses dados para a tomada de decisões. Recentemente, no entanto, grandes quantidades de informações Qualquer ciência experimental não pode prescindir das podem ser analisadas rapidamente com um computador pessoal e técnicas proporcionadas pela Estatística, como pôr exemplo, a programas adequados. Desta forma o computador contribui, Física, a Biologia, a Administração, a Economia, as Engenharias, positivamente, na difusão e uso de métodos estatísticos. Por outro curós na área de sistemas da informação e informática; etc. Todos lado, o computador possibilita uma automação que pode levar um esses ramos de atividade profissional têm necessidade de um indivíduo sem preparo específico a utilizar técnicas inadequadas instrumental que se preocupa com o tratamento quantitativo dos para resolver um dado problema. Assim, é necessária a fenômenos de massa ou coletivos, cuja mensuração e análise compreensão dos conceitos básicos da Estatística, bem como as requerem suposições necessárias para o seu uso de forma criteriosa. um conjunto de observações de fenômeno ou particulares. A utilização de técnicas, destinadas à análise de situações complexas ou não, tem aumentado e faz parte do nosso cotidiano. Tome-se, por exemplo, as transmissões esportivas. Em um jogo de PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 5 Ramos da Estatística A média industrial Dow-Jones, a taxa de desemprego, o A grosso modo pode-se dividir a Estatística em três áreas: custo de vida, o índice pluviométrico, a quilometragem média por Estatística Descritiva litro de combustível, as médias de estudantes são exemplos de Teoria da Probabilidades Teoria da Inferência Estatística dados tratados pela Estatística Descritiva. Vamos caracterizar estas três áreas Teoria da Probabilidade. Estatística Descritiva. A Teoria das Probabilidade pode ser pensada como o teoria A Estatística Descritiva pode ser definida como um conjunto matemática utilizada para estudar a incerteza oriunda de de técnicas destinadas a descrever e resumir dados, a fim de que fenômenos que envolvem o acaso. Jogos de dados e de cartas, ou possamos tirar conclusões a respeito de características de o lançamento de uma moeda para o ar enquadram-se na categoria interesse. Em geral utilizamos a Estatística Descritiva na etapa do acaso. A maioria dos jogos esportivos também é influenciada inicial da análise quando tomamos contato com os dados pela pelo acaso até certo ponto. A decisão de um fabricante de cola de primeira vez. empreender uma grande campanha de propaganda visando a Objetivando tirar conclusões de modo informal e direto, a aumentar sua participação no mercado, a decisão de parar de maneira mais simples seria a observação dos valores colhidos. imunizar pessoas com menos de vinte anos contra determinada Entretanto ao depararmos com uma grande massa de dados doença, a decisão de arriscar-se a atravessar uma rua no meio do percebemos, quarteirão, imediatamente, que a tarefa pode não ser simples.Para tentar retirar dos dados informações a respeito do todas inconscientemente. fenômeno sob estudo, é preciso aplicar algumas técnicas que nos permitam simplificar a informação daquele particular conjunto de valores. A finalidade da Estatística Descritiva é tornar as coisas mais fáceis de entender, de relatar e discutir. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. utilizam a probabilidade consciente ou 6 Teoria da Inferência Estatística. Inferência Estatística é o estudo de técnicas que possibilitam a extrapolação, a um grande conjunto de dados, das informações e conclusões obtidas a partir de subconjuntos de valores, usualmente de dimensões muito menores. Deve-se notar que se tivermos acesso a todos os elementos que desejamos estudar, não é necessário o uso das técnicas de inferência estatística; entretanto, elas são indispensáveis quando existe a impossibilidade de acesso a todo o conjunto de dados, por razões de natureza econômica, ética ou física. Coleta e crítica dos dados. Estudos complexos que envolvem o tratamento estatístico dos dados, usualmente incluem as três áreas citadas acima. Após definirmos cuidadosamente o problema que se quer pesquisar, damos início à coleta dos dados numéricos necessários à sua descrição. Fases do Trabalho Estatístico. A coleta pode ser direta ou indireta. O trabalho estatístico é um método científico, que consiste das cinco etapas básicas seguintes: de registro obrigatório (nascimentos, casamentos e óbitos, Coleta e crítica de dados importação e exportação de mercadorias), elementos pertinentes Tratamento dos dados aos prontuários dos alunos de uma escola ou, ainda, quando os Apresentação dos dados Análise e interpretação dos resultados Conclusão A coleta é direta quando feita sobre elementos informativos dados são coletados pelo próprio pesquisador através de inquéritos questionários. A coleta se diz indireta quando é inferida de elementos conhecidos (coleta direta) e/ou do conhecimento de outros PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 7 fenômenos relacionados com o fenômeno estudado. Como por Análise dos resultados. exemplo, podemos citar a pesquisa sobre a mortalidade infantil, que é feita através de dados colhidos por uma coleta direta. Obtidos os dados, eles devem ser cuidadosamente criticados, à procura de possíveis falhas e imperfeições, a fim de Após a apresentação dos dados devemos calcular as medidas típicas convenientes para fazermos uma análise dos resultados obtidos, através dos métodos da Estatística Indutiva ou Inferencial, e tirarmos desses resultados conclusões e previsões. não incorrermos em erros grosseiros ou certo vulto, que possam Conclusão. influir sensivelmente nos resultados. É de responsabilidade de um especialista no assunto que A crítica é externa quando visa às causas dos erros por parte do informante, por distração ou má interpretação das perguntas que lhe foram feitas; è interna quando visa observar os está sendo pesquisado, que não é necessariamente um estatístico, relatar as conclusões de maneira que sejam facilmente entendidas por quem as for usar na tomada de decisões. elementos originais dos dados da coleta. Tratamento dos dados. Nada mais é do que a soma e o processamento dos dados obtidos e a disposição mediante critérios de classificação Pode ser 1.2 População Estatística e Amostras. Ao conjunto de entes portadores de, pelo menos, uma manual ou eletrônica. característica comum denominamos População estatística ou Apresentação dos dados. Por mais diversa que seja a finalidade que se tenha em universo estatístico. vista, os dados devem ser apresentados sob forma adequada – Esse termo refere-se não somente a uma coleção de tabelas e gráficos – tornando mais fácil o exame daquilo que está indivíduos, mas também ao alvo sobre o qual reside nosso sendo objeto de tratamento estatístico. interesse. Assim, nossa população pode ser tanto todos os habitantes de Vila Velha, como todas as lâmpadas produzidas por uma fábrica em um certo período de tempo, ou todo o sangue no corpo de uma pessoa. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 8 Como em qualquer estudo estatístico temos em mente Tendo em vista as dificuldades de várias naturezas para pesquisar uma ou mais características dos elementos de alguma observar todos os elementos da população, tomaremos alguns população, esta característica deve estar perfeitamente definida. E deles para formar um grupo a ser estudado. A essa parte isso se dá quando, considerando um elemento qualquer, podemos proveniente da população em estudo denominamos amostra. afirmar, sem ambigüidade, se esse elemento pertence ou não à Uma amostra é um subconjunto finito de uma população. população. Etapas da análise Estatística. Vamos entender que, em Estatística, a palavra população tem significado muito mais amplo do que no vocabulário leigo. Para o estatístico, todos os valores que uma variável pode assumir, nos elementos de um conjunto, constitui uma população. Algumas vezes podemos acessar toda a população para estudarmos características de interesse, mas em muitas situações, tal procedimento não pode ser realizado, por impossibilidade ou inviabilidade econômica ou temporal. Por exemplo, uma empresa não dispõe de verba suficiente para saber o que pensa todos os consumidores de seus produtos. Há ainda razões éticas, quando, por exemplo, os experimentos de laboratório envolvem o uso de seres vivos. Além disso, existem casos em que a impossibilidade de acessar toda a população de interesse é incontornável como no Os pesquisadores trabalham com amostras. Primeiro, caso da análise do sangue de uma pessoa ou em um experimento para determinar o tempo de funcionamento das lâmpadas produzidas por uma indústria. porque as populações infinitas só podem ser estudadas através de amostras. As populações finitas muito grandes também só podem ser estudadas através de amostras. Finalmente, o estudo PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 9 cuidadoso de uma amostra tem mais valor cientifico do que o estudo rápido de toda a população. As medidas estatísticas obtidas com base na população são denominadas parâmetros. As medidas obtidas com base em Exemplos: amostras são denominadas estimativas. Tanto parâmetros quanto População infinita: estimativas são numéricos a única diferença é o fato de os A produção futura de uma máquina. parâmetros serem obtidos com base na população e as estimativas As extrações, com repetição das bolas de uma urna. com base nas amostras. Os nascimentos de bebês. Os parâmetros são em geral desconhecidos porque, na O número de peixes do mar constitui uma população finita muito grande, pois esse número é, em dado pratica, não é possível observar toda a população. Mas, como já momento, disse alguém, não é preciso beber todo o vinho para saber que matematicamente finito, mas tão grande que pode ser considerado gosto ele tem. Então o pesquisador obtém uma amostra para “ter infinito para finalidade pratica. uma ideia” do valor do parâmetro. Os alunos de uma sala de aula, os produtos de um Embora nenhum plano de amostragem possa garantir que a supermercado, os livros de uma biblioteca, os automóveis de vila amostra seja exatamente semelhante à população da qual foi velha, são exemplos de populações finitas. extraída, se a amostra for suficientemente grande e obtida com a A distinção entre população e amostra é fundamental técnica correta, na maioria das vezes, poderemos estimar o valor porque é com base nos dados de uma amostra que os estatísticos do erro possível, isto é dizer “quão próxima” esta a amostra da inferem sobre a população. população, em termos de representatividade. Mas ainda, amostras Exemplo: Uma pesquisa de opinião para saber o resultado sucessivas da mesma população tendem a fornecer estimativas das eleições para o governo do estado de São Paulo em 1988, a similares entre si e com valores em torno do verdadeiro, ou seja, o população considerada foram todos os eleitores do estado e para valor do parâmetro. constituir a amostra o IBOPE coletou a opinião de cerca de 1600 eleitores. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 10 Assim, vimos que, amostras diferentes dão estimativas diferentes do parâmetro. É o que os estatísticos chamam de elementos da população que constituirão a amostra. De acordo com a técnica usada, tem-se um tipo de amostra. flutuação amostral. Das estimativas possíveis desse parâmetro, com base em Amostragem “versus” Censo. Uma amostra usualmente envolve o estudo de uma parcela uma amostra de tamanho 2, que é muitíssimo pequena, apenas um caso coincide com o valor verdadeiro do parâmetro e as outras são dos itens de uma população, enquanto que um censo requer o exame de todos os itens. Embora concentremos nossa atenção nas muito ruins. Se a amostra fosse de tamanho 1000, uma proporção muito amostras, é conveniente considerar também a alternativa do censo. A primeira vista pode parecer que a inspeção completa ou maior de estimativas estaria em torno do valor verdadeiro do total de todos os itens de uma população seja mais conveniente do parâmetro. Existe uma técnica especial, a amostragem, para recolher amostras, que garantam, tanto quanto possível, o caráter de representatividade do todo, que possam ser usadas para permitir fazer inferências acerca da população de que originou. Quanto mais complexa for a amostragem, maiores cuidados deverão ser tomados nas análises estatísticas utilizadas; em contrapartida, o uso de um esquema de amostragem mais elaborado pode levar a uma diminuição no tamanho da amostra que a inspeção de apenas uma amostra deles. Na prática, o contrário é que é quase válido Firmas comerciais e entidades governamentais recorrem á amostragem por várias razões. O custo é usualmente um fator relevante. Colher dados e analisar resultados custam dinheiro e, em geral quanto maior o número de dados colhidos, maior o custo. Outra razão para o emprego de amostragem é que o valor da informação dura pouco. Para ser útil, a informação deve ser obtida e usada rapidamente. A amostragem é a única maneira de se fazer isso. Por vezes, o exame de necessário para uma dada precisão. Antes de escolher a amostra, é preciso definir a técnica de amostragem, isto é, os critérios que serão usados para escolher os determinado artigo o destrói. Testar cadeiras quanto a sua resistência ao peso obviamente as destrói; se fôssemos testar todas as cadeiras, não sobrariam cadeiras para a venda. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 11 A amostragem é preferível ao censo quando: uniformidade nos métodos de coleta I. A população pode ser infinita, e obviamente não seria comparabilidade entre os dados, do que um censo. possível examinar todos os itens da população o que tornaria então o censo impossível. de dados, e maior O tipo de informação pode depender da utilização de uma amostra ou de um censo. Freqüentemente as despesas com coleta II. Uma amostra pode ser mais atualizada do que o censo. de dados sofrem restrições orçamentárias. Existe também a Se se necessita de ma informação rapidamente, um estudo de toda premência do tempo. Se nos decidirmos por um censo, os a população pode consumir demasiado tempo e perder utilidade. problemas de custo e de tempo podem conduzir a uma limitação do Além disso, se a população tende a modificar-se com o tempo, um censo a apenas uma ou a poucas características por item. Uma censo poderá, na realidade, combinar várias populações. amostra com o mesmo custo e mesmo tempo, poderia proporcionar III. Os testes podem apresentar caráter destrutivo, ou seja, resultados mais aprofundados sobre um menor número de itens. os itens examinados são destruídos no próprio ato do experimento. Então o censo nos daria o panorama preciso de uma população Entretanto, há certas situações em que é mais vantajoso fazer um censo. Entre essas situações destacamos: que não existe mais. I. A população pode ser tão pequena que o custo e o tempo IV. O custo de um censo pode ser proibitivo, normalmente de um censo sejam pouco maiores que para uma amostra. se o custo individual é elevado e se existem muitos itens na população. II. Se o tamanho da amostra é grande em relação ao da população, o esforço adicional requerido por um censo pode ser A precisão pode sofrer no caso de um censo de uma grande pequeno, além disso, o censo eliminará a variabilidade amostral. população. A amostragem envolve menor número de observações III. Se exige precisão completa, então o censo é o único e, conseqüentemente, menor número de coletores de dados. Com método aceitável. Em face da variabilidade amostral, nunca grande número de agentes, há menor coordenação e controle, podemos ter certeza de quais são os parâmetros verdadeiros da aumentando a chance de erros. A amostragem pode revelar maior população. Um censo nos dará essa informação, embora erros na PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 12 coleta dos dados e outros tipos de tendenciosidade possam afetar a precisão dos resultados. Amostragem Aleatória Simples. Ocasionalmente, já se dispõe da informação completa, de modo que não há necessidade de amostra. Este tipo de amostragem é equivalente a um sorteio lotérico. A Amostragem Aleatória Simples é constituída de elementos retirados ao acaso da população. Então todo elemento da população tem probabilidade fixa de ser amostrado. Por isso é que 1.3 Tipos de amostras. a esse tipo de amostragem tende a produzir amostras representativas. Amostragem Probabilística. Exemplo: Geralmente são considerados aleatórios os Uma amostragem será probabilística se todos os elementos seguintes processos: da população tiverem probabilidade conhecida, e diferente de zero, • A chegada de carros a um posto de pedágio de pertencer à amostra. Desta forma, a amostragem probabilística • As chamadas telefônicas numa grande mesa de operação implica um sorteio com regras bem determinadas, cuja realização • A chegada de clientes aos caixas de um supermercado • A produção de qualquer processo mecânico só será possível se a população for finita e totalmente acessível. Consideraremos aqui os seguintes planos de amostragem probabilística: • Sucessivos lances de moeda ou de dado . Tempo de serviço em estações de pedágio Amostragem Sistemática. Amostragem Aleatória Simples Amostragem Proporcional Estratificada Amostragem Sistemática Quando os elementos da população já se acham ordenados, não há necessidade de construir um sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, as linhas de produção etc. Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 13 A Amostragem Sistemática é constituída de elementos retirados da população segundo um sistema preestabelecido. então os processos de amostragens não-probabilísticas também podem ser considerados válidos. Consideraremos aqui os seguintes planos de amostragem Amostragem Proporcional Estratificada. Muitas vezes a população se divide em subpopulações, não probabilística: Amostragem a Esmo e Amostragem por Julgamento denominadas de Estratos. Como é provável que a característica em estudo dessa população apresente, de estrato em estrato, um Amostragem a Esmo. comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que o sorteio dos elementos É o caso em que o pesquisador procura ser aleatório, sem, no entanto, utilizar um sorteio aleatório rigoroso da amostra leve em consideração tais estratos. A amostra proporcional estratificada é composta por Os resultados de uma amostragem a esmo são os mesmos de uma amostragem probabilística se a população é homogênea e elementos proveniente de todos os estratos. se não existe a possibilidade de o amostrados ser influenciado Amostragem Não Probabilística. (mesmo que inconscientemente) por alguma característica dos Quando nem todos os elementos da população tiverem uma elementos da população. probabilidade diferente de zero de pertencerem à amostra, dizemos que a amostragem é não probabilística. Este processo de Amostragem por Julgamento. Neste tipo de amostragem, a amostra é colhida na parte da amostragem é subjetivo e seu regimento depende do conhecimento que possui o pesquisador a respeito da estrutura da população. É empregada, muitas vezes, por simplicidade ou pela impossibilidade população que é acessível. Então se faz uma distinção entre população-objeto (aquela que se tem em mente ao realizar o estudo) e a população-amostrada (a parte da população que é de se obter amostragens probabilísticas. Se os efeitos das amostragens não-probilísticas podem ser considerados equivalentes aos das amostragens probabilísticas, acessível). Se essas duas populações tiverem as mesmas características, este tipo de amostragem vai ser equivalente a uma amostragem probabilística. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 14 Se o tamanho da amostra é bem pequeno, digamos, de um quantitativas discretas e quantitativas contínuas. As variáveis a cinco itens, a amostragem aleatória pode dar totalmente não- discretas podem ser vistas como resultantes de contagens, representativos, ao passo que uma pessoa familiarizada com a assumindo assim, valores inteiros. Já as variáveis contínuas população pode especificar quais os itens mais representativos da geralmente provêm de uma mensuração e podem assumir qualquer população. valor em intervalos dos números reais. Qualitativas (não numéricas): São as variáveis cujos possíveis valores que assumem representam atributos e/ou quantidades. Se 1.4 Tipos de variáveis. tais variáveis têm uma ordenação natural, indicando intensidades crescentes de realização, então elas serão classificadas como Organização de Dados – Variáveis. Os dados estatísticos se obtêm mediante um processo que envolve a observação ou outra mensuração de características de uma população ou amostra tais como renda anual numa comunidade, sexo dos indivíduos de uma tribo indígena, qualitativas ordinais ou por postos. Caso contrário, quando não é possível estabelecer uma ordem natural entre seus valores definindo apenas uma categoria, elas são classificadas como qualitativas nominais. percentagem de açúcar em cereais, etc. Cada uma dessas características é chamada de variável, porque originam valores que tendem a exibir certo grau de variabilidade quando se fazem mensurações sucessivas Classificação das variáveis. Vamos considerar dois grandes tipos de variáveis: Quantitativas (numéricas): São as variáveis cujos valores são expressos em números. Elas podem ser subdivididas em PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 15 gráficos. Meios de comunicação apresentam, diariamente, gráficos 1.5 Representações gráficas. das mais variadas formas para auxiliar na apresentação das Tabelas e Gráficos. Os dados depois de tratados podem ser apresentados em tabelas. Existem normas nacionais para a organização de tabelas, ditadas pela ABNT. Essas normas não serão tratadas aqui, mas convém saber que as tabelas devem ter os seguintes componentes: Título: Precede a tabela e explica, em poucas palavras, o dado em estudo. Se for o caso, indica o tempo e o lugar a que os dados se referem. Coluna Indicadora: Especifica em cada linha os valores que os dados podem assumir. a entidade, o pesquisador desempenho. Graças à proliferação de recursos gráficos, cuja construção tem sido cada vez mais simplificada em programas computacionais, existe hoje uma infinidade de tipos de gráficos que podem ser utilizados. Deve ser notado, entretanto, que a utilização de recursos visuais na criação de gráficos deve ser feita cuidadosamente; um gráfico desproporcional em suas medidas pode dar falsa impressão Obviamente, questões de manipulação incorreta da informação podem ocorrer em qualquer área e não cabe culpar a Estatística. O uso e a divulgação ética e criteriosa de dados devem Corpo da tabela: Apresenta a frequência dos dados. Especifica e tabelas em documentos internos e relatórios de atividades e de desempenho e conduzir a conclusões equivocadas. Cabeçalho: Especifica o conteúdo de cada coluna Fonte: informações. Órgãos públicos e empresas se municiam de gráficos ou ser pré-requisitos indispensáveis e inegociáveis. Exemplos: Vamos definir quatro tipos básicos de gráficos: pesquisadores que forneceram os dados, quando esses não foram coletados por você. A organização dos dados em tabelas de frequência proporciona um meio eficaz de estudo do comportamento de características de interesse. Muitas vezes, a informação contida Gráfico de disco: É usado para mostrar a importância relativa das proporções. Esse tipo de gráfico se adapta melhor às variáveis qualitativas nominais. nas tabelas pode ser mais facilmente visualizada através de PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 16 Gráfico de barras: Utiliza o plano cartesiano com os valores da variável no eixo das abscissas e as frequências ou Frequência relativa (fr): São os valores das razões entre as freqüências simples e a freqüência total. porcentagens no eixo das ordenadas. Normalmente calcula-se a frequência relativa para efeito de Esse tipo de gráfico se adapta melhor às variáveis discretas ou qualitativas ordinais. comparação com outros grupos ou conjunto de dados. Convém notar que, quando estivermos comparando dois grupos com relação às freqüências de ocorrência dos valores de uma dada variável, grupos com um número total de dados maior tendem a ter 2. DISTRIBUIÇÃO DE FREQUÊNCIA maiores freqüências de ocorrência dos valores da variável. Dessa forma, o uso de freqüência relativa vem resolver este problema. Frequência acumulada (F): É o total das freqüências de Uma distribuição de frequência é um método de grupamento de dados em classes, ou intervalos, de tal forma que se possa determinar o número ou a percentagem de observações em cada todos os valores inferiores ao limite superior do intervalo de uma dada classe. Normalmente utilizamos esse tipo de freqüência quando classe. O número ou percentagem numa classe chama-se freqüência de classe. Uma distribuição de freqüência pode ser apresentada sob forma gráfica ou tabular. tratamos de variáveis qualitativas ordinais ou quantitativas em geral. Frequência acumulada relativa (Fr): É o total das freqüências relativas de todos os valores inferiores ao limite 2.1 Tipos de frequências. superior do intervalo de uma dada classe. Como no caso anterior utilizamos esse tipo de freqüência quando Frequência simples ou absoluta (f): São os valores que realmente representam o número de dados de cada classe. tratamos de variáveis qualitativas ordinais ou quantitativas em geral. O processo de construção de uma distribuição de freqüência para determinado conjunto de dados depende do tipo de dados em estudo, isto é, contínuos, discretos, nominais ou ordinais. Vamos estudar cada caso. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 17 Os dados coletados são registrados em fichas que contêm, além dos dados de interesse, diversas outras informações. aproximado para cima com o mesmo número ou mais casas decimais que os valores das variáveis. 5 – Estabelecer os intervalos das classes começando com Portanto, terminada a fase de coleta dos dados, é preciso retirar os dados das fichas e organizá-los. Esta fase do trabalho é um inteiro logo abaixo do menor valor observado e somando a denominada, tecnicamente, de tratamento dos dados. amplitude das classes. Os intervalos de classe devem ser escritos, de acordo com a Resolução 866/66 do IBGE em termos de “desta Distribuição de Frequência para Variáveis Quantitativas Contínuas. quantidade até menos aquela”, empregando, para isso, o símbolo ├ (inclusão por limite inferior e exclusão do limite superior). 6 – Relacionar os intervalos e fazer a contagem dos pontos Os principais estágios na construção de uma distribuição de frequência para dados contínuos são: por classe. A contagem total deve ser igual a n. 1 – Organizar os dados brutos em um rol de ordem crescente ou decrescente. 7 – construir uma tabela de freqüência ou um gráfico de frequência. 2 – Determinar a amplitude total dos dados que é a diferença entre o maior e menor dos dados. 3 – Determinar quanto ao número de classes a usar (k). É aconselhável usar entre 5 e15 classes. Menos que cinco classes pode ocultar detalhes importantes dos dados, e mais que quinze torna a apresentação demasiado detalhada. Uma regra prática consiste em tomar a raiz quadrada do número total de dados ( n ) e ajustá-la, se necessário, aos limites de 5 a 15. 4 – Determinar a amplitude de cada classe dividindo a amplitude total por k. Se necessário o valor encontrado deve ser PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 18 2.2 Rol, Amplitude e Intervalos de uma Tabela de distribuição de frequência. 1º Obtenha o rol dos dados coletados acima: Atividade 1 - Elaboração de uma tabela de distribuição de frequência. Exemplo: Tomemos como dados brutos as notas de uma prova de Matemática para uma classe de 50 alunos. O professor que corrigiu a prova, tem uma lista em ordem alfabética, com as seguintes notas. 3,0 0,7 4,9 7,5 3,6 10,0 10,0 9,4 5,5 1,6 8,0 2,7 5,4 4,2 2,7 3,8 2,5 1,3 0,9 2,8 4,9 4,8 5,7 6,1 4,9 7,2 0,0 2,6 3,7 3,2 7,8 2,3 1,9 4,6 6,5 6,2 4,1 3,4 7,7 8,1 Tabela de notas. 6,2 4,2 1,5 0,0 8,5 5,3 8,1 5,2 5,8 3,5 2º Calcule a Amplitude deste Rol. 3º Escolha do intervalo ou Classe de estudo para construção de uma tabela de frequência. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 19 4º Construa uma tabela de distribuição de Frequência. Notas (Classes ou intervalos) Alunos (Frequência absoluta) (Fa) Frequência relativa (Fr) Frequência Relativa acumulada (Fra) 2.3 Histograma e polígonos de frequência. Histograma: É a representação gráfica de uma distribuição de frequência por meio de retângulos justapostos. Esse tipo de gráfico se adapta melhor às variáveis quantitativas contínuas. Polígono de frequência: É uma alternativa ao histograma construído mediante a conexão dos pontos médios dos intervalos do histograma com linhas retas. Atividade 2: Construção do Histograma e polígono de frequência. 5º Construa uma Histograma. Frequência Total PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 20 6º Construa um polígono de frequência. 3,9 um rendimento insatisfatório, os alunos da faixa 4,0 a 5.9 obtiveram um rendimento satisfatório, os da faixa 6,0 a 7,9 muito bom e os da faixa de 8,0 a 10,0 chegam ao rendimento Excelente. Obtenha um gráfico de disco (ou setores) explicitando a porcentagem de alunos em cada uma destes rendimentos. 7º Considerando que os alunos que estão na faixa de 0,0 a 1,9 tiveram um rendimento insuficiente, e os alunos na faixa de 2,0 a PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 21 2.5 Descrição de dados amostrais. A Moda. A moda é o valor que ocorre com maior frequência num conjunto. A moda de uma amostra será indicada por Mo. Exemplo: Determine a moda dos dados: 0,0,2,5,3,7,4,7,8,7,9,6. A moda é 7, porque é o valor que ocorre o maior número de vezes. Um conjunto de dados pode não ter moda porque nenhum valor se repete o maior número de vezes é o caso do conjunto:3,5,8,10,12,13 Dizemos que esse conjunto é amodal. Em outros casos, ao contrário, pode haver dois ou mais valores de concentração. Dizemos, então, que o conjunto tem dois ou mais valores modais. No conjunto: 2,3,4,4,4,5,6,7,7,7,8,9. valores, ou um grupo de valores, ocorre com muito mais frequência que os outros. Na maior parte das vezes, a média aritmética e a mediana fornecem melhor descrição da tendência central dos dados. Quando existe uma grande quantidade de dados e, principalmente, os dados estão dispostos em uma tabela de frequências, a ideia da moda é útil. A moda de uma distribuição de frequência indica qual porção da distribuição tem a maior frequência de ocorrências. Em geral é bastante simples identificar a moda de dados que estão agrupados em uma tabela de frequências. Exemplo: Considere a tabela de distribuição de frequências relativas ao percentual de vezes que 50 alunos formulam questões durante uma palestra. Temos duas modas: 4 e 7. Esse conjunto se diz bimodal. A moda funciona como medida descritiva quando se trata de contar dados. Essa medida não se presta a manipulações matemáticas. De um ponto de vista puramente descritivo, a moda indica o valor “típico” em termos de maior ocorrência. Além disso, se as frequências são razoavelmente uniformes, a moda perde muito de sua importância como medida descritiva. A moda neste caso é 4 pois a maior parte dos alunos (35%) formularam 4 perguntas para o palestrante. Por outro lado, a utilidade da moda se acentua quando um ou dois PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 22 n 2.6 Medidas de Tendência Central (Posição). x a .p p i 1 Média Aritmética (simples ou ponderada). Dado um conjunto de dados i i 1 n (valores i a1 . p1 a 2 . p 2 a3 . p3 ... a n 1 . p n 1 a n . p n p1 p 2 p3 ... p n 1 p n i numéricos) a1, a2, a3, ..., an-1, an ; define-se a média aritmética simples deste Exemplo: Calcule a média aritmética das notas de um aluno de conjunto de dados por: Educação Básica, referente aos quatro bimestres do ano: 4,5; 5,5; 7,0; 6,0. Sabendo que as notas possuem pesos referentes aos n x a i 1 n i a1 a 2 a3 ... a n 1 a n n bimestres, ou seja: 1º bimestre peso 1, 2ºbimestre peso 2, 3º bimestre peso 3 e 4ºbimestre peso 4. Exemplo: Calcule a média aritmética das notas de um aluno de Educação Básica, referente aos quatro bimestres do ano: 4,5; 5,5; 7,0; 6,0. x i 1 4 x a .p i 1 4 i a a 2 a3 a 4 4,5 5,5 7 6,5 23,5 1 5,9 4 4 4 Agora, dado um conjunto de dados (valores numéricos) a1, a2, a3, ...,an; supondo que eles sejam distintos dois a dois e que numa lista a1 apareça p1 vezes, a2 apareça p2vezes, a3 apareça p3 i p i 1 4 a 4 i a1 . p1 a 2 . p 2 a 3 . p 3 a 4 . p 4 4,5.1 5,5.2 7.3 6.4 p1 p 2 p 3 p 4 1 2 3 4 i 60,5 6.,05 10 Quando temos uma tabela de distribuição de frequência, podemos calcular uma aproximação da média aritmética usando os pontos médios das classes. Sendo xi o ponto médio e fi a frequência da classe i, temos: vezes, e assim por diante; neste caso a média é chamada de média aritmética ponderada, definida por: n x x .f i 1 n f i 1 PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. i i i x1 . f1 x 2 . f 2 x3 . f 3 ... x n 1 . f n 1 x n . f n f1 f 2 f 3 ... f n 1 f n 23 Mediana. Exemplo: Dado um conjunto de dados (valores numéricos) a1, a2, a3, mediana da sequência: Como a sequência possui 18 termos (par), faremos a média aritmética dos termos centrais é dado por: a18 a18 Se n é ímpar (conjunto de dados em número ímpar), tomemos o termo central da sequência, ou seja: M d a n1 . Md 2 Exemplo: a 0,0,1,1,1,2,2,2,3,3,3,3,3,4,4,5,6,7. ..., an-1, an ; em rol (ordenados em ordem crescente), a mediana Md é obtida por: Obtenha Obtenha a mediana da 2 2 2 a9 a10 3 3 6 3 2 2 2 Caso tenhamos uma tabela de distribuição de frequência, sequência: podemos estimar a mediana usando a seguinte relação: 0,0,1,1,1,2,2,2,3,3,3,3,3,4,4,5,6. Como a sequência possui 17 termos (ímpar), o termo central é dado por: M d a171 a18 a9 , sendo assim a mediana é o 2 1 Md 2 nono termo da sequência, ou seja, Md = 3. * .c L é o limite inferior da classe mediana, que é a classe Se n é par (conjunto de dados em número par), tomemos a média aritmética simples dos termos centrais da sequência, n f L 2 fm contendo o termo central ou termos centrais da série estatística; n é o número de termos da série; ou seja: an an Md 2 2 f 1 * é a soma das frequências das classes que precedem a classe mediana.; 2 fm é a frequência da classe mediana; c é a amplitude do intervalo da classe mediana. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 24 Comparação entre Média Aritmética e Mediana. A escolha da média, ou da mediana, como medida de tendência central de um conjunto, depende de diversos fatores. A Neste conjunto não há discrepância de valores. média é sensível a (ou influenciada por) cada valor do conjunto, inclusive os extremos. Por outro lado, a mediana é relativamente insensível aos valores extremos. Um exemplo clássico em que a mediana pode descrever melhor a tendência central dos dados do que a média é dado pelos salários de uma categoria profissional. A mediana descreve bem os grandes conjuntos de dados. De qualquer forma, em algumas circunstâncias, a mediana descreve, melhor do que a média, a tendência central dos dados. Exemplo: A mediana dos dados 5,7,10,13,65 é o número 10. É o caso dos salários dos jogadores de futebol no Brasil. A existência de alguns salários muito altos afeta mais a média do que a mediana. Então, a mediana dá, melhor do que a média, ideia do salário típico dessa categoria de profissionais. Calculando a média desses dados temos que: De modo geral, a média possui certas propriedades matemáticas que a tornam atraente. Além disso, a ordenação dos dados para determinar a mediana pode ser enfadonha, e o cálculo da mediana não pode ser feito com máquina de calcular, ao contrário do que ocorre com a média. Neste conjunto há um dado discrepante que é o 65. Esse valor “puxa” a média para cima, mas não afeta a mediana. Por outro lado, para o conjunto 5,7,10,13,15, a mediana ainda é o número 10, e sua média é dada por PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 25 Comparação entre Média, Mediana e Moda. Atividade 3: Lista de Exercícios 1. 1) Durante uma manhã, um feirante vendeu determinado produto a preços variados: 12 unidades foram vendidas a 2 reais; 10 unidades foram vendidas a 3 reais e 8 unidades foram vendidas a 6 reais. a) Coloque a sequência em rol. b) Qual a Moda dessa sequência? c) Qual a mediana? d) Qual foi o preço médio de venda desse produto naquela manhã? e) Construa uma “mini” tabela de distribuição de frequência. 2) Foram coletadas 150 observações da variável X, representando o número de vestibulares (um por ano) que um mesmo estudante prestou. Os dados estão na tabela abaixo: a) Quantas vezes, em média, cada aluno prestou vestibular? b) Qual a mediana em relação a quantidade de vezes que o aluno prestou o vestibular? PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 26 3) Pode ser de interesse estudar o gasto dos alunos associado com 5) Considere a distribuição relativa a 33 famílias de quatro filhos, as despesas do vestibular. Para simplificar um pouco a situação, tomando como variável o número de filhos do sexo masculino. vamos supor que se atribui, para cada aluno, uma despesa fixa de R$ 1300,00, relativo à preparação e mais R$ 50,00 para cada vestibular prestado. De posse dessas informações, vamos calcular a média da variável D: Despesa com vestibular. 4) Imagine que a margem de lucro na venda de um produto é variável, mas que, ao longo de seis meses, foram registrados os a) Determine a mediana desta distribuição. valores apresentados na tabela abaixo. b) Calcule a média aritmética. c) Qual a moda desta distribuição? 6) Considere a distribuição relativa a 8 pessoas, tomando para variável o número de vezes que vão ao cinema por mês. a) Calcule a média aritmética da margem de lucro nesse período. Margem de lucro, em termos de percentual do valor de compra, segundo a classe. b) Calcule a mediana da margem de lucro nesse período. Margem de lucro, em termos de percentual do valor de compra, segundo a a) Determinar a mediana desse conjunto classe. b) Calcule a média aritmética. c) Qual a moda desta distribuição? PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 27 Agora temos que o desvio médio desta sequência é: 2.7 Medidas de Dispersão. 18 As medidas de dispersão indicam se os valores de um conjunto de dados estão relativamente próximos um dos outros ou separados em torno de uma medida de tendência central (posição). Dm i 1 Dm Desvio médio. x O desvio médio analisa a média dos desvios em torno da i Md x1 M d x 2 M d x3 M d ... x18 M d 18 18 2. 0 3 3.1 3 3. 2 3 5. 3 3 2. 4 3 5 3 6 3 7 3 18 6 63 0 2 23 4 18 Dm mediana. Define-se o desvio médio como sendo a média aritmética 26 1,45 18 dos valores absolutos das diferenças entre cada valor e a mediana Variância. A variância de um conjunto de dados é a média dos da série: quadrados dos desvios dos valores a contar da média n Dm x i 1 i Md n x n x1 M d x 2 M d x3 M d ... x n M d n i 1 x x 2 1 n 2 2 2 x x 2 x x3 x ... xn x n 2 Exemplo: Calcule a variância das notas de um aluno de Exemplo: Obtenha o desvio médio da sequência:0,0,1,1,1,2,2,2,3,3,3,3,3,4,4,5,6,7. Como a sequência possui 18 termos (par), faremos a média aritmética dos termos centrais para obter a mediana: a18 a18 Md i 2 2 2 1 Educação Básica, referente aos quatro bimestres do ano: 4,5; 5,5; 7,0; 6,0. Sabendo que as notas possuem pesos referentes aos bimestres, ou seja: 1º bimestre peso 1, 2ºbimestre peso 2, 3º bimestre peso 3 e 4ºbimestre peso 4. a9 a10 3 3 6 3 2 2 2 PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 28 Notas: i) O desvio padrão não se altera quando a cada xi se 4 x a .p i 1 4 i p i 1 i a1 . p1 a 2 . p 2 a3 . p3 a 4 . p 4 4,5.1 5,5.2 7.3 6.4 p1 p 2 p3 p 4 1 2 3 4 adiciona uma constante. ii) O desvio padrão fica multiplicado por uma constante se i cada xi for multiplicado por esta constante. 60,5 6.05 10 Exemplo: Calcule o desvio padrão das notas de um aluno de Educação Básica, referente aos quatro bimestres do ano: 4,5; 5,5; Agora fazendo a variância, temos: 7,0; 6,0. Sabendo que as notas possuem pesos referentes aos x 4 x x 2 2 2 2 i 1 1 bimestres, ou seja: 1º bimestre peso 1, 2ºbimestre peso 2, 3º 2 x x 2 x x3 x x 4 x 4 4 2 2 2 2 4,5 6,05 5,5 6,05 6 6,05 7 6,05 4 2,4 0,3 0,003 0,9 3,6 0,9 4 4 1 bimestre peso 3 e 4ºbimestre peso 4. Como já conhecemos a média aritmética e a variância da série: x 6,05 e 0,9 , então para o cálculo do desvio padrão, temos: 0,9 0,95 Desvio Padrão. É a medida de dispersão mais utilizada em estatística, o desvio padrão é definido como sendo a raiz quadrada da média dos quadrados dos desvios dos valores a contar da média, ou seja, a raiz quadrada da variância. x n i 1 i x 2 n PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 29 Atividade 4: Lista de Exercícios 2. 1) Em um determinado dia foi registrado o número de veículos negociados por uma amostra de 10 vendedores de uma agencia de automóveis como mostra a tabela abaixo. 2) A tabela abaixo representa os escores obtidos por um grupo de 58 alunos matriculados em uma determinada disciplina. a) Calcule a média aritmética. a) Calcule a média aritmética. b) Calcule a mediana. b) Calcule a mediana. c) Calcule o desvio médio. c) Calcule o desvio médio. d) a variância da série de valores. d) a variância da série de valores. e) o desvio padrão da série. e) o desvio padrão da série. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 30 3. TEORIA DA PROBABILIDADE. Fenômenos Determinísticos. 3.1 Espaço amostral e Evento, Espaço Amostral Equiprovável. Os fenômenos determinísticos são aqueles em que os resultados são sempre os mesmos, qualquer que seja o número de Espaço Amostral ocorrências verificadas. . O Espaço amostral de um experimento aleatório é o conjunto de todos os Exemplo: Se tomarmos um determinado sólido, sabemos que uma certa temperatura haverá a passagem para o estado resultados possíveis deste experimento. Os elementos do espaço amostral podem ser chamado de pontos amostrais. Exemplos: 1. No lançamento de uma moeda não viciada, temos que o espaço líquido. Este exemplo caracteriza um fenômeno determinístico. amostral é dado por Fenômenos Aleatórios. C, K , onde C(cara) e K(coroa). 2. No lançamento de duas moedas não viciadas, temos o seguinte espaço Os fenômenos aleatórios são aqueles que os resultados não amostral: são previsíveis, mesmo que haja um grande número de repetições do mesmo fenômeno. C, C ; C, K ; K , C ; K , K . 3.No lançamento de um dado não viciado, temos que o seu espaço amostral é dado por 1,2,3,4,5,6. Exemplo: Se considerarmos um pomar com centenas de laranjeiras, as produções de cada planta serão diferentes e não Evento (E). O evento de um experimento aleatório é um subconjunto do espaço amostral. previsíveis, mesmo que as condições de temperatura, pressão, umidade, solo, etc. sejam as mesmas para todas as árvores. Exemplos: 1) No lançamento de uma moeda não viciada, o evento de ocorrer faces iguais é dado por: E C, C ; K , K , observe que como C, C ; C, K ; K , C ; K , K , então E . 2. No lançamento de um dado não viciado, temos os eventos acontecimentos de números pares E1 2,4,6e acontecimento de números como 1,2,3,4,5,6, então E1 e E2 , além disso podemos notar que PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. E1 E2 . ímpares E2 1,3,5 , observe que 31 Espaços amostrais Equiprováveis. Dizemos que um espaço amostral é equiprovável quando são atribuídas probabilidades iguais a cada um dos seus eventos 3.2 Axiomas de Probabilidades e Propriedades. Probabilidade de um Evento. unitários. Seja S um espaço amostral equiprovável de um certo experimento aleatório e seja Exemplo: No lançamento de um moeda não viciada, é fácil perceber que temos dois resultados igualmente prováveis de E um evento escolhido de S. Define-se P(E), como sendo a probabilidade de ocorrer o evento E, dado por: P( E ) acontecer: Cara (C) e Coroa (K), sendo assim o conjunto S C, K é uma espaço amostral equiprovável. n( E ) n( S ) Em que n(E) é o número de elementos do Evento Escolhido (E) e n(S) é o número de elementos do Espaço amostral equiprovável (S). Consequências da Definição – Axiomas e propriedades. Atividade 5: Lista de exercícios 3. 0 P( E ) 1. P( E) 0 E Proposição 1: Evento Complementar. 1) No lançamento de uma moeda e um dado (não viciados). Seja (E) um evento de um espaço amostral equiprovável S. Sendo a) Qual o espaço amostral? complementar a este evento (E) de forma que b) Quais os eventos: propriedade: E1 - Ocorrer cara e número par. P( E ) 1 E S E2 - Ocorrer coroa e número primo. P( S ) n( S ) 1 (I), mas como: n( S ) n(S ) n( E ) n E (II).Substituindo (II) em (I), temos: bola branca (b). a) Deseja-se retirar uma bola desta urna. Qual o espaço amostral para este experimento? n( E ) n E n ( S ) n( E ) n E 1 1 P( E ) P E 1 n( S ) n( S ) n( S ) n( S ) b) Se retiramos duas bolas desta urna, qual o evento no qual sempre aparece uma bola branca? PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. o evento Temos a seguinte P( E ) P E 1 Prova: De fato, temos que 2) Numa urna existem 5 bolas vermelhas (v1, v2, v3, v4, v5) e uma EE S. E 32 Atividade 6: Lista de exercícios 4. 1) Um dado honesto é lançado e observa-se o número da face voltada para cima. Qual a probabilidade desse número ser maior que 4? 4) Uma urna contém 10 bolas identificadas pelas letras A, B, C, D, ..., J. Uma bola é extraída ao acaso da urna e sua letra é observada. Qual a probabilidade da bola sorteada ser: a) vogal b) consoante 2) No lançamento de um único dado honesto: a) Qual a probabilidade de ocorrer face 6? b) Qual a probabilidade de ocorrer face par? c) Qual a probabilidade de ocorrer face impar? Atividade 7: Lista de exercícios 5 (Lista Complementar). 2) De um baralho de 52 cartas, retirando-se uma única carta ao 1) Determine a probabilidade de que um casal com três filhos tenha acaso. exatamente 2 meninos. a) Qual a probabilidade de se obter uma dama? b) Qual a probabilidade de se obter um reis preto? 2) Em um teste com três questões do tipo V/F, um estudante mal c) Qual a probabilidade de se obter uma carta de copas? preparado deve responder cada uma aleatoriamente (por palpite). d) Qual a probabilidade de se obter uma figura de ouros? a) Relacione os diferentes resultados possíveis: (Considere o “As” como figura, junto a dama, valete e reis) b) Qual é a probabilidade de responder corretamente todas as três questões? 3) Uma urna tem oito bolas idênticas numeradas de 1 a 8. Qual a c) Qual é a probabilidade de “palpitar” incorretamente todas as três probabilidade, ao retiramos uma bola da urna, de não obtermos a questões? bola de número 1? d) Qual é a probabilidade de passar no teste “palpitando” corretamente ao menos duas questões? PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 33 3) Escolhe-se aleatoriamente dois objetos de um lote contendo 12, 8) Duas bolas vão ser retiradas ao acaso de uma urna que contém dos quais 4 são defeituosos. Sejam os eventos: 2 bolas brancas, 3 pretas e 4 verdes. Qual a probabilidade de que A = {ambos os objetos são defeituosos} ambas: B = { ambos os objetos a) sejam verdes? não são defeituosos} b) sejam da mesma cor? a) Calcule a probabilidade de ocorrer o evento A. b) Calcule a probabilidade de ocorrer o evento B. 3.3 União de eventos. 4) De uma urna contendo 5 bolas numeradas de 1 a 5. Retira-se 3 bolas ao acaso, qual a probabilidade de saírem as bolas 1,2 e 3, nessa ordem? Proposição 2: Sejam um espaço amostral equiprovável S e os eventos A e B quaisquer de S. Temos então: 5) Da mesma urna do exercício anterior, se retiramos 3 bolas, uma P( A B) P A PB P A B após a outra, sem reposição, qual a probabilidade de saírem as Prova: De fato, pois P( A B) bolas 1,2 e 3, nessa ordem? 6) Ainda da mesma urna dos dois exercícios acima, se retirarmos 3 n( A B ) (I), mas: n( S ) bolas, uma após a outra, com reposição, qual a probabilidade de n( A B) n( A) nB n( A B) (II)Substituindo (II) em (I), saírem as bolas 1,2 e 3, nessa ordem? temos: n( A) n( B) n( A B) n( A) n( B) n( A B) n( S ) n( S ) n( S ) n( S ) P( A) P( B) P( A B) 7) De um baralho de 52 cartas, retirando-se duas cartas ao acaso, P( A B) calcule: a) Qual a probabilidade de se obter dois valetes? b) Qual a probabilidade de se obter duas figuras? (Considerando Eventos Mutuamente Exclusivos. Dois evento são mutuamente exclusivos quando não podem ocorrer como figura, As, valete, Dama e Rei) simultaneamente. Assim, se A e B são eventos mutuamente exclusivos, podemos escrever c) Qual a probabilidade de se obter 2 cartas de Paus? que A B . Sendo assim, P( A B) P A PB P A B P( A B) P A PB PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 34 Atividade 8: Lista de exercícios 6. 3.4 Probabilidade Condicional e Eventos Independentes. 1) Um grupo de 100 universitários é formado por 52 estudantes de engenharia, 27 de medicina, 10 de filosofia e os demais de Proposição 3: Partição de um espaço amostral. sistemas de informação. Escolhido ao acaso um elemento do Suponhamos agora que tomemos n subconjuntos de um grupo, qual a probabilidade de ele ser estudante de Engenharia ou espaço amostral equiprovável (S) mutuamente exclusivos dois a Sistemas de informação? dois, tais que: A1 A2 A3 A4 ... An S 2) Lança-se um dada honesto, e verifica-se a ocorrência de alguns Dizemos que os conjuntos A1, A2, A3, A4, ..., An , nessas eventos. a) Qual a probabilidade de ocorrer o evento número par ou número condições, constituem uma partição do espaço amostral equiprovável (S), então temos que: primo? P( A1 ) P( A2 ) P( A3 ) P( A4 ) ...P( An ) 1 b) Qual a probabilidade de ocorrer o evento número ímpar ou número primo? c) Qual a probabilidade de ocorrer o evento número par ou número Prova: De fato, pois P( S ) perfeito? Como A1, A2, A3, A4, ..., An são disjunto dois a dois, então: d) Qual a probabilidade de ocorrer o vento número ímpar ou número perfeito? n( S ) 1 (I). n( S ) n(S ) n( A1 ) n A2 ... n( An ) (II) Substituindo (II) em (I), temos: n( A1 ) n( A2 ) ... n( An ) 1 P( A1 ) P( A2 ) ... P( An ) 1 n( S ) PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 35 Proposição 4: Probabilidade Condicional. Proposição 5: Eventos Independentes. Num dado espaço amostral equiprovável S, considere os Dizemos que o evento A é independente de um evento B quando P( B / A) P( A) . eventos A e B. A probabilidade de ocorrer o evento B, já tendo ocorrido o evento A (ou seja, a probabilidade de B dado A), é definida por: P( A / B) Intuitivamente poderíamos dizer que a ocorrência do evento A não é influenciada pelo evento B. n( A B ) n( A) Assim, se dois eventos A e B são independentes, temos: P( A B) P( A).P( B) E, portanto: P( A B) (I) P( B / A) P( A) Prova: De fato, pois P( A B) P( A).P( B / A) , e como P( B / A) P( A) , temos que P( A B) P( A).P( B) Consequentemente: P( A / B) P( A B) (II) P( B) Atividade 9: Lista de exercícios 7. 1) Lançam-se 3 moedas não viciadas. Encontre a probabilidade de ocorrer cara em todas elas, se: Das expressões I e II tiramos uma expressão muito a) ocorrer cara na primeira. importante: P( A B) P( A).P( B / A) P( B).P( A / B) Esta expressão é conhecida como Interseção de eventos. b) Ocorrer cara numa das moedas. 2) A probabilidade de um atirador A acertar um alvo é de 1/4 e de um atirador B é 2/3. Calcule: a) P( A B) PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. b) P( A B) 36 3) Uma urna contém 7 bolas vermelhas e 3 bolas brancas. Três bolas são retiradas, uma após a outra, sem reposição. Encontre a probabilidade P de as duas primeiras serem vermelhas e a terceira ser branca. 4) Uma urna contém 7 bolas vermelhas e 3 bolas brancas. Três bolas são retiradas, uma após a outra, com reposição. Encontre a probabilidade P de as duas primeiras serem vermelhas e a terceira ser branca. Dizemos que um espaço amostral (S’) é não- equiprovável quando cada um de seus eventos unitários tem probabilidades diferentes. Exemplo: Três cavalos C1,C2 e C3 disputam um páreo no qual só se premiara o vencedor. Um conhecedor dos três cavalos afirma que a probabilidade de C1 vencer é o dobro de C2 e que C2 tem o triplo da probabilidade de C3 vencer. Se p é a probabilidade de C3 vencer, temos: 5) Um homem recebe 5 cartas, uma após a outra, de um baralho comum de 52 cartas. Qual é a probabilidade de todas serem de espadas? 6) lança-se um par de dados não viciados. Ache a probabilidade P de a soma ser igual ou maior que 10, se: Resolução: P(C1) = 2.P(C2) e P(C2) = 3.P(C3). Portanto, P(C1) = 6p, P(C2) = 3p e P(C3) = p. Ou seja, eventos unitários tem probabilidades diferentes de ocorrer, sendo, então, o espaço amostral S’ = {C1, C2, C3}, não – equiprovável a) ocorrer 5 no primeiro dado. b) ocorrer 5, em pelo menos um dos dados. . Proposição 6: Experimento repetidos. Consideremos um experimento que se repete n vezes e que em qualquer um deles tenhamos 3.5 Espaços amostrais não equiprováveis e experimentos repetidos. P( A) p e P( A) 1 p . Nessas condições, a probabilidade de o evento A ocorrer em k das n vezes que se repete o experimento é: n Pk . p k (1 p) n k k Espaços amostrais não – equiprováveis. Que é denominado lei binomial de probabilidade porque é expressa pelo termo de ordem K +1(Tk+1) do desenvolvimento de [p + (1-p)]n. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 37 Em que n k n! , número binomial ou número de (n k )!.k! combinações de k escolhas em n. Exemplo: i) um número par ou primo ocorra. ii) um número ímpar primo ocorra. iii) A ocorra, mas B não. Lança-se uma moeda 10 vezes. Qual a probabilidade de se obter 3 caras e 7 coroas? Resolução: Seja A o evento “obter cara”. Temos que P( A) p 2) Um dado de seis faces foi construído de modo que, sendo P(i) a 1 , n = 10 e k = 3; então: 2 10 1 n Pk . p k (1 p) nk P3 . 3 2 k 3 103 1 1 2 probabilidade de cair a face i, temos: P(1) = P(2) P(6) = 4.P(1) P3 3 10 1 1 7 . 8 2 15 1 1 P3 120 P3 128 8 128 P(3) = P(4) = P(5) = 2.P(1) Se lançarmos o dado duas vezes, qual a probabilidade de obtermos um par de 6? 3) Joga-se um dado quatro vezes. Qual a probabilidade de se obter Atividade 10: Lista de exercícios 8. 5 pontos duas vezes? 1) Seja um dado viciado de modo que a probabilidade de aparecer um número seja proporcional ao número dado (por exemplo, o 4) Um time A tem 2/3 de probabilidade de vitória sempre que joga. número 6 é duas vezes mais provável de aparecer que o 3). Se A joga 4 partidas, encontrar a probabilidade de vencer: Sejam A = {número par}, B = {número primo} e C = {número ímpar}; a) exatamente duas partidas. a) Descreva o espaço de probabilidade, isto é, encontre a b) mais que a metade das paridas. probabilidade de cada ponto amostral. b) Encontre a probabilidade de que: PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 38 3.6 Teorema de Bayes. Proposição 7: Teorema da probabilidade total. Proposição 8: Teorema de Bayes. Sejam A1, A2, A3, ...,An eventos que formam um partição do Sejam A1, A2, A3, ..., An eventos que formam um partição do espaço amostral. Seja B um evento desse espaço. Então: n P( B) P( Ai ).PB / Ai espaço amostral P(B/Ai), para P( A j / B) i 1 Prova: Os eventos . Seja B , e sejam conhecidas P(Ai) e ( B Ai ) e ( B A j ) , para i j , i i = 1,2,3,...,n, então teremos: P( A j ).P( B / A j ) n P( A ).P( B / A ) i 1 i , j 1,2,3,..., n i =1,2,3,..., n e j = 1,2,..., n, são mutuamente exclusivos, pois: ( B Ai ) ( B A j ) = B( Ai A j ) B Prova: Sendo: O evento B ocorre como se segue: P( A j / B) B ( B A1 ) ( B A2 ) ( B A3 ) ... ( B An ) P( B) P( B A1 ) P( B A2 ) P( B A3 ) ... P( B An ) E usando ao teorema do produto, vem: P( B) P( A1 ).P( B / A1 ) P( A2 ).P( B / A2 ) ... P( An ).( B / An ) P( A j B) P( B) . Usando-se o teorema do produto e o teorema da probabilidade total, chegando ao teorema acima. O Teorema de Bayes também é conhecido como teorema da probabilidade a posteriori, ele relaciona uma das parcelas da probabilidade total com a própria probabilidade total. Ou como se segue: n P( B) P( Ai ).PB / Ai i 1 PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 39 Atividade 11: Lista de exercícios 9. 4. DISTRIBUIÇÔES ESPECIAIS. 1) A urna A contém 3 fichas vermelhas e 2 azuis, e a urna B contém 2 vermelhas e 8 azuis. Joga-se uma moeda “honesta”. Se a moeda der cara, extrai-se uma ficha da urna A; se der coroa, extraise uma ficha da urna B. Uma ficha vermelha é extraída. 4.1 Variáveis aleatórias e função de distribuição de probabilidades. Variáveis aleatórias – Definição. Qual a probabilidade de ter saído cara no lançamento? Uma variável aleatória é uma função que associa um número real a cada elemento do espaço amostral. Exemplo: 2) Uma urna contém 5 bolas brancas, 4 vermelhas e 3 azuis. Duas bolas são retiradas, sucessivamente de Extraem-se simultaneamente 3 bolas. Achar a probabilidade de uma urna que contém quatro bola vermelhas e três bolas pretas, que: sem serem repostas. Os resultados possíveis e os valores y da a) nenhuma seja vermelha; variável aleatória Y, onde Y é o número de bolas vermelhas são: ESPAÇO AMOSTRAL Y VV 2 VP 1 3) As probabilidade de 3 jogadores, A, B e C, marcarem um gol PV 1 2 4 7 , e , respectivamente. Se 3 5 10 PP 0 b) exatamente uma seja vermelha; c) todas sejam da mesma cor. quando cobram um pênalti são cada um cobrar uma única vez, qual a probabilidade de que pelo menos um marque um gol? Onde (V) indica a bola de cor vermelha e(P) a bola de cor preta. Espaço amostral discreto: Se o espaço amostral contém um número finito de possibilidades ou uma sequência finita com tantos elementos quanto são os números inteiros, ele é chamado de espaço amostral discreto. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 40 Uma variável aleatória é chamada de variável aleatória discreta se seu conjunto de resultados possíveis for enumerável. Espaço amostral contínuo: Se um espaço amostral contém um número infinito de possibilidades igual ao número de É importante verificar que, para que haja uma distribuição de probabilidades de uma variável aleatória X, é necessário que: n p( x ) 1 i 1 i pontos em um segmento de linha, ele é chamado de espaço amostral contínuo. Exemplo: Lançam-se três moedas. Seja X o número de ocorrências de face cara. Determine a distribuição de probabilidade Se uma variável aleatória tiver um conjunto de valores de X. possíveis num intervalo contínuo de números, então ela não será Resolução: O espaço amostral do experimento é: C, C, C , C, C, K , C, K , C , C, K , K , K , C, C K , C, K , K , K , C , K , K , K discreta. Quando uma variável pode assumir valores em uma escala Se X é o número de caras, X assume os valores contínua, ela é chamada de variável aleatória contínua. Uma variável aleatória para ser discreta deve assumir valores em um conjunto infinito, porém enumerável. X: x1, x2, x3, ..., xn 0,1,2,3.Podemos associar a este número de eventos que correspondem à ocorrência de nenhuma, uma, duas ou três caras respectivamente, como se segue na tabela abaixo: X EVENTOS CORRESPONDENTES 0 A1 = {(K,K,K)} A Função de probabilidade é uma função que associa a 1 A 2= {(C,K,K),(K,C,K),(K,K,C)} cada valor assumido pela variável aleatória a probabilidade do 2 A 2= {(C,C,K),(C,K,C),(K,C,C)} evento correspondente, isto é: P( X xi ) P Ai , i 1,2,3,..., n 3 A1 = {(C,C,C)} Distribuição de Probabilidades – Função de Probabilidade. Ao conjunto {( xi , p( xi ), i 1,2,3,..., n} , damos o nome de distribuição de probabilidades da variável aleatória X. Podemos também associar, às probabilidades de X assumir um dos valores, as probabilidades dos eventos correspondentes: PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 41 1 3 P( X 0) P( A1 ) , P( X 1) P( A2 ) 8 8 3 1 P( X 2) P( A3 ) , P( X 3) P( A4 ) 8 8 Esquematicamente: X P(X) 0 1/8 1 3/8 2 3/8 3 1/8 TOTAL 1 Graficamente, temos: Representação por diagrama: Atividade 12: Lista de exercícios 10. 1) Lançam –se dois dados. Seja X a soma das faces. a) determine a distribuição de probabilidades de X. b) Expresse graficamente esta distribuição de probabilidades. 2) Uma urna tem 4 bolas brancas e 3 bolas pretas. Retiram-se 3 bolas sem reposição. Seja X: o número de bolas brancas, determinar a distribuição de probabilidades de X. 3) Refazer o exercício anterior, considerando a extração com reposição. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 42 Resolução: aplicando a definição, temos: 4.2 Esperança Matemática. Existem características numéricas que são muito importantes em uma distribuição de probabilidades de uma variável aleatória discreta. São os parâmetros das distribuições. X P(X) X.P(X) 1.000,00 0,97 970,00 -29.000,00 0,03 -870,00 1 100,00 Um primeiro parâmetro é a esperança matemática (ou E( X ) R$100,00 simplesmente média) de uma variável aleatória. Portanto, a seguradora espera ganhar por carro segurado Definição: Seja X uma variável aleatória discreta com distribuição de probabilidades P(x). A média ou valor esperado de X R$ 100,00. Caso a variável aleatória seja contínua, define-se: é: n E ( X ) xi .P( xi ) ou E ( X ) x. f ( x) dx i 1 E ( X ) x1 .P( x1 ) x2 .P( x2 ) ... xn .( xn ) Exemplo: Seja X a variável aleatória que denota a vida, em horas, de certo equipamento eletrônico. A função de densidade da Exemplo: Uma empresa seguradora paga R$ 30.000,00 em probabilidade é : 20.000 , x 100 f ( x) x 3 0, x 100 caso de acidente de carro e cobra uma taxa de R$ 1.000, 00. Sabese que a probabilidade de que um carro sofra acidente é de 3%. Quanto espera a seguradora ganhar por carro segurado? Determine o valor esperado de vida desse tipo de equipamento. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 43 Resolução: Atividade 13: Lista de exercícios 11 20.000 E ( X ) x. dx x3 100 20.000 2 dx 20 . 000 2 100 x 100x dx 21 20.000 x 2 1 100 20.000 x 100 20.000 20.000 E( X ) 0 (200) 100 E ( X ) 200 Portanto, podemos esperar que tal tipo de equipamento positivos. Seja X o número de divisores do número sorteado. Calcular o número médio divisores (Esperança Matemática) do número sorteado. 2) Num jogo de dados, A paga R$ 20,00 a B e lança 3 dados. Se sair face 1 em um dos dados apenas, A ganha R$ 20,00. Se sair 1 em dois dados apenas, A ganha R$ 50,00 e se sair 1 nos três dure, em média, 200 horas. Propriedades da Esperança Matemática. P1. E(k) = k, onde k é uma constante; 1) Suponhamos que um número seja sorteado de 1 a 10, inteiros dados, A ganha R$ 80,00. Calcular o lucro líquido médio de A em uma jogada. P2 E (K.X) = K.E(X); P3.E(X Y) = E(X) E(Y); 3) Seja X a variável aleatória com função de densidade: x2 ,1 x 2, f ( x) 3 0, caso contrário. n n P4. E X i = {E ( X i )} ; i 1 i 1 P5. E(aX b) = aE(X) b; P6. E(X - x ) = 0. Determine o valor esperado de g(X) = 4X + 3. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 44 4.3 Variância e desvio Padrão. Variância. O fato de conhecermos a média de uma distribuição de probabilidades (Esperança Matemática) já nos ajuda muito, porém X P(X) X.P(X) 0 1/8 0 1 6/8 6/8 2 1/8 2/8 1 x 1 não temos uma medida que nos de o grau de dispersão de Resolução: Calcularemos a Variância VAR(X) da seguinte probabilidade em torno desta média. Como o desvio médio, EX x é nulo, logo não serve como medida de dispersão. A medida que fornecerá o grau de dispersão (ou de concentração) de probabilidade em torno da média é a Variância. Seja X uma variável aleatória com distribuição de forma: X P(X) X.P(X) (X- x ) (X- x )2 (X- x )2.P(X) 0 1/8 0 -1 1 1/8 1 6/8 6/8 0 0 0 2 1/8 2/8 1 1 1/8 probabilidades p(X) e média (Esperança Matemática) . A x 1 VAR(X)=0,25 Variância de X, caso X seja uma variável aleatória discreta é: n VAR ( X ) xi x p( xi ) ou Podemos deduzir uma expressão mais simplificada para a 2 variância que talvez seja mais oportuna que a anterior em muitos i 1 VAR ( X ) x1 x .P( x1 ) x2 x p( x2 ) ... xn x . p( xn ) 2 2 2 casos. VAR ( X ) E ( X 2 ) E ( X ) 2 Exemplo: Para efetuarmos o estudo da variância de uma variável aleatória discreta, consideremos a distribuição de variáveis Já a Variância de X, caso X seja uma variável aleatória continua é definida por: aleatórias X com sua respectiva média (Esperança Matemática). VAR ( X ) ( x ) . f ( x) dx 2 PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 45 Exemplo: A demanda semanal da Pepsi, em milhares de O desvio padrão da variável X é definido de maneira litros, de uma rede de lojas de conveniência local é a variável semelhante a estudada em Estatística Descritiva, ou seja é a raiz aleatória contínua X, que tem como densidade de probabilidade: quadrada da variância. 2( x 1),1 x 2, f ( x) 0, caso contrário. x VAR (X ) Determine a média e a Variância de X. Propriedades da variância: P1. VAR(K) = 0, onde k é uma Resolução: A média (Esperança Matemática) é obtida por: 2 constante; E ( X ) x.2( x 1) dx 2. ( x 2 x) dx 2. x 2 dx x dx 2 2 1 1 x3 x 2 E ( X ) 2. 2 3 1 2 1 P2. VAR (k.X) = k2. VAR(X); P3. VAR( X Y) = VAR (X) + VAR(Y) COV(X,Y); Xi = i 1 2 8 5 5 1 1 2 1 2 2 2 2. 6 3 3 2 3 6 3 1 P4. VAR n n n i 1 i j VAR ( X i ) 2. COV ( X i , X j ) ; P5. VAR (aX b) = a2.VAR(X). A variância pode ser obtida por: 2 Onde COV(X,Y) é a Covariância entre X e Y. E ( X 2 ) x 2 .2( x 1) dx 2. ( x 3 x 2 ) dx 2. x 3 dx x 2 dx 2 2 1 1 1 2 1 A Covariância mede o grau de dependência entre duas variáveis X e Y. x 4 x3 2 8 1 1 1 17 17 4 2 4 2 2. 4 3 3 4 3 3 12 12 6 1 Para variáveis aleatórias discretas: E ( X 2 ) 2. VAR ( X ) E ( X 2 ) E ( X ) 2 2 17 5 17 25 1 6 3 6 9 18 Desvio padrão. COV ( X , Y ) EX E( X ).Y E(Y ) Para variáveis aleatórias contínuas: PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. ( x x ).( y y ) f ( x, y) dx dy 46 Atividade 14: Lista de exercícios 12 1) Consideremos a distribuição de variáveis aleatórias Y com sua 3) Seja X a variável aleatória com função de densidade: x2 ,1 x 2, f ( x) 3 0, caso contrário. respectiva média (Esperança Matemática). Y P(Y) Y.P(Y) -2 1/5 -2/5 -1 1/5 -1/5 0 1/5 0 3 1/5 3/5 5 1/5 5/5 1 Y 1 a) Determine o valor esperado de g(X) = 4X + 3. b) Determine a variância da variável aleatória g(X) = 4X + 3. c) Calcule o desvio padrão da variável aleatória g(X) = 4X + 3. Calcularemos a Variância VAR(X) nesta distribuição de variáveis aleatórias discretas. 2) Os empregados A, B, C e D ganham 1, 2, 2 e 4 salários mínimos, respectivamente. Retiram-se amostras com reposição de dois indivíduos e mede-se o salário médio da amostra retirada. 4.4 Distribuições teóricas de probabilidades de variáveis aleatórias discretas. Distribuição de Bernoulli. a) Qual a média (Esperança matemática) do salário médio amostral? Consideremos inicialmente uma única tentativa de um experimento aleatório, onde podemos obter sucesso ou fracasso b) Qual a Variância do salário médio amostral? nessa tentativa. Seja (p) a probabilidade de sucesso e (q) a probabilidade de c) Qual o desvio padrão deste salário médio amostral? fracasso, com p + q = 1. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 47 Seja ainda X p número de sucessos em uma única tentativa do de um experimento aleatório. X assome o valor 0 que corresponde ao fracasso, com probabilidade q, ou valor 1, que corresponde ao sucesso, com probabilidade p. 0 fracasso; com X 1 sucesso. P( X 0) q e P( X 1) p Nessas condições, a variável aleatória discreta X tem distribuição de Bernoulli, e sua função de probabilidade é dada por: 1 x P( X x) p .q x E a Variância é dada por: VAR ( X ) p p 2 p.(1 p) , as como: (1 p) q , então: VAR ( X ) p.q Exemplo: Uma urna tem 30 bolas brancas e 20 verdes. Retira-se uma bola desta urna. Seja X o número de bolas verdes. a) Determine P(X). b) Calcule a esperança matemática. c) Calcule a variância. Resolução: 30 3 o q 0 fracasso; 50 5 X X 1 sucesso . 1 p 20 2 50 5 Esperança matemática e Variância. Calcularemos a média e a variância da variável com distribuição de Bernoulli pela tabela abaixo: X P(X) E(X)=X.P(X) X2.P(X) 0 q 0 0 1 p P p Total: 1 p p 1 x a) P( X x) p .q x 2 P( X x) 5 b) E ( X ) p E ( X ) Através da tabela acima, podemos concluir que a Esperança Matemática é: E( X ) p c) VAR ( X ) PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. x 1 x 3 . 5 2 0,4 5 2 3 6 p.q VAR ( X ) . 0,24 5 5 25 48 8 208 n k nk 20 1 1 P( X k ) p .q P( X 8) . . k 8 2 2 Distribuição Binomial. Vamos considerar agora n tentativas independentes e um mesmo experimento aleatório. Cada tentativa ira admitir novamente apenas dois resultados: fracasso com probabilidade q e sucesso com probabilidade p, onde p + q = 1. As probabilidades de sucesso e fracasso são as mesmas para cada tentativa. 20 1 . 8 2 8 1 . 2 12 0,12013 2) Achar a média e a variância da variável aleatória Y = 3X + 2, Seja X o número de sucesso em n tentativas. sendo X:B(20, 0,3). Iremos determinar a função de probabilidades da variável X, Resolução: Como X:B(n, p) e X:B(20, 0,3) => n = 20 e p = 03. I. isto é P(X = k). E( X ) n. p E( X ) 20.0,3 6 E(Y ) E(3 X 2) 3( EX ) 2 Aplicando a lei binomial, temos: n P( X k ) p k .q nk k Onde a esperança matemática e a variância, podem ser obtidas por: E ( X ) n. p e VAR ( X ) n. pq Exemplos: 1) uma moeda é lançada 20 vezes. Qual a probabilidade E(Y ) 3.6 2 20 II. VAR ( X ) n. pq VAR ( X ) 20.0,3.(1 0,3) 20.0,3.0,7 4,2 VAR (Y ) VAR (3 X 2) 32.VAR ( X ) 9.VAR ( X ) 9.4.2 37,8 Distribuição de Poisson. de saírem 8 caras? Em muitos casos do uso da distribuição binomial, acontece Resolução: X: número de sucessos (caras). do valor de n ser muito grande (n ) e p é muito pequeno ( p 0) . Nesses casos, não encontramos o valor em tabelas, ou então o cálculo manual se torna muito difícil, sendo necessário o PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 49 uso de máquinas de calcular muito sofisticadas ou até mesmo Demonstração: recorrer ao uso do computador. Seja Podemos então, fazer uma aproximação da distribuição binomial pela distribuição de Poisson. n n! pk P( X k ) . p k .q nk . p k .q nk n.(n 1).(n 2).....(n k 1). .q nk (n k )!.k! k! k Consideremos, que: 1.n (n. 30) mior o valor tabelado 2. p 0 ( p 0.1) 3.0 E ( X ) 10 Quando este fato acima ocorre, então a média (Esperança Matemática) será: n. p np Nessas condições, se Fazendo: n e q 1 n . Quando (n ) , dai: P( X k ) lim [n.(n 1).(n 2).....(n k 1). n 1 k . 1 k! n n 1 2 k 1 k 1 P( X k ) lim [11 .1 .....1 . . 1 n n nn k! n n X : B(n. p) ,queremos calcular: n nk P( X k ) A distribuição de Poisson, é uma aproximação da distribuição Binomial, fornecida pela expressão: e .k k! Onde a esperança matemática e a variância podem ser obtidas por: E (X ) e VAR (X ) Exemplo: Seja X: (200; 0.01). Calcular P(X = 10). a) usando o método binomial. b) pela aproximação de Poisson. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. ] k .1 ] n k 1 k 1 P( X k ) 1.1.1.....1 . . .e .1] nn k! n P( X k ) . p k .q nk k e .k P( X k ) k! p 50 Resolução: 3) A probabilidade de uma lâmpada se queimar ao ser ligada é de a) P( X 10) 200 (0,01)10 .(1 0,01) 20010 200 .(0,01)10 (0,09)190 0,000033 10 10 b) Sendo n. p 200.0,01 2 , então: e .k e 2 210 P( X k ) P( X 10) 0,000038 k! 10! 1/100. Numa instalação com 100 lâmpadas, qual a probabilidade de 2 lâmpadas se queimarem ao serem ligadas? a) resolva pela distribuição binomial. b) resolva pela distribuição de Poisson. Portanto a aproximação é muito boa, pois o erro é de apenas 0,000005. Atividade 15: Lista de exercícios 13 1) Uma urna contém 20 bolas amarelas e 10 bolas azuis. Ao 4.5 Distribuições teóricas de probabilidades de variáveis aleatórias continuas. Função densidade de probabilidade retirarmos uma única bola desta urna. Seja X o número de bolas Consideremos a representação gráfica a seguir, a qual se azuis: tomarmos os pontos médios das bases superiores dos retângulos e a) Determine P(X). os ligarmos por uma curva, teremos, se considerarmos X uma variável aleatória contínua, uma função contínua f(X). b) Calcule E(X) e VAR(X). 2) Uma prova tipo teste de 50 questões independentes. Cada questão tem 5 alternativas. Apenas uma das alternativas é correta. Se o aluno resolve a prova respondendo a esmo as questões, qual a probabilidade de tirar nota 5? (Use a distribuição binomial) Podemos, então, definir uma variável aleatória contínua: uma variável aleatória X é contínua em IR se existir uma função f(x), tal que: PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 1. f ( x) 0 51 As principais características desta função são: 2. f ( x) dx 1 II. Os pontos de inflexão da função são: A função f(x) é chamada função densidade de probabilidade X (f.d.p.). X ; I. O ponto máximo de f(x) é o ponto Observe que: IV. f ( x) dx e ; III. A curva é simétrica com relação a p ( a X b) X ; E (X ) e VAR ( X ) 2 . Pode-se demostrar que: (Corresponde à área delimitada pela função f(x), eixo dos X, pelas 1 x 2 1 2 . e . 2 retas X = a e X = b). dx 1 Distribuição Normal. Uma variável aleatória contínua X tem distribuição normal de probabilidade se sua função densidade de probabilidade (f.d.p.) é dada por: f ( x) 1 .e . 2 1 x 2 Caso se queira calcular a probabilidade indicada na figura 2 , para x acima, devemos fazer: b 1 .e . 2 a P ( a x b) O gráfico de f(x) é: 1 x 2 2 dx Que claro, representa um grau relativo de dificuldade, já que será explorado conceitos de Cálculo Diferencial e Integral. PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 52 Usaremos, então a seguinte notação: X : N , 2 (X tem distribuição normal com média Seja, então, X : N , 2 Z e variância 2 ) , define-se: Exemplo: 1) Seja X:N(100, 25)Usando a tabela calcule: X Nota: Pode ser demostrado que Z possui distribuição Normal. Onde Z é chamado de variável normal reduzida, normal padronizada ou variável normalizada. Onde E(Z) = 0 e VAR(Z) =1. A vantagem de se usar a variável Z P100 X 106; b) P89 X 107; c) P112 X 116. Resolução: De X:N(100, 25) e X a) , é que que: para cada X dado, a área depende de 2 1, e . Como , podemos concluir 100 e 2 25 5 podemos tabelar os valores da área, ou as probabilidades, pois 2 X : N , 2 Z 0 e uma única tabela de Z é suficiente. A tabela será apresentada no final desta apostila, no apêndice, esta tabela nos dá: PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. Portanto: Z X Z X 100 5 P100 X 106 53 Para X = 100, temos: Z X 100 100 100 0. 5 5 Para X = 106, temos: Z 106 100 6 1,2 5 5 Para X = 107, temos: Z 107 100 6 1,4 5 5 P(2,2 Z 1,4) P(0 Z 1,2) Consultando a tabela temos: P89 X 107 P(2,2 Z 1,4) P(2,2 Z 0) P(0 Z 1,4) 0,486097 0,419243 0,90534 Consultando a tabela temos: P100 X 106 P(0 Z 1,2) 0,384930 b) Como já se sabe: Z X 100 . 5 c) Como já se sabe: Z P89 X 107 X 100 89 100 11 Para X = 89, temos: Z 2,2 . 5 5 5 PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. X 100 . 5 P112 X 116. Para X = 112, temos: Z 112 100 12 11 2,4 . 5 5 5 54 Para X = 116, temos: Z 116 100 16 3,2 5 5 Considerando condições muito gerias, a variável n P(2,4 Z 3,2) Z X i i 1 n i 1 2 i Que possui distribuição aproximadamente N(0,1). 2 P112 X 116 P(2,4 Z 13,2) P(0 Z 3,2) P(2,4 Z 3,2Se ) E X i i e VAR ( X i ) i , i 1,2 3,..., n e para 0,499313 0,491802 0,007511 Aproximação da distribuição binomial pela n muito grande (n ) Z distribuição X n. Normal. Para que possamos entender a aproximação da distribuição tem distribuição normal no limite n. 2 (Z N (0,1)) . Na prática quando n é fixo, a aproximação será melhor na binomial pela distribuição normal, usaremos um resultado muito importante, o teorema do limite central. medida em que as variáveis Xi, i=1,2,3,...,n forme mais próximas da Teorema do limite central. distribuição normal. Veremos agra, que podemos fazer uma aproximação da Consideremos n varáveis aleatórias, X1,X2, X3, ...,Xn, independentes, com E X i i e distribuição binomial pela distribuição normal. Seja X: B(n,p). Podemos escrever VAR ( X i ) , i 1,2 3,..., n . Seja: X X i 2 i i 1 n X Xi i 1 PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 55 1 1 P ( X x ) P k X k cc 2 2 onde as variáveis , X1,X2, X3, ...,Xn, são independentes, cada uma com distribuição de bernoulli. E ( X i ) p Como : VAR ( X i ) p.q, i 1,2,3,..., n Então E ( X ) e 1 1 P(a X b) P a X b cc 2 2 n E ( X ) n. p e i 1 Exemplo: i Lança-se uma moeda 20 vezes. probabilidade de se obter de primeira as cinco caras, usando: n VAR ( X ) VAR ( X i ) npq , que são os mesmos resultados a) a distribuição binomial; b) aproximação da binomial pela normal. i 1 obtidos anteriormente. Resolução: X ; Número de Caras Logo, para n suficientemente grande, a varável é: Z Qual a X n. p N (0,1) n. pq a) Essa aproximação é conhecida por Moivre – Lagrange. Onde Moivre mostrou que para n muito grande (n ) , temos: P(1 X 5) P( X 1) P( X 2) P( X 3) P( X 4) P( X 5) 20 1 1 P(1 X 5) . . 1 2 2 1 20 1 1 . 4 2 2 4 n P( X x) p x .q n x x 1 x np npq 2 1 .e 2 2 .(npq) Para uma aproximação ainda melhor, usaremos o recurso da correção de continuidade (cc), 1 X : B 20, 2 20 4 201 20 1 1 . 2 2 2 20 1 1 . 5 2 2 5 2 20 2 20 1 1 . 3 2 2 3 203 205 19 18 17 20 1 1 20 1 1 20 1 1 P(1 X 5) . . . . 1 2 2 2 4 2 3 8 2 20 1 1 20 1 1 . . 0,00002 0,00018 0,00109 0,00462 4 16 2 5 32 2 0,01479 0,0207 PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA. 16 15 56 1 1 b) Se X : B 20, , então n. p 20. 10 2 2 1 1 2 npq 20. . 5 5 2,24 2 2 Atividade 16: Lista de exercícios 14 1) Um fabricante de baterias sabe, por experiência passada, que as baterias de sua fabricação tem vida média de 600 dias e desvio padrão de 100 dias, sendo que a duração tem aproximadamente distribuição normal. Ele oferece uma garantia de 312 dias, isto é, troca as baterias que apresentarem falha nesse período. Se ele Queremos calcular, então P1 X 5 . fabrica 10.000 baterias mensalmente. Quantas deverá trocar pelo uso da garantia, mensalmente? Usando a correlação de continuidade: P1 X 5 P1 0,5 X 5 0,5 P0,5 X 5,5 Como Z Z X X tem duração normal com média de 150.000 km e desvio padrão de , então, Para X = 0,5, temos: X 10 0,5 10 9,5 4,24 2,24 2,24 2,24 X 5.000 km. Qual a probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa firma, tenha um motor que dure: a) menos de 170.000 km? b) entre 140.000 km e 165.000 km? Para x = 5,5, temos: Z 2) Uma fábrica de carros sabe que os motores de sua fabricação X 10 5,5 10 4,5 2,01 2,24 2,24 2,24 3) Um sistema é formado por 100 componentes, cada um dos quais com confiabilidade de 0.95 (Probabilidade de funcionamento do Portanto, P1 X 5 P1 0,5 X 5 0,5 P0,5 X 5,5 componente P(4,24 Z 2,01) componentes funcionam independentes um do outro e se o sistema Então, consultando a tabela, temos: 0,5 – 0,477784 = 0,022216 durante certo período de tempo). Se esses completo funciona adequadamente quando pelo menos 80 componentes funcionam, qual a confiabilidade do sistema? PROF. MSC. LUIZ HENRIQUE MORAIS DA SILVA.