C iências ontábeis ADMINISTRAÇÃO Caderno de Estatística I Dom Alberto Prof: Rosane de Fátima Worm C122 WORM, Rosane de Fátima Caderno de Estatística I Dom Alberto / Rosane de Fátima Worm. – Santa Cruz do Sul: Faculdade Dom Alberto, 2010. Inclui bibliografia. 1. Administração – Teoria 2. Ciências Contábeis – Teoria 3. Estatística I – Teoria I. WORM, Rosane de Fátima II. Faculdade Dom Alberto III. Coordenação de Administração IV. Coordenação de Ciências Contábeis V. Título CDU 658:657(072) Catalogação na publicação: Roberto Carlos Cardoso – Bibliotecário CRB10 010/10 Página 2 Apresentação O Curso de Administração da Faculdade Dom Alberto iniciou sua trajetória acadêmica em 2004, após a construção de um projeto pautado na importância de possibilitar acesso ao ensino superior de qualidade que, combinado à seriedade na execução de projeto pedagógico, propiciasse uma formação sólida e relacionada às demandas regionais. Considerando esses valores, atividades e ações voltadas ao ensino sólido viabilizaram a qualidade acadêmica e pedagógica das aulas, bem como o aprendizado efetivo dos alunos, o que permitiu o reconhecimento pelo MEC do Curso de Administração em 2008. Passados seis anos, o curso mostra crescimento quantitativo e qualitativo, fortalecimento de sua proposta e de consolidação de resultados positivos, como a publicação deste Caderno Dom Alberto, que é o produto do trabalho intelectual, pedagógico e instrutivo desenvolvido pelos professores durante esse período. Este material servirá de guia e de apoio para o estudo atento e sério, para a organização da pesquisa e para o contato inicial de qualidade com as disciplinas que estruturam o curso. A todos os professores que com competência fomentaram o Caderno Dom Alberto, veículo de publicação oficial da produção didáticopedagógica do corpo docente da Faculdade Dom Alberto, um agradecimento especial. Lucas Jost Diretor Geral Página 3 PREFÁCIO A arte de ensinar e aprender pressupõe um diálogo entre aqueles que interagem no processo, como alunos e professores. A eles cabe a tarefa de formação, de construção de valores, habilidades, competências necessárias à superação dos desafios. Entre estes se encontra a necessidade de uma formação profissional sólida, capaz de suprir as demandas de mercado, de estabelecer elos entre diversas áreas do saber, de atender às exigências legais de cada área de atuação, etc. Nesse contexto, um dos fatores mais importantes na formação de um profissional é saber discutir diversos temas aos quais se aplicam conhecimentos específicos de cada área, dispondo-se de uma variedade ampla e desafiadora de questões e problemas proporcionada pelas atuais conjunturas. Para que isso se torne possível, além da dedicação daqueles envolvidos no processo de ensino-aprendizagem, é preciso haver suporte pedagógico que dê subsídios ao aprender e ao ensinar. Um suporte que supere a tradicional metodologia expositiva e atenda aos objetivos expressos na proposta pedagógica do curso. Considerando esses pressupostos, a produção desse Caderno Dom Alberto é parte da proposta pedagógica do curso da Faculdade Dom Aberto. Com este veículo, elaborado por docentes da instituição, a faculdade busca apresentar um instrumento de pesquisa, consulta e aprendizagem teóricoprática, reunindo materiais cuja diversidade de abordagens é atualizada e necessária para a formação profissional qualificada dos alunos do curso. Ser um canal de divulgação do material didático produzido por professores da instituição é motivação para continuar investindo da formação qualificada e na produção e disseminação do que se discute, apresenta, reflete, propõe e analisa nas aulas do curso. Espera-se que os leitores apreciem o Caderno Dom Alberto com a mesma satisfação que a Faculdade tem em elaborar esta coletânea. Elvis Martins Diretor Acadêmico de Ensino Página 4 Sumário Apresentação 3 Prefácio 4 Plano de Ensino 6 Aula 1 Introdução a Estatística 10 Aula 2 Atividades 84 Aula 3 Distribuição de Freqüência 90 Aula 4 Representação Gráfica 96 Aula 5 Medidas de tendência central 108 Aula 6 A Mediana 113 Aula 7 Continuação Aula 6 116 Aula 8 Medidas de dispersão 118 Aula 9 Continuação Aula 8 124 Aula 10 Medidas de Posição 125 Aula 11 Coeficiente de Variação 129 Aula 12 Eventos Complementares 138 Página 5 Centro de Ensino Superior Dom Alberto Plano de Ensino Curso: Administração/Ciências Contábeis Carga Horária (horas): 60 Identificação Disciplina: Estatística I Créditos: 4 Semestre: 2º Ementa População e Amostra. Séries Estatísticas. Gráficos Estatísticos. Distribuição de Freqüência. Tipos de Médias. Medidas de Variabilidade. Medidas de Dispersão. Probabilidade. Objetivos Geral: Desenvolver processos cognitivos e a aquisição de atitudes possibilitando o aluno a criar hábito de investigação e confiança para enfrentar situações novas e formar uma visão ampla e científica da realidade. Específicos: Compreender os conceitos de população, amostra e variável. Construir, ler, analisar e interpretar vários tipos de gráficos. Resolver problemas que envolvam os conceitos de estatística. Determinar a probabilidade de um evento num espaço amostra finito, independente da experimentação. Compreender e aplicar o conceito de distribuição binomial no cálculo de probabilidades. Inter-relação da Disciplina Horizontal: As aplicações da disciplina são processadas de forma a adaptar o conhecimento teórico a uma situação prática e interdisciplinar ajustada a realidade dos negócios na economia brasileira. Vertical: Despertar o interesse do aluno na interpretação de dados com vista na utilização de instrumentos capazes de fornecer um conhecimento científico, no que se refere ao pleno entendimento e leitura de dados. Competências Gerais Reconhecer e definir problemas, equacionar soluções, pensar estrategicamente, introduzir modificações no processo produtivo, atuar preventivamente, transferir e generalizar conhecimentos e exercer, em diferentes graus de complexidade, o processo da tomada de decisão; Desenvolver raciocínio lógico, crítico e analítico para operar com valores e formulações matemáticas presentes nas relações formais e causais entre fenômenos produtivos, administrativos e de controle, bem assim expressando-se de modo crítico e criativo diante dos diferentes contextos organizacionais e sociais; Competências Específicas Identificar problemas específicos, da estatística descritiva, ler, compreender e interpretar dados. Coletar e organizar dados. Habilidades Gerais Reconhecer e definir problemas, organizar, compreender e interpretar gráficos e demais dados estatísticos referentes a estatística descritiva. Habilidades Específicas Conhecer métodos estatísticos para descrever, analisar e interpretar os dados referentes a estatística descritiva. Conteúdo Programático PROGRAMA 1. Introdução a Estatística; 2. Natureza dos dados: variáveis quantitativas e qualitativas; variáveis discretas e contínuas; 3. População e Amostra; 4. Amostragem: conceitos e tipos; Página 6 Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”. 5. 6. 7. 8. 9. 10. Dados absolutos e relativos; Tabelas: conceitos; ROL; elementos essenciais; construção; Séries estatísticas; Gráficos: principais tipos; análise; histogramas; Distribuição de freqüências: intervalos de classes; freqüências: absolutas, relativas e acumuladas; Medidas de tendência central: - Médias: aritmética, geométrica, ponderada e móvel - Mediana - Moda - Ponto médio. 11. Medidas de posição: - Escore z - Quartis, decis e percentis. 12. Medidas de variação: - Amplitude - Desvio-padrão - Variância. 13. Medidas de Assimetria e Curtose.. 14. Probabilidade: - Experimentos - Espaço amostral - Eventos - Arranjos e Combinações. 15. Números índices Estratégias de Ensino e Aprendizagem (metodologias de sala de aula) O planejamento do trabalho em sala de aula é à base da construção do processo de ensino e aprendizagem. Planejando a ação, o professor tem a possibilidade de saber exatamente qual o ponto de partida e o de chegada para cada tema abordado em seu curso. Um planejamento não é um esquema de trabalho rígido, inflexível. Pelo contrário, devem-se levar em conta as situações inesperadas que vão ocorrendo e adaptar ou modificar o que se havia inicialmente previsto, de acordo com suas observações de classe e necessidades dos alunos. Há metas que devem ser estabelecidas e alcançadas, sendo necessário que o professor disponha de um fio condutor para a ação que vai desenvolver e de uma previsão para os resultados dessa ação. Avaliação do Processo de Ensino e Aprendizagem A avaliação do processo de ensino e aprendizagem deve ser realizada de forma contínua, cumulativa e sistemática com o objetivo de diagnosticar a situação da aprendizagem de cada aluno, em relação à programação curricular. Funções básicas: informar sobre o domínio da aprendizagem, indicar os efeitos da metodologia utilizada, revelar conseqüências da atuação docente, informar sobre a adequabilidade de currículos e programas, realizar feedback dos objetivos e planejamentos elaborados, etc. A forma de avaliação será da seguinte maneira: 1ª Avaliação – Peso 8,0 (oito): Prova; – Peso 2,0 (dois): Trabalho referente ao conteúdo ministrado até a 1a avaliação. 2ª Avaliação Peso 8,0 (oito): Prova; Peso 2,0 (dois): referente ao Sistema de Provas Eletrônicas – SPE (maior nota das duas provas do SPE) Observação: As provas do SPE deverão ser realizadas até o dia 30/09/2010 (1ª prova SPE) e até o dia 30/11/2010 (2ª prova SPE), sendo obrigatória a realização de ao menos uma prova. Avaliação Somativa A aferição do rendimento escolar de cada disciplina é feita através de notas inteiras de zero a dez, permitindo-se a fração de 5 décimos. O aproveitamento escolar é avaliado pelo acompanhamento contínuo do aluno e dos resultados por ele obtidos nas provas, trabalhos, exercícios escolares e outros, e caso necessário, nas provas substitutivas. Dentre os trabalhos escolares de aplicação, há pelo menos uma avaliação escrita em cada disciplina no Página 7 Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”. bimestre. O professor pode submeter os alunos a diversas formas de avaliações, tais como: projetos, seminários, pesquisas bibliográficas e de campo, relatórios, cujos resultados podem culminar com atribuição de uma nota representativa de cada avaliação bimestral. Em qualquer disciplina, os alunos que obtiverem média semestral de aprovação igual ou superior a sete (7,0) e freqüência igual ou superior a setenta e cinco por cento (75%) são considerados aprovados. Após cada semestre, e nos termos do calendário escolar, o aluno poderá requerer junto à Secretaria-Geral, no prazo fixado e a título de recuperação, a realização de uma prova substitutiva, por disciplina, a fim de substituir uma das médias mensais anteriores, ou a que não tenha sido avaliado, e no qual obtiverem como média final de aprovação igual ou superior a cinco (5,0). Sistema de Acompanhamento para a Recuperação da Aprendizagem Serão utilizados como Sistema de Acompanhamento e Nivelamento da turma os Plantões Tira-Dúvidas que são realizados sempre antes de iniciar a disciplina, das 18h30min às 18h50min, na sala de aula. Recursos Necessários Humanos Professor. Físicos Laboratórios, visitas técnicas, etc. Materiais Recursos Multimídia. Bibliografia Básica CRESPO, Antônio Arnot. Estatística fácil. 18. ed. São Paulo: Saraiva, 2002. SILVA, Ermes Medeiros da. et al. Estatística: para cursos de economia, administração e ciências contábeis. São Paulo: Atlas, 1999. 1 e 2 v. MORETTIN, Pedro A; BUSSAB, Wilton de O. Estatística básica. 5. ed. São Paulo: Saraiva 2003. TOLEDO, Geraldo Luciano; OVALLE, Ivo Izidoro. Estatística básica. 2. ed. São Paulo: Atlas, 1995. SPIEGEL, Murray R. Estatística. 3. ed. São Paulo: Pearson Education, 1994. Complementar BARBETTA, Pedro Alberto. Estatística aplicada às ciências sociais. 5. ed. Florianópolis: UFSC, 2002. MOORE, David. A Estatística básica e a sua prática. Rio de Janeiro: LTC, 2005. BUNCHAFT G.; KELLNER S. R. O. Estatística sem mistério. Petrópolis: Vozes; 1999. FONSECA, Jairo Simon da; MARTINS, Gilberto. Curso de estatística. São Paulo: Atlas, 1996. MARTINS, Gilberto de Andrade; DONAIRE, Denis. Princípios de estatística. São Paulo: Atlas, 1990. Periódicos Jornais: Gazeta do Sul, Zero Hora. Revistas: Veja, Isto é. Sites para Consulta http://www.mec.gov.br http://www.ime.usp.br http://www.ibge.gov.br Outras Informações Endereço eletrônico de acesso à página do PHL para consulta ao acervo da biblioteca: http://192.168.1.201/cgi-bin/wxis.exe?IsisScript=phl.xis&cipar=phl8.cip&lang=por Página 8 Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”. Cronograma de Atividades Aula Consolidação Avaliação 1ª Conteúdo Procedimentos Recursos Apresentação do plano de ensino. Introdução a estatística. Natureza dos dados: tipos de variáveis; População e Amostra; AE QG, AP, DS 2ª Amostragem: conceitos e tipos; Dados absolutos e relativos; AE, TI AP, QG, DS 3ª Tabelas: conceitos; ROL; elementos essenciais; construção; Séries estatísticas; AE AP, QG, DS 4ª Gráficos: principais tipos; análise; histogramas; AE AP, QG, DS AE AP, QG AE, TI AP, QG PA, AE AP, QG AE AP, QG Distribuição de freqüências:intervalos de classes; freqüências: absolutas, relativas e acumuladas; Distribuição de freqüências:intervalos de classes; freqüências: absolutas, relativas e acumuladas; Medidas de tendência central: Médias: aritmética, geométrica, ponderada e móvel 5ª 6ª 7ª 1 Consolidação 1. 1 1ª Avaliação. 8ª Medidas de tendência central: Mediana; Moda; Ponto médio. AE AP, QG 9ª Medidas de posição: Escore z; Quartis, decis e percentis. AE AP, QG 10ª Medidas de variação: amplitude; desvio-padrão e variância. AE AP, QG 11ª Medidas de Assimetria e Curtose. Números índices. AE, TG AP, QG, DS 12ª Números índices. Probabilidade: Experimentos; Espaço amostral; Eventos; AE AP, QG, DS 13ª Probabilidade: Arranjos e Combinações. AE AP, QG Consolidação 2. AE AP, QG 2 2 2ª avaliação. 3 Avaliação substituta. Legenda Código AE TG TI SE PA Descrição Aula expositiva Trabalho em grupo Trabalho individual Seminário Palestra Código QG RE VI DS FC Descrição Quadro verde e giz Retroprojetor Videocassete Data Show Flipchart Código LB PS AP OU Descrição Laboratório de informática Projetor de slides Apostila Outros Página 9 Missão: "Oferecer oportunidades de educação, contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento regional”. MEDIDAS DE TENDÊNCIA CENTRAL Depois de se fazer a coleta e a representação dos dados de uma pesquisa, é comum analisarmos as tendências que essa pesquisa revela. Assim, se a pesquisa envolve muitos dados, convém sintetizarmos todas essas informações a um mínimo de parâmetros que possam caracterizá-la. Esses parâmetros podem ser: MEDIDAS DE TENDÊNCIA CENTRAL Uma medida de tendência central é um valor no centro ou no meio de um conjunto de dados. Página 10 As medidas de posição mais importantes são as medidas de tendência central, que recebem tal denominação pelo fato de os dados observados tenderem, em geral, a se agrupar em torno dos valores centrais. Dentre as medidas de tendência central, destacam-se as seguintes: Média aritmética, Moda e Mediana. Cada uma com um significado diferenciado, porém tendo como serventia representar um conjunto de dados. A maneira de se obter estas medidas é um pouco diferenciada dependendo de como os dados são apresentados. Eles podem vir de forma isolada (não agrupados) ou ainda ponderada (agrupados em intervalos ou sem intervalo de classe, por ponto). Página 11 MEDIDAS DE TENDÊNCIA CENTRAL MODA MEDIANA MÉDIA Página 12 Média: ponto de equilíbrio do conjunto. Página 13 Média Aritmética ( µ ou x ) É o quociente da divisão da soma dos valores da variável pelo número deles: µ = ∑ xi N ou X = ∑ xi n Sendo: µ ou x: média aritmética Xi: valores da variável n ou N: número de valores Página 14 Dados não-agrupados Quando se deseja conhecer a média dos dados não-agrupados, determinamos à média aritmética simples. Exemplo: Sabendo-se que as vendas diárias da empresa A, durante uma semana, foram de 10, 14, 13, 15, 16, 18 e 12 unidades, tem-se, para produção média da semana: 10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14 7 7 Página 15 Dados Agrupados – média aritmética ponderada Sem intervalos de classe: As freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que leva a calcular a média aritmética ponderada. _ µ = ∑ xi.fi população X = ∑ xi.fi amostra N n Página 16 Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, adotando-se a variável Σ “número de filhos do sexo masculino”, determine a média. N.º de Meninos fi 0 2 1 6 2 10 3 12 4 4 = 34 Página 17 Com intervalos de classe: Convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada. µ = ∑ xi.fi N __ população X = ∑ xi.fi amostra n Onde Xi é o ponto médio da classe Página 18 Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüência s 150 -- ├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 Total 40 Página 19 A média é utilizada quando: Desejamos obter a medida de posição que possui a maior estabilidade; Houver a necessidade de um tratamento algébrico ulterior. Página 20 Média Geométrica Simples Para uma seqüência numérica x: x1, x2, ......., xn, a média geométrica simples, que designaremos por , é definida por: Exemplo: Se X: 2, 4, 6, 9, então: Página 21 Média Geométrica Ponderada Para uma seqüência numérica x: x1, x2, ...., xn afetados de pesos p1, p2, ..., pn respectivamente, a média geométrica ponderada que designaremos por é definida por: Página 22 Exemplo: Se x: 1, 2, 5, com pesos 3, 3, 1 respectivamente então: xg = 7 1 .2 .5 = 3 3 1 7 1.8.5 = 7 40 = 1,6938 Página 23 Média Móvel • Uma média, como o nome diz, mostra o valor médio de uma amostra de determinado dado. Uma média móvel aritmética (MMA) é uma extensão desse conceito, representando o valor médio, normalmente dos preços de fechamento, em um período de tempo. Página 24 Exemplo: A média móvel simples é calculada pela formação do preço médio por um número específico de períodos. Para o cálculo usamos o preço de fechamento. Por exemplo: Vamos utilizar a média dos últimos 10 dias. Devemos somar os preços finais durante os últimos 10 dias e dividir o total por 10. 10+11+12+13+14+15+16+17+18+19=145 (145/10) = 14,50 Página 25 • Devemos repetir este cálculo conforme o passar dos dias, assim, as médias vão se juntando e formando uma linha. Se continuarmos com o nosso exemplo, o próximo preço final na média será 20, então teremos um novo período, somando o último dia (20) e removendo o primeiro da lista (10). Continuando com a média dos últimos 10 dias, a média móvel simples deverá ser calculada da seguinte maneira: 11+12+13+14+15+16+17+18+19+20=155 (155/10) = 15,50 • Repare que removemos o primeiro dia da lista (10) para incluir o novo dia (20). • Durante os últimos dois dias, a média moveu-se de 14,50 para 15,50. Como são somados novos dias, os antigos serão removidos e a média permanece se movendo com o passar do tempo. Página 26 Exercícios Página 27 Moda: valor mais provável. Página 28 Moda (Mo) A moda de uma distribuição é o valor da variável que tem a maior freqüência absoluta simples, quer dizer aquele valor que aparece mais [mais se repete]. Existem algumas situações nas quais não existe moda, isto é, todos os valores da variável só aparecem uma vez, não se repetem. Em outras situações pode-se ter mais de uma moda, isto é, quando dois ou mais valores da variável têm maior freqüência [freqüências iguais], neste caso diz-se que o conjunto é bimodal. Podem-se ter três, quatro, etc. Nestes casos é difícil escolher a moda como um representante do grupo, uma vez que teremos muitos representantes. Para que se possa obter o valor da moda é necessário que os dados estejam no mínimo em escala nominal, quer dizer, com qualquer nível de mensuração podemos obter o valor da moda, uma vez que ela é oriunda apenas de uma contagem. Portanto, a moda é o valor que ocorre com maior freqüência em uma série de valores. Página 29 Exemplo: - o dono do restaurante vai preparar mais o filé de maior saída; maioria tirou “C” numa turma; o proprietário da loja de sapato vai comprar mais os números de maior saída. Página 30 Dados não-agrupados A moda é facilmente reconhecida: basta procurar o valor que mais se repete. Exemplo: A série de dados: 7, 8, 9, 10, 10, 10, 11, 12, 12, 12, 12, 13, 15 tem moda igual a 12. Amodal: são as séries nas quais nenhum valor apareça mais vezes que outros. Exemplo: 3, 5, 8, 10, 13. Multimodal: é uma série que possui dois ou mais Página 31 valores modais. Dados agrupados Sem intervalos de classe: É o valor da variável de maior freqüência Xi 3 5 7 fi 8 1 15 9 10 7 6 Classe Modal Mo = 7 Página 32 Com intervalos de classe: A classe que apresenta maior freqüência é denominada classe modal. O método mais simples para o cálculo da moda consiste em tomar o ponto médio da classe modal. Damos a esse valor a denominação de moda bruta. Há, para o cálculo da moda, outros métodos mais elaborados, como, por exemplo, o que faz uso da fórmula de CZUBER: Página 33 Exemplo: Calcule a moda da seguinte distribuição SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) 150 154 158 162 166 170 |--- 154 |--- 158 |--- 162 |--- 166 |--- 170 |--- 174 Total Freqüências 4 9 11 8 5 3 40 Página 34 Empregamos a moda quando: Desejamos obter uma medida rápida e aproximada de posição; A medida de posição deve ser o valor mais típico da distribuição Página 35 Mediana: divide o conjunto em duas partes iguais. Página 36 Mediana (Md): É o número que se encontra no centro de uma série de números, estando estes dispostos segundo uma ordem. Para que se possa obter o valor da mediana os dados têm que estar em uma escala de medida no mínimo ordinal, uma vez que se precisa ordená-los. A mediana é o valor que divide o conjunto ao meio, isto é, concentra antes e depois de si, 50% das observações ordenadas. Ao contrário da média aritmética a mediana não sofre influência quando temos no conjunto valores discrepantes [tanto para mais como para menos]. Neste caso a mediana pode melhor representar um conjunto do que a média aritmética, porém não tem o mesmo significado que aquela. Página 37 A mediana pode ou não pertencer ao conjunto do qual ela é originária, vai pertencer sempre que o conjunto tiver um número ímpar de informações e vai ou não pertencer quando o conjunto tiver um número par de observações. Com isso já podemos ver que a quantidade de observações influi na maneira pela qual vamos encontrar o valor da mediana. Página 38 Dados não-agrupados: Estando ordenados os valores de uma série e sendo n o número de elementos da série, o valor mediano será, quando n for: ímpar : o termo de ordem ; n + 1 2 par : a média aritmética dos termos de ordem n e n + 1. 2 2 Página 39 Exemplo 1: Dada à série de valores: 5, 13, 10, 2, 18, 15, 6, 16, 9, identifique a mediana. Md = 10 Exemplo 2: Dada à série de valores: 2, 6, 7, 10, 12, 13, 18, 21, calcule a mediana. Md = 11 O valor da mediana pode coincidir ou não com um elemento da série. Página 40 Dados agrupados: Para o caso de uma distribuição, porém, a ordem, a partir de qualquer um dos extremos, é dada por: n 2 Sem intervalos de classe: É o bastante identificar a freqüência acumulada imediatamente superior à metade da soma das freqüências. A mediana será aquele valor da variável que corresponde a tal freqüência acumulada. Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, tomando para variável o número de filhos do sexo masculino, determine a mediana: Página 41 Σ N.ºde Meninos 0 1 2 3 4 fi 2 6 10 12 4 = 34 Página 42 No caso de existir uma freqüência acumulada (Fi), tal que: a mediana será dada por: Md = xi + X i + 1 2 isto é, a mediana será a média aritmética entre o valor da variável correspondente a essa freqüência acumulada e a seguinte. Página 43 Exemplo: Determine a mediana da distribuição abaixo: Xi 12 14 15 16 17 20 fi 1 2 1 2 1 1 Fi Página 44 Com intervalos de classe: Classe mediana é aquela correspondente à freqüência acumulada imediatamente superior a ∑ fi. 2 Página 45 Em seguida, emprega-se a fórmula: Me = li + h ( ∑ fi/2 - Fi ( i -1) ) fi Sendo: li = limite inferior da classe mediana h = amplitude do intervalo da classe mediana fi = freqüência simples da classe mediana Fi = freqüência acumulada da classe anterior à classe mediana Página 46 Exemplo: Calcule a mediana da seguinte distribuição: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) 150 -- |--- 154 154 |--- 158 158 |--- 162 162 |--- 166 166 |--- 170 170 |--- 174 Total Freqüência s 4 9 11 8 5 3 40 Página 47 No caso de existir uma freqüência acumulada exatamente igual a , a mediana será o limite superior da classe correspondente. i Exemplo Classes 0 |--- 10 10 |--- 20 20 |--- 30 30 |--- 40 40 |--- 50 50 |--- 60 fi 1 3 9 7 4 2 26 Fi Página 48 Empregamos a mediana quando: Desejamos obter o ponto que divide a distribuição em partes iguais; Há valores extremos que afetam de uma maneira acentuada a média; A variável em estudo é salário. Página 49 ESTATÍSTICA O que a Estatística significa para você? Página 50 INTRODUÇÃO ESTATÍSTICA: é a ciência dos dados. Ela envolve coletar, classificar, resumir, organizar, analisar e interpretar informação numérica. ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos, faziam estimativas das riquezas individual e social, distribuíam terras ao povo, cobravam impostos. Página 51 ESTATÍSTICA Página 52 ESTATÍSTICA ENVOLVE DOIS PROCESSOS DIFERENTES DESCREVER CONJUNTO DE DADOS OBTER CONCLUSÕES (FAZER ESTIMATIVAS, PREVISÕES,TOMAR DECISOES, ETC.) Página 53 ESTATÍSTICA DESCRITIVA A Estatística descritiva utiliza métodos numéricos e gráficos para detectar padrões em um conjunto de dados, para resumir a informação revelada em um conjunto de dados para apresentar a informação de uma forma conveniente. INFERENCIAL A Estatística inferencial utiliza uma amostra de dados para fazer estimativas, tomar decisões, previsões ou outras generalizações acerca de um conjunto maior de dados. Página 54 Página 55 ESTATÍSTICA DESCRITIVA COLETAR CONTAR ORGANIZAR TABULAR DADOS ESTATÍSTICOS DESCREVER O FENÔMENO ESTATÍSTICO Página 56 ESTATÍSTICA INFERENCIAL POPULAÇÃO AMOSTRA MEDIANTE MÉTODOS E MODELOSPágina 57 VAI INFERIR POSSÍVEIS RESULTADOS A natureza dos dados estatísticos Dados numéricos ou dados quantitativos. Obtidos: medindo ou contando discreto Resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável desses valores. (ou seja, números inteiros.). Ex.: números de ovos que as galinhas põem. contínuo Resultam de um número infinito de valores possíveis que podem ser associados a pontos em uma escala contínua. Ex: quantidade de leite que as vacas produzem Dados categóricos ou dados qualitativos. Resultam de descrições, por exemplo, grupos sanguíneos, estado civil ou na religião de pacientes de um hospital. Página 58 Exemplos . Cor dos olhos das aluna: qualitativa . Produção de café no Brasil: quantitativa contínua . Número de defeitos em aparelhos de TV: quantitativa discreta . Comprimento dos pregos produzidos por uma empresa: quantitativa contínua . O ponto obtido em cada jogada de um dado: quantitativa discreta Página 59 POPULAÇÃO PESSOAS, ANIMAIS, OBJETOS ou NÚMEROS PASSÍVEIS DE UM LEVANTAMENTO OU PESQUISA Página 60 POPULAÇÃO FINITA Consiste em um número finito, ou fixo, de elementos, medidas ou observações. Exemplos: pesos líquidos de 3000 latas de tintas de um certo lote de produção; pontos obtidos por todos os candidatos no vestibular de 2008 numa certa universidade. INFINITA Contém, pelo menos hipoteticamente, um número infinito de elementos. Por exemplo: quando medimos repetidamente o ponto de ebulição de um composto de silicone (não há limite para o número de vezes que podemos medir); quando observamos os totais obtidos em repetidas jogadas de um par de dados (não há limite para o número de vezes que podemos jogar um par de dados). Página 61 é um plano definido, completamente determinado antes da coleta de quaisquer dados, de obter uma amostra de uma dada população. Página 62 AMOSTRAGEM POPULAÇÃO AMOSTRA Página 63 MÉTODOS PARA COMPOR A AMOSTRA PROBABILÍSTICAS ALEATÓRIA SISTETMÁTICO ESTRATIFICADO CONGLOMERADOS NÃO PROBABILÍSTICAS OU INTENCIONAL ACIDENTAL INTENCIONAL CONVENIÊNCIA Página 64 Métodos Probabilísticos O método de amostragem probabilística exige que cada elemento da população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento será 1/N. Tratase do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar inferências induções sobre a população a partir do conhecimento da amostra. Página 65 AMOSTRAGEM ALEATÓRIA os elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de n elementos, de maneira que toda amostra de tamanho n possível tenha a mesma chance de ser escolhida.) Página 66 Ex: Vamos obter uma amostra, de 10%, representativa para a pesquisa da estatura de 90 alunos de uma escola: 1º - numeramos os alunos de 1 a 90. 2º - escrevemos os números dos alunos, de 1 a 90, em pedaços iguais de papel, colocamos na urna e após misturar retiramos, um a um, nove números que formarão a amostra. OBS: quando o número de elementos da amostra é muito grande, esse tipo de sorteio torna-se muito trabalhoso. Neste caso utiliza-se uma Tabela de números aleatórios, construída de modo que os algarismos de 0 a 9 são distribuídos ao acaso nas linhas e colunas. Página 67 ESTRATIFICADA Com a amostragem estratificada, subdividimos a população em, no mínimo, duas sub populações (ou estratos) que compartilham das mesmas características (como sexo) e, em seguida, extraímos uma amostra de cada estrato. Página 68 Ex: Vamos obter uma amostra proporcional estratificada, de 10%, do exemplo anterior, supondo, que, dos 90 alunos, 54 sejam meninos e 36 sejam meninas. São portanto dois estratos (sexo masculino e sexo feminino). Logo, temos: SEXO POPULACÃO 10 % AMOSTRA MASC. 54 5,4 5 FEMIN. 36 3,6 4 Total 90 9,0 9 Numeramos então os alunos de 01 a 90, sendo 01 a 54 meninos e 55 a 90, meninas e procedemos o sorteio casual com urna ou tabela de números aleatórios. Página 69 PROBABILÍSTICA SISTEMÁTICA Quando se conhece uma listagem dos elementos da população pode-se obter uma amostra aleatória de elementos dividindo-se o número de elementos da população pelo tamanho da amostra. Exemplo: Se a população tem 10.000, onde devemos selecionar uma amostra de 1000. Vamos sortear o primeiro entre 1 e 10 e a partir deste acrescentar sempre 10, até completar a amostra. Página 70 CONGLOMERADO Na amostragem por conglomerados, começamos dividindo a área da população em seções (ou conglomerados); em seguida escolhemos algumas dessas seções e, finalmente, tomamos todos os elementos das seções escolhidas. Uma diferença importante entre a amostragem por conglomerados e a amostragem estratificada é que a amostragem por conglomerados utiliza todos os elementos dos conglomerados selecionados, enquanto a amostragem estratificada utiliza uma amostra de membros de cada estrato. Pode-se encontrar um exemplo de amostragem por conglomerado em uma pesquisa préeleitoral, onde escolhemos aleatoriamente 30 zonas eleitorais e pesquisamos todos os elementos de cada uma das zonas escolhidas. Esse método é muito mais rápido e menos dispendioso do que a escolha de um indivíduo de cada uma das inúmeras zonas da área populacional. Os resultados podem ser ajustados ou ponderados para corrigir qualquer representação desproporcionada de grupos. A amostragem por conglomerados é extensamente utilizada pelo governo e por organizações particulares de pesquisa. Página 71 NÃO PROBABILÍSTICA São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras nãoprobabilísticas não garantem a representatividade da população. Página 72 ACIDENTAL Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Exemplo: As pessoas que de modo voluntário estão dispostas para responder ao questionário. Pesquisas de opinião em praças públicas, ruas... As pessoas que estão mais ao alcance do investigador. Página 73 INTENCIONAL De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Exemplo1: Em um teste de mercado o investigador pesquisa na cidade para comprovar as possibilidades de comercialização de um produto. Exemplo2: Para extrair uma amostra de revistas que reflitam os valores da classe média brasileira, poderíamos ser levados pela intuição, selecionar Veja, Exame e Isto é. Exemplo 3: Numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram. Página 74 Amostragem de Conveniência Na amostragem de conveniência, simplesmente utilizamos resultados que já estão disponíveis. Página 75 Aula 1- 05/08/10 Profª Rosane Worm ESTATÍSTICA BÁSICA 1. INTRODUÇÃO O que a Estatística significa para você? ESTATÍSTICA: é a ciência dos dados. Ela envolve coletar, classificar, resumir, organizar, analisar e interpretar informação numérica. ANTIGUIDADE: os povos já registravam o número de habitantes, nascimentos, óbitos, faziam estimativas das riquezas individual e social, distribuíam terras ao povo, cobravam impostos. TIPOS DE APLICAÇÕES ESTATÍSTICAS NA EMPRESA Para a maioria das pessoas, estatística significa, descrições numéricas, taxas mensais de desemprego, índice de falência para um novo negócio e proporção de mulheres executivas em um setor em particular, todos esses exemplos representam descrições estatísticas de um grande conjunto de dados coletados sobre algum fenômeno. Freqüentemente os dados são selecionados de algum conjunto maior do qual desejamos estimar alguma característica. Este processo de seleção é chamado de amostragem. Por exemplo, você pode coletar as idades de uma amostra de consumidores em uma videolocadora para estimar a idade média de todos os consumidores da loja. Assim, você poderia usar suas estimativas nos anúncios da loja para atingir o grupo de faixa etária apropriada. Repare que a estatística envolve dois processos diferentes: (1) descrever conjuntos de dados e (2) obter conclusões (fazer estimativas, previsões, tomar decisões, etc.) sobre os conjuntos de dados baseados na amostragem. Assim, as aplicações da Estatística podem ser divididas em duas grandes áreas: estatística descritiva e estatística inferencial. Por meio de sondagem, de coleta de dados e de recenseamento de opiniões, podemos conhecer a realidade geográfica e social, os recursos naturais, humanos e financeiros disponíveis, as expectativas da comunidade sobre a empresa, e estabelecer suas metas, seus objetivos com maior possibilidade de serem alcançados a curto, médio ou longo prazo. A Estatística ajudará em tal trabalho, como também na seleção e organização da estratégia a ser adotada no empreendimento e, ainda, na escolha das técnicas de verificação e avaliação da quantidade e da qualidade do produto e mesmo dos possíveis lucros e/ou perdas. A Estatística descritiva utiliza métodos numéricos e gráficos para detectar padrões em um conjunto de dados, para resumir a informação revelada em um conjunto de dados para apresentar a informação de uma forma conveniente. Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento Regional”. Página 76 A Estatística inferencial utiliza uma amostra de dados para fazer estimativas, tomar decisões, previsões ou outras generalizações acerca de um conjunto maior de dados. A coleta, a organização ,a descrição dos dados, o cálculo e a interpretação de coeficientes pertencem à ESTATÍSTICA DESCRITIVA, enquanto a análise e a interpretação dos dados, associado a uma margem de incerteza, ficam a cargo da ESTATÍSTICA INDUTIVA ou INFERENCIAL, também chamada como a medida da incerteza ou métodos que se fundamentam na teoria da probabilidade. A natureza dos dados estatísticos Dados numéricos ou dados quantitativos. São obtidos medindo ou contando, por exemplo, pesos de ratos utilizados num experimento (obtidos medindo) ou as faltas diárias de alunos numa turma ao longo do ano letivo (obtidos contando). Podemos descrever os dados quantitativos distinguido entre discreto e contínuo. • • Dados discretos. Resultam de um conjunto finito de valores possíveis, ou de um conjunto enumerável desses valores. (ou seja, números inteiros.). Ex.: números de ovos que as galinhas põem. Dados contínuos. Resultam de um número infinito de valores possíveis que podem ser associados a pontos em uma escala contínua. Ex: quantidade de leite que as vacas produzem. Dados categóricos ou dados qualitativos. Resultam de descrições, por exemplo, grupos sanguíneos, estado civil ou na religião de pacientes de um hospital. Exemplos . Cor dos olhos das aluna: qualitativa . Produção de café no Brasil: quantitativa contínua . Número de defeitos em aparelhos de TV: quantitativa discreta . Comprimento dos pregos produzidos por uma empresa: quantitativa contínua . O ponto obtido em cada jogada de um dado: quantitativa discreta Populações e Amostras Quando dissemos que a escolha de uma descrição estatística pode depender da natureza dos dados, estamos nos referindo, entre outras coisas, à seguinte distinção: se um conjunto de dados consiste em todas as observações possíveis de um dado fenômeno, dizemos que é uma população; se um conjunto de dados consiste em apenas uma parte da população, dizemos que é uma amostra. Originalmente, a Estatística tratava apenas da descrição de populações humanas, resultados de censos. Mas, à medida que seus objetivos se ampliaram, o Página 77 termo “população” passou a ter a conotação muito mais ampla. Em Estatística, “população” é um temo técnico com um significado próprio. Podemos designar como população qualquer grupo de elementos, depende do contexto em que os itens serão considerados. Suponhamos, por exemplo, que nos ofereçam um lote com 400 ladrilhos de cerâmicas, que podemos comprar ou não, dependendo de sua resistência. Se medirmos a resistência à quebra de 20 desses ladrilhos para estimar a resistência média de todos os ladrilhos, essas 20 mensurações constituem uma amostra da população que consiste nas resistências de todos os 400 ladrilhos. Em outro contexto, se pensarmos em firmar um contrato de longo prazo para o fornecimento de dezenas de milhares desses ladrilhos, consideraríamos como apenas uma amostra o conjunto das resistências dos 400 ladrilhos originais. Distinguiremos ainda dois tipos de populações, as populações finitas e as populações infinitas. Populações finitas. Consiste em um número finito, ou fixo, de elementos, medidas ou observações. Exemplos: pesos líquidos de 3000 latas de tintas de um certo lote de produção; pontos obtidos por todos os candidatos no vestibular de 2008 numa certa universidade. Populações infinitas. Contém, pelo menos hipoteticamente, um número infinito de elementos. Por exemplo: quando medimos repetidamente o ponto de ebulição de um composto de silicone (não há limite para o número de vezes que podemos medir); quando observamos os totais obtidos em repetidas jogadas de um par de dados (não há limite para o número de vezes que podemos jogar um par de dados). Planejamento da amostra e amostragem Em Estatística, um planejamento de amostra é um plano definido, completamente determinado antes da coleta de quaisquer dados, de obter uma amostra de uma dada população. Assim, o plano para extrair uma amostra aleatória simples de tamanho 12 das 247 farmácias de uma cidade, utilizando uma tabela de números aleatórios de uma maneira predeterminada, constitui um planejamento de amostra. Basicamente, existem dois métodos para composição da amostra: probabilístico e não probabilístico ou intencional. Métodos Probabilísticos O método de amostragem probabilística exige que cada elemento da população possua determinada probabilidade de ser selecionado. Normalmente possuem a mesma probabilidade. Assim, se N for o tamanho da população, a probabilidade de cada elemento será 1/N. Trata-se do método que garante cientificamente a aplicação das técnicas estatísticas de inferências. Somente com base em amostragens probabilísticas é que se podem realizar inferências induções sobre a população a partir do conhecimento da amostra. Amostragem Aleatória Em uma amostra aleatória, os elementos da população são escolhidos de tal forma que cada um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatória simples de n elementos, de maneira que toda a mostra de tamanho n possível tenha a mesma chance de ser escolhida.) As amostras aleatórias podem ser escolhidas por diversos métodos, inclusive a utilização de tabelas de números aleatórios e de computadores para Página 78 gerar números aleatórios. Com a amostragem aleatória, espera-se que todos os grupos da população sejam representados na amostra de forma aproximadamente proporcional. Uma amostragem descuidada pode facilmente resultar em uma amostra tendenciosa, com características assaz diferentes das da população que a originou. Em contrapartida, a amostragem aleatória é cuidadosamente planejada para evitar qualquer tendenciosidade. Por exemplo, a utilização de catálogos telefônicos elimina automaticamente todos aqueles cujos telefones não figurem no catálogo, e a exclusão desse segmento da população pode facilmente conduzir a resultados falsos. Há cidades que, por exemplo, 42,5% dos números de telefones não estão no catálogo. Os pesquisadores costumam contornar esse problema utilizando computadores para gerar números de telefone, de modo que todos os números sejam possíveis. Eles devem também ter o cuidado de incluir os que inicialmente não foram encontrados ou se recusaram a responder. Uma empresa constatou que a taxa de recusa para entrevistas telefônicas é em geral de 20%, no mínimo. O fato de ignorarmos os que inicialmente se recusam a responder pode concorrer para que nossa amostra seja tendenciosa. Amostragem Estratificada Com a amostragem estratificada, subdividimos a população em, no mínimo, duas sub populações (ou estratos) que compartilham das mesmas características (como sexo) e, em seguida, extraímos uma amostra de cada estrato. Em uma pesquisa sobre a Emenda Constitucional da Igualdade de Direitos, poderíamos utilizar o sexo como base para a criação de dois estratos. Após obter uma relação dos homens e uma relação das mulheres, aplicamos um método conveniente (como a amostragem aleatória) para escolher determinado número de elementos de cada relação. Quando os diversos estratos têm tamanhos amostrais que refletem a população global, temos o que se chama amostragem proporcional. No caso de alguns estratos não serem representados na proporção adequada então os resultados poderão ser ajustados ou ponderados convenientemente. Para um tamanho fixo de amostra, se escolhemos aleatoriamente elementos de diferentes estratos, temos chance de obter resultados mais consistentes (e menos variáveis) do que com a simples escolha de uma amostra aleatória de toda a população. Por essa razão, costuma-se usar a amostragem estratificada para reduzir a variação nos resultados. Amostragem Sistemática Quando se conhece uma listagem dos elementos da população pode-se obter uma amostra aleatória de n elementos dividindo-se o número de elementos da população pelo tamanho da amostra. N k= n Escolhemos um ponto de partida, que deve ser um valor entre 1 e k e a partir de então selecionamos cada k − ésimo elemento da população para fazer parte da amostra. Por exemplo, se a Motorola quisesse fazer uma pesquisa sobre seus 107.000 empregados, poderia partir de uma relação completa dos mesmos e selecionar cada 100º empregado, obtendo uma amostra de 1.070 elementos. Esse método é simples e utilizado com freqüência. Amostragem por Conglomerado Página 79 Na amostragem por conglomerados, começamos dividindo a área da população em seções (ou conglomerados); em seguida escolhemos algumas dessas seções e, finalmente, tomamos todos os elementos das seções escolhidas. Uma diferença importante entre a amostragem por conglomerados e a amostragem estratificada é que a amostragem por conglomerados utiliza todos os elementos dos conglomerados selecionados, enquanto a amostragem estratificada utiliza uma amostra de membros de cada estrato. Pode-se encontrar um exemplo de amostragem por conglomerado em uma pesquisa pré-eleitoral, onde escolhemos aleatoriamente 30 zonas eleitorais e pesquisamos todos os elementos de cada uma das zonas escolhidas. Esse método é muito mais rápido e menos dispendioso do que a escolha de um indivíduo de cada uma das inúmeras zonas da área populacional. Os resultados podem ser ajustados ou ponderados para corrigir qualquer representação desproporcionada de grupos. A amostragem por conglomerados é extensamente utilizada pelo governo e por organizações particulares de pesquisa. Métodos não Probabilísticos São amostragens em que há uma escolha deliberada dos elementos da amostra. Não é possível generalizar os resultados das pesquisas para a população, pois as amostras não-probabilísticas não garantem a representatividade da população. Amostragem Acidental Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Amostragem Intencional De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irão compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Por exemplo, numa pesquisa sobre preferência por determinado cosmético, o pesquisador se dirige a um grande salão de beleza e entrevista as pessoas que ali se encontram. Amostragem de Conveniência Na amostragem de conveniência, simplesmente utilizamos resultados que já estão disponíveis. Em alguns casos, os resultados da amostragem de conveniência podem ser muito bons, mas em outros casos podem apresentar séria tendenciosidade. Ao fazer uma pesquisa sobre pessoas canhotas, seria conveniente um estudante pesquisar seus próprios colegas de classe, porque estão ao seu alcance imediato. Mesmo que tal amostra não seja aleatória, os resultados devem ser bem satisfatórios. Em contrapartida, poderia ser muito conveniente (e talvez mesmo lucrativo) para a ABC News fazer uma pesquisa pedindo aos espectadores que liguem para um número de telefone “900” para registrar suas opiniões, mas essa pesquisa seria autoselecionada e os resultados seriam provavelmente tendenciosos Um erro amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias. Ocorre um erro não-amostral quando os dados amostrais são coletados, registrados ou analisados incorretamente. Tais erros resultam de um erro que não Página 80 seja uma simples flutuação amostral aleatória, como a escolha de uma amostra não aleatória e tendenciosa, a utilização de um instrumento de mensuração defeituoso, um grande número de recusas de resposta ou a cópia incorreta dos dados amostrais. Se extrairmos uma amostra cuidadosamente, de forma que ela represente realmente a população, podemos aplicar os métodos descritos neste livro para analisar o erro amostral, mas devemos ter o máximo de cuidado em minimizar os erros não-amostrais. Exercício: 1- Classifique a variável como quantitativa discreta ou quantitativa contínua: a) População: funcionários de uma empresa. Variável: salários mensais. b) População: computadores produzidos por uma empresa. Variável: número de peças usadas. c) População: jogadores de basquete de um clube. Variável: estatura. 2 . Classifique as variáveis em qualitativas ou quantitativas contínuas ou discretas: a) População: alunos de uma escola. Variável: cor dos cabelos b) População: casais residentes em uma cidade. Variável: número de filhos. c) População: as jogadas de um dado. Variável: o ponto obtida em cada jogada. d) População: peças produzidas por certa máquina. Variável: número de peças produzidas por hora. e) População: peças produzidas por certa máquina. Variável: diâmetro externo. 3 - uma agência de turismo tem 2.500 clientes cadastrados. Para melhor atendê-los, foi pesquisada a preferência em relação ao tempo de duração, ao preço, ao número de acompanhantes, ao número de passeios e à qualidade dos serviços prestados em uma viagem. Foram consultados de modo imparcial, 700 pessoas. a) Quantas pessoas têm a população estatística envolvida nessa pesquisa? b) A amostra pesquisada foi de quantas pessoas? c) Quais foram as variáveis qualitativas pesquisadas? 4- Quais são as etapas básicas do método estatístico? 5. Uma concessionária de automóveis tem cadastrados 3500 clientes e fez uma pesquisa sobre a preferência de compra em relação a “cor”(branco, vermelho ou azul), “preço”, “número de portas”(duas ou quatro) e “estado de conservação” (novo ou usado). Foram consultados 210 clientes. Diante dessas informações, responda: Página 81 a) Qual é o universo estatístico e qual é a amostra dessa pesquisa? b) Quais são as variáveis e qual é o tipo de cada uma? c) Quais os possíveis valores da variável “cor” nessa pesquisa? 6. Ao nascer, os bebês são pesados e medidos, para se saber se estão dentro das tabelas de peso e altura esperados. Estas duas variáveis são: a) Qualitativas b) Ambas discretas. c) Ambas contínuas. d) Contínua e discreta, respectivamente. e) Discreta e contínua, respectivamente. 7. Para cada uma das seguintes variáveis aleatórias, determine se a variável é quantitativa ou qualitativa. Se quantitativa, determine se a variável de interesse é discreta ou contínua. a. Número de telefones por domicílio. b. Tipo de telefone mais utilizado. c. Número de chamadas de longa distância realizadas por mês. d. Duração (em minutos) da mais demorada chamada de longa distância. e. Cor do telefone mais utilizado. f. Quantia em dinheiro gasto com livros. g. Número de livros didáticos comprados. h. Tempo gasto na livraria. i. Sexo. j. Principal matéria acadêmica. k. Número de créditos matriculados para o semestre corrente. l. Método de pagamento na livraria. m. Nome do provedor de internet. n. Tarifa mensal do serviço de internet. o. Quantidade de tempo gasto por semana navegando na internet. p. Número semanal de e-mails recebidos. q. Número mensal de compras on-line. r. Total gasto em compras on-line. s. Quantia gasta no mês passado com vestuário. t. Número de agasalhos que possui. u. Quantia de tempo gasto no mês passado comprando vestuário. v. Horário mais provável para compra de vestuário (comercial, à noite ou fim de semana). w. Loja de departamento preferida. x. Número de pares de meias que possui. y. Número de alunos matriculados na disciplina de Estatística I. z. Disciplinas disponíveis para cursar no semestre corrente. 8. Identifique o tipo de amostragem utilizada: aleatória, estratificada, sistemática, por conglomerado ou conveniência. a. Ao escrever um livro, o autor baseou suas conclusões em 4.500 respostas a 100.000 questionários distribuídos a mulheres. b. Um sociólogo seleciona 12 homens e 12 mulheres de cada uma de quatro turmas de inglês. c. Um cabo eleitoral escreve o nome de cada senador em cartões separados, mistura-os e extrai 10. Página 82 d. Um programa de Planejamento Familiar pesquisa 500 homens e 500 mulheres sobre seus pontos de vista sobre o uso de anticoncepcionais. e. Um pesquisador médico de uma Universidade entrevista todos os portadores de leucemia em cada um de 20 hospitais selecionados aleatoriamente. f. Obtém-se uma amostra de um produto extraindo-se cada 100ª unidade de linha de montagem. g. Geram-se números aleatórios em um computador para selecionar números de série de carros a serem escolhidos para uma amostra de teste. h. Um fornecedor de peças para automóvel obtém uma amostra de todos os itens de cada um de 12 fornecedores selecionados aleatoriamente. i. Um fabricante de automóveis faz um estudo de mercado compreendendo testes de direção feitos por uma amostra de 10 homens e 10 mulheres em cada uma de quatro diferentes faixas etárias. j. Um fabricante de automóveis faz um estudo de mercado entrevistando clientes em potencial que solicitam teste de direção a um revendedor local. Página 83 Aula 02- Estatística I – 12/08/10 Profª Rosane Worm Atividades 1. Explique uma forma de se obter uma amostra estratificada dos empregados de uma empresa em que existam funcionários de escritório, funcionários de produção e vendedores. 2. Numa escola com 1200 alunos, foi feito um recenseamento, recolhendo-se dados referentes às seguintes variáveis: Idade dos alunos; anos de escolaridade; meio de transporte utilizado para ir à escola; local de almoço; número de irmãos; local de trabalho; número de televisores em casa; local de moradia. a) Das variáveis observadas, quais são quantitativas e quais são qualitativas? b) Como organizar uma amostra simples e uma sistemática para fazer esse recenseamento? 3. Deseja-se fazer uma pesquisa em uma população constituída por um número maior de homens que de mulheres. Como você faria para selecionar uma amostra: a) com o mesmo número de homens e de mulheres? b) Com mais mulheres que homens? 4. Suponha que 40% da população mencionada no problema anterior seja constituída por mulheres. Numa amostra estratificada proporcional formada por 50 indivíduos, qual seria o número de homens e o de mulheres? E numa amostra composta de 150 pessoas, quais seriam esses números? 5. Uma empresa de publicidade quer fazer um estudo sobre o interesse despertado por certa propaganda entre os alunos de 10 anos de idade das escolas de Ensino Fundamental de uma cidade. Para isso, pretende estratificar uma amostra de 300 crianças. Como a empresa poderia fazer essa amostra a partir dos dados da tabela abaixo? Escola A B C D E População 400 300 350 450 520 Missão: "Oferecer oportunidades de educação contribuindo para a formação de profissionais conscientes e competentes, comprometidos com o comportamento ético e visando ao desenvolvimento Regional”. Página 84 F 300 DESCRIÇÃO DE POPULAÇÃOES E AMOSTRAS COM TABELAS Representação tabular Um dos objetivos da Estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação dessa ou dessas variáveis, apresentando esses valores em tabelas e gráficos, que irão nos fornecer rápidas e seguras informações a respeito das variáveis em estudo, permitindo-nos determinações administrativas e pedagógicas mais coerentes e científicas. TABELA: É um quadro que resume um conjunto de dados dispostos segundo linhas e colunas de maneira sistemática. • De acordo com a Resolução 886 do IBGE, nas casas ou células da tabela devemos colocar : um traço horizontal ( - ) quando o valor é zero; três pontos ( ... ) quando não temos os dados; zero ( 0 ) quando o valor é muito pequeno para ser expresso pela unidade utilizada; um ponto de interrogação ( ? ) quando temos dúvida quanto à exatidão de determinado valor. Obs.: O lado direito e esquerdo de uma tabela oficial deve ser aberto. Elementos Essenciais e Facultativos de uma Tabela: Podemos determinar que uma tabela estatística é formada por elementos facultativos e por elementos essenciais: ELEMENTOS ESSENCIAIS Título: É a parte superior que procede a tabela e que contém a designação do fato observado, o local e a época em que foi registrado. Corpo: É o conjunto de colunas e linhas, respectivamente, em ordem vertical e horizontal, que contém as informações sobre o fato observado. Cabeçalho: É a parte da tabela que especifica o conteúdo das colunas. Coluna Indicadora: É a parte da tabela que especifica o conteúdo das colunas no sentido vertical. . ELEMENTOS FACULTATIVOS Fonte: É a indicação da entidade responsável pelo fornecimento dos dados. Notas: São as informações destinadas a esclarecer o conteúdo das tabelas. Chamadas: São as informações utilizadas para esclarecer certas minúcias em relação as linhas e colunas. Obs. Todos os elementos facultativos de uma representação tabular estão situados no rodapé. Página 85 CORPO Fonte: IBGE ( rodapé) Listando dados numéricos Em geral, listar, e portanto, organizar dados é a primeira etapa em qualquer tipo de análise estatística. Como situação típica, consideremos os dados seguintes, que representam o comprimento (em centímetros) de 60 sardinhas pescadas em uma colônia de pescadores: 17,2 16,5 16,5 20,0 17,8 24,2 18,8 17,8 18,5 22,8 22,7 21,0 20,7 17,9 20,7 21,4 24,7 24,4 22,6 24,7 20,0 19,2 22,7 18,8 18,6 20,7 21,9 22,5 22,4 17,5 18,3 20,9 17,6 20,8 18,3 18,8 22,7 25,0 23,4 24,4 24,2 17,2 24,0 21,0 16,5 17,0 23,1 24,6 20,0 17,2 24,0 18,9 16,7 21,2 22,4 18,4 22,5 16,7 16,1 18,6 A coleta desses dados por si só já não é tarefa simples, mas deveria ser evidente que é preciso fazer muito mais para tornar os números compreensíveis. Seria interessante se soubéssemos os valores extremos (menor e maior valor). Ocasionalmente, é útil dispor os dados de maneira crescente ou decrescente. A listagem a seguir dos comprimentos das sardinhas está arranjada em ordem crescente: 16,1 17,5 18,6 20,7 22,4 24,0 16,5 17,6 18,8 20,7 22,5 24,0 16,5 17,8 18,8 20,8 22,5 24,2 16,5 17,8 18,8 20,9 22,6 24,2 16,7 17,9 18,9 21,0 22,7 24,4 16,7 18,3 19,2 21,0 22,7 24,4 17,0 18,3 20,0 21,2 22,7 24,6 17,2 18,4 20,0 21,4 22,8 24,7 17,2 18,5 20,0 21,9 23,1 24,7 17,2 18,6 20,7 22,4 23,4 25,0 Esta listagem de dados ordenados, também, no meio estatístico como ROL. SÉRIE ESTATÍSTICA: É qualquer tabela que apresenta a distribuição de um conjunto de dados estatísticos em função da época, do local ou da espécie. SÉRIES HOMÓGRADAS: são aquelas em que a variável descrita apresenta variação discreta ou descontínua. Podem ser do tipo temporal, geográfica ou específica. Página 86 Séries históricas, cronológicas ou temporais É a série cujos dados estão dispostos em correspondência com o tempo, ou seja, varia o tempo e permanece constante o fato e o local. Tabela 1. PREÇO DO ACÉM NO VAREJO EM SÃO PAULO – 1989-94 ANOS 1989 1990 1991 1992 1993 1994 Tabela 2. Produção de Petróleo Bruto no Brasil De 1976 a 1980 (x1000m3) PREÇO MÉDIO (US$) 2,24 2,73 2,12 1,89 2,04 2,62 Anos 1976 1977 1978 1979 1980 Produção 9.702 9.332 9.304 9.608 10.562 Fonte: Conjuntura Econômica (fev. 1983) Fonte: APA Séries geográficas, espaciais, territoriais ou de localização É a série cujos dados estão dispostos em correspondência com o local, ou seja, varia o local e permanece constante a época e o fato. Tabela 3. EXPORTAÇÃO BRASILEIRA 1985 Tabela 4. População Urbana do Brasil em 1980(x1000) IMPORTADORES América Latina EUA e Canadá Europa Ásia e Oceania África e Oriente Médio Região Norte Nordeste Sudeste Sul Centro-Oeste (%) 13,0 28,2 33,9 10,9 14,0 Fontes: MIC e SECEX. Produção 3.037 17.568 42.810 11.878 5.115 Fonte: Anuário Estátistico (1984) Séries específicas ou categóricas É a série cujos dados estão dispostos em correspondência com a espécie ou qualidade, ou seja, varia o fato e permanece constante a época e o local. Tabela 5. PRODUÇÃO BRASILEIRA DE AÇO BRUTO EM 1991 (em toneladas) PROCESSOS Oxigênio básico Forno elétrico EOF 1991 17.934 4.274 409 Fonte: Instituto Brasileiro de Siderurgia. SÉRIES CONJUGADAS: Também chamadas de tabelas de dupla entrada. São apropriadas à apresentação de duas ou mais séries de maneira conjugada, havendo duas ordens de classificação: uma horizontal e outra vertical. O exemplo abaixo é de uma série geográficatemporal. Tabela 6. População Urbana do Brasil por Região de 1940 a 1980 (x1000) Anos N NE REGIÕES SE S CO Página 87 1940 1950 1960 1970 1980 406 581 958 1.624 3.037 3.381 4.745 7.517 11.753 17.567 7.232 10.721 17.461 28.965 42.810 1.591 2.313 4.361 7.303 11.878 271 424 1.007 2.437 5.115 Fonte: Anuário Estatístico (1984) 1. Classifique as seguintes séries: b) AVICULTURA BRASILEIRA 1992 a) PRODUÇÃO DE BORRACHA NATURAL ANOS 1991 1992 1993 TONELADAS 29.543 30.712 40.663 ESPÉCIE Galinhas Galos, frangos e pintos Codornas Fonte: IBGE NÚMERO (1.000 cabeças) 204.160 435.465 2.488 Fonte: IBGE c) VACINAÇÃO CONTRA A DE AVIÃO POLIOMIELITE – 1993 REGIÕES QUANTIDADES Norte 211.209 Nordeste 631.040 Sudeste 1.119.708 Sul 418.785 Centro185.823 Oeste FONTE: Ministério da Saúde d) AQUECIMENTO DE UM MOTOR DE MARCA X MINUTOS 0 1 2 3 4 5 6 Dados fictícios TEMPERATURA ( °C ) 20 27 34 41 49 56 63 2. De acordo com o IBGE (1988), em 1986 ocorreram, em acidentes de trânsitos, 27306 casos de vítimas fatais, assim distribuídos: 11712 pedestres, 7116 passageiros e 8478 condutores.. Faça uma tabela para representar esses dados. 3. De acordo com o ministério dos transportes, em 1998, o tamanho das malhas de transporte no Brasil é assim distribuído: 320480 km de rodovias (estradas municipais não estão incluídas), 29700 km de Ferrovias (inclui as linhas de trens urbanos) e 40000 km de Hidrovias (desse total, apenas 8000 km estão sendo usados de fato). Faça uma tabela para representar esses dados. 4. De acordo com o Ministério de Educação a quantidade de alunos matriculados no ensino de 1º grau no Brasil nos anos de 1990 a 1996 em milhares de alunos, são: 19.720 – 20.567 – 21.473 – 21.887 – 20.598 – 22.473 – 23.564. Faça uma tabela para representar esses dados. 5. Estabelecimentos de ensino da região norte do Brasil em 1982 subdividiam-se em: Rondônia, Acre, Amazonas, Roraima, Pará e Amapá e possuem um total de 29, 13, 78, 4, 10 e Página 88 9 estabelecimentos de ensino, respectivamente, segundo o MEC. Faça uma tabela para apresentar esses dados. 6. De acordo com o IBGE(1988), a distribuição dos suicídios ocorridos no Brasil em 1986, segundo a causa atribuída, foi a seguinte: 263 alcoolismo, 198 por dificuldade financeira, 700 por doença metal, 189 por outro tipo de doença, 416 por desilusão amorosa e 217 por outras causas. Apresente essa distribuição em uma tabela. Página 89 Aula 3 – Estatística I – 19/08/10 Profª Rosane Worm Distribuição de Freqüência A freqüência é o número de repetições da observação no conjunto de observações. A distribuição de freqüência de uma série de observações é uma função que representa os pares de valores formados por cada observação e seu número de repetições. Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) 150 ├ 154 154 ├ 158 158 ├ 162 162 ├ 166 166 ├ 170 170 ├ 174 Total Quantidade( fi) 4 9 11 8 5 3 40 FONTE: PESQUISA DO SETOR DE PESSOAL Na construção de tabelas de freqüências, devemos observar as seguintes diretrizes: 1. As classes devem ser mutuamente excludentes, ou seja, cada valor original deve pertencer exatamente a uma e só uma classe. 2. Todas as classes devem ser incluídas, mesmo as de freqüência zero. 3. Procurar utilizar a mesma amplitude para todas as classes, embora eventualmente seja impossível evitar intervalos com extremidade aberta. 4. Escolher números convenientes para limites de classe. Arredondar para cima a fim de ter menos casas decimais, ou utilizar números adequados à situação. 5. Utilizar entre 5 e 20 classes. 6. As somas das freqüências das diversas classes deve ser igual ao número de observações originais. Elementos de uma Distribuição de Freqüência 1. Classe: Classes de freqüência ou, simplesmente, classe são intervalos de variação da variável. As classes são representadas simbolicamente por i, sendo i = 1, 2, 3, . . ., k (onde k é o número total de classes da distribuição). Exemplo: O intervalo 154 ├ 158 define a segunda classe (i = 2) A distribuição é formada por seis classes, podemos afirmar que i = 6. 2. Limites de Classe: Determinam-se limites de classes os extremos de cada classe. O menor número é o limite inferior da classe ( li ) e o maior número, o limite superior da classe ( ls ). Exemplo: Na terceira classe do exemplo acima, temos: li 3 = 158 e Ls 3 = 162 3. Amplitude de um Intervalo de Classe (h): É a medida de intervalo que define a classe. Ela é obtida pela diferença entre os limites superior e inferior. Assim: Página 90 h = ls − li Exemplo: o intervalo de classe do exemplo acima é 4, pois 162 ├ 158 = 4 4. Amplitude Total ( AT) : É a diferença entre o valor máximo e o valor mínimo da amostra. AT = Vmax - Vmin Exemplo: A amplitude amostral do exemplo acima é 24, pois 174 ├150 = 24 5.Ponto Médio de uma Classe ( Xi) : É o ponto que divide o intervalo de classe em duas partes iguais. Xi = li + ls 2 Exemplo: O ponto médio da segunda classe, em nosso exemplo, é 156. 6. TIPOS DE FREQUÊNCIAS Freqüência absoluta (fi). É o número de repetições de um valor individual ou de uma classe de valores da variável. Freqüência relativa (fri ou fri%) Representa a proporção de observações de um valor individual ou de uma classe, em relação ao número total de observações, ou seja, é o número de repetições dessa observação dividida pelo tamanho da amostra. Freqüência absoluta acumulada (Fi). É a soma das freqüências daquela classe e de todas as classes que a antecedem. Freqüência relativa acumulada (Fri ou Fri%). É a Fi dividida pelo total de observações (n). Freqüência Simples ou Absoluta (fi): É o número de observações correspondentes a uma classe. A soma de todas as freqüências é representada por: N = ∑ fi ( população ) n = ∑ fi ( amostra ) Exemplo: Para a distribuição em estudo, temos: n = ∑ fi = 40 Freqüência Acumulada ( F i ) É o total das freqüências de todos os valores inferiores ao limite superior. do intervalo de uma dada classe. Fi = f 1 + f 2 + ... + fi ou Fi = ∑ fi Exemplo: Calcule a freqüência acumulada correspondente à terceira classe, em nosso exemplo: Página 91 Freqüências Relativas simples (f ri ) São os valores da razão entre as freqüências simples e a freqüência total. fi fri = n Exemplo: Calcule a freqüência relativa simples da terceira classe, em nosso exemplo: Freqüência Acumulada Relativa ( F ri ) É a freqüência acumulada da classe, dividida pela freqüência total da distribuição. Fri = Fi n Exemplo: Para a terceira classe, qual é a freqüência acumulada relativa? 7. Número de Classes: Pode-se utilizar a regra de STURGES, que fornece o número de classes em função do total de casos: K = 1 + 3,33 log n( N ) Onde: K é o número de classes; N ou n é o número total de observações. Para determinar a amplitude do intervalo de classe, temos: H h= K SIMBOLOGIA ENTRE OS VALORES DE CLASSE: Inclui o valor da esquerda mas não o da direita. Inclui o valor da direita mas não o da esquerda. Não inclui nem o valor da direita, nem o da esquerda. Inclui tanto o valor da direita quanto o da esquerda. – Distribuição de Freqüência sem Intervalos de Classe Quando se trata de variáveis discretas de variação relativamente pequena, cada valor pode ser tomado como um intervalo de classe. Ex: Uma professora organizou os resultados obtidos em uma prova da seguinte forma: 4–5–7–9–9–4–5–7–9–9–4–5–7–9–9–4–6–8–9–9–4–6–8–9–9 Nota Nº de alunos Total Página 92 EXERCÍCIO 1. Complete a seguinte tabela e responda as seguintes perguntas: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS SALÁRIOS RECEBIDOS PELOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais Freqüências Xi % fr i Fi Fr i % (R$) 150 ├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 Total 40 100 FONTE: PESQUISA DO SETOR DE PESSOAL a) Quantos empregados têm salário entre R$ 154, inclusive, e R$ 158? b) Qual a percentagem de empregados cujos salários são inferiores a R$ 154? c) Quantos empregados têm salário abaixo de R$ 162? d) Quantos empregados têm salário não inferior a R$ 158? 1. Conhecidas as notas de 50 alunos: 33 41 50 55 60 35 42 52 55 61 35 45 53 56 64 39 47 54 57 65 41 48 55 59 65 66 67 68 68 69 71 73 73 73 74 74 76 77 78 80 81 84 85 85 88 89 91 94 94 98 Obtenha a distribuição de freqüência, tendo 30 para limite inferior da primeira classe e 10 para intervalo das classes. Página 93 2. Os resultados do lançamento de um dado 50 vezes foram os seguintes 6 5 2 6 4 3 6 2 6 5 1 6 3 3 5 1 3 6 3 4 5 4 3 1 3 5 4 4 2 6 2 2 5 2 5 1 3 6 5 1 5 6 2 4 6 1 5 2 4 3 Forme uma distribuição de freqüência sem intervalos de classe. 4) Abaixo são mostrados os saldos médios amostrais de 48 contas de clientes do BB S.A. ( dados brutos em US$ 1,00). 120 150 150 150 150 150 225 225 230 250 250 270 275 275 275 300 350 360 375 375 375 450 450 470 475 500 500 500 500 500 550 600 600 600 650 650 700 750 750 800 800 900 950 1000 1000 1000 1000 1000 Pede-se: a) agrupar os dados numa distribuição de freqüências com intervalo de classes (use Teorema de STURGES); b) determine as freqüências simples e acumuladas (absolutas e relativas); c) calcule a interprete: fr2, f3 e Fr4 - Fr2; 5. Considere a seguinte distribuição de freqüência correspondente aos diferentes preços de um determinado produto em 20 lojas pesquisadas. Preços ($) 50 51 52 53 54 Total Número de lojas 2 5 6 6 1 20 a) Quantas lojas apresentaram um preço de $52,00? b) Construa uma tabela de freqüências simples relativas. c) Construa uma distribuição de freqüência acumulada relativa. d) Quantas lojas apresentaram um preço de até $51,00 (inclusive)? e) Qual a porcentagem de lojas com preço maior que $52,00? f) Qual a porcentagem de lojas com preço maior do que $51,00 e menor do que $54,00? Página 94 6. Com referência tabela abaixo Distribuição de freqüência de Diárias para 200 apartamentos Diárias (R$) Número de apartamentos 150 |--- 180 3 180 |--- 210 8 210 |--- 240 10 240 |--- 270 13 270 |--- 300 33 300 |--- 330 40 330 |--- 360 35 360 |--- 390 30 390 |--- 420 16 420 |--- 450 12 200 Total Responda: a) Quais os limites (inferior e superior) da primeira classe? b) A amplitude dos intervalos de classe é a mesma para todas as classes? c) Suponha um aluguel mensal de $239,50. Identificar os limites superior e inferior da classe na qual esta observação seria registrada. d) Construir a distribuição de freqüência simples relativa. e) Construir a distribuição de freqüência acumulada. Página 95 Aula 4 – Estatística I – 26/08/10 Profª Rosane Worm Representação Gráfica Com as tabelas de freqüência, podemos identificar a natureza geral da distribuição dos dados, bem como construir gráficos que facilitem a visualização dessa distribuição. O gráfico estatístico é uma forma de apresentação dos dados, onde o objetivo é o de produzir, no investigador ou no público em geral, uma impressão mais rápida e visual do fenômeno em estudo. Excelência gráfica 1. É uma apresentação bem elaborada de dados, que fornece substância, estatísticas e formas; 2. Comunica idéias complexas com clareza, precisão e eficiência; 3. Fornece ao observador o maior número de idéias, no menor espaço de tempo, com o menor volume de impressão; 4. Exige que seja transmitida a verdade sobre os dados. Vejamos alguns tipos de gráficos Histogramas É utilizado para descrever dados numéricos que tenham sido agrupados na forma de distribuições de freqüências ou distribuições de freqüências relativas. Ao desenhar um histograma, a variável aleatória de interesse é exibida ao longo do eixo horizontal (eixo X). O eixo vertical (eixo Y) representa o número (freqüência), proporção ou porcetagem de observações por intervalo de classe. Altura em centímetros de 160 alunos do curso de estatística Fonte: Departamento de Estatística Idade (em anos) de um grupo de 30 Clientes de uma loja de calçados em Santa Cruz do Sul Página 96 14 Número de Pessoas 12 10 8 6 4 2 0 15|---26 26|---37 37|---48 48|---59 59|---70 Idade (Anos) Histograma da Percentagem de Fundos de Alto Risco 35% Percentagem 30% 25% 20% 15% 10% 5% 0% --- -20 0 20 40 60 80 100 Pontos Médios da Classe Como se interpreta um histograma? Este gráfico é utilizado para variáveis contínuas. Características: - Cada barra representa a freqüência do intervalo respectivo; - Os intervalos devem ter a mesma amplitude; - As barras devem estar todas juntas. A simples observação da forma do histograma permite algumas conclusões. Veja a figura. Os dados têm uma tendência central. As freqüências mais altas estão no centro da figura. Nos processos industriais, esta é a forma desejável. Página 97 Histograma A figura ao lado apresenta um histograma com assimetria positiva. A média dos dados está localizada à esquerda do centro da figura e a cauda à direita é alongada. Esta ocorre quando o limite inferior é controlado ou quando não podem ocorrer valores abaixo de determinado limite. Histograma com assimetria positiva A figura apresenta um histograma com assimetria negativa. A média dos dados está localizada à direita do centro da figura e a cauda à esquerda é alongada. Esta forma ocorre quando o limite superior é controlado ou quando não podem ocorrer valores acima de certo limite. Histograma com assimetria negativa Histograma em plateau, isto é, com exceção das primeiras e das últimas classes, todas as outras têm freqüências quase iguais. Essa forma ocorre quando se misturam várias distribuições com diferentes médias. Histograma em plateau Página 98 A figura mostra um histograma com dois picos, ou duas modas. As freqüências são baixas no centro da figura, mas existem dois picos fora do centro. Esta forma ocorre quando duas distribuições com médias bem diferentes se misturam. Podem estar misturados, por exemplo, os produtos de dois turnos de trabalho. Histograma com Dois picos Os histogramas também mostram o grau de dispersão da variável. O histograma à esquerda mostra pouca dispersão, mas o histograma à direita mostra grande dispersão. Histogramas com dispersões diferentes Gráficos em Linhas Usado principalmente para ilustrar uma série temporal. Produção de Petróleo Bruto no Brasil de 1976 a 1980 (x1000 m³) Fonte: Conjuntura Econômica (Fev. 1983) Página 99 Gráfico de linhas comparativas População Urbana do Brasil por Região de 1940 a 1980 (x 1000) Fonte: Conjuntura Econômica (1984) Gráficos de colunas ou barras Representação gráfica da distribuição de freqüências. Este gráfico é utilizado para variáveis nominais e ordinais. Características: • Todas as barras devem ter a mesma largura • Devem existir espaços entre as barras Gráfico de Colunas Usado para ilustrar qualquer tipo de série. População População Urbana do Brasil em 1980 (x 1000) 45000 40000 35000 30000 25000 20000 15000 10000 5000 0 42810 17568 11878 5115 CO 3037 S SE NE N Regiões Fonte: Anuário Estatístico (1984) Página 100 Fonte: Anuário Estatístico (1984) As larguras das barras que deverão ser todas iguais podendo ser adotado qualquer dimensão, desde que seja conveniente e desde que não se superponham. O número no topo de cada barra pode ou não ser omitido, se forem conservados, a escala vertical pode ser omitida. Gráfico de colunas comparativas a. Colunas Justapostas (gráfico comparativo) População Urbana do Brasil por Região de 1940 a 1980 (x1000) Fonte: Anuário Estatístico (1984) b. Colunas Sobrepostas (gráfico comparativo) População Urbana do Brasil por Região de 1940 a 1980 (x 1000) Página 101 Fonte: Anuário Estatístico (1984) Gráfico de Barras As regras usadas para o gráfico de barras são iguais as usadas para o gráfico de colunas. População Urbana do Brasil em 1980 (x 1000) 3037 N 17568 NE 42810 SE 11878 S CO 5115 0 10000 20000 30000 40000 50000 Fonte: Anuário Estatístico (1984) Assim como os gráficos de Colunas podem ser construídos gráficos de barras comparativas. Gráficos circulares ou de Setores Representação gráfica da freqüência relativa (percentagem) de cada categoria da variável. Este gráfico é utilizado para variáveis nominais e ordinais. É uma opção ao gráfico de barras quando se pretende dar ênfase à comparação das percentagens de cada categoria. A construção do gráfico de setores segue uma regra de 3 simples, onde as freqüências de cada classe correspondem ao ângulo que se deseja representar em relação à freqüência total que representa o total de 360. Características: Página 102 • A área do gráfico equivale à totalidade de casos (360º = 100%); • Cada “fatia” representa a percentagem de cada categoria. População Urbana e Rural do Brasil em 1980 (x 1000) 32% Urbana Rural 68% Fonte: Anuário Estatístico (1984) População Urbana e Rural do Brasil em 1980 (x 1000) 32% Urbana Rural 68% Fonte: Anuário Estatístico (1984) Gráfico Pictorial - Pictograma Tem por objetivo despertar a atenção do público em geral, muito desses gráficos apresentam grande dose de originalidade e de habilidade na arte de apresentação dos dados. Evolução da matricula no Ensino Superior no Brasil de 1968 a 1994 (x 1000) Página 103 Fonte: Grandes números da educação brasileira março de 1996 Os métodos mais eficientes para deixar de fumar segundo 30.000 fumantes entrevistados no Canadá Gráfico Polar (radar) É o tipo de gráfico ideal para representar séries temporais cíclicas, ou seja, toda a série que apresenta uma determinada periodicidade. Precipitação pluviométrica do município de Santa Maria – RS- 1999 Fonte: Base Aérea de Santa Maria Página 104 Cartograma É a representação de uma carta geográfica. Este tipo de gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com as áreas geográficas ou políticas. Brasil por vendas (em mil reais) 144 237 300 440 320 Atividades 1. O gráfico a seguir ilustra o número de inscritos nos últimos quatro vestibulares que disputaram as vagas oferecidas pela Universidade de São Paulo (USP) e pelas universidades federais do Rio de Janeiro (UFRJ), de Minas Gerais (UFMG) e do Rio Grande do Sul (UFRGS). Fonte: Época 26/04/99 (com adaptações) Com base nessas informações, julgue os itens seguintes como verdadeiro ou falso: a. De 1997 a 1998, o crescimento percentual do número de inscritos na USP foi maior que o da UFRGS. (___) b. Os crescimentos percentuais anuais na UFRJ diminuíram a cada ano. (___) c. Todas as universidades tiverem crescimento no número de inscritos no referido período. (___) d. A UFRGS foi a única que apresentou crescimento no número de inscritos. (___) Página 105 e. A UFMG teve um crescimento de mais de 100% no número de inscritos no período. (___) f. A UFRGS teve um crescimento de 3,74%, 36,17% em 97 e 98, respectivamente, e uma redução de cerca de 3,17% no número de inscritos em 99. 2. Numa turma de cursinho de informática, a distribuição das idades dos alunos, segundo o sexo, é dada pelo gráfico seguinte. Com base nos dados do gráfico, pode-se afirmar que: a. o número de meninas com, no máximo, 16 anos é maior que o número de meninos nesse mesmo intervalo de idade. (___) b. o número total de alunos é 19. (___) c. a média de idade das meninas é 15 anos. (___) d. o número de meninos é igual ao número de meninas. (___) e. o número de meninos com idade maior que 15 anos é maior que o número de meninas nesse mesmo intervalo de idades. (___) 3. Considere os dados referentes ao consumo de água, em m3, de 75 contas da CORSAN. 32 45 33 51 28 40 25 48 12 37 22 10 20 19 26 11 18 12 15 44 34 23 31 41 11 40 35 39 29 53 16 22 17 25 38 26 30 58 13 46 23 14 19 23 17 31 18 16 32 36 27 20 12 14 28 10 13 21 27 49 38 24 15 43 56 17 35 12 37 19 13 29 20 21 11 a. agrupar os dados em uma distribuição de freqüência. Utilize o limite inferior da distribuição igual a zero na primeira classe e amplitude de classe 10. b. determine as freqüências simples e acumuladas ( absolutas e relativas); c. calcule e interprete: fr 2 , f 3 e Fr 4 – Fr 2 ; d. construa o correspondente histograma de freqüências relativas. 5. Abaixo são mostrados os saldos médios em R$ de 48 contas de clientes do BB Novo S.A. 450 500 150 1000 250 275 550 500 225 475 150 450 950 300 800 275 600 750 375 650 150 500 1000 700 475 900 800 275 600 750 375 650 150 500 225 250 150 120 250 360 230 500 350 375 470 600 1030 270 Página 106 a. b. c. Agrupe os dados numa distribuição de freqüências. Determine as freqüências relativas: simples e acumulada. Apresente o histograma de freqüências relativas. 6. Conhecidas as notas de 50 alunos: 33 35 35 39 39 40 40 40 41 41 41 42 45 47 48 50 52 53 54 55 55 59 60 61 64 65 65 66 66 67 68 69 71 73 74 74 76 77 77 80 84 85 88 89 94 94 97 97 100 100 a) Construa uma tabela de freqüências usando a regra de Sturges. b) Construa o histograma e o polígono de freqüências. 7- Em uma eleição concorreram os candidatos A, B e C e, apurada a primeira urna, os votos foram os seguintes: A: 50 votos; B: 80 votos; C: 60 votos; brancos e nulos: 10 votos.A partir desses dados construa: a) O gráfico de barras horizontal 8- Construa os gráficos de barras verticais e de setores para a variável hobby . Hobby Esporte Música Patinação Dança Freqüência 8 6 3 7 Página 107 Aula 5 – Estatística I- 02/09/10 Profª Rosane Worm MEDIDAS DE TENDÊNCIA CENTRAL Uma medida de tendência central é um valor no centro ou no meio de um conjunto de dados. Estudaremos aqui: Médias: aritmética, geométrica, ponderada e móvel Mediana Moda Ponto médio. 1. Média aritmética A média (aritmética) é, de modo geral, a mais importante de todas as mensurações numéricas descritivas. A média aritmética de um conjunto de valores é o resultado da divisão da soma de todos os elementos desse conjunto pelo número de elementos do conjunto. Representamos a média pelo símbolo: x Média da amostra (leia-se “x barra”) µ média da população (minúscula grega: mi) então Σxi n Σx Média de uma população: µ = i N Média de uma amostra: x = Onde, n é o tamanho da amostra. N é o tamanho da população. Σ indica um somatório de valores (sigma maiúsculo). Ex. Selecionados aleatóriamente 10 alunos da turma, e obtemos as seguntes alturas (em m): 1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63 1,77 1,59 Calcule a média das alturas. Solução: Como se trata de uma amostra: Σxi 1,76+1,73+1,80+1,65+1,70+1,74+1,81+1,63+1,77+1,59 17,18 = x = = = 1, 718 10 10 n Página 108 Média Aritmética Ponderada – dados agrupados Sem intervalos de classe: As freqüências são números indicadores da intensidade de cada valor da variável, elas funcionam como fatores de ponderação, o que leva a calcular a média aritmética ponderada. µ= ∑ xi. fi N X = ( população ) ∑ xi. fi n ( amostra ) Exemplo: Considerando a distribuição relativa a 34 famílias de quatro filhos, adotando-se a variável “número de filhos do sexo masculino”, determine a média. N.º de Meninos 0 1 2 3 4 fi 2 6 10 12 4 Σ = 34 Com intervalos de classe: Convenciona-se que todos os valores incluídos em um determinado intervalo de classe coincidem com o seu ponto médio, e determina-se a média aritmética ponderada. µ= ∑ xi. fi ( população ) N onde Xi é o ponto médio da classe. X = ∑ xi. fi n ( amostra ) Exemplo: SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais Freqüências (R$) 150 ├ 154 4 154 ├ 158 9 158 ├ 162 11 162 ├ 166 8 166 ├ 170 5 170 ├ 174 3 Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL Página 109 Média Geométrica Simples Para uma seqüência numérica x: x 1 , x 2 , ......., x n , a média geométrica simples, que designaremos por xg , é definida por: Exemplo: Se X: 2, 4, 6, 9, então: xg = 4 2.4.6.9 = 4 432 = 4,559 Média Geométrica Ponderada Para uma seqüência numérica x: x 1 , x 2 , ...., x n afetados de pesos p 1 , p 2 , ..., p n respectivamente, a média geométrica ponderada que designaremos por x g é definida por: Exemplo: Se x: 1, 2, 5, com pesos 3, 3, 1 respectivamente então: xg = 7 13.2 3.51 = 7 1.8.5 = 7 40 = 1,6938 Observando-se que: A média geométrica só é indicada para representar uma série de valores aproximadamente em progressão geométrica. Os casos anteriores não são muito freqüentes nas aplicações. Vamos restringir o desenvolvimento de médias ao caso de média aritmética, que é a média mais utilizada nas aplicações. 4. Média Móvel Uma média, como o nome diz, mostra o valor médio de uma amostra de determinado dado. Uma média móvel aritmética (MMA) é uma extensão desse conceito, representando o valor médio, normalmente dos preços de fechamento, em um período de tempo. Exemplo: A média móvel simples é calculada pela formação do preço médio por um número específico de períodos. Para o cálculo usamos o preço de fechamento. Por exemplo: Vamos utilizar a média dos últimos 10 dias. Devemos somar os preços finais durante os últimos 10 dias e dividir o total por 10. Página 110 10+11+12+13+14+15+16+17+18+19=145 (145/10) = 14,50 Devemos repetir este cálculo conforme o passar dos dias, assim, as médias vão se juntando e formando uma linha. Se continuarmos com o nosso exemplo, o próximo preço final na média será 20, então teremos um novo período, somando o último dia (20) e removendo o primeiro da lista (10). Continuando com a média dos últimos 10 dias, a média móvel simples deverá ser calculada da seguinte maneira: 11+12+13+14+15+16+17+18+19+20=155 (155/10) = 15,50 Repare que removemos o primeiro dia da lista (10) para incluir o novo dia (20). Durante os últimos dois dias, a média moveu-se de 14,50 para 15,50. Como são somados novos dias, os antigos serão removidos e a média permanece se movendo com o passar do tempo. No modelo da média móvel, a projeção yˆ t +1 é calculada com a fórmula: yˆt +1= t 1 × ∑ yi k i =t − k +1 Ou, média móvel de ordem k: yˆt +1 = Yt + Yt −1 + Yt − 2 + ... + Yt − k +1 k EXERCÍCIOS 1. As notas finais de 15 alunos de um curso de computação estão apresentadas abaixo. Qual a média das notas obtidas? 7,5 9,0 4,5 4,0 5,5 8,0 8,5 9,0 7,5 7,5 7,0 6,5 7,5 9,0 6,5 NOTAS 2. Os dados abaixo referem-se ao tempo de vida útil, em anos, de determinado aparelho eletrônico: 5 – 5 – 6 – 4 – 20 Calcule a média aritmética simples. Página 111 3. No ano 2000, o número de nascimentos, por mês, em uma maternidade foi: MÊS Jan. Fev. Março Abril Maio Junho Julho Agosto Set. Out. Nov. Dez. NASC. 38 25 42 30 29 47 18 36 38 43 49 37 a) Calcule a média mensal de nascimentos. b) Em que meses o número de nascimentos ficou acima da média? 4. A classificação final para um determinado curso é a média ponderada das provas de capacidade geral, com peso 3, e das provas de capacidade específica, com peso 2. Nessas condições, qual é a classificação final de um aluno que obteve 162 pontos na prova de capacidade geral e 147 pontos na prova de capacidade específica? 5. O quadro de distribuição de freqüências representa os salários mensais de 40 empregados de uma firma. CLASSE (EM REAIS) 180 ├ 200 200 ├ 220 220 ├ 240 240 ├ 260 260 ├ 280 PONTO MÉDIO DA CLASSE ( X I ) 190 210 230 250 270 FREQÜÊNCIA ( fi ) 4 18 10 5 3 Calcule o salário médio mensal dos empregados dessa firma. 6. Calcule a média geométrica para as séries: X : 1, 2, 4, 7, 16 Y : 81, 26, 10, 3, 1 7. Calcule a média aritmética da série: xi 2 3 4 5 fi 1 4 3 2 Página 112 Aula 6 – Estatística I – profª Rosane Worm 09/09/2010 A Mediana A mediana de um conjunto de valores é o valor do meio desse conjunto, quando os valores estão dispostos em ordem crescente (ou decrescente). A mediana é representada geralmente por ~ x (lê-se: “x til”) ou pode também ser representada com o símbolo md.. Para calcular a mediana, primeiro coloque os valores em ordem (crescente ou decrescente); em seguida aplique um dos dois processos a seguir: Se o número de valores é ímpar, a mediana é o número localizado exatamente no meio da lista. Se o número de valores é par, a mediana é a média dos dois valores do meio. Exemplo 1. Calcule a mediana da altura de 7 alunos da turma. 1,76 1,73 1,80 1,65 1,70 1,74 1,81 Exemplo 2. Calcule a mediana da altura de 8 alunos da turma. 1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63 Moda A moda de um conjunto de dados é o valor que ocorre com maior freqüência. Quando dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda, e o conjunto se diz bimodal. Se mais de dois valores ocorrem com a mesma freqüência máxima, cada um deles é uma moda, e o conjunto é multimodal. Quando nenhum valor é repetido, o conjunto não tem moda (amodal). Costuma-se denotar a moda por Mo. Exemplo 1. Um estudo sobre tempos de reação abrangeu 30 canhotos, 50 destros e 20 ambidestros. Qual é a moda das características citadas. Exemplo 2. Determine a moda dos seguintes conjuntos de dados: a. 5 5 5 3 1 5 1 4 3 5 b. 1 2 2 2 3 5 6 6 6 7 c. 1 2 3 6 9 4 Ponto Médio O ponto médio é o valor que está a meio caminho entre o maior e o menor valor. Para obtê-lo, somamos esses valores extremos e dividimos o resultado por 2, como na fórmula a seguir: ponto médio = maior valor + menor valor 2 Embora o ponto médio não seja muito usado, incluímo-lo aqui para enfatizar o fato de que há diferentes maneiras de definir o centro de um conjunto de dados. Ao nos referirmos ao valor médio de um conjunto de dados, devemos ser precisos, mencionando o termo exato, como média, mediana, moda ou ponto médio. Página 113 Exemplo. Calcule o ponto médio da altura de 8 alunos da turma. 1,76 1,73 1,80 1,65 1,70 1,74 1,81 1,63 Regra do Arredondamento Eis uma regra simples para arredondamento de respostas: “Tome uma decimal a mais, além das que aparecem nos dados.” Devemos arredondar apenas a resposta final, e não os valores intermediários. Por exemplo, a média de 2, 3, 5 é 3,33333333..., que deve ser arredondada para 3,3. Como os dados originais são expressos em números inteiros, arredondamos a resposta para o décimo mais próximo. Outro exemplo: a média de 2,1, 3,4 e 5,7 é arredondada para 3,73 com duas decimais (uma a mais em relação às que figuram nos valores originais). Atividades 1. As idades em anos de 25 pessoas presentes nesta sala de aula são: 20, 19, 22, 24, 25, 26, 18, 19, 18, 20, 21, 22, 23, 21, 19, 20, 19, 22, 21, 23, 24, 25, 22, 20, 22. Determine a média, moda, mediana e ponto médio de idade desse grupo de pessoas. 2. Calcule a média para a amostra abaixo que representa as pessoas apresentados na questão anterior: PESOS ( Kg) fi 45 |--- 50 2 50 |--- 55 5 55 |--- 60 8 60 |--- 65 5 65 |--- 70 3 70 |--- 75 2 3. Numa faculdade obtiveram-se amostras de carros de estudantes e carros de professores e funcionários da faculdade, com as respectivas idades (em anos). Essas idades estão resumidas na tabela de freqüência a seguir. Ache a idade média de ambos os grupos de carros. Encontre também a classe modal e a classe da mediana. Idade (em anos) 0 - 2 3 - 5 6 - 8 9 - 11 12 - 14 15 - 17 18 - 20 21 - 23 Estudantes 23 33 63 68 19 10 1 0 Profs. E Funcs. 30 47 36 30 8 0 0 1 4. As companhias de seguro pesquisam continuamente as idades na morte e as respectivas causas. Os dados se baseiam em um estudo de uma revista sobre mortes causadas por armas de fogo na América durante uma semana. Calcule a média, o ponto médio. Encontre as classes modal e mediana. Página 114 Idade na morte 16 - 25 26 - 35 36 - 45 46 - 55 56 - 65 66 - 75 76 - 85 Freqüência 22 10 6 2 4 5 1 5. Qual é a média de idade de um grupo em que há 6 pessoas de 14 anos, 9 pessoas de 20 e 5 pessoas de 16? 6. Pesquisa sobre o peso em quilogramas de um grupo de pessoas. Determine a média, a moda e a mediana: Peso (kg) fi 40 ├ 44 1 44 ├ 48 3 48 ├ 52 7 52 ├ 56 6 56 ├ 60 3 20 Total 7. Determine a média, a moda e a mediana: Idade (em anos) 13 14 15 16 Total fi 3 2 4 1 8. As notas de um candidato, em seis provas de um concurso, foram: 8,4; 9,1; 7,2; 6,8; 8,7; e 7,2. Determine: a) A nota média. b) A nota mediana. c) A nota modal. Página 115 – Aula 7 – Estatística- 16/09/2010 Profª Rosane Worm 1. A parcela da população convenientemente escolhida para representá-la é chamada de: a) variável b) rol c) amostra d) dados brutos e) nenhuma das alternativas acima 2. Os gráficos próprios de uma distribuição de freqüência são: a) colunas, curva de freqüência e histograma b) polígono de freqüência e histograma c) colunas, curva de freqüência e polígono de freqüência d) gráfico de setor, gráfico de barra, curva de freqüência e curva normal e) colunas, barra, setor e curva de freqüência. 3. Dados os conjuntos de valores abaixo A = { 3, 5, 6, 8, 9, 10, 10, 10, 11, 12, 17 } B = { 4, 5, 7, 10, 11, 13, 15 } C = { 2, 3, 4, 5, 5, 5, 5, 6, 7, 8, 8, 8, 8, 9, 10, 11 } Em relação à moda, podemos dizer que I. A é unimodal e a moda é 10 II. B é unimodal e a moda é 10 III. C é bimodal e as modas são 5 e 8 Então: a. b. c. d. e. estas afirmações estão todas corretas estas afirmações estão todas erradas I e II estão corretas I e III estão corretas II e III estão corretas. 4. A altura de 80 homens de uma comunidade está distribuída de acordo com a tabela abaixo: Altura (metros) 1,60 ├ 1,65 1,65 ├ 1,70 1,70 ├ 1,75 1,75 ├ 1,80 1,80 ├ 1,85 1,85 ├ 1,90 1,90 ├ 1,95 Total fi 4 12 18 26 10 8 2 80 fr i (%) 5 15 22,5 32,5 12,5 10 2,5 100 Fr i % 5 20 42,5 75 87,5 97,5 100 Página 116 A moda que corresponde aos dados da tabela é a) 1,75 m. b) 1,80 m c) 1,775 m d) 1,70 m e) 1,725 m 5. A representação gráfica que apresenta a sequência de um trabalho de forma analítica, caracterizando as operações, os responsáveis e(ou) as unidades organizacionais envolvidas no processo é chamada de (A) organograma. (B) histograma. (C) gráfico de barras. (D) diagrama de dispersão. (E) fluxograma. Página 117 FACULDADE DOM ALBERTO MEDIDAS DE DISPERSÃO Aula 8- Estatística- 14/10/2010 Profª Rosane Worm Dispersão ou Variabilidade A média, ainda que considerada como um número que tem a faculdade de representar uma série de números não pode, por si mesma, destacar o grau de homogeneidade ou heterogeneidade que existe entre os valores que compõem o conjunto. Considerando os seguintes conjuntos de valores das variáveis X, Y e Z: X: 5, 5, 5, 5, 5. Y: 3, 4, 5, 6, 7. Z: 5, 0, 10, 8, 2. Calculando a média aritmética de cada um desses conjuntos, obtém-se: X = Y = Z = 5. Chamando de dispersão ou variabilidade a maior ou menor diversificação dos valores de uma variável em torno do valor da média, pode-se dizer que o conjunto Xi apresenta dispersão ou variabilidade nula e que o conjunto yi apresenta uma dispersão ou variabilidade menor que o conjunto zi. Para qualificar os valores de uma dada variável, ressaltando a maior ou menor dispersão ou variabilidade entre esses valores e a sua média, é necessário recorre às medidas de dispersão. Dessas medidas, estudaremos: a variância absoluta, o desvio padrão e o coeficiente de variação ou de variabilidade. Medidas de Dispersão Absoluta As principais medidas de dispersão absolutas são: amplitude total, desvio médio simples, variância e desvio padrão. 1. DESVIO MÉDIO SIMPLES O desvio médio simples que indicaremos por DMS é definido como sendo uma média aritmética do desvio de cada elemento da série para a média da série. Cálculo do Desvio Médio Simples: 1º) Caso: Dados Brutos ou Rol Calculamos inicialmente a média da seqüência. Em seguida identificamos a distância de cada elemento da seqüência para sua média. Finalmente, calculamos a média destas distâncias. Se a seqüência for representada por X: x 1 , x 2 , x 3 ,... , x n , então DMS admite como fórmula de cálculo: DMS = ∑ x i - x Página 118 n Exemplo: Calcule o DMS para a seqüência x : 2, 8, 5, 6. O DMS é a média aritmética simples destes valores. 2º) Caso: Variável Discreta No caso da apresentação de uma variável discreta, lembramos que a freqüência simples de cada elemento representa o número de vezes que este valor figura na série. Conseqüentemente, haverá repetições de distâncias iguais de cada elemento distinto da série para a média da série. Assim, a média indicada para estas distâncias é uma média aritmética ponderada. A fórmula para o cálculo do DMS é: DMS = ∑| x i – x | f i . ∑ fi Exemplo: Determinar o DMS para a série: Xi 1 3 4 5 fi 2 5 2 1 3º) Caso: Variável Contínua Nesta situação, por desconhecer os valores individuais dos elementos componentes da série, substituiremos estes valores x i , pelos pontos médios da classe. Desta forma, o desvio médio simples tem por cálculo a fórmula: DMS = ∑ x i – x f i ∑ fi Onde x i é o ponto médio da classe i. Exemplo: Determinar o DMS para a série: Classe 1 2 3 4 Intervalo de classe 2 4 4 6 6 8 8 10 fi 5 10 4 1 Página 119 Exercícios: 1. Calcule o DMS da série X : 3, 8, 12, 3, 9, 7. 2. Calcule o DMS da série Y: 2; 2,5; 3,5; 7; 10; 14,5; 20. 3. Calcule o DMS da série: Xi 2 4 5 6 8 10 fi 3 8 10 6 2 1 4. Responda, justificando: Qual das série X e Y da 1ª e 2ª questão possui maior dispersão absoluta? 5. Calcule o DMS da série: Classe 1 2 3 4 5 6 Salários US$ 70 120 120 170 170 220 220 270 270 320 320 370 Nº de vendedores 8 28 54 32 12 6 6. A tabela mostra o total de pontos obtidos por dois times de futebol no período de 1996 a 2000. ANOS 1996 TIME A 7 TIME B 18 1997 12 16 1998 20 15 1999 16 9 2000 10 12 a) Qual o desvio médio de cada um desses times? b) Qual o time mais regular nesse período? Variância (σ² ou s²) e Desvio Padrão (σou s) A amplitude total e o desvio médio também são medidas de variação, no entanto a variância e o desvio padrão levam em consideração a totalidade dos valores da variável em estudo sem utilizar a idéia de módulo, o que faz delas índices de variabilidade bastante estáveis e os mais empregados. A variância Página 120 baseia-se nos desvios em torno da média aritmética, porém determinando a média aritmética dos quadrados dos desvios. Dados não agrupados σ 2 ∑ ( xi − µ ) = Dados agrupados 2 ou σ N s2 = ∑ ( xi − x) 2 ∑ ( xi − µ ) = n −1 fi N 2 ou 2 s2 = ∑ ( xi − x) n −1 2 fi ( população ) ( amostra) Sendo a variância calculada a partir dos quadrados dos desvios, ela é um número em unidade quadrada em relação à variável em questão, o que, sob o ponto de vista prático, é um inconveniente. Por isso mesmo, imaginou-se uma nova medida que tem utilidade e interpretação práticas, denominada desvio padrão, definida como a raiz quadrada da variância. σ = σ2 s = s2 ( população ) ( amostra ) • Tanto o desvio padrão como a variância são usados como medidas de dispersão ou variabilidade. O uso de uma ou de outra dependerá da finalidade que se tenha em vista. • A variância é uma medida que tem pouca utilidade na estatística descritiva, porém é extremamente importante na inferência estatística e em combinações de amostras. Para o cálculo do desvio padrão, considera-se os seguintes casos: Observe como exemplo, o conjunto de valores da variável populacional x: 40, 45, 48, 52, 54, 62 Exemplo: Calcule o desvio padrão da seguinte distribuição amostral: Xi fi 0 1 2 3 4 2 6 12 7 3 30 Xi fi __ (X i - x )2 . fi – Com intervalos de classe Exemplo: Calcule o desvio padrão da tabela abaixo. Página 121 SALÁRIOS SEMANAIS EM REAIS DE UMA AMOSTRA DOS FUNCIONÁRIOS DA EMPRESA Z Salários semanais (R$) Freqüências 150 |--- 154 4 154 |--- 158 9 158 |--- 162 11 162 |--- 166 8 166 |--- 170 5 170 |--- 174 3 Total 40 FONTE: PESQUISA DO SETOR DE PESSOAL Exercícios sobre Medidas de Dispersão 1) Calcule a variância e o desvio padrão da População: X: 2, 3, 7, 9, 11, 13. 2)Calcule a variância e o desvio padrão da População: Y: 5, 12, 4, 20, 13, 17. 3) Calcule a variância e o desvio padrão da amostra: Z: 15, 16, 17, 20, 21. 4) Calcule a variância e o desvio padrão da amostra: T: 6, 5, 10, 12, 19. 5) Calcule a variância e o desvio padrão da população: Idade (anos) Nº. de alunos 17 3 18 18 19 17 20 8 21 4 50 Página 122 6) Calcule a variância e o desvio padrão para o número de acidentes diários, observados em um cruzamento, durante 40 dias. (Amostra) Nº. de acidentes por dia Nº. de dias 0 30 1 5 2 3 3 1 4 1 7) Calcule a variância e o desvio padrão para a distribuição de valores de 54 notas fiscais emitidas na mesma data, selecionadas em uma loja de departamentos. (Amostra) Classe Consumo por nota US$ Nº.de notas 1 0├ 50 10 2 50├100 28 3 100 ├ 150 12 4 150├ 200 2 5 200├ 250 1 6 250├ 300 1 54 8) Calcule a variância e o desvio padrão para as alturas de 70 alunos de uma classe (Amostra). Classe Alturas Nº. de (cm) alunos 1 150├ 160 2 2 160├ 170 15 3 170├ 180 18 4 180├ 190 18 5 190├ 200 16 6 200├ 210 1 Página 123 Aula 9 – Estatística – 21/10/2010 Profª Rosane Worm 1. As companhias de seguro pesquisam continuamente as idades na morte e as respectivas causas. Os dados se baseiam em um estudo de uma revista sobre mortes causadas por armas de fogo na América durante uma semana. Calcule o desvio-padrão e a variância. Idade na morte Freqüência 16 - 25 22 26 - 35 10 36 - 45 6 46 - 55 2 56 - 65 4 66 - 75 5 76 - 85 1 2. Calcule o desvio-padrão e a variância para a amostra abaixo que representa o peso das pessoas. PESOS ( Kg) f 45 |--- 50 2 50 |--- 55 5 55 |--- 60 8 60 |--- 65 5 65 |--- 70 3 70 |--- 75 2 3. Em um colégio funciona uma cantina. Os gastos diários de 12 alunos com a cantina estão abaixo relacionados em reais: (amostra) 0,80 1,20 0,90 1,40 2,00 1,00 1,50 1,50 0,80 1,50 1,00 0,80 a) determine o gasto médio diário de um aluno na cantina. b) Determine a variância e o desvio padrão. c) Qual é a moda dos gastos diários na cantina? 4. Com o objetivo de verificar o comportamento do consumidor, um órgão de defesa do consumidor registrou o seguinte número de queixas ao longo de 10 dias: (amostra) 58 39 63 60 95 48 56 72 75 80 a) Determine à média e a mediana do número de queixas recebidas? b) Qual é o desvio padrão dos dados acima? 5. Em uma classe as notas obtidas pelos alunos foram agrupadas da seguinte maneira: (população) Nota Nº alunos 0├2 1 2├4 6 4├6 9 6├8 8 8 ├ 10 6 A partir desses dados calcule o desvio padrão. Página 124 Aula 10- Estatística – 28/10/2010 Profª Rosane Worm Medidas de Posição As Medidas de Posição nos permitem comparar valores, elas nos dão informações importantes sobre sobre a posição dos dados dentro do conjunto. Estudaremos aqui: Escore Z Quartis, Decis e Percentis. Escores z O escore padronizado, ou escore z, é o número de desvios-padrão pelo qual um valor x dista da média (para mais ou para menos). Obtém-se como segue: z= z= x−x s x−µ σ → Amostra → População OBS: Arredondar z para duas decimais. A importância dos escores z na estatística reside no fato de que eles permitem distinguir entre valores usuais e valores raros, ou incomuns. Consideramos usuais os valores cujos escores padronizados estão entre -2,00 e 2,00, e incomuns os valores com escore z inferior a -2,00 ou superior a 2,00. Nosso critério para classificar um escore z como incomum decorre da regra empírica e do teorema de Tchebichev. Valores incomuns Valores Usuais Valores incomuns Valores incomuns -3 -2 -1 0 z 1 2 3 Exemplo. As alturas da população de homens adultos têm média µ = 175 cm., desviopadrão σ = 7,1 cm. e distribuição em forma de sino. O jogador de basquete Michael Jordan ganhou reputação de gigante por suas proezas no jogo, mas com 198 cm, ele pode ser considerado excepcionalmente alto, comparado com a população geral de homens adultos? Determine o escore z para a altura de 198 cm. Em comparação com a população geral, Michel Jordan é exepcionalmente alto. Quartis, Decis e Percentis Página 125 Assim como a mediana divide os dados em duas partes iguais, os três quartis, denotados por Q 1 , Q 2 e Q 3 , dividem as observações ordenadas (dispostas em ordem crescente) em quatro partes iguais. Ao grosso modo: - Q 1 separa os 25% inferiores dos 75% superiores dos valores ordenados; - Q 2 é a mediana; - Q 3 separa os 75% inferiores dos 25% superiores dos dados. Mais precisamente, ao menos 25 % dos dados serão no máximo iguais a Q 1 , e ao menos 75% dos dados serão no mínimo iguais a Q 1 . Ao menos75% dos dados serão no máximo iguais a Q3 , enquanto ao menos 25 % serão, no mínimo, iguais a Q3 . Analogamente, há nove decis, denotados por D1 , D2 , D3 ,..., D9 , que dividem os dados em 10 grupos com cerca de 10% deles em cada grupo. Há, finalmente, 99 percentis, que dividem os dados em 100 grupos com cerca de 1% em cada grupo. O processo de determinação do percentil correspondente a um determinado valor x, é bastante simples, como se pode ver na expressão seguinte. = percentil do valor x número de valores inferiores a x ⋅100 número total de valores Para o processo inverso, há vários métodos diferentes para achar o valor correspondente a determinado percentil, sendo um deles: Cálculo do p-ésimo percentil Etapa 1: Arranje os dados na ordem crescente Etapa 2: Calcule o índice L k = L ⋅n 100 onde n → número de escores, ou valores, no conjunto de dados k → percentil a ser utilizado L Pk → indicador que dá a posição de um escore → k mo percentil Página 126 Uma vez dominados os cálculos para os percentis, podemos seguir o mesmo processo para calcular os quartis e decis fazendo-se os ajustes relativos. Sendo que: Quartis Q1 = P25 Q2 = P50 Q3 = P75 Decis D1 = P10 D2 = P20 D9 = P90 Exemplo: calcule Q 1 da sequência X : 2, 5, 8, 5, 5, 10, 12, 12, 11, 13, 15 Exemplo: calcule D3 da sequência: 2; 8; 7,5; 6; 10; 12; 2; 9 Xi 2 4 5 7 10 Exemplo: calcule D 4 da série fi 3 5 8 6 2 Exemplo: Calcule o Q 3 da série Classe 1 2 3 4 5 Intervalo de classe 0 ├ 10 10 ├ 20 20 ├ 30 30 ├ 40 40 ├ 50 fi 16 18 24 35 12 Atividades 1. Os carros dos estudantes de certa faculdade têm idade média de 7,9 anos com desviopadrão de 3,67 anos, determine os escores z para os carros com as seguintes idades: a. Um GOL de 12 anos Página 127 b. Um Corsa de 2 anos c. Um Fiesta novo 2. Os números de horas que os calouros passam estudando cada semana têm média de 7,06 h e desvio-padrão de 5,32 h. Determine o escore z para um calouro que estuda 20 horas por semana. 3. Qual dos dois escores abaixo acusa melhor posição relativa? a. Um escore de 60 em um teste com x = 50 e s = 5 b. Um escore de 250 em um teste com x = 200 e s = 20 4. Dois grupos semelhantes de estudantes fazem testes equivalentes de facilidade de linguagem. Qual dos resultados seguintes indica maior facilidade relativa a linguagem? a. Uma pontuação de 65 em um teste com x = 70 e s = 10 b. Uma pontuação de 455 em um teste com x = 500 e s = 80 5. A distribuição de frequência abaixo representa a idade de 50 alunos de uma classe de 1º ano de uma faculdade: Idade (anos) Nº de alunos 17 3 18 18 19 17 20 8 21 4 Calcule: b) K 3 a) Q 1 c) D 1 d) Q 3 e) P 95 6. A distribuição de freqüências abaixo representa o consumo por nota de 50 notas fiscais emitidas durante um dia em uma loja de departamentos Classe 1 2 3 4 5 6 Intervalo de classe 0 ├ 50 50 ├ 100 100 ├ 150 150 ├ 200 200 ├ 250 250 ├ 300 Calcule: a) Q 1 b) D 3 N° notas 10 28 12 2 1 1 c) D 7 d) Q 2 e) P 98 Página 128 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Aula 11 – 04/11/2010 Profª Rosane Worm Coeficiente de Variação ( δ para população ou g para amostras ) É a caracterização da dispersão ou variabilidade dos dados em termos relativos a seu valor. δ = σ µ ou g = s x MEDIDAS DE ASSIMETRIA Assimetria A comparação da média, mediana e moda pode nos dizer algo sobre a característica da assimetria, definida a seguir. Definição: Uma distribuição de dados é simétrica quando a metade esquerda do seu histograma é aproximadamente a imagem-espelho da metade direita (uma distribuição de dados é assimétrica quando não é simétrica, estendendo-se mais para um lado do que para o outro). Negativamente assimétricos: a média e a mediana estão à esquerda da moda. Embora nem sempre previsíveis, os dados negativamente assimétricos têm em geral a média à esquerda da mediana. Positivamente assimétricos; a média e a mediana estão à direita. Assimetria para a esquerda (negativamente assimétrica): A média e a mediana estão à esquerda da moda. Simetria (assimetria zero): A média, a mediana e a moda coincidem. Assimetria para a direita (positivamente assimétrica): A média e a mediana estão à direita da moda. Histogramas de distribuições assimétricas e simétrica: f f Histograma de distribuição simétrica. (média = mediana = moda) x Histograma de distribuição assimétrica para a direita (positiva). (média > mediana > moda) x Página 129 f Histograma de distribuição assimétrica para a esquerda (negativa). (média < mediana < moda) x Fórmulas para o cálculo do coeficiente de assimetria: Coeficiente de Pearson AS = 0 diz-se que a distribuição é simétrica 1º Coeficiente de Pearson AS = x − Mo S AS > 0 diz-se que a distribuição é assimétrica positiva (à direita) AS ∠ 0 diz-se que a distribuição é assimétrica positiva (à direita) 1. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. (população) Xi 1 2 3 4 5 6 fi 2 10 6 4 2 1 2. Classifique, quanto à assimetria, a distribuição abaixo: (amostra) Classe 1 2 3 4 5 Int. C. 3 ├5 5 ├7 7 ├9 9 ├ 11 11 ├ 13 fi 1 2 13 3 1 3. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. População Página 130 Xi 2 3 4 5 fi 2 4 6 1 0 6 7 8 6 4 2 4. Classifique, quanto à assimetria, a distribuição abaixo, segundo o coeficiente de Pearson. Amostra Classe Int. C. fi 1 0 ├4 10 2 4 ├8 15 3 8 ├ 12 6 4 12 ├ 16 2 5 16 ├ 20 1 5. Em um exame final de Estatística, o grau médio de um grupo de 150 alunos foi 78 e o desvio padrão, 8,0. Em Matemática, entretanto, o grau médio final foi 73 e o desvio padrão, 7,6. a)Em que disciplina foi maior a dispersão relativa? b) Se um estudante obteve 75 em Estatística e 71 em Matemática. Em qual dos exames foi mais elevada a sua posição relativa? 6. Medidas as estaturas de 1.017 indivíduos, obtivemos média = 162,2 cm e s= 8,01 cm. O peso médio desses mesmos indivíduos é 52 kg, com um desvio padrão de 2,3 kg. a) Esses indivíduos apresentam maior variabilidade em estatura ou em peso? b) Se um indivíduo tem estatura de 175 cm e peso de 65 kg em qual obteve uma posição mais elevada? 7. Um grupo de 100 estudantes tem uma estatura média de 163,8 cm, com coeficiente de variação de 3,3%. Qual o desvio padrão desse grupo? Página 131 8. Uma rede de lojas afirma que as vendas diárias de televisores obedecem à seguinte distribuição: População Classe Nº de Nº de dias televisores 1 5 0 | 20 2 25 20 | 40 2 40 40 | 60 3 15 60 | 80 4 10 80 | 100 5 5 100 | 120 ∑ a) Calcule o desvio padrão da distribuição: b) Calcule a variância populacional da distribuição: c) Calcule o coeficiente de variação. d) Classifique, quanto à assimetria, a distribuição segundo o coeficiente de Pearson. e) Calcule o Q 3 da distribuição. 9. Calcule a média aritmética, a mediana, a moda, o primeiro e o terceiro quartis, a variância, o desvio padrão, o coeficiente de variação e a assimetria das distribuições de freqüências abaixo: a) NOTAS 0 2 2 4 4 6 6 8 8 10 fi 5 8 14 10 7 ∑ = 44 Estaturas (cm) 150 158 158 166 166 174 174 182 182 190 fi 5 12 18 27 8 ∑ = 70 b) PROBABILIDADES Conhecidas certas condições, podemos prever, por exemplo, a temperatura em que a água entrará em ebulição ou a velocidade com que um corpo, em queda livre, atingirá o solo. Página 132 Estes experimentos cujos resultados podem ser previstos, isto é, podem ser determinados antes da sua realização, são denominados experimentos determinísticos. Considere agora os seguintes experimentos: ∗ No lançamento de uma moeda, qual a face voltada para cima? ∗ No lançamento de um dado, qual o número que saiu? ∗ Uma carta foi retirada de um baralho completo. Que carta é essa? Estes experimentos que, ao serem realizados repetidas vezes, nas mesmas condições, não podem ter seus resultados previstos são denominados experimentos aleatórios. Experimento aleatório apresenta as seguintes características: ∗ Pode se repetir várias vezes nas mesmas condições; ∗ É conhecido o conjunto de todos os resultados possíveis; ∗ Não se pode prever o resultado. Como não se pode prever o resultado de um experimento aleatório, procura-se descobrir as possibilidades de ocorrência de cada um, ou seja, a probabilidade de que ele ocorra. A teoria da probabilidade mede a “chance” de ocorrer um determinado resultado num experimento aleatório. EXPERIMENTO ALEATÓRIO Em quase tudo, em maior ou menor grau, vislumbramos o acaso. Assim, da afirmação “é provável que meu time ganhe a partida de hoje” pode resultar: a. Que, apesar do favoritismo, ele perca; b. Que, como pensamos, ele ganhe; c. que empate. Como vimos, o resultado final depende do acaso. Fenômenos como esse são chamados fenômenos aleatórios ou experimentos aleatórios. ESPAÇO AMOSTRAL A cada experimento correspondem, em geral, vários resultados possíveis. Assim, ao lançarmos uma moeda, há dois resultados possíveis: ocorrer cara ou coroa. Já ao lançarmos um dado há 6 resultados possíveis: 1, 2, 3, 4, 5, ou 6. Ao conjunto desses resultados possíveis damos o nome de Espaço Amostral ou Conjunto Universo, representado por S. S = { Cara, Coroa} S = { 1, 2, 3, 4, 5, 6} Se temos 2 lançamento sucessivos de uma moeda podemos obter cara nos dois lançamentos, ou cara no primeiro e coroa no segundo, ou cara no primeiro e coroa no segundo, ou cara nos dois lançamentos, o espaço amostral é: S= { ( C, C), (C, K), ( K, C) ( K, K) EVENTO Chamamos de evento qualquer subconjunto do espaço amostral S de um experimento aleatório. 1Considere o espaço amostral do lançamento de um dado e a observação da face superior. Descreva, por seus elementos, os seguintes eventos: a) A: sair face par. b) B: sair face com número primo. c) C: sair face maior que três. d) D: sair face maior que 6. Página 133 e) E: sair face múltipla de 3. f) F: sair face menor ou igual a 4. Suponha-se que um evento E possa acontecer de h maneiras diferentes, em um total de n modos possíveis, igualmente prováveis. Então, a probabilidade de ocorrência do evento (denominada sucesso) é definida por: p = Pr {E} = h/n A probabilidade de não ocorrência do evento (denominado insucesso ou fracasso) é definida por: q = Pr {não E} = n – h /n = 1 – h/n = 1 – p = 1 – Pr {E} Assim, p + q = 1 ou Pr { não E} = 1 O evento “não E” é representado, às vezes por E, ou ~E Admita-se que o evento E seja a ocorrência dos números 3 ou 4, em um único lance de um dado. Há 6 maneiras segundo as quais o dado pode cair, e que resultam nos números 1, 2, 3, 4, 5, ou 6. Se o dado é honesto (isto é, não é viciado), pode-se supor que as seis maneiras sejam igualmente prováveis. Como E pode ocorrer de duas destas maneiras, tem-se: p= Pr {E} = 2/6 = 1/3 A probabilidade de não ser conseguido um 3 ou um 4 ( isto é de ocorrência de um 1, 2, 5 ou 6) é: q = Pr {~E} = 1 – 1/3 = 2/3 Note-se que a possibilidade de um evento é um número compreendido entre 0 e 1. Se o evento não pode ocorrer, sua probabilidade é 0. Se ele deve ocorrer isto é, se sua ocorrência é certa, sua probabilidade é 1. Se p é a probabilidade de que um evento ocorra, a vantagem a favor de seu acontecimento é q:p. por conseguinte, a vantagem contra o aparecimento de um 3 ou um 4, em um único lance de um dado honesto, é de q : p = 2/3 : 1/3 = 2 : 1, isto é, 2 para 1 2. Considere o espaço amostral S= { 1,2,3,4,5,6,7,8,9,10} e os seguintes eventos: A= { 2, 3, 4} B= { 1, 3, 5, 7, 9} C= { 5 } D= { 1, 2, 3 } E = { 2, 4, 6} Determine: a) A U B b) A ∩ B c) A ∩ C d) (A ∩ D) U E Exercícios: 1- Determine a probabilidade de cada evento: a) um número par aparece no lançamento de um dado. b) Uma figura aparece ao se extrair uma carta de um baralho de 52 cartas. c) Uma só coroa aparece no lançamento de três moedas. S= { (c,c,c), (k,k,k), (c,k,c), (k,c,k), (c,k,k), (k,k,c)(k,c,c) (c,c,k)} 2- Um número inteiro é escolhido aleatoriamente dentre os números 1, 2, 3, ..., 49, 50. determine a probabilidade de: a. o número ser divisível por 5. Página 134 b. O número terminar em 3 c. O número ser divisível por 6 ou por 8; d. O número ser divisível por 4 e por 6. 3- Dois dados são lançados simultaneamente. Determine a probabilidade de: a. a soma ser menor que 4; b. a soma ser 9; c. o primeiro resultado ser maior que o segundo; d. a soma ser menor ou igual a 5. 4- O experimento consiste em retirar ao acaso uma bola de uma urna que contém 20 bolas iguais em peso e volume; sendo 5 bolas brancas, 8bolas pretas e 7 bolas amarelas, e anotar sua cor. Determine a função de probabilidade. 5- Um casal planeja ter 3 filhos. Determine os eventos; a) os três são do sexo feminino. b) pelo menos 1 é do sexo masculino. c) os 3 do mesmo sexo. 6- uma urna contém 20 bolinhas numeradas de 1 a 20. Escolhe-se ao acaso uma bolinha e observa-se o seu número. Determine os seguintes eventos: a) o número escolhido é impar. b) o número escolhido é maior que 15. c) o número escolhido é múltiplo de 5. d) o número escolhido é múltiplo de 2 e de 3. e) o número escolhido é primo. f) o número escolhido é ímpar e múltiplo de 7. Função de Probabilidade Uma vez identificado o espaço amostral S = { a 1, a 2,... a n } de um elemento, podemos associar a cada elemento sua possibilidade de ocorrência. 1. 0 ≤ p(a i ) ≤ 1 i = 1,2,…,n Página 135 2. ∑ p(a i ) = 1 i = 1,2,…n O valor p(a i ) é denominado probabilidade de ocorrência do resultado a i . PROBABILIDADE CLÁSSICA Aplica-se às situações em que os resultados que compõem o espaço amostral ocorrem com mesma regularidade, ou seja, os resultados são equiprováveis. Deste modo definimos: P(a i ) = n (a i ) n (a i ) é o número de casos favoráveis à realização de a i n n é o número total de casos possíveis OU P=E S Probabilidade de um evento Exemplo: lançamento de um dado e observação da face superior. Determine a probabilidade de cada um dos eventos abaixo: a) Sair face 2 ou face 3. b) Sair face ímpar. c) Sair face maior que 1. d) Sair face 5. e) Sair face 1 ou 2 ou 3 ou 4 ou 5 ou 6. f) Sair face múltiplo de 9 Inicialmente, determinamos o espaço amostral e a função de probabilidade. O espaço amostral é S= { 1, 2, 3, 4, 5, 6} A função de probabilidade é dada por: S __P___R 1 _____ p(1) = 1/6 2 _____ p ( 2) = 1/6 3 _____ p ( 3) = 1/6 4 _____ p ( 4) = 1/6 5 _____ p ( 5) = 1/6 6 _____ p ( 6) = 1/6 1. O experimento consiste em lançar dois dados e observar a diferença dos pontos das faces superiores. Determine a função de probabilidade. 2. O experimento consiste em lançar dois dados e observar o produto dos pontos das faces superiores. Determine a função de probabilidade. 3. No lançamento de dois dados e na observação da soma dos pontos das faces superiores, determine a probabilidade de cada um dos eventos seguintes: a. A – a soma ser par. b. B - A soma ser ímpar. c. C - a soma ser múltiplo de 3. d. D - A soma ser um número primo. e. E - A soma ser maior ou igual a 7. Página 136 f. F – A soma ser maior que 12. Página 137 CENTRO DE ENSINO SUPERIOR DOM ALBERTO Aula 12 – Estatística I – 11/11/2010 Profª Rosane Worm Eventos Complementares Sabemos que um evento pode ocorrer ou não. Sendo p a probabilidade de que ele ocorra (sucesso) e q a probabilidade de que ele não ocorra (insucesso), para um mesmo evento existe sempre a relação: p + q = 1 ⇒ q = 1 – p Ex. A probabilidade de tirar um 4 no lançamento de um dado é p = 1/6. logo a probabilidade de não tirar o 4 no lançamento de um dado é q = 1 – 1/6 = 5/6. Eventos Independentes Dois eventos são independentes quando a realização ou a não-realização de um dos eventos não efeta a probabilidade da realização do outro e vice-versa. Ex. quando lançamos dois dados, o resultado obtido em um deles independe do resultado obtido no outro. A probabilidade de que dois eventos se realizem simultâneamente é dada por p = p1 x p2 Ex. Lançamos dois dados. A probabilidade de obter 1 no 1º dado é : p 1 = 1/6. A probabilidade de obtermos 5 no 2º dado é p 2 = 1/6. Logo, a probabilidade de obtermos, simultaneamente, 1 no 1º e 5 no 2º é : p = 1/6 x 1/6 = 1/36. Eventos Mutuamente Exclusivos Dois eventos são mutuamente exclusivos quando a realização de um exclui a realização do(s) outro(s). Assim, no lançamento de uma moeda, o evento “tirar cara” e o evento “tirar coroa” são mutuamente exclusivos, já que, ao se realizar um deles, o outro não se realiza. P = p 1 + p 2. Ex. Lançamos um dado. A probabilidade de tirar o 3 ou o 5 é : p = 1/6 + 1/6 = 2/6 = 1/3 Exercícios 1. Qual a probabilidade de sair o ás de ouros quando retiramos uma carta de um baralho com 52 cartas? 2. Qual a probabilidade de sair um rei quando retiramos uma carta de um baralho de 52 cartas? 3. Em um lote de 12 peças, 4 são defeituosas. Sendo retirada uma peça, calcule: a) a probabilidade de essa peça ser defeituosa. b) a probabilidade de essa peça não ser defeituosa. 4. No lançamento de dois dados, calcule a probabilidade de se obter soma igual a 5. Página 138 5. De dois baralhos de 52 cartas retiram-se, simultaneamente, uma carta do primeiro baralho e uma carta do segundo. Qual a probabilidade de a carta do primeiro baralho ser um rei e a do segundo ser o 5 de paus? 6. Uma urna A contém: 3 bolas brancas, 4 pretas, 2 verdes; uma urna B contém: 5 bolas brancas, 2 pretas, 1 verde; uma urna C contém: 2 bolas brancas, 3 pretas, 4 verdes. Uma bola é retirada de cada urna. Qual é a probabilidade de as três bolas retiradas da primeira, segunda e terceira urnas serem, respectivamente, branca, preta e verde? 7. No lançamento de um dado, qual a probabilidade de se obter um número não-inferior a 5? 8. Dois dados são lançados conjuntamente. Determine a probabilidade de a soma ser 10 ou maior que 10. 9. Em um lote de 12 peças, 4 são defeituosas. Sendo retiradas aleatoriamente 2 peças, calcule: a) A probabilidade de ambas serem defeituosas. b) A probabilidade de ambas não serem defeituosas. 10. Um lote é formado por 10 peças boas, 4 com defeitos e 2 com defeitos graves. Uma peça é escolhida ao acaso. Calcule a probabilidade de que: a) Ela não tenha defeitos graves. b) Ela não tenha defeitos. c) Ela seja boa ou tenha defeitos graves. 11- O quadro abaixo representa a classificação por sexo e por estado civil, de um conjunto de 50 deputados presentes em uma reunião. ESTADO CIVIL Casado Solteiro Desquitado Divorciado SEXO M F 10 5 7 8 8 3 5 4 Uma pessoa é sorteada ao acaso. Determine a probabilidade dos eventos: a) Ser um homem. b) Ser uma mulher c) Ser uma pessoa casada. d) Ser uma pessoa solteira. e) Ser uma pessoa desquitada. Página 139 f) Ser uma pessoa divorciada. 12- O quadro abaixo representa a classificação de um grupo de 30 mulheres, segundo o estado civil e a cor dos cabelos: ESTADO CIVIL Casada Solteira Viúva Divorciada COR DOS CABELOS Loira 5 2 0 3 Morena 8 4 1 1 Ruiva 3 1 1 1 Uma mulher é sorteada neste grupo. Determine a probabilidade dos eventos: a) Ser casada. b) Não ser loira. c) Não ser morena nem ruiva. d) Ser viúva. e) Ser solteira ou casada. f) Ser morena e solteira. g) Ser viúva e ruiva. 13- Um experimento consiste em sortear um aluno em uma classe pela lista de chamada (1 a 20). Determine a probabilidade dos seguintes eventos. a) ser sorteado um número par. b) Não ser sorteado um número maior que 12 e múltiplo de 3. c) Ser sorteado um número menor que 7 e múltiplo de 4. d) Ser sorteado um número menor que 13, maior que 8 e múltiplo de 7. e) Ser sorteado um número real. Página 140