Universidade Estácio de Sá
- 1Produção
Engenharia de
PROBABILIDADE E ESTATÍSTICA
ESTATÍSTICA
Prof. Uanderson Rebula de Oliveira
[email protected]
www.uandersonrebula.blogspot.com | www.iluminaconsultoria.com.br
Uanderson Rebula de Oliveira
Estatística
-2-
Engenharia de Produção
PROBABILIDADE E ESTATÍSTICA
UANDERSON REBULA DE OLIVEIRA
Mestrando em Engenharia (ênfase em Engenharia de Produção)-Universidade Estado de São Paulo-FEG-UNESP
Pós-graduado em Controladoria e Finanças-Universidade Federal de Lavras-UFLA
Pós-graduado em Logística Empresarial-Universidade Estácio de Sá-UNESA
Graduado em Ciências Contábeis-Universidade Barra Mansa-UBM
Técnico em Metalurgia-Escola Técnica Pandiá Calógeras-ETPC
Técnico em Segurança, Saúde e Higiene do Trabalho-ETPC
Operador Siderúrgico e Industrial-ETPC
Professor na Universidade Barra Mansa – UBM. Professor da Universidade Estácio de Sá - UNESA nas disciplinas de
Gestão Financeira de Empresas, Fundamentos da Contabilidade e Matemática Financeira, Probabilidade e Estatística,
Ergonomia, Higiene e Segurança do Trabalho, Gestão de Segurança e Análise de Processos Industriais, Gestão da
Qualidade: programa 5S (curso de férias). Ex-professor Conteudista na UNESA (elaboração de Planos de Ensino e
de Aula, a nível nacional). Professor em escolas técnicas nas disciplinas de Estatística Aplicada, Estatística de
Acidentes do Trabalho, Probabilidades, Contabilidade Básica de Custos, Metodologia de Pesquisa Científica,
Segurança na Engenharia de Construção Civil e Higiene do Trabalho. Ex-professor do SENAI. Desenvolvedor e
instrutor de diversos cursos corporativos na CSN, a níveis Estratégicos, Táticos e Operacionais.
Membro do IBS–Instituto Brasileiro de Siderurgia.
ESTATÍSTICA
EMENTA DE ESTATÍSTICA: Estatística: conceito e fases de estudo. Variáveis. População, amostra e métodos de amostragem. Estatística descritiva e inferencial. Séries estatísticas: conceitos, distribuição de frequência e representação gráfica. Medidas de Tendência Central: Média, moda e mediana. Medidas de Variação: Variância, desvio padrão e coeficiente de variação. OBJETIVO: Refletir a partir da Estatística Básica sobre as ferramentas consolidadas pelo uso e pela ciência, disponíveis a todos, que auxiliam na tomada de decisão.
Resende - 2010
Uanderson Rebula de Oliveira
Estatística
-3-
APRESENTAÇÃO
DA DISCIPLINA
Uma das ferramentas mais utilizadas hoje em dia pelos cientistas, analistas financeiros, médicos, engenheiros, jornalistas etc. é a Estatística, que descreve os dados observados e desenvolve a metodologia para a tomada de decisão em presença da incerteza. O verbete estatística foi introduzido no século XVIII, tendo origem na palavra latina status (Estado), e serviu inicialmente a objetivos ligados à organização político‐social, como o fornecimento de dados ao sistema de poder vigente. Hoje em dia, os modelos de aplicação da Teoria Estatística se estendem por todas as áreas do conhecimento, como testes educacionais, pesquisas eleitorais, análise de riscos ambientais, finanças, controle de qualidade, análises clínicas, índices de desenvolvimento, modelagem de fenômenos atmosféricos etc. Podemos informalmente dizer que a Teoria Estatística é uma ferramenta que ajuda a tomar decisões com base na evidência disponível, decisões essas afetadas por margens de erro, calculadas através de modelos de probabilidade. No entanto, a probabilidade se desenvolveu muito antes de ser usada em aplicações da Teoria Estatística. Um dos marcos consagrados na literatura probabilística foi a correspondência entre B. Pascal (1623‐1662) e P. Fermat (1601‐
1665), onde o tema era a probabilidade de ganhar em um jogo com dois jogadores, sob determinadas condições. Isso mostra que o desenvolvimento da teoria de probabilidades começou com uma paixão humana, que são os jogos de azar, mas evoluiu para uma área fortemente teórica, em uma perspectiva de modelar a incerteza, derivando probabilidades a partir de modelos matemáticos. A análise combinatória deve grande parte de seu desenvolvimento à necessidade de resolver problemas probabilísticos ligados à contagem, mas hoje há diversas áreas em que seus resultados são fundamentais para o desenvolvimento de teorias, como, por exemplo, a área de sistemas de informação. Nesta apostila encontraremos as definições de Estatística, vocabulário básico, população e amostra, séries estatísticas, medidas de tendência central, medidas de variabilidade. Probabilidades serão tratadas em outra apostila. Uanderson Rebula de Oliveira
Estatística
-4-
Falou mais o Senhor a Moisés, no deserto de Sinai, na tenda da
congregação, no primeiro dia do mês segundo, no segundo ano da sua
saída da terra do Egito, dizendo:
Tomai a soma de toda a congregação dos filhos de Israel, segundo as
suas gerações, segundo a casa dos seus pais, conforme o número dos
nomes de todo o varão, cabeça por cabeça;
Da idade de vinte anos e para cima, todos os que saem à guerra em
Israel; a estes contareis segundo os seus exércitos, tu e Aarão.
Estará convosco, de cada tribo, um homem que seja cabeça da casa dos
seus pais.
Todos os contados, pois, foram seiscentos e três mil, quinhentos e
cinquenta.
Números 1: 1-4; 46
Uanderson Rebula de Oliveira
Estatística
-5-
Sumário
1 – CONCEITOS PRELIMINARES 1.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA, 7 1.2 FASES DO ESTUDO ESTATÍSTICO, 13 1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA, 15 1.4 POPULAÇÃO E AMOSTRA, 17 MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS, 18 Amostragem aleatória simples, 18 Amostragem aleatória estratificada, 20 Amostragem aleatória por conglomerado, 21 Amostragem sistemática, 23 1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL , 24 2 – SÉRIES ESTATÍSTICAS 2.1 CONCEITOS E TIPOS DE SÉRIES ESTATÍSTICAS, 26 Tabelas, 26 Gráficos, 27 2.2 DISTRIBUIÇÃO DE FREQUÊNCIA, 30 Freqüência absoluta e histograma, 30 Freqüência relativa, absoluta acumulada e relativa acumulada, 31 Agrupamento em classes, 32 Polígono de freqüência e ogiva, 33 3 – MEDIDAS 3.1 MEDIDAS DE TENDÊNCIA CENTRAL, 35 MÉDIA, 35 Média simples, 35 Média aparada, 36 Média ponderada, 36 Média de distribuição de frequência, 37 Média geométrica, 38 MEDIANA, 39 MODA, 40 RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA, 41 3.2 MEDIDAS DE VARIAÇÃO, 42 VARIÂNCIA E DESVIO PADRÃO, 43 COEFICIENTE DE VARIAÇÃO, 45 REFERÊNCIAS BIBLIOGRÁFICAS, 46 ANEXO I – LIVROS RECOMENDADOS, 47 ANEXO II – Software BIOESTAT , 48 ANEXO III – ESTATÍSTICA NO EXCEL, 49 Uanderson Rebula de Oliveira
Estatística
-6-
1
CONCEITOS PRELIMINARES
Uanderson Rebula de Oliveira
Estatística
-71.1 CONCEITO E IMPORTÂNCIA DA ESTATÍSTICA
ESTATÍSTICA NA PRÁTICA
Analise as informações abaixo para melhor compreensão do conceito e importância da Estatística. ACIDENTES DO TRABALHO no Brasil – 1970 a 2005 Conceito resumido: Lesão corporal ou doença, relacionada com o exercício do trabalho. Legislação: Lei 8.213/91 – art. 19 a 21 INSS: Órgão público responsável pela coleta, organização e representação dos dados. ;
Coleta: Por meio de um formulário eletrônico denominado “CAT – Comunicação de Acidente do Trabalho”, enviado pelas empresas quando da ocorrência, conforme determina o art. 22 da Lei 8.213/91. Organização: Através de um grande banco de dados do INSS. Representação: Através de um documento denominado “Anuário Estatístico de Acidentes do Trabalho”, contendo tabelas, gráficos e diversas análises. Disponível no site www.previdencia.gov.br, na seção “Estatística”. ;
;
Motivo: Quando o trabalhador se afasta por motivo de acidente o INSS concede benefícios acidentários, como auxílio doença acidentário, auxílio acidente, aposentadoria por invalidez, pensão por morte, reabilitação entre outros. Mais informações na apostila Profº Uanderson “Ergonomia, Higiene e Segurança do Trabalho”, pág. 50‐
52;136, disponível no portal www.uandersonrebula.blogspot.com. COMPILAÇÃO E ANÁLISE DE DADOS (INFORMAÇÕES) sobre acidentes do trabalho, de 1970 a 2005: 35.000.000
30.000.000
25.000.000
20.000.000
15.000.000
10.000.000
5.000.000
0
33.238.617
31.407.576
29.544.927
28.683.913
27.189.614
26.228.629
24.491.635
23.667.24123.830.312
Evolução da QUANTIDADE de TRABALHADORES
no Brasil - 1970 a 2005.
23.661.57923.198.656
22.163.827
22.272.843
19.476.36219.673.915
18.686.355
16.638.799
14.945.489
11.537.024
8.148.987
7.284.022
1970 1972 1974 1976 1978 1980
FONTE: Revista Proteção
1982 1984 1986
1988 1990
1992 1994
1996 1998
2000 2001 2002
2003 2004
2005
Anos
Observa‐se ao longo dos anos o aumento gradativo da quantidade de trabalhadores no Brasil, de 7.284.022 chegando a 33.238.617, reflexo do crescimento econômico do País. Essas informações (dados) são importantes para fins de comparação com a evolução da quantidade de acidentes do trabalho no mesmo período, como segue abaixo: 1.796.671
1.743.825
2.000.000
1.750.000
Involução da QUANTIDADE de ACIDENTES DO
TRABALHO no Brasil - 1970 a 2005.
Aprovação das NR’s
1.551.461
1.464.211
1.504.723
1.500.000
1.220.111
1.178.472
1.250.000
1.207.859
991.581
961.575
1.000.000
693.572
750.000
532.514
388.304 395.455414.341 363.868
500.000
465.700 491.711
393.071 399.077
340.251
250.000
0
1970
1972
1974
1976
1978
FONTE: Revista Proteção
Uanderson Rebula de Oliveira
1980
1982
1984
1986
1988
1990
1992
1994
1996
1998
2000
2001
2002
2003
2004
2005
Anos
Estatística
-8No período de 1970 a 1976 a quantidade de acidentes foi alta, comparando‐se com a pequena quantidade de trabalhadores no mesmo período. Somente a partir de 1978 os acidentes começaram a reduzir, em razão da aprovação das Normas Regulamentadoras – NR’s (disponível no www.mte.gov.br), tornando‐se de aplicação obrigatória em todo o País. Esta redução pode ser vista como positiva, entretanto, não podemos comemorar esses números, pois a quantidade de acidentes ainda é alarmante e está praticamente estagnada, desde 1994. E as regiões? Como esses acidentes estão distribuídos nas regiões do país? Qual a pior região? Qual a melhor? Vejamos abaixo em um Cartograma (mapa com dados), SOMENTE NO ANO DE 2005 (491.711 acidentes): Distribuição da quantidade e porcentagem de acidentes de trabalho no Brasil por Regiões, correlacionados com o Produto Interno Bruto ‐ PIB ‐ ano 2005. NORTE • Acidentes: 19.117 (4% do total) • PIB: 5% de participação NORDESTE • Acidentes: 49.010 (10% do total) • PIB: 13,1% de participação CENTRO‐OESTE • Acidentes: 31.470 (6% do total) • PIB: 8,9% de participação SUDESTE • Acidentes: 279.689 (57% do total) • PIB: 56,5% de participação SUL • Acidentes: 112.425 (23% do total) • PIB: 16,6% de participação Espírito Santo ‐ 11.039 acidentes Minas Gerais ‐ 52.335 acidentes Rio de Janeiro ‐ 34.610 acidentes São Paulo ‐ 181.705 acidentes
São campeões de acidentes no Brasil, participando com 181.705, o que corresponde a 37% do total; por conseguinte o seu PIB também é o maior do País, com 33,9% de participação.
FONTE: Adaptado da Revista Proteção e do IBGE (www.ibge.gov.br)
Observa‐se que a região em 1° lugar em número de acidentes é a Sudeste, em 2° está a região Sul, em 3° a região Nordeste, em 4° a região Centro‐Oeste e por último a Norte. Ao analisarmos este gráfico podemos tomar diversas conclusões, porém, tais conclusões somente são possíveis através de um estudo, o que demanda tempo. Todavia, observa‐se que a quantidade de acidentes acompanha a porcentagem da participação do PIB da região. Esta correlação pode ser resultado do reflexo da economia da região. Ora, a região Sudeste, por exemplo, corresponde a 56,5% do PIB do País. Logicamente esta região possui um maior número de empresas e, consequentemente, maior número de mão‐de‐obra e atividades produtivas, fato que pode justificar a enorme quantidade de acidentes comparada com as demais regiões. Esses dados também podem estar relacionados com as políticas dos estados e das empresas, a atuação das fiscalizações do Ministério do Trabalho, as culturas das regiões, os investimentos empresariais, a capacitação de mão de obra (treinamentos) entre outros fatores. Entende‐se por Produto Interno Bruto (PIB) a soma, em valores monetários, de todos os bens e serviços finais produzidos em uma determinada região. Mais dados vocês encontrarão na Apostila “Ergonomia, higiene e segurança do trabalho”, do profº Uanderson Rebula, disponível no portal www.uandersonrebula.blogspot.com ou no “Anuário Estatístico de Acidentes do Trabalho”, disponível no portal www.previdencia.gov.br, na seção “Estatística”. Tradicionalmente, no Brasil, as políticas de desenvolvimento têm se restringido aos aspectos econômicos e vêm sendo traçadas de maneira paralela ou pouco articuladas com as políticas sociais, cabendo a estas últimas arcarem com os ônus dos possíveis danos gerados sobre a saúde da população, dos trabalhadores em particular e a degradação ambiental. Para que o Estado cumpra seu papel para a garantia desses direitos, é mister a formulação e implementação de políticas e ações de governo. Uanderson Rebula de Oliveira
Estatística
-9POSSÍVEIS SOLUÇÕES PARA REDUZIR OS ACIDENTES
A partir da análise dos dados podemos concluir que a política de segurança do trabalho adotada no País está estagnada. A simples aplicação da norma regulamentadora não está sendo suficiente para reduzir o índice de acidentes. Os dados nos mostram que não haverá mudanças significativas se não forem feitas alterações nessa política. Para contornar a situação, os Ministérios do Trabalho, da Saúde e da Previdência Social publicaram, para consulta pública, em 29.12.2004 a PNSST ‐ POLÍTICA NACIONAL DE SEGURANÇA E SAÚDE DO TRABALHADOR, com a finalidade de promover a melhoria da qualidade de vida e da saúde do trabalhador. Esse plano está disponível no portal www.mte.gov.br. Os Ministérios reconheceram a deficiência da segurança do trabalho no país, carecendo de mecanismos que: •
•
•
•
•
Incentivem medidas de prevenção; Responsabilizem os empregadores; Propiciem o efetivo reconhecimento dos direitos do trabalhador; Diminuam a existência de conflitos institucionais; Tarifem de maneira mais adequada as empresas e possibilite um melhor gerenciamento dos fatores de riscos ocupacionais. Face ao exposto, a PNSST propõe, dentre outras, as seguintes ações a serem desenvolvidas de modo articulado e cooperativo pelos três Ministérios: Área Tributos1, financiamentos e licitações. Educação e pesquisa Ações )
)
)
Estabelecer política tributária que privilegie empresas com menores índices de acidentes e que invistam na melhoria das condições de trabalho; Criar linhas de financiamento para a melhoria das condições de trabalho, incluindo máquinas e equipamentos, em especial para as pequenas e médias empresas; Incluir requisitos de Segurança do Trabalho ‐ SST para concessão de financiamentos públicos e privados; Incluir requisitos de SST nos processos de licitação dos órgãos públicos; Instituir a obrigatoriedade de publicação de balanço de SST para as empresas, a exemplo do que já ocorre com os dados contábeis; Incluir conhecimentos básicos em SST no currículo do ensino fundamental e médio; Incluir disciplinas em SST no currículo de ensino superior, em especial nas carreiras de profissionais de saúde, engenharia e administração; Estimular a produção de estudos e pesquisas na área de interesse desta Política; Articular instituições de pesquisa e universidades para a execução de estudos e pesquisas em SST, integrando uma rede de colaboradores para o desenvolvimento técnico ‐ cientifico na área; Desenvolver um amplo programa de capacitação dos profissionais, para o desenvolvimento das ações em segurança e saúde do trabalhador; Eliminar as políticas de monetarização dos riscos (adicionais de riscos). Outras ações )
Compatibilizar os instrumentos de coleta de dados e fluxos de informações. )
)
)
)
)
)
)
)
)
Ambientes nocivos Coleta de dados ) Incluir nos Sistemas e Bancos de Dados as informações contidas nos relatórios de intervenções e análises dos ambientes de trabalho, elaborados pelos órgãos de governo envolvidos nesta Política. A gestão do PNSST prevê o seu desenvolvimento pelo Grupo Executivo Interministerial de Segurança e Saúde do Trabalhador – GEISAT, integrado por representantes do Ministério do Trabalho, da Saúde e da Previdência Social. Ressalta‐se que no PNSST não está previsto o prazo para execução das ações propostas. Infelizmente este plano permanece no papel até os dias de hoje e sem sinais de sua saída desta condição tão cedo.
_________________ 1. Tributo: Impostos; taxas e contribuições de melhoria, devida ao poder público. Uanderson Rebula de Oliveira
Estatística
- 10 CONSIDERAÇÕES FINAIS SOBRE O ESTUDO DE ACIDENTES
O que acabamos de ver é um estudo estatístico. Como vimos, os dados sobre acidentes do trabalho no Brasil são controladas pelo Ministério da Previdência Social, junto ao INSS (Instituto Nacional de Seguridade Social). A comunicação de acidentes permite ao INSS estimar e acompanhar o real impacto do trabalho sobre a saúde e a segurança da população brasileira. O INSS coleta, organiza, apresenta e publica as estatísticas de acidentes do trabalho no Brasil. Conforme observado, quando ocorre um acidente, a empresa, por força de lei, é obrigada a enviar a CAT ao INSS, alimentando, assim, o seu grande banco de dados. As estatísticas de acidentes no Brasil podem ser visualizadas no site da Previdência Social através do endereço eletrônico www.previdencia.gov.br. O interessante neste site é a existência de um documento, disponível para download, denominado “Anuário estatístico da previdência social”. Nele estão contidos todos os dados estatísticos da Previdência Social, inclusive os dados referentes a acidentes do trabalho, distribuídos por região, idade, tipos, parte do corpo mais atingida dentre outros. É um importante documento para os estudiosos no assunto. É importante ressaltar que os dados de acidentes de trabalho não se constituem, tão somente, num importante registro histórico, mas sim numa ferramenta inestimável para os profissionais que desempenham atividades nas áreas de saúde e segurança do trabalhador, assim como pesquisadores e demais pessoas interessadas no tema. A análise desses dados possibilita a construção de um diagnóstico mais preciso acerca da epidemiologia dos acidentes, propiciando, assim, a elaboração de políticas mais eficazes para as áreas relacionadas com o tema, como vimos no PNSST. TÓPICO PARA REFLEXÃO
Acidente do
Trabalho: o
problema do
Brasil.
Os acidentes de trabalho afetam a produtividade econômica, são responsáveis por um impacto substancial sobre o sistema de proteção social e influenciam o nível de satisfação do trabalhador e o bem estar geral da população. Estima‐se que a ausência de segurança nos ambientes de trabalho no Brasil tenha gerado, no ano de 2003, um custo de cerca de R$32,8 bilhões para o país. Deste total, R$ 8,2 bilhões correspondem a gastos com benefícios acidentários e aposentadorias especiais, equivalente a 30% da necessidade de financiamento do Regime Geral de Previdência Social ‐ RGPS verificado em 2003, que foi de R$ 27 bilhões. O restante da despesa corresponde à assistência à saúde do acidentado, indenizações, retreinamento, reinserção no mercado de trabalho e horas de trabalho perdidas. Isso sem levar em consideração o sub‐dimensionamento na apuração das contas da Previdência Social, que desembolsa e contabiliza como despesas não acidentárias os benefícios por incapacidade, cujas CAT não foram emitidas. Ou seja, sob a categoria do auxílio doença não ocupacional, encontra‐se encoberto um grande contingente de acidentes que não compõem as contas acidentárias. Parte deste “custo segurança no trabalho” afeta negativamente a competitividade das empresas, pois ele aumenta o preço da mão‐de‐obra, o que se reflete no preço dos produtos. Por outro lado, o incremento das despesas públicas com previdência, reabilitação profissional e saúde reduz a disponibilidade de recursos orçamentários para outras áreas ou induz o aumento da carga tributária sobre a sociedade. De outro lado, algumas empresas afastam trabalhadores, e muitas vezes os despedem logo após a concessão do beneficio. Com isso, o trabalhador se afasta, já sendo portador de doença crônica contraída no labor, e o desemprego poderá se prolongar na medida em que, para obter o novo emprego, será necessária a realização do exame admissional, no qual serão eleitos apenas aqueles considerados como “aptos” e, portanto, não portadores de enfermidades. Fonte: RESOLUÇÃO CNPS Nº 1.269, DE 15 DE FEVEREIRO DE 2006 Uanderson Rebula de Oliveira
Estatística
- 11 CONCEITO DE ESTATÍSTICA
É A CIÊNCIA QUE SE DEDICA EM COLETAR, ORGANIZAR, APRESENTAR, ANALISAR E INTERPRETAR DADOS (INFORMAÇÕES) PARA TOMADA DE DECISÃO. ; Estatística é a ciência dos dados. A Estatística lida com a coleta, o processamento e disposição de dados (informações), atuando como ferramenta fundamental nos processos de soluções de problemas. A Estatística facilita o estabelecimento de conclusões confiáveis sobre algum fenômeno que esteja sendo estudado (WERKEMA, 1995). ; É por meio da análise e interpretação dos dados estatísticos que é possível o conhecimento de uma realidade, de seus problemas, bem como, a formulação de soluções apropriadas por meio de um planejamento objetivo da ação, para além dos “achismos” e “casuismos” comuns. ; No uso diário o termo “estatística” refere‐se a fatos numéricos. Tenha em mente, entretanto, que estatística é bem diferente de matemática. Estatística é, antes de qualquer coisa, um método científico que determina questões de pesquisa; projeta estudos e experimentos; coleta, organiza, resume e analisa dados; interpreta resultados e esboça conclusões. Ou seja, utiliza‐se dados como evidências para responder a interessantes questões sobre o mundo. A matemática só é utilizada para calcular a estatística e realizar algumas das análises, mais isso é apenas uma pequena parte do que realmente é a estatística. Portanto, a estatística mantém com a matemática uma relação de dependência, solicitando‐lhe auxílio, sem o qual não poderia desenvolver‐se. ; A Estatística é uma ciência interdisciplinar, ou seja, é comum a duas ou mais disciplinas ou ramos de conhecimento. Assim, a Estatística é aplicada na Medicina, Administração, Engenharias, Economia, Contabilidade, Direito, Segurança do Trabalho, Qualidade, Marketing entre outras áreas. Veja abaixo. Medicina. Estudos de epidemiologia, *Engenharia de Produção. Estudos de Segurança do Trabalho. Estudos de inter‐relações dos determinantes da freqüência e distribuição de doenças populacionais Contabilidade. Estudos das informações financeiras das empresas públicas e privadas. um conjunto de dados de todas as acidentes e doenças, suas causas, fases de um processo produtivo. quantidade, parte atingida, setores, % de afastamentos etc. Finanças. Estudos de uma série de Economia. Estudos de taxas de informações estatísticas para orientar inflação, índice de preços, taxa de investimentos. desemprego, futuro da economia. *Engenharia de Produção – A aplicação da Estatística na produção merece especial atenção. A atual ênfase na qualidade torna o controle da qualidade uma importante aplicação da estatística na área da produção. Usa‐se uma série de mapas estatísticos de controle de qualidade para monitorar o resultado (output) de um processo de produção. Suponha, por exemplo, que uma máquina preencha recipientes com 2 litros de determinado refrigerante. Periodicamente, um operador do setor de produção seleciona uma quantidade de recipientes e verifica a exatidão, ou seja, se não há desvios. A Estatística também é usada na Engenharia de Produção para Estratificação, que consiste no agrupamento da informação (dados) sob vários pontos de vista, de modo a focalizar a ação, considerando os fatores equipamento, tempo entre outros. Exemplo: Roupas danificadas Tipo de dano: Operador: Máquina de lavar: em uma lavanderia Tipo de roupa: Marca do sabão: Máquina de secar: Uanderson Rebula de Oliveira
Estatística
- 12 UM POUCO DE HISTÓRIA E ATUALIDADE
O termo “Estatística” provém da palavra “Estado” e foi utilizado originalmente para denominar levantamentos de dados (riquezas, impostos, nascimentos, mortalidade, batizados, casamentos, habitantes etc.), cuja finalidade era orientar o Estado em suas decisões. ; Segundo Costa (2005, p. 5) em 1085, Guilherme “O Conquistador”, ordenou que se fizesse um levantamento na Inglaterra, que deveria incluir informações sobre terras, proprietários, uso da terra, empregados, animais e serviria, também, de base para cálculo de impostos. Tal levantamento originou um volume intitulado “domesday book”. ; No século XVIII o estudo dos dados foi adquirindo, aos poucos, feição verdadeiramente científica. A palavra Estatística apareceu pela primeira vez no século XVIII e foi sugerida pelo alemão Godofredo Achenwall (1719‐
1772), onde determinou o seu objetivo e suas relações com as ciências. ; Desde essa época, a Estatística deixou de ser a simples catalogação de dados numéricos coletivos e se tornou o estudo de como chegar a conclusões sobre o todo, partindo da observação e análise de partes desse todo. Essa é sua maior riqueza. Atualmente a sociedade está completamente tomada pelos números. Eles aparecem em todos os lugares para onde você olha, de outdoors mostrando as últimas estatísticas sobre aborto, passando pelos programas de esporte que discutem as chances de um time de futebol chegar à final do campeonato, até o noticiário da noite, com reportagens focadas no índice de criminalidade, na expectativa de vida de uma pessoa que não come alimentos saudáveis e no índice de aprovação do presidente. Em um dia comum, você pode se deparar com cinco, dez ou, até mesmo, vinte diferentes estatísticas (ou até muito mais em um dia de eleição). Se você ler todo o jornal de domingo, irá se deparar com centenas de estatísticas em reportagens, propagandas e artigos sobre todo tipo de assunto: desde sopa (quanto em média uma pessoa consome por ano?) até castanhas (quantas castanhas você precisa comer para aumentar seu QI?). Nas empresas a Estatística desempenha um papel cada vez mais importante para os Gerentes. Esses responsáveis pela tomada de decisão utilizam a estatística para: ; Apresentar e descrever apropriadamente dados e informações sobre a empresa; ; Tirar conclusões sobre grandes populações, utilizando informações coletadas a partir de amostras; ; Realizar suposições confiáveis sobre a atividade da empresa; ; Melhorar os processos da empresa. A estatística é um instrumento eficiente para a compreensão e interpretação da realidade e não deve ser subestimada. Realmente existem pesquisas feitas de forma incorreta e que, por isso, não são confiáveis. Mas, em geral, quando um estudo estatístico é feito com critério, seus resultados permitem obter conclusões e prever tendências sobre fatos e fenômenos. Um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível. Uanderson Rebula de Oliveira
Estatística
- 13 1.2 FASES DO ESTUDO ESTATÍSTICO
Um estudo estatístico confiável depende do planejamento e da correta execução das seguintes etapas: 1. Definir o que será estudado e a natureza dos dados, como exemplo:
ESTUDO
Acidentes do Trabalho no Brasil Peças danificadas na linha A ;
;
;
;
;
;
;
;
;
;
;
;
;
NATUREZA DOS DADOS
Quantidade e período Por regiões, estados ou municípios Por atividade econômica Por idade dos acidentados Por parte do corpo atingida Por causas dos acidentes etc. Tipo de peça | Tipo de defeito Quantidade Período Turnos Máquinas Operadores Matéria prima etc. ; É preciso definir com clareza os objetivos da pesquisa, ou seja, o que se pretende apurar, que tipo de problema buscará detectar. 2. Coletar dados
Após a definição do que será estudado e o estabelecimento do planejamento do trabalho (forma de coleta dos dados, cronograma das atividades, custos envolvidos, levantamento das informações disponíveis), o passo seguinte é o da coleta de dados, que consiste na busca ou compilação dos dados, componentes do fenômeno a ser estudado. Nessa etapa recolhem‐se os dados tendo o cuidado de controlar a qualidade da informação. O sucesso de uma pesquisa depende muito da qualidade dos dados recolhidos. Podem ser por meio de: • Criação de Softwares, a exemplo da CAT; • Uso de Softwares da empresa; • Dados históricos da empresa (físicos); • Pesquisas com questionários etc.
3. Organizar e contar dados
À procura de falhas e imperfeições, os dados devem ser cuidadosamente organizados e contados, a fim de não incorrermos em erros grosseiros que possam influenciar nos resultados. No exemplo da “Estatística na prática”, após a coleta da quantidade de acidentes por meio da CAT, organiza‐os por período, regiões etc. Da mesma maneira, se você usa um questionário para coletar dados na empresa, organiza‐os da forma necessária à pesquisa, além da contagem a ser feita. Uanderson Rebula de Oliveira
Estatística
- 14 4. Apresentação de dados
Os dados devem ser apresentados sob a forma de tabelas ou gráficos, a fim de tornar mais fácil e rápido o exame daquilo que está sendo estudado. 1.796.671
1.743.825
2.000.000
1.750.000
Involução da QUANTIDADE de ACIDENTES DO
TRABALHO no Brasil - 1970 a 2005.
Aprovação das NR’s
1.551.461
1.464.211
1.504.723
1.500.000
1.220.111
1.178.472
1.250.000
1.207.859
991.581
961.575
1.000.000
693.572
750.000
532.514
388.304 395.455414.341 363.868
500.000
465.700 491.711
393.071 399.077
340.251
250.000
0
1970
1972
1974
1976
1978
1980
1982
1984
1986
1988
1990
1992
1994
1996
1998
2000
2001
2002
2003
2004
2005
Anos
FONTE: Revista Proteção
5. Análise dos dados e tomada de decisão
Chegamos à fase mais complexa do processo estatístico, que consiste na análise dos dados. Por fim, a partir da análise realizada, poderemos chegar a uma tomada de decisão. Observe o estudo “Estatística na prática”. O que resultou a análise dos acidentes no Brasil, no período de 1970 a 2005? Veja que os Ministérios do Trabalho, Previdência Social e da Saúde se mobilizaram para resolverem essa questão de saúde pública, com diversas ações a serem implementadas no país. A partir dessa discussão, fica claro que um profissional com conhecimentos de Estatística terá maior facilidade em identificar um problema em sua área de atuação, determinar os tipos de dados que irão contribuir para sua análise, coletar esses dados e a seguir estabelecer conclusões e determinar um plano de ação para a solução do problema detectado. Uanderson Rebula de Oliveira
Estatística
- 15 1.3 VOCABULÁRIO BÁSICO DE ESTATÍSTICA O vocabulário utilizado em estudos estatísticos teve sua origem nos primeiros estudos feitos pela humanidade e que eram relativos à demografia (estudo estatístico das populações). Por isso a Estatística emprega termos próprios dessa área de conhecimento, mas com um sentido diferenciado. Assim, para dar prosseguimento, é de extrema importância destacar alguns termos utilizados no jargão estatístico. VARIÁVEL – É o termo usado para aquilo que você está pesquisando, estudando, analisando. ;
No estudo representado no gráfico abaixo a variável é o acidente do trabalho. Utilizada como um adjetivo do vocabulário do dia‐a‐dia, variável sugere que alguma coisa se modifica ou varia. 1.796.671
1.743.825
2.000.000
1.750.000
Involução da QUANTIDADE de ACIDENTES
DO TRABALHO no Brasil - 1970 a 2005.
1.551.461
1.464.211
1.504.723
1.500.000
1.220.111
1.178.472
1.250.000
1.207.859
VARIÁVEL
991.581
961.575
1.000.000
693.572
750.000
532.514
388.304 395.455414.341 363.868
500.000
465.700 491.711
393.071 399.077
340.251
250.000
0
1970
1972
1974
1976
1978
1980
FONTE: Revista Proteção
1982
1984
1986
1988
1990
1992
1994
1996
1998
2000
2001
2002
2003
2004
2005
Anos
São exemplos de Variáveis
Doenças, Sexo, Estaturas, Peso, Idade, Renda, Natalidade, Mortalidade, PIB, Inflação, Exportações brasileiras,
Produção de café, Alimentação, Peças produzidas por hora, Paradas de produção no mês, Rotatividade de
estoque por ano, Poluição, Clima na região sudeste, Consumo de energia no mês, Vendas mensais de uma
empresa, Produção diária de automóveis etc.
EXEMPLO DE APLICAÇÃO:
A associação dos moradores de um bairro queria traçar um perfil dos freqüentadores de um parque ali situado. Uma equipe de pesquisa elaborou questões a fim de reunir as informações procuradas. Numa manhã de quarta‐
feira, 6 pessoas foram entrevistadas e cada uma respondeu a questões para identificar idade, número de vezes que freqüenta o parque por semana, estado civil, meio de transporte utilizado para chegar ao parque, tempo de permanência no parque e renda familiar mensal. Os resultados são mostrados na tabela a seguir: Variáveis
Cada um dos aspectos investigados — os quais permitirão fazer a análise desejada — é denominado variável. Uanderson Rebula de Oliveira
Estatística
- 16 TIPOS DE VARIÁVEIS
Há, pois, uma divisão principal para as variáveis estatísticas, que consiste em considerá‐las como Variáveis Quantitativas (contínuas ou discretas) e Variáveis Qualitativas. Esta divisão é de facílima compreensão! Veja o esquema abaixo. Tipo de VARIÁVEL
Quantitativa
; Discreta
; Contínua
Qualitativa
Esquema básico
Resposta fornecida à pesquisa
Em números
; Inteiros 0,1, 2, 3,...,9
; Não inteiros 0,12 1,64
Em nomes, atributos
Exemplos
Gols de futebol, Idade (anos)
Altura (cm), Peso (kg), Tempo
Sexo, Cor, Nacionalidade, Raça
Tipos de Variáveis da pesquisa em um parque:
Qualitativa
Quantitativa discreta Quantitativa contínua Se a dúvida persiste, no quadro abaixo você pode observar os esclarecimentos do Esquema básico. Esclarecimentos do Esquema básico
Resposta fornecida à pesquisa
Tipo de VARIÁVEL
Quantitativa
(Em números)
;
Discreta
(números inteiros)
(contagem)
; Contínua
(Números não inteiros)
(medição)
Qualitativa
(nomes, atributos)
Será Quantitativa a variável para a qual se possa atribuir um valor numérico. Se a resposta fornecida à pesquisa estiver expressa por um número, então a variável é quantitativa. Por exemplo: quantos livros você lê por ano? A resposta é um número? Então, variável quantitativa. Quantas pessoas moram em sua casa? A resposta é um número? Então, novamente, variável quantitativa. Exemplo. No caso do estudo “ACIDENTE DO TRABALHO”, é uma variável quantitativa, pois o objeto do estudo foi a quantidade de acidentes no período de 1970 a 2005
Variável Quantitativa Discreta é a variável quantitativa que assume somente números inteiros. Resulta, geralmente, de contagem. Esta variável não pode assumir qualquer valor, dentro de um intervalo de valores de resultados possíveis. Por exemplo, se eu pergunto quantos irmãos você tem, a resposta jamais poderia ser “tenho 3,75 irmãos”, ou “tenho 4,8 irmãos”, ou seja, a resposta não poderia assumir todos os valores de um intervalo! Este acima é o conceito formal de variável discreta! O conceito para memorizar é o seguinte: aquela variável obtida por meio de uma contagem. Em outras palavras: a variável discreta você conta!. Exemplos: quantas pessoas moram na sua casa? Quantos livros você tem? Quantos carros você tem? Se, para responder à pergunta, você faz uma contagem, então está diante de uma variável quantitativa discreta. Variável Quantitativa Contínua é aquela que pode assumir qualquer valor dentro de um intervalo de resultados possíveis. Se eu pergunto quantos quilos você pesa, a resposta pode ser 65,35kg. Se eu pergunto qual a temperatura na cidade hoje, a resposta pode ser 27,35°C. Para facilitar a memorização, basta lembrar que a variável quantitativa contínua pode ser obtida por uma medição, ou seja, a variável contínua você mede! Exemplos: peso, altura, duração de tempo para resolução de uma prova, pressão, temperatura etc. Se a pergunta é “qual a sua cor preferida?”, logicamente a resposta não será um número, daí estaremos tratando de uma variável qualitativa, ou seja, aquela para a qual não se atribui um valor numérico. Exemplos: Sexo: masculino ou feminino Uanderson Rebula de Oliveira
Estatística
- 17 1.4 POPULAÇÃO E AMOSTRA Quando você quer saber se a sopa ficou boa, o que você faz? Mexe a panela, retira um pouco com uma colher e prova. Depois tira uma conclusão sobre todo o conteúdo da panela sem, na verdade, ter provado tudo. Portanto, é possível ter uma idéia de como a sopa está sem ter que comer tudo. Isso é o que se faz em estatística. A estatística deixou de ser a simples catalogação de dados numéricos e se tornou o estudo de como chegar a conclusões sobre o todo (população), partindo da observação e análise de partes desse todo (amostra). Essa é sua maior riqueza. Assim, podemos conceituar população e amostra como: POPULAÇÃO É UM CONJUNTO DE TODOS OS ELEMENTOS EM ESTUDO. AMOSTRA É UMA PARTE DA POPULAÇÃO. Podemos visualizar o conceito de população e amostra na figura ao lado. Quando pesquisamos toda a população, damos o nome de censo. A precisão depende do tamanho da amostra, e quanto maior é o tamanho amostral, maior será a precisão das informações. AMOSTRA
(uma parte da população)
“n”
POPULAÇÃO
(todos os elementos em estudo)
“N”
N é designado para População
n é designado para Amostra
; Muitas vezes quando queremos fazer um estudo estatístico, não é possível analisar toda a população envolvida com o fato que pretendemos investigar, como exemplo o sangue de uma pessoa ou a poluição de um rio. É impossível o teste do todo. Há situações também em que é inviável o estudo da população, por exemplo, a pesquisa com todos os torcedores em um estádio de futebol durante uma partida. Nesses casos, o estatístico recorre a uma amostra que, basicamente, constitui uma redução da população a dimensões menores, sem perda das características essenciais. ; Os resultados fundamentados em uma amostra não serão exatamente os mesmos que você encontraria se estudasse toda a população, pois, quando você retira uma amostra, você não obtém informações a respeito de todos em uma dada população. Portanto, é importante entender que os resultados da amostra fornecem somente estimativas dos valores das características populacionais. Com métodos de amostragens apropriados, os resultados da amostra produzirão “boas” estimativas da população, ou seja, um estudo bem feito não elimina o erro, mas limita‐o a uma margem, procurando torná‐la o menor possível. Quando aprendemos estatística inferencial, também aprendemos técnicas para controlar esses erros de amostragem. 4 razões para selecionar uma amostra
O número de elementos em uma população é muito grande; Demanda menos tempo do que selecionar todos os itens de uma população; É menos dispendioso (caro) do que selecionar todos os itens de uma população; Uma análise amostral é menos cansativa e mais prática do que uma análise da população inteira. Uanderson Rebula de Oliveira
Estatística
- 18 São exemplos de População e Amostra:
MEDICINA. Pretende‐se estudar o efeito de um novo medicamento para curar determinada doença. É selecionado um grupo de 50 doentes, administrando‐se o novo medicamento a 10 desses doentes escolhidos ao acaso e o medicamento habitual aos restantes. População: Todos os 50 doentes com a doença que o medicamento a estudar pretende tratar. Amostra: Os 10 doentes selecionados. CONTROLE DE QUALIDADE. O Gerente de Produção de uma fábrica de parafusos pretende assegurar‐se de que a porcentagem de peças defeituosas não excede um determinado valor, a partir do qual determinada encomenda poderia ser rejeitada. População: Todos os parafusos fabricados ou a fabricar, utilizando o mesmo processo. Amostra: Parafusos escolhidos ao acaso entre os lotes produzidos. ESTUDOS DE MERCADO. O gerente de uma fábrica de produtos desportivos pretende lançar uma nova linha de esquis, pelo que encarrega uma empresa especialista em estudos de mercado de “estimar“ a porcentagem de potenciais compradores desse produto. População: conjunto de todos os praticantes de desportos de neve. Amostra: conjunto de alguns praticantes inquiridos pela empresa. SISTEMAS DE PRODUÇÃO. Um fabricante de pneus desenvolveu um novo tipo de pneu e quer saber o aumento da durabilidade em termos de kilometragem em relação à atual linha da empresa. Produz diariamente 1000 pneus e selecionou 120 para testes. População: 1000 pneus. Amostra: 120 pneus. A amostra na prática - Oxford Cereais (Levine et al, 2008, p.218)
A Oxford Cereais abastece milhares de caixas de cereais durante um turno de oito horas. Como gerente de operações da unidade de produção, você é responsável por monitorar a quantidade de cereal colocada em cada caixa. Para ser coerente com o conteúdo especificado na embalagem, as caixas devem conter 368 gramas de cereal. Em razão da velocidade do processo, o peso do cereal varia de caixa para caixa, fazendo com que algumas caixas fiquem mal abastecidas enquanto outras ficam hiperabastecidas. Se o processo não estiver funcionando de maneira apropriada, o peso das caixas pode se desviar demasiadamente do peso especificado no rótulo, 368 gramas, e se tornar inaceitável. Uma vez que a pesagem de cada caixa individual consome uma quantidade demasiadamente grande de tempo, é dispendiosa e ineficiente, você deve extrair uma amostra de caixas. Para cada amostra selecionada, você planeja pesar caixas individuais. Com base em sua análise, você terá que decidir entre manter, alterar ou interromper o processo. MÉTODOS DE AMOSTRAGEM PROBABILÍSTICOS
Amostragem Aleatória Simples – É a técnica de amostragem em que cada um dos
elementos da população tem a mesma chance de ser selecionado. ; Uma característica importante de uma boa pesquisa é que a amostra da população alvo seja selecionada aleatoriamente. Aleatoriamente significa que todos os membros da população alvo devem ter as mesmas chances de serem incluídos na amostra. Ou seja, o processo usado para a seleção de sua amostra não pode ser parcial. “Aleatório” = Dependente de fatores incertos. Suponha que você tenha um rebanho com 500 novilhos e precisa retirar uma amostra aleatória de 50 deles para fazer um exame para uma doença. Retirar os 50 primeiros novilhos que vierem em sua direção não se encaixaria na definição de amostra aleatória. Os primeiros novilhos que forem capazes de vir em sua direção, provavelmente são os que têm menos chances de apresentarem qualquer tipo de doença ou, talvez, sejam os mais velhos e mais amigáveis, que realmente são os mais suscetíveis a doenças. De qualquer forma, a pesquisa foi tendenciosa. Como coletar uma amostra aleatória dos novilhos? Os animais provavelmente possuem etiquetas com um número de identificação, assim você deve conseguir uma lista com todos os números de identificação, selecione uma amostra aleatória desses números e localize os animais. Uanderson Rebula de Oliveira
Estatística
- 19 ; Uma amostra aleatória é boa; ela dá a mesma chance a todos os membros de uma população de ser selecionado, além de utilizar mecanismos de casualidade para escolhê‐los, como a tabela de números aleatórios. O método é semelhante a um sorteio. Tabela de números aleatórios
; Um dos mecanismos utilizados para seleção é a tabela de números aleatórios, que consiste em uma série de números listados em uma sequência aleatoriamente gerada. Esta tabela tem duas características que a tornam particularmente adequada: primeiro, os números estão dispostos de tal maneira que a chance de qualquer um deles aparecer em determinada sequência é igual à chance do aparecimento em qualquer outra posição; segundo, cada uma de todas as combinações de dois algarismos tem a mesma chance de ocorrência, como também todas as combinações de três algarismos, e assim por diante. ; Sistemas computacionais elaboram números aleatórios. O Excel dispõe da função “ALEATÓRIO” para gerar números aleatórios (veja figura ao lado). ; A tabela de números aleatórios abaixo foi construída de modo que os dez algarismos (0 a 9) são distribuídos ao acaso, pelo Excel, identificadas pelas linhas (1, 2, 3, 4...) e colunas (A, B, C, D ...): Tabela de números aleatórios
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 A 9 0 6 9 5 8 3 3 4 6 7 8 8 2 3 0 1 1 6 2 9 4 5 8 1 7 7 8 1 7 1 3 6 5 B 3 7 5 7 5 3 1 6 2 8 9 1 1 8 3 2 1 9 9 7 5 2 8 4 2 7 2 7 4 6 5 2 5 0 C 3 6 1 0 6 4 2 3 0 7 1 4 7 8 7 7 0 0 7 1 5 4 3 3 8 5 8 7 8 1 8 2 4 8 D 1 8 5 2 5 8 7 1 4 0 6 6 9 4 2 8 5 4 4 2 5 9 1 2 1 7 8 1 2 9 1 2 6 7 E 2 1 3 6 1 8 5 1 7 3 5 3 3 4 0 1 9 1 5 1 2 7 1 1 0 9 8 9 2 0 0 1 5 8 F 1 4 4 7 6 3 4 7 2 9 8 8 4 0 0 7 6 1 0 6 2 3 3 3 5 2 3 6 1 5 4 1 9 1 G 6 5 4 3 4 8 7 6 7 9 1 8 3 4 2 7 6 4 1 3 0 1 8 5 4 4 8 7 9 1 3 4 5 3 H 6 0 2 2 8 0 1 9 9 9 4 4 6 3 9 6 2 3 0 1 1 8 2 7 3 5 5 6 5 4 9 5 1 5 I 3 5 3 6 3 6 3 5 3 8 3 7 9 2 5 0 7 3 6 1 3 3 5 6 8 7 5 6 2 4 2 8 0 1 J 3 8 7 7 3 4 5 3 3 6 7 1 5 2 5 4 2 1 6 7 6 4 3 7 5 8 4 5 6 4 4 0 0 4 Uanderson Rebula de Oliveira
K 9 6 9 4 1 8 2 3 3 8 9 3 9 8 6 3 2 5 2 1 9 8 8 3 1 7 4 5 6 1 5 2 1 6 L 0 6 1 9 5 2 4 5 3 2 1 6 2 1 8 4 7 6 1 2 6 3 6 3 1 1 5 9 3 0 6 4 4 1 M 7 1 4 1 3 3 1 3 3 1 2 3 1 1 2 5 1 7 5 3 5 7 2 6 8 4 9 1 4 1 6 5 2 5 N
0
4
8
6
8
5
5
5
2
5
5
7
7
0
4
8
8
0
2
4
3
1
2
1
9
8
4
6
0
6
8
8
7
5
O
4
2
5
2
8
2
1
6
8
8
3
7
3
2
5
7
5
1
1
8
2
3
7
9
1
4
9
5
1
4
2
3
7
6
P
0
6
8
7
2
5
3
3
7
7
4
5
8
8
7
8
5
2
8
8
2
1
8
4
3
1
2
6
3
3
2
3
7
6
Q
4
7
7
7
3
3
1
3
1
4
1
2
7
1
4
3
2
2
8
1
6
1
1
7
8
6
3
1
0
7
3
0
7
0
R
4
5
2
8
8
7
8
3
8
5
6
6
5
8
0
0
7
2
2
1
3
6
1
6
7
4
1
2
5
3
1
9
8
3
S
1
6
4
6
8
1
0
4
0
5
3
2
2
1
6
3
5
4
5
7
1
4
1
5
4
9
1
2
5
7
2
3
0
5
T
3
0
7
8
7
7
5
3
6
2
1
4
2
4
7
1
9
4
2
1
4
8
3
6
5
7
1
3
6
1
8
9
3
5
U
8
5
3
4
7
6
8
6
1
6
6
8
7
5
3
2
5
9
2
1
4
2
4
6
0
5
2
2
9
0
4
8
2
0
V
1
7
7
7
4
8
8
8
5
3
3
6
6
1
2
7
0
2
2
1
4
3
4
7
4
9
7
5
1
7
5
9
7
3
W
6 7 0 8 5 2 6 4 3 4 2 3 0 8 6 8 3 2 8 3 3 3 8 2 7 4 6 7 7 4 9 6 7 6 X
5
9
6
1
0
9
0
5
4
1
5
2
6
1
3
5
7
1
1
6
1
1
8
6
0
1
3
5
8
1
1
9
2
5
Y
8
6
2
5
4
5
6
5
0
1
1
1
1
8
7
2
0
9
2
2
6
4
6
5
8
4
5
6
8
6
7
8
8
4
Z
8
3
2
7
5
3
6
8
6
2
9
4
8
3
6
3
3
7
3
1
7
7
4
7
3
4
1
9
8
8
4
8
7
1
a
9
2
1
1
1
4
9
8
3
2
5
8
1
3
7
2
1
1
8
1
0
3
2
0
8
3
4
5
2
9
7
4
5
4
b 8 6 3 2 8 3 5 1 2 1 7 3 2 4 2 5 5 5 1 7 5 8 3 8 9 2 0 0 7 9 6 5 8 1 c 6 3 5 6 7 7 5 9 8 2 7 1 1 5 7 7 4 9 3 9 5 6 1 2 6 2 6 3 7 7 7 9 1 4 d 5 4 0 6 2 0 5 2 3 9 5 7 4 6 2 5 2 1 5 2 1 3 8 6 2 5 2 1 9 9 1 8 3 0 e 0 5 8 6 3 3 3 5 3 4 6 0 8 6 2 7 9 1 7 2 0 1 6 4 3 8 7 7 7 6 6 1 8 6 f 6 9 9 3 2 9 5 7 0 0 6 8 5 8 7 4 7 5 6 5 7 8 1 9 7 0 7 1 5 2 1 3 7 9 g 3 8 4 5 9 7 8 8 7 5 8 1 2 1 6 3 4 8 7 3 3 0 8 1 1 2 7 1 0 7 8 3 6 5 h
3
6
7
6
6
0
5
7
2
8
4
9
7
4
4
5
4
9
8
2
1
2
4
4
4
3
7
5
3
6
0
5
4
2
i 1
5
1
0
4
1
6
7
7
7
6
4
3
7
1
2
2
7
1
2
2
8
9
7
6
4
7
5
6
3
4
8
0
2
Estatística
j 2
2
6
8
7
5
7
5
2
0
5
1
3
4
6
9
6
2
6
2
1
1
1
7
2
5
7
2
2
7
6
9
0
0
k
4
1
4
2
7
7
1
8
4
6
7
2
8
3
1
4
0
2
7
7
5
0
5
3
9
4
0
6
4
0
2
0
2
5
l 8
1
4
1
9
2
2
7
2
8
1
3
5
3
1
6
5
2
1
6
3
8
6
4
4
2
4
6
4
1
9
6
6
5
- 20 Como usar a tabela de números aleatórios
; 1º Numerar todos os elementos da população N; ; 2º Determinar as combinações dos algarismos para assegurar correspondência entre os dígitos aleatórios e os elementos da população (ex.: se o último número da população for 80, por exemplo, devem ser lidos números de dois algarismos; caso o último número seja 456, devem ser lidos números de três algarismos, e assim por diante; ; 3º Escolher um ponto de partida arbitrário da tabela. A leitura pode ser feita horizontalmente →← (da direita para a esquerda ou vice‐versa), verticalmente ↓↑ (de cima para baixo ou vice‐versa), diagonalmente ↗↙↖↘ (no sentido ascendente ou descendente) ou formando o desenho de uma letra qualquer. A opção, porém, deve ser feita antes de iniciado o processo; ; 4º Descartar os números maiores que o tamanho da população e/ou numeral repetido; ; 5º Usar os números escolhidos para identificar os elementos da população. EXEMPLO. Uma empresa pecuária possui uma população de novilhos de tamanho N = 80 e precisa retirar amostras de tamanho n = 12 (15% da população) para fazer exame de uma determinada doença. Utilize o método de amostragem aleatória simples, considerando a tabela, a partir da 4ª linha, coluna D, sentido horizontal, da esquerda para direita (→). Informar, também, os números descartados. SOLUÇÃO. Como a população N=80 teve dois algarismos, então combinamos dois algarismos na tabela (00), descartando os números repetidos e/ou maiores que o tamanho da população (Ex.: 81, 82, 83...) e escolhendo outra combinação de algarismos. Este procedimento é repetido até a amostra de tamanho n=12 ser escolhida. Então: 1 2 3 A 9 0 6 4 9 B 3 7 5 C 3 6 1 D E F 1 2 1 8 1 4 5 3 4 G 6 5 4 H 6 0 2 I 3
5
3
J 3 8 7 K 9 6 9 L 0 6 1 M 7 1 4 N 0 4 8 O
4
2
5
P
0
6
8
Q
4
7
7
R
4
5
2
S
1
6
4
T
3
0
7
U
8
5
3
V
1
7
7
W
6 7 0 X
5
9
6
Y
8
6
2
Z
8
3
2
a
9
2
1
b
8
6
3
c 6 3 5 d 5 4 0 e 0 5 8 f 6 9 9 g 3 8 4 h 3 6 7 i 1
5
1
j 2
2
6
k
4
1
4
l 8
1
4
7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7
8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4
5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8
2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
n = 26 73 74 62 77 78 15 71 66 35 60 56 Descartados por repetição: 26 26 15 Descartados por serem maiores que a população: 91 86 84 82 Amostragem Aleatória Estratificada – É a técnica de amostragem em que dividimos todos os
elementos da população em grupos (estratos) de idênticas características.
Às vezes, a população é heterogênea (ex.: sexo masculino e feminino; peça A, B e C) e a amostra aleatória simples não apresentaria esta heterogeneidade. Seria, então, necessário homogeneizar as amostras em grupos, estratos. Neste caso recorremos à amostragem aleatória estratificada. “Estratificar” sugere “formar‐se em camadas”. A estratificação mais simples que encontramos na população do rebanho de tamanho N=80 é a divisão entre novilhos e novilhas. Supondo que haja 35 novilhos e 45 novilhas, teremos a seguinte formação dos estratos: População (80)
Estrato 1
Novilhos (35)
Estrato 2
Novilhas (45)
Uanderson Rebula de Oliveira
Estatística
- 21 São, portanto, dois estratos (novilhos e novilhas). Como queremos uma amostra de tamanho n=12 (15% da população), por estrato, temos: Rebanho
População
15%
Amostra
Número de
35 Novilho (estrato 1) 35*15% = 5,25 5 amostras
45 Novilha (estrato 2) 45*15%= 6,75 7 estratificadas
80 TOTAL 80*15% = 12 12 O próximo passo é extrair as amostras dentro de cada estrato. Então, numeramos o rebanho de 01 a 80, sendo que de 01 a 35 correspondem novilhos e de 36 a 80, as novilhas. Tomando na tabela de números aleatórios, a partir da 4ª linha, coluna D, sentido horizontal, da esquerda para direita (→), obtemos os seguintes números: 1 2 3 A 9 0 6 4 9 B 3 7 5 C 3 6 1 D E F 1 2 1 8 1 4 5 3 4 G 6 5 4 H 6 0 2 I 3
5
3
J 3 8 7 K 9 6 9 L 0 6 1 M 7 1 4 N 0 4 8 O
4
2
5
P
0
6
8
Q
4
7
7
R
4
5
2
S
1
6
4
T
3
0
7
U
8
5
3
V
1
7
7
W
6 7 0 X
5
9
6
Y
8
6
2
Z
8
3
2
a
9
2
1
b
8
6
3
c 6 3 5 d 5 4 0 e 0 5 8 f 6 9 9 g 3 8 4 h 3 6 7 i 1
5
1
j 2
2
6
k
4
1
4
l 8
1
4
7 0 2 6 7 3 2 6 7 4 9 1 6 2 7 7 8 6 8 4 7
8 1 5 7 1 2 6 6 6 3 5 6 0 8 2 1
5 5 5 6 5 1 6 4 8 3 3 1 5 3 8 8 2 3 8 8 7 7 4
5 0 4 5 1 8 7 2 3 2 9 6 4 7 7 9
6 8 3 4 8 8 3 8 0 6 4 8 2 3 5 2 5 3 7 1 7 6 8
2 9 5 3 4 3 7 0 3 9 7 0 1 5 7 2
Temos, então: 1 a 35 → Novilhos n = 36 a 80 → Novilhas n = Descartados 26 73 15 74 35 62 31 77 23 78 71 66 ;
Notas
importantes
sobre este tipo de
amostragem
;
Como é provável que a variável em estudo apresente, de estrato para estrato, um comportamento heterogêneo e, dentro de cada estrato, um comportamento homogêneo, convém que a amostragem seja feita por estratos. Portanto, a amostragem estratificada é, em geral, usada para reduzir a variação nos resultados. A amostragem estratificada é mais eficiente do que a amostragem aleatória simples, uma vez que fica assegurada a representatividade de elementos ao longo de toda a extensão da população. A homogeneidade de itens dentro de cada estrato proporciona maior precisão. Da mesma maneira, em um sistema produtivo, podemos estratificar as amostras em, por exemplo, peça A, peça B, peça C e assim por diante. Amostragem Aleatória por Conglomerado- É a técnica de amostragem em que dividimos
todos os elementos da população em diversos grupos (conglomerados).
A conglomeração mais simples que encontramos na população do rebanho de novilhos de tamanho N=80 é a sua divisão, por exemplo, em 10 grupos (conglomerados), cada um com 8 elementos da população. Depois numeramos cada conglomerado, como mostrado na figura abaixo: População (80)
8 novilhos (as) para cada conglomerado
Conglomerado 1
Conglomerado 2
Conglomerado 3
Conglomerado 4
Conglomerado 5
Conglomerado 6
Conglomerado 7
Conglomerado 8
Conglomerado 9
Conglomerado 10
O próximo passo é extrair uma amostra aleatória simples dos conglomerados. Supondo o tamanho amostral n=24, teremos, portanto, 3 conglomerados a considerar. Partindo da 1ª linha, coluna A, sentido horizontal e da esquerda para direita (→) da tabela aleatória, temos, então: Conglomerados selecionados: Uanderson Rebula de Oliveira
06 07 02 Agora, é só coletar todos os elementos desses conglomerados selecionados e estudar todos os itens. Estatística
- 22 Uma amostra por conglomerado é uma amostra aleatória simples na qual cada unidade de amostragem é um grupo de elementos. Uma das principais aplicações da amostragem por conglomerados é a amostragem por áreas geográficas, como cidades, municípios, setores de uma empresa, quarteirões de cidades, domicílios, território de vendas etc. Segundo Levine et al (2008, p. 222) e Anderson et al (2009, p.263) a amostragem por conglomerados têm as seguintes características: ;
;
;
;
Todos os elementos contidos em cada conglomerado amostrado formam a amostra; Cada conglomerado é uma versão representativa em pequena escala da população inteira; Tende a produzir melhores resultados quando os elementos neles contidos não são similares; De um modo geral, é mais eficaz em termos de custo do que a amostragem aleatória simples, particularmente se a população estiver dispersa ao longo de uma extensa área geográfica. Entretanto, a amostragem por conglomerado geralmente demanda um maior tamanho de amostra para que sejam produzidos resultados tão precisos quanto aqueles que seriam obtidos da amostragem aleatória simples ou estratificada. Segundo Triola (2008, p. 23) outro exemplo de amostra por conglomerado pode ser encontrado nas pesquisas eleitorais, onde selecionamos aleatoriamente 30 zonas eleitorais dentre um grande número de zonas e, em seguida, entrevistamos todos os eleitores daquelas seções (zonas selecionadas). Isso é muito mais rápido e muito menos dispendioso do que selecionar uma pessoa de cada uma das zonas na área populacional. ATENÇÃO!
É fácil confundir amostragem estratificada com a amostragem por conglomerado, porque ambas envolvem a formação de grupos. Porém, a amostragem por conglomerado usa todos os elementos de um grupo selecionado, enquanto a amostragem estratificada usa amostras de elementos de todos os estratos. Figura. Amostragem por Conglomerados em quarteirões de um bairro. Uanderson Rebula de Oliveira
Estatística
- 23 -
Amostragem Sistemática - É a técnica de amostragem em que retiramos os elementos da
população periodicamente, definida pelo pesquisador.
Utilizamos este tipo de amostragem quando os elementos de uma população se encontram ordenados, por exemplo, a coleta de amostras de um determinado produto em uma linha de produção. Coleta de Amostras
Amostras
Nestes casos, a seleção dos elementos que constituirão a amostra pode ser feita por um sistema imposto pelo pesquisador. Assim, no caso de uma linha de produção, podemos, a cada dez itens produzidos, retirar um para pertencer a uma amostra da produção diária. Neste caso, estaríamos fixando o tamanho amostral de 10% da população. Uma amostragem é sistemática quando a retirada dos elementos da população é feita periodicamente, sendo o intervalo de seleção calculado, por meio da divisão do tamanho da população pelo tamanho da amostra a ser selecionada. EXEMPLO. Deseja‐se retirar uma amostra de n = 10 unidades de peças de uma população de tamanho N = 800. O intervalo de seleção é, então, 800/10 = 80. Desse modo, 80 seria o primeiro elemento a ser considerado para a amostra; os demais elementos seriam periodicamente considerados de 80 em 80. Nesse caso escolhem‐se aquelas que estiverem nas seguintes posições: 80, 160, 240, 320, 400, 480, 560, 640, 720, 800. População = 800
800/10 = 80
Amostra = 10
1
2
3
4
5
6
7
8
9
10
Amostra 80 80 80 80 80 80 80 80 80
Nº da peça
0
80
160
240 320 400
480 560 640
720 800
Outras amostragens (não probabilísticas)
Amostragem por julgamento – A pessoa que conhece mais profundamente o tema do estudo escolhe os elementos que julga serem mais representativos da população. Por exemplo, um repórter pode tomar como amostra dois ou três senadores, julgando que eles refletem a opinião geral de todos os senadores. A qualidade dos resultados depende do julgamento da pessoa que a seleciona. Amostragem por conveniência – a amostra é identificada primeiramente por conveniência (cômodo, útil, favorável). Como exemplo estudantes de uma universidade voluntários para compor uma amostra de uma determinada pesquisa escolar. Uanderson Rebula de Oliveira
Estatística
- 24 1.5 ESTATÍSTICA DESCRITIVA E ESTATÍSTICA INFERENCIAL AMOSTRA
(uma parte da população)
POPULAÇÃO
(todos os elementos em estudo)
Estatística descritiva – É o ramo da estatística que envolve a organização, o resumo e a representação dos dados para tomada de decisão. Estatística inferencial – É o ramo da estatística que envolve o uso da amostra para chegar a grandes conclusões sobre a população. Uma ferramenta básica no estudo da estatística inferencial é a probabilidade. Algumas ferramentas
Estatística Inferencial: aplicadas
à
Probabilidades
Uma Probabilidade é uma medida numérica que representa a chance de um evento ocorrer. Ex.: Ao lançar um dado, qual a probabilidade de obter o valor 4? R = 1/6 = 16% Estimação, margem de erro e intervalo de confiança
Suponha que o tempo médio que você leva para chegar ao trabalho de carro é de 35’, com uma margem de erro de 5’ para mais ou para menos. A estimativa é de que o tempo médio gasto até chegar ao trabalho fica em algum ponto entre 30’ e 40’. Esta estimativa é um intervalo de confiança, pois leva em consideração o fato de que os resultados da amostra irão variar e dá uma indicação de uma variação esperada. A margem de erro é uma medida de quão próximo você espera que seus resultados representem toda a população que está sendo estudada. Vários fatores influenciam a amplitude de um intervalo de confiança, tais como o tamanho amostral, a variabilidade da população e o quanto você espera obter de precisão. A maioria dos pesquisadores contenta‐se com 95% de confiança em seus resultados. Estar 95% confiante indica que se você coletar muitas, mas muitas amostras e calcular o intervalo de confiança para todas, 95% dessas amostras terão intervalos de confiança que abrangerão o alvo. Teste de hipótese
Teste de hipótese é um procedimento estatístico em que os dados são coletados e medidos para comprovar uma alegação feita sobre uma população. Por exemplo, se uma pizzaria alega entregar as pizzas dentro de 30’ a partir do pedido, você pode testar se essa alegação é verdadeira, coletando uma amostra aleatória do tempo de entrega durante um determinado período de tempo e observar o tempo médio de entrega para essa amostra. Uanderson Rebula de Oliveira
Estatística
- 25 2
SÉRIES ESTATÍSTICAS
Uanderson Rebula de Oliveira
Estatística
- 26 2.1 CONCEITOS E TIPOS DE SÉRIES As tabelas e gráficos constituem um importante instrumento de análise e interpretação de um conjunto de dados. Diariamente é possível encontrar tabelas e gráficos nos mais variados veículos de comunicação (jornais, revistas, televisão, Internet), associadas a assuntos diversos do nosso dia‐a‐dia, como resultados de pesquisas de opinião, saúde e desenvolvimento humano, economia, esportes, cidadania, etc. A importância das tabelas e dos gráficos está ligada sobretudo à facilidade e rapidez na absorção e interpretação das informações por parte do leitor e também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. TABELAS
São quadros que resumem um conjunto de dados. Título – conjunto de informações sobre o estudo. Cabeçalho –especifica o conteúdo das colunas Coluna indicadora –especifica o conteúdo das linhas Coluna numérica ‐–especifica a quantidade das linhas Linhas – retas imaginárias de dados Célula – espaço destinado a um só número Rodapé – simplesmente a fonte dos dados
Tipos de Tabelas
SÉRIE HISTÓRICA Descreve os valores da variável, discriminados por TEMPO (anos, SÉRIE GEOGRÁFICA Descreve os valores da variável, discriminados por REGIÕES (países, cidades, bairros, ruas, layout, etc) meses, dias, horas, etc. SÉRIE ESPECÍFICA Descreve os valores da variável, discriminados por temas ESPECIFICOS. SÉRIE CONJUGADA É utilizado quando temos a necessidade de apresentar em uma única tabela a variação de valores DE MAIS DE UMA VARIÁVEL, isto é, fazer de forma conjugada de duas ou mais séries. Esta série, por exemplo, é GEOGRÁFICA – HISTÓRICA Uanderson Rebula de Oliveira
Estatística
- 27 GRÁFICOS A importância dos gráficos está ligada à facilidade e rapidez na absorção e interpretação das informações e também às inúmeras possibilidades de ilustração e resumo dos dados apresentados. Eis os mais usados: Quantidade
Quantidade
Quantidade
Gráfico em Linha (para séries históricas)
É a representação dos valores por meio de linhas. Usamos quando precisamos de uma informação rápida de um valor ao longo do tempo. ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
10000
8658
9578
8000
7265
6325
6254
6000
5458
4000
2000
0
1989
1990
1991
1992
1993
1994
Anos
FONTE: Dados fictícios
ACIDENTES DO TRABALHO EM SÃO PAULO: 1989 ‐ 1991
2500
São Paulo
2000
Guarulhos
Campinas
1500
Osasco
1000
Santos
500
0
1989
1990
1991
FONTE: Dados fictícios
anos
Gráfico em Colunas
É a representação dos valores por meio de retângulos, dispostos verticalmente. Utiliza‐se muito quando necessitamos saber a quantidade de valor. QUANTIDADE DE ACIDENTES DO TRABALHO
SÃO PAULO: 1989 ‐ 1994
12000
9578
10000
8658
7265
8000
6254
6325
6000
5458
4000
2000
0
1989
1990
1991
1992
1993
1994
Anos
FONTE: Dados fictícios
Uanderson Rebula de Oliveira
Estatística
- 28 -
Tipo
Gráfico em Barras
É o mesmo conceito que o de Colunas, porém utiliza‐se sempre que os dizeres a serem inscritos são extensos. QUANTIDADE DE ACIDENTES DO TRABALHO
EM SÃO PAULO ‐ POR TIPO ‐ 1989
598
Corte
3578
Queda
Atrito
698
Perfuração
55
1396
Impacto
0
1000
2000
3000
4000
Quantidade
FONTE: Dados fictícios
Gráfico em Setores
Este gráfico é construído com base em um círculo, e é empregado sempre que desejamos ressaltar a participação de um dado no total, geralmente na forma de porcentagem. ACIDENTES DO TRABALHO
SÃO PAULO ‐ 1989 FONTE: Dados fictícios
Gráfico Polar
É o gráfico ideal para representar séries temporais cíclicas, isto é, séries temporais que apresentam em seu desenvolvimento determinada periodicidade, por exemplo, o mês de janeiro a dezembro. ACIDENTES DO TRABALHO
SÃO PAULO ‐ 1989 FONTE: Dados fictícios
Uanderson Rebula de Oliveira
Estatística
- 29 Gráfico de Pareto
É um gráfico de colunas na qual a altura de cada barra representa os dados, porém na ordem de altura decrescente, com a coluna mais alta posicionada à esquerda. Tal posicionamento ajuda a enfatizar dados importantes e é frequentemente usado nos negócios. Quantidade (milhões) 34 30 25 22 15 Veículo Ômega Monza Gol Corsa Fusca FONTE: dados fictícios Os cinco veículos mais vendidos no Brasil em janeiro de 1995
40
Quantidade (milhões)
Os cinco veículos mais vendidos no Brasil em janeiro de 1995 34
30
30
25
20
22
15
10
0
Ômega
Monza
Gol
FONTE: Dados fictícios
Corsa
Fusca
Veículos
Gráfico de Dispersão
É usado para representar a relação entre duas variáveis quantitativas, por meio de pontos e linhas. Investimentos versus vendas no setor da empresa X Anos 1999 2000 2001 2002 Investimentos 500 3000 1300 2000 Vendas 3000 2000 4000 2500 FONTE: dados fictícios Gráfico Cartograma
Este gráfico é empregado quando o objetivo é o de figurar os dados estatísticos diretamente relacionados com áreas geográficas ou políticas (mapas), corpo humano entre outras figuras Número de cada Delegacia FONTE: SSP/SP Uanderson Rebula de Oliveira
Estatística
- 30 2.2 DISTRIBUIÇÃO DE FREQUÊNCIA FREQUÊNCIA ABSOLUTA E HISTOGRAMA
Ao se trabalhar com grandes conjuntos de dados, em geral é útil organizá-los e resumi-los
em uma tabela, chamada Distribuição de frequência.
;
;
Na distribuição de frequência listamos todos os valores coletados, um em cada linha, marcam‐se as vezes em que eles aparecem, incluindo as repetições, e conta‐se a quantidade de ocorrências de cada valor. Por este motivo, tabelas que apresentam valores e suas ocorrências denominam‐se distribuição de freqüências. O termo “freqüência” indica o número de vezes que um dado aparece numa observação estatística. EXEMPLO 1
Um professor organizou os resultados obtidos em uma prova com 25 alunos da seguinte forma: Notas dos 25 alunos Comentário 4,0 4,0 4,0 4,0 4,0 5,0 5,0 5,0 6,0 6,0 7,0 7,0 7,0 8,0 8,0 9,0 9,0 9,0 9,0 9,0 9,0 9,0 9,0 9,0 9,0 Agora ele pode fazer uma representação gráfica para analisar o desempenho da turma. Em primeiro lugar, o professor pode fazer uma tabulação dos dados, ou seja, organizá‐los de modo que a consulta a eles seja simplificada. Então, faremos a distribuição de freqüência destas notas, por meio da contagem de dados. Distribuição de freqüência Comentário Nota Freqüência absoluta, f 4,0 5,0 6,0 7,0 8,0 9,0 5 3 2 3 2 10 ∑f=25 Esta forma de organizar dados é conhecida como distribuição de frequência, e o número de vezes que um dado aparece é chamado de frequência absoluta, representado por f. Exemplos: (nº de alunos) ;
;
A frequência absoluta da nota 4,0 é 5. A freqüência absoluta da nota 9,0 é 10. O símbolo grego ∑ “sigma” significa “somatório”, muito usado em Estatística. Portanto, ∑f=25 significa a soma de 5+3+2+3+2+10. Representamos a freqüência por um gráfico, chamado Histograma. HISTOGRAMA Comentário Quando os dados numéricos são organizados, eles geralmente são Número de alunos
Desempenho dos alunos na prova
12
10
10
8
6
ordenados do menor para o maior, divididos em grupos de tamanho razoável e, depois, são colocados em gráficos para que se examine sua forma, ou distribuição (no exemplo: 4,0 – 5,0 – 6,0 – 7,0 – 8,0 – 9,0). Este gráfico é chamado de Histograma. Um histograma é um gráfico de colunas juntas. Em um histograma não existem espaços entre as colunas adjacentes, como ocorre em um gráfico de colunas. No exemplo, a escala horizontal (→) representa as notas e a escala vertical (↑) as freqüências. 5
3
4
2
2
3
2
0
4,0
5,0
6,0 7,0
Nota
8,0
9,0
O histograma ao lado indica que cinco alunos tiraram a nota 4,0; três alunos tiraram a nota 5,0; dois alunos tiraram a nota 6,0; três alunos tiraram a nota 7,0; dois alunos tiraram 8,0 e dez alunos tiraram 9,0. ESTA FREQUÊNCIA QUE ACABAMOS DE ESTUDAR É DENOMINADA FREQUENCIA ABSOLUTA (f), QUE É SIMPLESMENTE A CONTAGEM DOS DADOS. ;
Em Estatística não trabalhamos somente com frequência absoluta (f), mas também com outros tipos de freqüências, que são: freqüência relativa (fr), frequência absoluta acumulada (Fa) e frequência relativa acumulada (FRa). ;
Estudaremos agora cada uma delas. Uanderson Rebula de Oliveira
Estatística
- 31 FREQUENCIA RELATIVA (fr) %
Conceito. Representado por fr, significa a relação existente entre a frequência absoluta (f) e a soma das freqüências (∑f). É a porcentagem (%) do número de vezes que cada dado aparece em relação ao total. EXEMPLO 1a
f/∑f*100→5/25*100= 20% freqüência relativa (fr)% Comentários aos cálculos Nota 4,0 5,0 6,0 7,0 8,0 9,0 f 5 3 2 3 2 10 ∑f=25 fr(%) 20% 12% 8% 12% 8% 40% 100 A frequência relativa (fr) é obtida por f/∑f *100, conforme abaixo: ; A fr(%) da nota 4,0 é fr = 5/25 = 0,2 = 20%. ; A fr(%) da nota 5,0 é fr = 3/25 = 0,12 = 12% ; A fr(%) da nota 6,0 é fr = 2/25 = 0,08 = 8% ; A fr(%) da nota 7,0 é fr = 3/25 = 0,12 =12% ; A fr(%) da nota 8,0 é fr = 2/25 = 0,08 = 8% ; A fr(%) da nota 9,0 é fr = 9/25 = 0,4 = 40%. FREQUENCIA ABSOLUTA ACUMULADA (Fa)
Conceito. Representado por Fa, significa a soma das freqüências absolutas até o elemento analisado. EXEMPLO 1b
Fa2=5+3 = 8 frequência absoluta acumulada (Fa) Comentários aos cálculos Nota 4,0 5,0 6,0 7,0 8,0 9,0 f 5 3 2 3 2 10 ∑f=25 fr(%) 20% 12% 8% 12% 8% 40% 100 Fa 5 8 10 13 15 25 ‐ A frequência absoluta acumulada (Fa) é obtida conforme abaixo: ; A “Fa” da nota 4,0 é 5 (sempre repete a primeira). ; A “Fa” das notas 4,0 e 5,0 é 5+3=8. ; A “Fa” das notas 4,0, 5,0 e 6,0 é 5+3+2=10. ; A “Fa” das notas 4,0, 5,0, 6,0 e 7,0 é 5+3+2+3=13. ; A “Fa” das notas 4,0, 5,0, 6,0, 7,0 e 8,0 é 5+3+2+3+2=15. ; A “Fa” das notas 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 5+3+2+3+2+10=25 FREQUENCIA RELATIVA ACUMULADA (FRa) %
Conceito. Representado por FRa, significa soma das freqüências relativas (fr) até o elemento analisado. EXEMPLO 1c
20%+12% = 32% frequência relativa acumulada (FRa) Comentários aos cálculos Nota 4,0 5,0 6,0 7,0 8,0 9,0 f fr(%) 5 20% 3 12% 2 8% 3 12% 2 8% 10 40% ∑f=25 100 Fa 5 8 10 13 15 25 ‐ FRa(%) 20% 32% 40% 52% 60% 100% ‐ Fa 25 ‐ FRa(%) 100 ‐ A frequência relativa acumulada (FRa) é obtida conforme abaixo: ; A “FRa” de 4,0 é 20% (sempre repete a primeira). ; A “FRa” de 4,0 e 5,0 é 20+12 = 32% ; A “FRa” de 4,0, 5,0 e 6,0 é 20+12+8 = 40% ; A “FRa” de 4,0, 5,0, 6,0 e 7,0 é 20+12+8+12 = 52% ; A “FRa” de 4,0, 5,0, 6,0, 7,0 e 8,0 é 20+12+8+12+8 = 60% ; A “FRa” de 4,0, 5,0, 6,0, 7,0, 8,0 e 9,0 é 20+12+8+12+8+40=100% NOTA IMPORTANTE SOBRE DISTRIBUIÇÃO DE FREQUÊNCIA: Nota f ∑f=25 fr(%) 100 Para saber se o desenvolvimento da distribuição de freqüência por completo está correto, os valores ao lado, em vermelho, deverão coincidir. Uanderson Rebula de Oliveira
Estatística
- 32 AGRUPAMENTO EM CLASSES
Em uma distribuição de frequência, ao se trabalhar com grandes conjuntos de dados e
com valores dispersos, podemos agrupá-los em classes.
;
Se um conjunto de dados for muito disperso, uma representação melhor seria através do agrupamento dos dados com a construção de classes de frequência. Caso isso não ocorresse, a tabela ficaria muito extensa. Veja abaixo: EXEMPLO 2
Um radar instalado na Dutra registrou a velocidade (em Km/h) de 40 veículos, indicadas abaixo: Velocidade de 40 veículos (Km/h) 70 71 73 76 80 81 83 86 90 93 95 97 97 97 99 99 100 102 103 105 105 109 109 109 Distribuição de freqüência com classes 110 123 115 123 115 123 115 123 117 124 117 124 121 128 121 128 Classes
Distribuição de frequência Nota 70 71 73 76 80 81 83 86 90 93 95 97 99 100 102 103 105 109 110 115 117 121 123 124 128 f 1 1 1 1 1 1 1 1 1 1 1 3 2 1 1 1 2 3 1 3 2 2 4 2 2 ∑f=40 É fácil ver que a distribuição de frequências diretamente obtida a partir desses dados é dada uma tabela razoavelmente extensa. Uanderson Rebula de Oliveira
i 1 2 3 4 5 6 f Velocidade (Km/h) 4 4 8 8 6 10 ∑f=40 70 |⎯ 80 80 |⎯ 90 90 |⎯ 100 100 |⎯ 110 110 |⎯ 120 120 |⎯ 130 A criação de grupos de frequências, chamado de ”classes”, é como se fosse uma compressão dos dados. Imagine se fizéssemos uma distribuição de freqüência de todas velocidades, desde 70 até 128. A distribuição ficaria imensa! Por este motivo existe a distribuição de frequência com classes. Como criar uma Distribuição de Freqüência com classes 1.
2.
Calcule a quantidade de classes (i), obtida por meio da raiz da quantidade de dados. Neste exemplo: 40 = 6,3 ≅ i = 6 classes. Calcule a amplitude de classe (h) que nada mais é o tamanho da classe, representado por “h”, sendo: Maior valor – Menor valor = 128 – 70 = 9,6 ≅ h=10 quantidade de classes (i) 6 Nota: o Maior valor e o Menor valor são obtidos da relação das velocidades dos 40 veículos, ou seja,o maior valor é 128 e o menor valor é 70. 3.
Montar as classes a partir do Menor valor (70 no exemplo), somando com a amplitude de classe (10 no exemplo) até que se chegue na 6ª classe, assim: i 1 2... ...6 Velocidade (Km/h) 70 +10 80 80 +10 90 120 +10 130 CONCEITOS IMPORTANTES: TIPOS DE INTERVALO DE CLASSE: Representação Tipo Aberto 70 ⎯ 80 Fechado à esquerda 70 |⎯ 80 Fechado 70 |⎯| 80 Fechado à direita 70 ⎯| 80 Dados do intervalo 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80 No Brasil costuma‐se utilizar o intervalo |⎯ (Resolução 866/66 do IBGE). Já na literatura estrangeira, a exemplo de Triola (2008), Anderson et al (2009) e Levine et al (2008), utiliza‐se somente com intervalo fechado. LIMITES DE CLASSE ‐ São os extremos de cada classe, no exemplo 70 |⎯ 80, temos que o limite inferior é 70 e o limite superior 80. Estatística
- 33 AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) – É a diferença entre o limite superior da última classe e o limite inferior da primeira classe, no exemplo 130 – 70 = 60. AMPLITUDE AMOSTRAL (AA) – É a diferença entre o valor máximo e o valor mínimo da amostra, no exemplo 128 – 70 = 58. Abaixo vemos as distribuições de frequências absoluta, relativa, absoluta acumulada e relativa acumulada, bem como o Histograma desta distribuição. Distribuição de freqüência com classes f, fr, Fa e FRa Fr(%) Fa FRa(%) 10% 10% 20% 20% 15% 25% 4 8 16 24 30 40 10% 20% 40% 60% 75% 100% 100% Quantidade de veículos
f i Velocidade (Km/h) 4 1 70 |⎯ 80 4 2 80 |⎯ 90 8 3 90 |⎯ 100 8 4 100 |⎯ 110 6 5 110 |⎯ 120 10 6 120 |⎯ 130 ∑f=40 Resultados dos registros de um radar
12
10
10
8
8
8
6
6
4
4
4
2
0
70 80 90 100 110 120 130 Velocidade (Km/h) OUTRAS REPRESENTAÇÕES GRÁFICAS DE UMA DISTRIBUIÇÃO DE FREQUÊNCIA POLÍGONO DE FREQUÊNCIA – É um gráfico em linha que representa os pontos centrais dos intervalos de classe. Calcule o ponto central de classe (x), que é o ponto que divide o intervalo de classe em duas partes iguais. Por exemplo, a velocidade dos veículos da 1ª classe pode ser representada por 70 + 80 = 75Km/h 2 x 75 85 95 105 115 125 Resultados dos registros de um radar
12
Quantidade de veículos
f i Velocidade (Km/h) 4 1 70 |⎯ 80 4 2 80 |⎯ 90 8 3 90 |⎯ 100 8 4 100 |⎯ 110 6 5 110 |⎯ 120 10 6 120 |⎯ 130 ∑f=40 Ponto central
75Km/h
70 |⎯ 80
10
8
6
4
2
0
A construção de um polígono de frequências é muito simples. Primeiro, 70 75 80 85 90 95 100 105 110 115
construímos um histograma; depois marcamos no “telhado” de cada coluna o Velocidade (Km/h) ponto central e unimos sequencialmente esses pontos. 120
125 130 OGIVA – (pronuncia‐se o’jiva). Conhecida também por polígono de frequência acumulada. É um gráfico em linha que representa freqüências acumuladas (FRa), levantada nos pontos correspondentes aos limites superiores dos intervalos de classe. Resultados dos registros Quantidade de veículos
f FRa i Velocidade (Km/h) 4 4 1 70 |⎯ 80 4 8 2 80 |⎯ 90 8 16 3 90 |⎯ 100 8 24 4 100 |⎯ 110 6 30 5 110 |⎯ 120 10 40 6 120 |⎯ 130 ∑f=40 40 de um radar
30 24 16 4
4 4
8 8
10
8
6
70 80 90 100 110 120 130 Uanderson Rebula de Oliveira
40
35
30
25
20
15
10
5
0
Velocidade (Km/h) Estatística
- 34 3
MEDIDAS
Para resumir a quantidade de informação contida em um conjunto de dados, os estatísticos definem medidas que descrevem, através de um só elemento, características dos dados. Algumas medidas descrevem a tendência central, isto é, a tendência que os dados têm de se agrupar em torno de certos valores. Uanderson Rebula de Oliveira
Estatística
- 35 3.1 MEDIDAS DE TENDÊNCIA CENTRAL São medidas que utilizamos para obter um número que represente o valor central de um conjunto de dados. As Medidas de Tendência Central mais utilizadas são: Média, Mediana e Moda. Uma maneira de pensar o que o centro de um conjunto de dados significa é perguntar: “qual seria um valor normal”? ou, “onde está o meio dos dados”? Por exemplo, pode‐se, ao identificar‐se um grupo de idosos, referir‐se ao grupo como tendo “em torno de 70 anos”. O que se quer dizer com isso? Por certo que as idades dos membros que formam o grupo estão próximas de 70 anos, para mais ou para menos. Quando as pessoas conversam sobre “um valor normal” ou “valor do meio” ou “valor mais freqüente”, elas estão falando informalmente sobre a média, a mediana e a moda. MÉDIA
MÉDIA SIMPLES
É uma medida que representa um valor típico ou normal num conjunto de dados.
;
A média simples serve como um “ponto de equilíbrio” em um conjunto de dados (como o ponto de apoio de uma gangorra). Cada dado tem igual importância e peso. Sofre a influência de todos os dados. A Média simples é obtida pela seguinte fórmula: A Média é representada por x = ∑x → soma dos valores dos dados n → quantidade de dados x (lê‐se “x barra”) EXEMPLO
Supondo que uma escola adote como critério de aprovação a Média 7,0 e, considerando as quatro notas de João e Maria durante o ano, informe se foram aprovados. x = ∑x 3,5 + 6,0 + 9,5 + 9,0 n 4 Notas
Notas de João: 3,5 | 6,0 | 9,5 | 9,0 | x = 7,0 → aprovado 8,0
7,0
Média de João
6,0
6,0
4,0
9,0
3,5
0,0
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
x = 5,6 → reprovada Uanderson Rebula de Oliveira
Média das notas de Maria 9,5
10,0
8,0
Notas
x = ∑x 3,5 + 4,0 + 5,5 + 9,5 n 4 Média das notas de João 9,5
2,0
Notas de Maria: 3,5 | 4,0 | 5,5 | 9,5 | 10,0
Média exigida
5,6
6,0
4,0
3,5
5,5
4,0
Média de Maria
2,0
0,0
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
Estatística
- 36 MÉDIA APARADA
Semelhante à Média simples, porém, descartando-se em partes iguais alguns
números nos extremos inferior e superior.
;
Também chamada de Média podada, truncada, ajustada. A média simples possui uma deficiência por ser facilmente influenciada por valores discrepantes (valores muito grandes ou muito pequenos em um conjunto de dados) Ex.: x de 10, 15, 13, 18, 525 = 116. Assim, devido a maneira como a média é calculada (cada dado tem igual importância e peso), os valores discrepantes muito altos tendem a elevar a média, enquanto que valores discrepantes muito baixos tendem a reduzir a média. Portanto, a média sempre será atraída para o valor mais afastado dos demais. ;
Por isso, dizemos que a média simples não é uma medida robusta de tendência central. A média aparada é mais resistente. Segundo Anderson et al (2009, p. 77) e Triola (2007, p. 74) ela é obtida ordenando os dados e excluindo‐se igualmente uma porcentagem (entre 5% e 10%) dos valores menores e maiores de um conjunto de dados e calculando‐se então a média dos valores restantes. $500 $2.000 $2.050 $2.100 $2.150 $2.200 5% de 12 = 0,6 ≅ 1 $2.200 $2.250 x a = ∑x $2.300 10 $2.300 $2.350 x a = 2.190 $6.000 Média aritmética simples salarial de uma empresa 7000
6000
Quantidade
6000
5000
Média simples 4000
3000
2000 2050
2000
1000
2150 2200 2200 2250
2100
2300 2300 2350 2366
500
0
Salários dos empregados
Média aritmética aparada (5%) salarial de uma empresa 7000
$6.000
6000
Quantidade
Exemplo: Supondo a Média simples dos salários de 12 empregados de uma empresa: $500 $2.200 x = ∑x $2.000 $2.250 12 $2.050 $2.300 $2.100 $2.300 $2.150 $2.350 x = 2.366 $2.200 $6.000 Supondo a Média aparada em 5% dos salários de 12 empregados de uma empresa: 5000
4000
Média
aparada 3000
2000
2000 2050
2100
2150 2190 2200 2200 2250
2300 2300 2350
$500 1000
0
Salários dos empregados
Neste caso, 5% de 12 = 0,6. O arredondamento desse valor para 1 indica que a média aparada de 5% significa eliminar 1 menor valor (no exemplo, $500) e 1 maior valor (no exemplo, $6.000). A média aparada de 5%, usando‐se as 10 observações restantes será, então, 2.190. MÉDIA PONDERADA
Semelhante a Média simples, porém, atribuindo-se a cada dado um peso que
retrate a sua importância.
; O termo “ponderação” é sinônimo de peso, importância, relevância. Sugere, então, a atribuição de um peso a um determinado dado. Em alguns casos, os valores variam em grau de importância, de modo que podemos querer ponderá‐los apropriadamente. É calculada multiplicando‐se um peso por cada valor, fazendo com que alguns valores influenciem mais fortemente a média do que outros. Uanderson Rebula de Oliveira
Estatística
- 37 A Média ponderada é obtida pela seguinte fórmula: Vamos representar a Média ponderada por x p = ∑(x . p) → soma dos valores . pesos xp ∑ p → soma dos pesos p representa o peso e x representa o valor do dado EXEMPLO
Supondo que uma escola adote como critério de aprovação a Média 7,0, sendo que as provas bimestrais são ponderadas com pesos 1, 2, 3 e 4, respectivamente para o 1º bim, 2º bim, 3º bim e 4º bim. Considerando as notas de João (na ordem bimestral crescente), informe se foi aprovado. Notas de João: | 9,0 | 8,0 | 6,0 | 5,0 ∑ p x p = (9,0.1) + (8,0.2) + (6,0.3) + (5,0.4) 1+2+3+4 8,0
8,0
6,3
6,0
Média ponderada 6,0
5,0
4,0
2,0
1
2
1º Bim
2º Bim
3
4
0,0
Notas e pesos
x p = ∑(x . p) Média ponderada das notas de João 10,0 9,0
x p = 6,3 → reprovado Média 3º Bim
Bimestres
4º Bim
Nota. Em uma média simples ele seria aprovado por 7,0. Algumas vezes, em especial nos colégios, é comum que sejam atribuídos “pesos” às notas de determinadas provas. A atribuição de pesos visa fazer com que determinados valores tenham mais influência no resultado final do que outros. Também pode aplicado, por exemplo, em cálculos de índices de inflação, atribuindo pesos para setor de vestuário, alimentação, etc.
MÉDIA DE DISTRIBUIÇÃO DE FREQUÊNCIA
Quando trabalhamos com dados resumidos em uma distribuição de frequência, não sabemos os valores exatos que caem em determinada classe. Para tornar possíveis os cálculos, consideramos que, em cada classe, todos os valores amostrais sejam iguais ao ponto central de classe. Por exemplo, considere o intervalo de classe 70 |⎯ 80, com uma frequência de 4. Admitimos que todos os 4 valores sejam iguais a 75 (o ponto central de classe). Com o total de 75 repetido 4 vezes, temos um total de 75 x 4 = 300. Podemos, então, somar esses produtos obtidos de cada classe para encontrar o total de todos os valores, os quais, então, dividimos pela quantidade de dados. i 1 2 3 4 5 6 É importante salientar que a distribuição de frequência resulta em uma aproximação de não se baseia na lista original exata dos valores amostrais. x
porque Ponto central de classe Velocidade (Km/h) 70 |⎯ 80 80 |⎯ 90 90 |⎯ 100 100 |⎯ 110 110 |⎯ 120 120 |⎯ 130 f x f . x 4 x = 75 300 4 85 340 8 95 760 8 105 840 6 115 690 10 125 1250 ‐ ∑f=40 ∑(f.x) = 4180 Uanderson Rebula de Oliveira
Procedimento: 1. Multiplicar as frequências f pelos pontos centrais de classe x e adicionar os produtos. 2. Somar as frequências f; 3. Somar os produtos (f.x); 4. Aplicar a fórmula abaixo: x = ∑(f.x) → 4180 = 104,5 Km/h ∑f → 40 Estatística
- 38 f Nota (x) 4,0 5,0 6,0 7,0 8,0 9,0 Quando a distribuição não tem agrupamento de classes, consideraremos as frequências como sendo os pesos dos elementos correspondentes: f . x (nº de alunos) = X 5 3 2 3 2 10 ∑f=25 20 15 12 21 16 90 ∑(f.x) = 174 x =∑(f.x) → 174 = 6,96 ∑f → 25 MÉDIA GEOMÉTRICA
Medida que representa as taxas médias de variações de uma variável ao longo dos
anos.
A Média geométrica é obtida pela seguinte fórmula: Vamos representar a Média geométrica por x G = n
∏x xG O símbolo grego ∏ (lê‐se “PI”) representa produtório (multiplicação) Exemplo Supondo que a categoria de operários de uma fábrica teve um aumento salarial de 20% em 1999, 12% em 2000 e 7% em 2001. Qual o percentual médio anual de aumento? Para acumularmos aumento de 20%, 12% e 7%, devemos multiplicá‐lo por 1,2, 1,12 e 1,07 que são os *fatores correspondentes a tais percentuais. Porce ntagem %
Então: Percentual médio anual dos salários dos operários
30
x G = 3 1,2 .1,12 .1,07 x G = 3 1,43808 = 1,1287 = 12,87% 20
20%
12%
12,87%
7%
10
0
1999
Use a calculadora científica: Introduza 3 x
1,43808 2000
2001
Média
Anos
Um fator de 1,1287 corresponde a 12,87% de aumento. Este é o valor percentual médio anual do aumento salarial, ou seja, se aplicarmos três vezes consecutivas o percentual 12,87%, no final teremos o mesmo resultado que se tivéssemos aplicado os percentuais 20%, 12% e 7%. Digamos que o salário desta categoria de operários seja de R$ 1.000,00, aplicando‐se os sucessivos aumentos temos: Salário inicial + % informado Salário final // Salário inicial + % médio Salário final R$ 1.200 R$ 1.000 12,87% R$ 1.128 12% R$ 1.344 R$ 1.128 12,87% R$ 1.274 7% R$ 1.438 R$ 1.274 12,87% R$ 1.438 R$ 1.000 20% R$ 1.200 R$ 1.344 Observe que o resultado final de R$ 1.438,08 é o mesmo nos dois casos. Se tivéssemos utilizado a média simples no lugar da média geométrica, os valores finais seriam distintos, pois a média simples de 13% resultaria em um salário final de R$ 1.442,90, ligeiramente maior como já era esperado, já que o percentual de 13% utilizado é ligeiramente maior que os 12,87% da média geométrica. Uanderson Rebula de Oliveira
Estatística
- 39 *FATOR DE MULTIPLICAÇÃO: É frequente o uso de expressões que refletem acréscimos ou reduções em preços, números ou quantidades, sempre tomando por base 100 unidades. Exemplo: A gasolina teve um aumento de 15% → Significa que em cada R$100 houve um acréscimo de R$15, logo: R$115 Se há um acréscimo de 15% a um valor, podemos calcular o novo valor apenas multiplicando‐o por 1,15, que é o fator de multiplicação. EXEMPLO Se o preço da gasolina é R$2,55 e teve aumento de 15%; então 2,55 *1,15 = R$2,93. Se o acréscimo for de 20%, multiplicamos por 1,20, e assim por diante. Veja a tabela abaixo: Acréscimo Fator de Multiplicação 6% 1,06 15% 1,15 20% 1,20 47% 1,47 67% 1,67 MEDIANA
Medida que representa exatamente o valor do MEIO de um conjunto de dados.
; Uma desvantagem da Média simples é que ela é sensível a qualquer valor, de modo que um valor ;
excepcional pode afetar drasticamente a média. A Mediana supera grandemente essa desvantagem, pois não é afetada pelos valores extremos. Pelo fato de a Mediana não ser tão sensível a valores extremos, ela é, em geral, usada para conjunto de dados com um número relativamente pequeno de valores extremos. Por exemplo, segundo Triola (2008, p. 65), a agência do Censo dos Estados Unidos registrou recentemente que a renda familiar mediana anual é 36.078 dólares. A mediana foi usada porque há um pequeno número de famílias com renda realmente alta.
A Mediana é o valor que está no meio de tal no sentido de que cerca de metade dos valores no conjunto de dados está abaixo da mediana e metade está acima dela. É representada por Md.
Para encontrar a Mediana basta ordenar os valores e depois siga um dos procedimentos seguintes: Se o número de valores for ímpar, a mediana será o número localizado no meio exato da lista. Se o número de valores for par, a mediana será encontrada pelo cálculo da média dos dois números do meio. Mediana = 138 Mediana = 138 + 140 = 139 2 Para encontrar, por exemplo, a mediana do conjunto de dados {03, 36, 41, 22, 59, 43, 12, 07, 17} NÃO ESQUEÇA DE ORDENÁ‐LOS PRIMEIRO! Uanderson Rebula de Oliveira
Estatística
- 40 MODA
Medida que representa o valor que mais se REPETE em um conjunto de dados.
; Na linguagem coloquial, moda é algo que está em evidência, ou seja, algo que se vê bastante! Na Estatística, como o próprio nome sugere, a Moda é aquele elemento que mais vezes aparece no conjunto! (é o elemento de maior freqüência). Sua determinação é simples, como se verá adiante. Repete uma vez = Moda Repete duas vezes = Bimodal Repete + de duas vezes = Polimodal Não repete = Amodal José Kelly Maria João Mário Kelly Lúcio → Moda = Kelly José Kelly Maria João Mário Kelly José → Bimodal = Kelly e José José Kelly Maria Mário Mário Kelly José → Polimodal = Kelly, José e Mário
José Kelly Maria João José Kelly José → Moda = José José Kelly Maria João Mário Kátia Lúcio → Amodal Da mesma maneira, a Moda pode ocorrer com dados quantitativos. Exemplo: Um professor organizou os resultados obtidos em uma prova com 25 alunos, conforme abaixo. Determine a Moda. 5,0 5,0 5,0 6,0 6,0 7,0 7,0 7,0 8,0 8,0 9,0 9,0 9,0 9,0 9,0 9,0
9,0 9,0 9,0 9,0 A Moda será 9,0, pois é a nota que mais se repete no conjunto de dados. Número de alunos
Desempenho dos alunos na prova
4,0 4,0 4,0 4,0 4,0 12
10
10
8
6
Moda
9,0 5
3
4
2
2
3
2
0
4,0
5,0
6,0 7,0
Nota
8,0
9,0
Outro exemplo: Um professor organizou os resultados obtidos em uma prova com 25 alunos, conforme Desempenho dos alunos na prova
Número de alunos
abaixo. Determine a Moda. 4,0 4,0 6,0 7,0 8,0
4,0 4,0 6,0 7,0 9,0 4,0 5,0 7,0 7,0 9,0 4,0 5,0 7,0 7,0 9,0 4,0 5,0 7,0 8,0 9,0 A Moda será 4,0 e 7,0, pois são as notas que mais se repetem. Portanto o conjunto será Bimodal. 12
10
8
7
Bimodal
4,0 e 7,0 7
6
4
2
4
3
2
2
6,0 7,0
Nota
8,0 9,0
0
4,0 5,0
Uanderson Rebula de Oliveira
Estatística
- 41 RELAÇÃO ENTRE MÉDIA, MEDIANA E MODA.
Quantidade de veículos
Quando a Média, Mediana e Moda se coincidem, chamamos a distribuição dos dados de simétrica. Média
Média = 70(3) + 80(4) + 90(7) + 100(4) + 110(3) = 90 Mediana Resultados dos registros 3+4+7+4+3 10
de um radar
Moda 8
7
Mediana = 90 6
4
4
4
3
3
Moda = 90 2
0
70 80 90 100 110 Velocidade (Km/h) Quando a Média, Mediana e Moda não se coincidem, chamamos a distribuição dos dados de assimétrica. Assimétrica à direita Resultados dos registros 12
de um radar
Mediana
Média = 70(1) + 80(3) + 90(6) + 100(9) + 110(2) = 94 Moda 10
9
Média 3+4+7+4+3 8
6
Mediana = 100 6
4
3
2
2
1
Moda = 100 0
70 80 90 100 110 Velocidade (Km/h) Quantidade de veículos
Quantidade de veículos
Assimétrica à esquerda Média = 70(2) + 80(9) + 90(6) + 100(3) + 110(1) = 86 3+4+7+4+3 Mediana = 80 Moda = 80 Mediana Resultados dos registros 12 Moda de um radar
10
Média 9
8
6
6
4
3
2
2
1
0
70 80 90 100 110 Velocidade (Km/h) Uanderson Rebula de Oliveira
Estatística
- 42 3.2 MEDIDAS DE VARIAÇÃO (OU DISPERSÃO) O termo “variação” sugere tornar vário ou diverso; alterar, diversificar; mudar; ser inconstante; não ser conforme, discrepar. Na maioria dos casos existirá variação em um conjunto de dados, independente da característica que você esteja medindo, pois nem todos os indivíduos terão o mesmo exato valor para todas as variáveis. EXEMPLO
Média das notas de Maria
10,0
Notas
8,0
Pequena variação a partir da Média Média das notas de José 9,5
10,0
6,5
6,5
7,0
7,5
7,5
6,0
4,0
7,0
8,0
Notas
Notas
Notas
Durante o ano letivo a Média das notas de João, Mário, Maria e José foi 7,0. Se considerarmos apenas a Média, não notaremos qualquer diferença entre os quatro alunos. No entanto, observa‐se que as notas são muito diferentes em relação a Média. Há variação de notas e, no caso de João e José, é bem discrepante. Veja abaixo: Grande variação Média das notas de João Média das notas de Mário Nenhuma variação a partir da Média 9,5
10,0
10,0
a partir da Média 9,0
7,0
8,0
7,0
8,0 7,0
7,0
7,0
7,0
6,0
6,0
6,0
4,0 3,5
4,0
2,0
2,0
0,0
0,0
1º Bim 2º Bim Média 3º Bim 4º Bim
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
Bimestres
Grande variação a partir da Média 8,5
6,0
6,0
4,0
4,0
2,0
2,0
0,0
0,0
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
1º Bim 2º Bim Média 3º Bim 4º Bim
Bimestres
Diante deste contexto, podemos questionar: qual o aluno é mais estável? Qual teve melhor desempenho? Qual o aluno com pior desempenho? Notadamente o aluno de melhor desempenho é o Mário, pois todas as suas notas foram 7,0 e, portanto, não houve nenhuma variação em relação a Média. Já José e João tiveram o pior desempenho pois suas notas estiveram muito distantes da Média. Neste capítulo vamos desenvolver maneiras específicas de realmente medirmos a variação, de modo que possamos usar números específicos em lugar de julgamento subjetivo. Outros exemplos de variações: ;
;
;
;
;
;
;
;
Os preços das casas variam de casa para casa, de ano para ano e de estado para estado. Os preços de um produto variam de supermercado para supermercado. O tempo que você leva para chegar ao trabalho varia dia a dia. O tamanho das peças produzidas em uma empresa também varia. A renda familiar varia de família para família, de país para país e de ano para ano. Os resultados das partidas de futebol, de temporada para temporada, variam. As notas que você tira nas provas, não diferente, também variam. Seu saldo bancário também varia, podendo ser de hora em hora, dia a dia, mês a mês. Uanderson Rebula de Oliveira
Estatística
- 43 VARIÂNCIA E DESVIO PADRÃO (amostral)
São medidas que representam “um valor médio de variação” em torno da média.
O desvio padrão é um modo que se usa para medir a variabilidade entre os números em um conjunto de dados. Assim como o termo sugere, um desvio padrão é um padrão (ou seja, algo típico) de desvio (ou distância) da média. O desvio padrão é uma estatística importante, mas, frequentemente, é omitida quando os resultados são relatados. Sem ele, você está recebendo apenas uma parte da história sobre os dados. Os estatísticos gostam de contar a história do homem que estava com um dos pés em um balde de água gelada e o outro em um balde de água fervendo. O homem dizia que, na média, ele estava se sentindo ótimo! Mas imagine a variabilidade da temperatura para cada um dos pés. Agora, colocando os pés no chão, o preço médio de uma casa, por exemplo, não lhe diz nada sobre a variedade de preços de casas com a qual você pode se deparar enquanto estiver procurando uma casa para comprar. A média dos salários pode não representar o que realmente está se passando em sua empresa se os salários forem extremamente discrepantes. Entendendo a Variância e o Desvio Padrão Calculando a Variância e o Desvio Padrão Notas
Desvios em torno da Média das notas de João 10,0 8,0
‐1,0 6,0 ‐3,5 6,0
4,0 3,5
2,0
0,0
1º Bim
9,5
9,0
2,5 2,0
7,0
Este problema foi resolvido pelos matemáticos: basta elevar cada desvio ao quadrado antes de somá‐los. Um número ao quadrado é sempre positivo, portanto a soma não se anula mais, e a média dos desvios ao quadrado pode ser calculada: 2º Bim
Média Bimestres
3º Bim
Notas Média Desvios Desvios elevado ao (x) ( x ) (x ‐ x ) quadrado (x ‐ x )2 3,5 ‐3,5 (‐3,5)2 = 12,25 6,0 ‐1,0 (‐1,0)2 = 1 7,0 9,5 2,5 (2,5)2 = 6,25 9,0 2,0 (2,0)2 = 4 n=4 ‐ ∑=0 ∑ = 23,5 4º Bim
Variância amostral
No gráfico percebemos que o desvio determina o Agora podemos calcular a média dos quadrados dos quanto cada elemento do conjunto de dados se desvios, chamada de Variância, representada por S2: distancia da média 7,0. No 1º Bim. faltam ‐3,5 para se 2
S2 = ( x − x) → 23,5 = 7,8 chegar a Média e no 2º Bim. ‐1,0. Já nos 3º e 4º Bim. 4 ‐ 1 temos +2,5 e +2,0 acima da média, respectivamente. n ‐ 1 Transpondo essas informações para uma tabela, temos: ∑
Notas (x) 3,5 6,0 9,5 9,0 ‐ Média ( x ) Desvios (x ‐ x ) ‐3,5 ‐1,0 2,5 2,0 ∑=0 A divisão por n−1 aparece por fornecer um melhor resultado do que a divisão por n. Desvio padrão amostral
Mas, se elevamos os desvios ao quadrado para poder calcular sua média, não seria correto que agora fizéssemos a raiz quadrada dessa média, para desfazer a 7,0 potenciação? Sim, e o valor dessa raiz é chamado Desvio padrão, representado por S: ‐ Desvio padrão → S = 7,8 = 2,8 Perceba que a soma dos desvios é igual a zero. Esta O desvio padrão indica que a maioria das notas de João característica não é exclusiva deste exemplo. Ela estão concentradas dentro dos limites de ± 2,8 em torno sempre ocorre e prende‐se ao fato de que a média é o da média 7,0. Ou seja, se concentrando entre 4,2 e 9,8. ponto de equilíbrio em um conjunto de dados. Fórmula da Variância e do Desvio padrão Como os desvios indicam o grau de variação dos Podemos concluir, então, o uso das fórmulas: valores em relação à média, seria interessante poder da Variância do Desvio padrão encontrar um único número que o representasse. Algo como a média dos desvios. Mas, para fazer essa média, 2
2
( x − x) S = precisamos somar os desvios e acabamos de ver que S = S 2 essa soma é sempre igual a zero. n ‐ 1 ∑
Uanderson Rebula de Oliveira
Estatística
- 44 Interpretação do Desvio padrão O desvio padrão é sempre um valor que está na mesma unidade dos dados originais. Um desvio padrão pequeno, basicamente, significa que os valores do conjunto de dados estão, na média, próximos do centro desse conjunto, enquanto um desvio padrão grande significa que os valores do conjunto de dados estão, na média, mais afastados do centro. Então, quanto mais espalhados ou dispersos forem os dados, maior será o desvio padrão e, quanto mais concentrados ou homogêneos forem os dados, menor será o desvio padrão. Se os valores forem iguais, ou seja, sem variação, o desvio padrão será zero. Um desvio padrão pequeno pode ser um bom objetivo em determinadas situações, onde os resultados são restritos, como exemplo, na produção e no controle de qualidade de uma indústria. Uma determinada peça de carro que deve ter centímetros de diâmetro para encaixar perfeitamente não pode apresentar um desvio padrão grande, nesse caso, significaria que acabariam sendo jogadas fora, pois ou não se encaixariam adequadamente ou os carros teriam problemas. Observe que o desvio padrão das notas de João indica que estão concentradas dentro dos limites de ± 2,4 em torno da média 7,0. Ou seja, se concentrando entre 4,6 e 9,4. Isto representa um desvio padrão grande. Calculando a Variância e o Desvio padrão das notas de Maria, José e Mário – passo a passo Notas de Maria (x) 6,5 6,5 7,5 7,5 1º Calcular a Média x = ∑ x 2º Calcular a Variância ( x − x)
S = ∑
2
2
S = n −1
n
3º Calcular o Desvio padrão 4 – 1 x = 28 → 7,0 4
S2 = (– 0,5)2 + (– 0,5)2 + (0,5)2 + (0,5)2 = 0,33 3 x = 6,5+6,5+7,5+7,5 S2 = (6,5 – 7,0)2 + (6,5 – 7,0)2 + (7,5 – 7,0)2 + (7,5 – 7,0)2 4 S2
0 , 33
S = S = 0,5 Interpretação: O resultado indica que a maioria das notas de Maria estão concentradas dentro dos limites de ± 0,5 em torno da Média 7,0. Ou seja, se concentrando entre 6,5 e 7,5. Notas de José (x) 4,0 9,5 8,5 6,0 1º Calcular a Média x = ∑ x 2º Calcular a Variância S2 = n
x = 4,0+9,5+8,5+6,5 4 x = 28 → 7,0 4
∑ ( x − x)
3º Calcular o Desvio padrão 2
S = n −1
S2
S2 = (4,0 – 7,0)2 + (9,5 – 7,0)2 + (8,5 – 7,0)2 + (6,0 – 7,0)2 4 ‐ 1 S = 6 ,16
S2 = (–3,0)2 + (2,5)2 + (1,5)2 + (–1,0)2 = 6,16 3 S = 2,5 Interpretação: O resultado indica que a maioria das notas de João estão concentradas dentro dos limites de ± 2,5 em torno da Média 7,0. Ou seja, se concentrando entre 4,5 e 9,5. Notas de Mário (x) 7,0 7,0 7,0 7,0 1º Calcular a Média x = ∑x 2º Calcular a Variância n
x = 7,0+7,0+7,0+7,0 ( x − x)
S = ∑
2
2
n −1
4 S2 = (7,0 – 7,0)2 + (7,0 – 7,0)2 + (7,0 – 7,0)2 + (7,0 – 7,0)2 = 0 28
x = → 7,0 4 ‐ 1 4
3º Calcular o Desvio padrão S = 0 Interpretação: O resultado indica que todas as notas de João estão dentro do limite de ± 0 em torno da Média 7,0. Ou seja, se concentrando exatamente na média 7,0. Portanto, sem variação. Uanderson Rebula de Oliveira
Estatística
- 45 COEFICIENTE DE VARIAÇÃO
É a medida relativa de variação que é sempre expressa
porcentagem (%).
sob a forma de
; Em algumas situações, podemos estar interessados em uma estatística que indique qual é o tamanho do desvio padrão em relação à média. A melhor forma de representá‐la é através do coeficiente de variação por ser expressa na forma de porcentagem. O coeficiente de variação, Exemplo: Considerando a Média 7,0 de João e o Desvio representado por Cv, é calculado da padrão de 2,8, temos: seguinte maneira: Cv = S x 100% Cv = S x 100% → x Ou seja: CV = Desvio padrão x 100% Média Cv = 2,8 x 100% → 40% 7,0 x O resultado indica que a Média 7,0 de João teve um desvio padrão em torno de 40%. Fazendo a Distribuição de Variabilidade das notas de João, Maria, José e Mário, temos: Alunos João Maria José Mário Média ( x ) 7,0 Desvio padrão (S) 2,8 0,5 2,5 0 Cv (%) Memória de cálculo de Cv (%) 40% 7% 36% 0% → 2,8/7,0 x 100 → 0,5/7,0 x 100 → 2,5/7,0 x 100 ‐ Assim, podemos concluir que o desempenho dos alunos será: 1º ‐ Mário 2º ‐ Maria 3º ‐ José 4º ‐ João Uanderson Rebula de Oliveira
Estatística
- 46 -
REFERÊNCIAS BIBLIOGRÁFICAS
ANDERSON, David R.; SWEENEY, Dennis J.; WILLIANS, Thomas A. Estatística aplicada à administração e
economia. 2 ed. São Paulo: Cengage Learning, 2009. 597 p.
BRUNI, Adriano Leal. Estatística para concursos. São Paulo: Atlas, 2008. 197p.
COSTA, Sérgio Francisco. Introdução ilustrada à estatística. 4 ed. São Paulo: Harbra, 2005. 399 p.
CRESPO, Antônio Arnot. Estatística fácil. 17 ed. São Paulo: Saraiva, 1999. 224 p.
FARIAS, Alfredo Alves et al. Introdução à estatística. 2 ed. Rio de Janeiro: LTC, 2003, 320 p.
GIOVANNI José Ruy; BONJORNO, José Roberto; GIOVANNI JR., José Rui. Matemática fundamental: uma nova
abordagem – volume único. São Paulo: FTD, 2002. 712 p.
HAZZAN, Samuel. Fundamentos da matemática elementar: Matemática financeira, comercial e estatística
descritiva. Volume 11. 1 ed. São Paulo: Atual editora, 2004. 230p.
HELP! Sistema de consulta interativa. Matemática. Rio de Janeiro: O globo, 1997. 319 p.
Instituto
Brasileiro
de
Geografia
e
Estatística
–
IBGE.
A
instituição.
Disponível
<http://www.ibge.gov.br/home/disseminacao/eventos/missao/default.shtm>. Acesso em 06 abr 2010.
em
LAPPONI, Juan Carlos. Estatística usando o Excel. 4 ed. Rio de Janeiro: Elsevier, 2005. 476 p.
LARSON, Ron; FARBER, Betsy. Estatística aplicada. 4 ed. São Paulo: Pearson, 2010. 637 p.
LEVINE, David M. et al. Estatística: teoria e aplicações. 5 ed. Rio de Janeiro: LTC, 2008. 752 p.
LOPES, Paulo Afonso. Probabilidade e estatística: conceitos, modelos e aplicações em Excel. Ernesto Reichmann,
1999. 174 p.
MONTGOMERY, Douglas C.; RUNGER, George C. Estatística aplicada e probabilidade para engenheiros. 2 ed.
Rio de Janeiro: LTC, 2003. 465 p.
MORETTIN, Luiz Gonzaga. Estatística básica e probabilidade. 7 ed. São Paulo: Makron books,1999. 209 p.
OLIVEIRA, Uanderson Rebula de. Ergonomia, higiene e segurança do trabalho. Resende-RJ: Apostila.
Universidade Estácio de Sá, 2009. 199 p..
Resumão – estatística. 2 ed. São Paulo: Barros, fischer & Associados, novembro 2006. 6 p.
RUMSEY, Deborah. Estatística para leigos. Rio de Janeiro: Alta books, 2009. 350 p.
SILVA, Ermes Medeiros et al. Estatística: para os cursos de Economia, Administração e Ciências Contábeis volume 1. 2 ed. São Paulo: Atlas, 1996. 189 p.
SMOLE, Kátia Stocco; DINIZ, Maria Ignez. Matemática–ensino médio. 5 ed. São Paulo: Saraiva, 2005. 558p.
TRIOLA, Mario F. Introdução à estatística. 10 ed. Rio de Janeiro: LTC, 2008. 696 p.
VASCONCELLOS, Maria José Couto; SCORDAMAGLIO, Maria Terezinha; CÂNDIDO, Suzana Laino. Coleção
Matemática. 1ª e 3ª série do ensino médio. São Paulo: Editora do Brasil, 2004. 232 p.
WERKEMA, Maria Cristina Catarino. As ferramentas da qualidade no gerenciamento dos processos. Belo
Horizonte: EDG, 1995. 128 p.
Uanderson Rebula de Oliveira
Estatística
- 47 SITES PARA CONSULTA
www.brasilescola.com
Instituto de pesquisa econômica aplicada - http://www.ipea.gov.br
Instituto brasileiro de geografia e estatística - http://www.ibge.gov.br
Associação Brasileira de Estatística - http://www.ime.usp.br/~abe/
www.ibope.com.br
ANEXO I - LIVROS RECOMENDADOS
Um livro introdutório de estatística que inclui um estilo de escrita
amigável, conteúdo que reflete as características importantes de um
curso introdutório moderno de estatística, o uso da tecnologia
computacional mais recente, de conjuntos de dados interessantes e
reais, e abundância de componentes pedagógicos. O CD-ROM inclui
os conjuntos de dados do Apêndice B do livro. Esses conjuntos de
dados encontram-se armazenados em formato texto, planilhas do
Minitab, planilhas do Excel e uma aplicação para a calculadora TI-83.
Inclui também programas para a calculadora gráfica TI-83 Plus®, o
Programa Estatístico STATDISK (Versão 9.1) e um suplemento do
Excel, desenvolvido para aumentar os recursos dos programas
estatísticos do Excel.
Este livro diferencia-se dos tradicionais livros,
materiais de referência e manuais de estatísticas,
pois possui: Explicações intuitivas e práticas sobre
conceitos estatísticos, ideias, técnicas, fórmulas e
cálculos. Passo a passo conciso e claro de
procedimentos que intuitivamente explicam
como lidar com problemas estatísticos. Exemplos
interessantes do mundo real relacionados ao
cotidiano pessoal e profissional. Respostas
honestas e sinceras para perguntas como “O que
isso realmente significa?” e “Quando e como eu
vou usar isso?”
Neste livro você encontrará:
Explicações em português de fácil entendimento.
Informações fáceis de localizar e passo-a-passo.
Ícones e outros recursos de identificação e
memorização. Folha de cola para destacar com
informações práticas. Listas dos 10 melhores
relacionados ao assunto. Um toque de humor e
diversão.
Onde comprar: www.submarino.com.br
Uanderson Rebula de Oliveira
Estatística
- 48 -
ANEXO II - SOFTWARE BIOESTAT
Texto extraído da tese de doutorado em Engenharia de Ualison Rebula de Oliveira Existem inúmeros recursos tecnológicos para a análise estatística de dados, que vão desde calculadoras, a exemplo da TI – 83 PLUS, a aplicativos específicos, tais como o STATDISK e o MINITAB (TRIOLA, 2005). Assim, buscando‐se recursos computacionais que facilitassem o tratamento de dados, vários aplicativos e softwares estatísticos foram pesquisados, dos quais se destacam a planilha Excel, o STATDISK, o MINITAB, o BioEstat, o SPSS e algumas páginas na Internet que oferecem programas em Javascript para cálculos on‐line, a exemplo da página na Internet www.stat.ucla.edu. Após análise de pós e contras de cada aplicativo pesquisado, selecionou‐se o pacote estatístico BioEstat, disponível para download no site www.mamiraua.org.br, por possuir as seguintes características positivas: i) serventia tanto para a Estatística descritiva como para testes estatísticos não‐paramétricos; ii) ser em português; iii) possuir manual em PDF com diversos exemplos; iv) ser de fácil utilização; v) ser gratuito; vi) ser referenciado em vários livros, sites e entidades de pesquisa – conforme Siegel & Castellan Junior (2006), o BioEstat é o melhor programa disponível na atualidade para o cálculo do qui‐quadrado; vii) possuir apoio do CNPQ; e viii) estar na versão 5.0 e possuir mais de 20 anos de criação. INTERFACE BIOESTAT Baixar software: www.mamiraua.org.br Uanderson Rebula de Oliveira
Estatística
- 49 Anexo III - ESTATÍSTICA NO EXCEL
O Excel dispõe da função “Estatística”. Assim, tudo que vimos poderá ser desenvolvido pelo excel, bastando inserir os valores da variável de interesse.
Para saber mais, basta adquirir o livro “Estatística usando o excel”, de Juan Carlos Lapponi. WWW.SUBMARINO.COM.BR 4ª Edição, Edição 2005, 496 págs. Editora Elsevier Campus ‐ Acompanha CD‐ROM com Planilhas, Modelos, Simuladores etc. para Excel. O conteúdo deste livro é útil para: Estudantes que cursam Estatística nas diversas áreas do conhecimento e em diferentes níveis de graduação como, em ordem alfabética, Administração, Biologia, Contabilidade, Economia, Engenharia, Finanças, Marketing, Medicina, etc. Estudantes que necessitam aprimorar ou complementar seus conhecimentos de Estatística utilizando o Excel. Profissionais das diversas áreas que utilizam os conceitos de Estatística e necessitam, ou gostariam, de utilizar as funções estatísticas, as ferramentas de análise, planilhas, modelos e simuladores de estatística em Excel. Todos aqueles que poderão utilizar as planilhas, modelos e simuladores de estatística em Excel da forma como estão no CD‐Rom, ou modificando‐os, para atender às suas necessidades. Alunos de áreas correlatas que utilizarão estatística e desejam antecipar seu aprendizado e agregar valor ao seu conhecimento visando o mercado de trabalho. Usuários de Excel que desejam conhecer e aprender a utilizar os recursos de Estatística disponíveis. TÓPICOS • DADOS, VARIÁVEIS E AMOSTRAS • DESCRIÇÃO DE AMOSTRAS COM TABELAS E GRÁFICOS • MEDIDAS DE TENDÊNCIA CENTRAL • MEDIDAS DE DISPERSÃO/VARIAÇÃO • PROBABILIDADE • CORRELAÇÃO • VARIÁVEIS ALEATÓRIAS E DISTRIBUIÇÕES DISCRETAS • DISTRIBUIÇÕES CONTÍNUAS COMBINAÇÃO LINEAR DE VARIÁVEIS ALEATÓRIAS • • DISTRIBUIÇÃO AMOSTRAL • ESTIMAÇÃO • TESTE DE HIPÓTESES • TESTES DE HIPÓTESES COM DUAS AMOSTRAS • ANÁLISE DA VARIÂNCIA • REGRESSÃO LINEAR • AJUSTE NÃO LINEAR Uanderson Rebula de Oliveira
Estatística
Download

Estatística para engenharia