A seguir, uma demonstração do livro. Para adquirir a versão completa em papel, acesse: www.pagina10.com.br Aprendendo Estatística - 2 1 Visão Geral da Estatística Neste capítulo, apresentamos uma imagem abrangente do que é a Estatística através de seus principais objetos de estudo. Acreditamos que estes são os principais tradutores de sua intrínseca definição. Desta forma, através dos princípios a serem apresentados de suas partes Descritiva, Inferencial, Probabilidades e Testes de Hipóteses, identificamos o que é a Estatística e como tem sido uma ferramenta fundamental na gestão de informações para a tomada de decisões no âmbito organizacional e também como tem sido empregada na validação das hipóteses científicas. Os autores preferem fazer do primeiro capítulo de seus trabalhos uma espécie de vista panorâmica do território a ser estudado, o que está de acordo também com o princípio holístico de ver antes o todo e depois as partes. Outra razão para tal é que muitos leem apenas o primeiro capítulo dos livros técnicos e, desta forma, acreditamos que a leitura deste dará uma ideia mais próxima do que seja a Estatística, sem limitá-la a alguma de suas partes. A utilização do Ms Excel será incentivada em alguns momentos específicos deste capítulo conceitual, mas será bem mais explorada nos seguintes, onde os cálculos se tornarão bem mais complexos. Vamos incentivar o uso do programa gratuito Graph. Aprendendo Estatística - 3 HISTÓRIA E SIGNIFICADOS É provável que, antes da criação dos A prática de reunir informações sobre pessoas, animais, objetos, números, pedras eram usadas para fatos, entre outros, remonta à Antiguidade e, talvez, à época anterior à representar quantidades. escrita. Contar o número de pessoas, de propriedades, de terras Estas tábuas ainda hoje são referências para os cálculos das companhias de seguros. produtivas, de bois era hábito dos povos antigos, como os chineses, babilônios e egípcios. Nesta mesma época, entre os hebreus, havia o censo populacional. No século XI, o rei Guilherme da Inglaterra ordenou Com o 1° significado, dizemos livro de Estatística, faculdade de Estatística, curso de Estatatística, etc. É Estatística com letra inicial maiúscula (substantivo próprio) ao contrário de estatística para os 2 significados seguintes. que fosse feito um levantamento de terras, proprietários, empregados e animais para implementar uma política fiscal. No século XVII, o inglês John Graunt publicou um trabalho intitulado a Aritmética Política onde analisou nascimentos e mortes a partir de tábuas de mortalidade. A palavra estatística (usada pela primeira vez no século XVIII) vem do latim status, que significa estado. Isso porque era de uso exclusivo dos estadistas, reis, e demais líderes políticos. Hoje, a palavra Se observarmos os números de paradas de estatística pode ser usada com três significados diferentes, porém uma máquina ao longo de um dia de trabalho, relacionados entre si: ao final de 14 dias, teremos a estatística das 1º) a Estatística = o ramo da Matemática Aplicada; paradas daquela máquina. A palavra aqui foi 2º) uma estatística = uma coleção de informações; usada com o seu 2º significado: 3º) uma estatística = um valor numérico calculado a partir de uma amostra 7 9 4 1 0 10 1 9 2 0 0 3 0 1 (que estimará um parâmetro que é um valor numérico da população). Com o 1° significado, Estatística é o ramo da Matemática Aplicada cujos Com o 3° significado, teremos que são princípios apresentamos neste capítulo. Com o 2° significado, estatística é estatísticas: média, desvio padrão, curva de uma coleção de informações obtidas a partir de uma observação ou de frequência, etc, todos estes valores uma pesquisa. Com o 3° significado, estatística também significa um valor calculados a partir de uma amostra. Trata-se, obtido a partir de uma amostra que pretende estimar algum parâmetro da portanto, de um significado mais técnico, de população. São conceitos inter-relacionados conforme sugere a frase: uso restrito aos estatísticos ou ainda a quem "Num trabalho de Estatística (1º), a estatística (2º) da amostra de 10 alunos estuda ou trabalha com Estatística. resultou na média de idade 24 anos, que é uma boa estatística (3º) para estimar as idades da população dos 80 alunos". Porém, resumos feitos por outras pessoas não terão a mesma eficácia devido à subjetividade da importância atribuída aos conteúdos e também a omissões feitas pela pessoa que resumiu que poderão ser essenciais para quem tentar entender o livro através do resumo. CONHECENDO OS DADOS PESQUISADOS Quando estudamos um livro técnico com muitas informações, é muito aconselhável, à medida que vamos lendo, fazer resumos de suas partes mais importantes. A partir do resumo feito de todo o livro, poderemos ter uma compreensão geral do mesmo, sem nos ater a detalhes de pouca importância. Além disso, depois de algum tempo, não será mais necessário ler novamente tal livro, apenas o resumo feito naquela ocasião. Algo parecido ocorre com uma grande quantidade de informações numéricas: para que possam ser globalmente assimiladas, é importante recorrer a espécies de resumos que poderão ter a forma de tabelas, gráficos, médias, desvios padrão, percentis, etc. Isso porque a mente humana encontra dificuldades quando lida com uma grande quantidade de informações, principalmente, informações numéricas. Estes resumos serão capazes de substituí-las de modo a permitir uma compreensão global daquelas informações. Estes são os objetos de estudo da parte da Estatística denominada Descritiva. Aprendendo Estatística - 4 Exemplo 1A Um gerente deseja avaliar os valores com que são abertas novas A tabela, então, constitui seu primeiro cadernetas de poupança em seu banco. Para isso, consulta seu sistema e resumo: muitas informações foram faz o levantamento dos depósitos de 40 de clientes que abriram conta no resumidas nela que contém apenas o valor último mês e os transcreve para a seguinte tabela: do 1º depósito. O fato de estar também classificada em ordem crescente aumenta 100 100 120 150 180 180 180 180 180 200 sua eficiência em ser uma fonte de 200 200 210 220 250 250 250 250 250 280 referência para conclusões. 280 300 300 320 330 350 370 380 390 400 400 400 400 450 490 500 500 500 1.000 2.000 Com este segundo resumo, já é possível identificar mais rapidamente qual é a faixa do Conforme dissemos, muitos números, assim como muitos depósito de maior frequência (entre 200 e documentos, tendem a confundir nossa mente. Desta forma, podemos 299), qual de menor (600 ou mais) e perceber lançar mão de um segundo resumo: agrupar valores de depósitos algumas tendências, tais como o decaimento próximos dentro de um mesmo intervalo de modo a obter um pequeno da frequência após o valor de R$ 300,00. A número de intervalos e as frequências com que tais depósitos escolha do passo do intervalo de R$ 100,00 ocorreram nestes intervalos: foi absolutamente arbitrária e visou apenas à facilidade de manipulação dos valores. Este Depósito de princípio será o adotado em todo o livro, mas 100 a 199 9 200 a 299 12 300 a 399 8 400 a 499 6 500 a 599 3 600 ou mais 2 há autores que preferem utilizar fórmulas e procedimentos para escolher o número e o tamanho dos intervalos. Número de depósitos Para montar um histograma a partir de um gráfico de frequências, basta representar os Um histograma de frequências disponibiliza as mesmas informações intervalos no eixo horizontal e as frequências anteriores num gráfico de colunas justapostas verticais. Observe que isso no eixo vertical. Em seguida, você fará os serve para agilizar ainda mais as comparações entre as frequências: nossa retângulos onde as bases serão os intervalos mente leva muito menos tempo para comparar tamanhos do que e as alturas serão as números. Assim, é mais fácil comparar os tamanhos das colunas do frequências. Para montar os histogramas gráfico seguinte do que os números da tabela anterior: neste livro, utilizamos em geral o programa gratuito Graph e o Ms Excel quando 12 especificado. 10 Assim, R$ 349,75 é o valor que os 40 8 depósitos teriam se em vez de variáveis 6 (diferentes) os mesmos fossem fixos (iguais). 4 2 100 200 300 400 500 600 + Um terceiro resumo ainda mais familiar do que o anterior trata-se da média dos depósitos, isto é, a soma de todos os seus valores dividida pelo número de depósitos: x 100 100 120 ... 1.000 2.000 40 x 349,75 Aprendendo Estatística - 5 Na célula B7, colocamos a fórmula Exemplo 1B SE(B2<200;1;SE(B2<300; Vamos desenvolver o exemplo anterior no ambiente MS Excel. 2;SE(B2<400;3;SE(B2<500;4; SE(B2<600;5;6))))) para atribuir à célula B7 o intervalo de 1 a 6 a que pertence o valor em B2. Trata-se de um teste lógico SE aninhado: se B2 for menor que 200, então, o valor pertencerá ao intervalo 1. Caso contrário, haverá um novo teste: se B2 for menor que 300, pertencerá ao 2, e assim por diante. Depois disso, clique e arraste para as demais células. Usamos a função CONT.SE() parametrizada Na primeira tabela, temos os valores originais. Na segunda, atribuímos da seguinte maneira:=CONT.SE(B$7:K$10; cada um dos valores da 1ª aos intervalos de 1 a 6 conforme a função E14) que conta, na 2ª tabela (B$7:K$10), lógica SE() do Excel explicado na coluna auxiliar. quantas ocorrências de E14, isto é, números 1, aparecem. Em seguida, clicamos e arrastamos para as demais células. Para retirar as linhas de grade, clique em algum lugar fora das colunas, escolha 'Opções de Gráfico > Linhas de Grade'. Para retirar a borda e a área, clique com o botão direito no mesmo local e escolha 'Formatar Área de Plotagem'. Para obter espaçamento zero entre as colunas, clique sobre o gráfico com o botão direito, escolha 'Formatar Sequência de Dados > Opções > largura do espaçamento = 0'. Comparando este Em seguida, montamos a tabela anterior onde definimos, para cada intervalo de 1 a 6, os seus limites inferior e superior, além da média. Na coluna frequência, digitamos a fórmula que contará na 2ª tabela quantas são as células de cada um dos intervalos. histograma obtido com o Excel 2003 ao obtido com o programa Graph exibido na página anterior, vemos a diferença dos valores expressos no eixo horizontal: enquanto que no Graph é possível especificar os intervalos, no Excel temos que atribuir um único número para cada coluna, o que escolhemos a média do intervalo que a mesma representa. Finalmente, obtemos o histograma, fazendo alguns ajustes ao gráfico de colunas do Excel, e a média dos valores através da função MÉDIA(). Aprenderemos mais sobre outros tipos de resumos, isto é, sobre outras ferramentas estatísticas usadas para melhor descrever os dados pesquisados, como a variância, a distribuição de frequências e o desvio padrão e os percentis. Como dissemos, a parte da Estatística que se preocupa com tratamento dos dados para facilitar as conclusões sobre os mesmos é chamada de Estatística Descritiva e será estudada em detalhes nos próximos dois capítulos deste trabalho. Aprendendo Estatística - 6 EXERCÍCIOS 1) Nas afirmações seguintes, a palavra ESTATÍSTICA está sendo usada em um de seus 3 diferentes significados: 1°) o ramo da Matemática Aplicada; 2°) uma coleção de informações; 3°) um valor associado a uma amostra. Coloque os números correspondentes ao final de cada uma delas: a) Meu médico não gosta de estatísticas. ( ) b) A faculdade de Estatística é cursada em 5 anos. ( ) c) Esta é a segunda vez que Paula faz a disciplina de Estatística. ( d) A média daqueles valores não é uma estatística confiável. ( e) Os acidentes de trânsito constituem tristes estatísticas. ( ) ) ) f) O desvio padrão é uma excelente estatística para avaliar variações. ( ) 2) O histograma ao lado mostra as idades das crianças que foram deixadas num playground enquanto seus pais faziam compras durante um horário específico. Encontre: a) o número de crianças; b) a média de idade das crianças, considerando as frequências das idades médias em cada um dos intervalos. 10 8 6 4 2 2 6 5 4 3 3) Um professor aplicou uma prova a 28 alunos e seus desempenhos 7 estão sendo mostrados na tabela seguinte: 1,0 2,0 2,5 7,0 0,0 5,0 7,0 1,0 6,0 8,0 6,5 9,0 1,5 9,5 9,0 3,0 0,0 8,5 3,5 5,5 9,0 9,0 0,5 6,0 7,5 8,5 2,0 0,0 a) Monte um histograma com 5 intervalos. b) Calcule a média das respostas dadas e avalie se representa o desempenho de um aluno típico. c) Faça uma interpretação com base no histograma sobre o desempenho dos alunos. 4) Um questionário com 20 nomes de políticos brasileiros solicitou a atribuição de uma nota de 0 a 4 para cada um deles. A tabela ao lado 0 0 0 2 3 1 1 0 3 0 1 3 2 0 1 4 0 2 2 1 mostra o que uma pessoa respondeu. Monte um histograma onde o eixo horizontal são as próprias respostas e Conclua o que tal pessoa acha dos políticos em geral. 5) Usando o Ms Excel, proceda como no exemplo 1B para obter os intervalos de 10 em 10, o histograma e a média para os valores da seguinte tabela: 3 5 6 6 7 8 8 9 10 11 12 14 14 19 22 24 27 29 33 35 38 44 46 46 48 50 52 52 53 54 58 59 59 60 61 62 62 64 65 66 Aprendendo Estatística - 7 Visite o site e conheça melhor estes e outros livros didáticos. www.pagina10.com.br