NOÇÕES BÁSICAS DE ESTATÍSTICA Tipos de Estatísticas Estatística descritiva É a parte mais conhecida. Quem vê o noticiário, na televisão ou nos jornais, sabe o quão freqüente é o uso de médias, índices e gráficos nas notícias. Estatística inferencial (ou indutiva) A tomada de decisões sobre a população, com base em estudos feitos sobre os dados da amostra, constitui o problema central da inferência estatística. TERMOS DE UMA PESQUISA ESTATÍSTICA População e amostra Um total de elementos descreve o universo estatístico, como nem sempre é possível consultar a todos, recorremos, então, ao que se chama de amostra, ou seja, um grupo de elementos que consultados, permitem que se chegue a um resultado mais próximo da realidade. A amostra pode ser um indivíduo ou um objeto. TIPOS DE AMOSTRAS Amostragem casual ou aleatória simples: É o processo mais elementar e freqüentemente utilizado. É equivalente a um sorteio lotérico. Amostragem proporcional estratificada: Quando a população se divide em estratos (subpopulações) Amostragem sistemática: Quando os elementos da população já se acham ordenados, não há necessidade de construir o sistema de referência. São exemplos os prontuários médicos de um hospital, os prédios de uma rua, etc. Amostragem por conglomerados (ou agrupamentos): Algumas populações não permitem ou tornam extremamente difícil que se identifiquem seus elementos. Agrupamentos típicos são quarteirões, famílias, organizações, agências, edifícios, etc. Amostragem acidental: Trata-se de uma amostra formada por aqueles elementos que vão aparecendo, que são possíveis de se obter até completar o número de elementos da amostra. Geralmente utilizada em pesquisas de opinião, em que os entrevistados são acidentalmente escolhidos. Amostragem intencional: De acordo com determinado critério, é escolhido intencionalmente um grupo de elementos que irá compor a amostra. O investigador se dirige intencionalmente a grupos de elementos dos quais deseja saber a opinião. Amostragem por quotas: Um dos métodos de amostragem mais comumente usado em levantamentos de mercado e em prévias eleitorais. Variável no min al qualitativ a ordinal Variável discreta quantitati va contínua Variável qualitativa nominal são valores que estão relacionados a uma qualidade ou atributo dos elementos pesquisados sem uma ordem nos seus valores. Ex: cor de cabelo ou esporte favorito Variável qualitativa ordinal são valores que estão relacionados a uma qualidade ou atributo dos elementos pesquisados com uma ordem nos seus valores Ex: grau de instrução: fundamental, médio, superior, etc. Variável quantitativa discreta são valores que estão relacionados a números, se tratando de contagem (números inteiros) Ex: Número de irmãos: 0, 1, 2, etc. Variável quantitativa contínua são valores que estão relacionados a números, se tratando de medidas (números reais) Ex: Altura:1,55 m, 1,80 m, etc. ROL E AMPLITUDE Rol: É o arranjo dos dados Brutos em ordem crescente ou decrescentes. Amplitude total: É a diferença o maior e o menor dos valores observados. FREQÜÊNCIA ABSOLUTA(FA) (FR) E FREQÜÊNCIA RELATIVA O número de vezes que um valor de uma variável é citado representa a freqüência absoluta daquele valor. A freqüência relativa é a que registra a freqüência absoluta em relação ao total de citações. Ex: Suponha que entre um grupo de turistas, participantes de uma excursão, tenha sido feita uma pesquisa sobre a nacionalidade de cada um e que o resultado dela tenha sido o seguinte: Pedro: brasileiro; Ana: brasileira; Ramón: espanhol; Laura: espanhola; Cláudia: brasileira; Sergio: brasileiro; Raul: argentino; Nélson: brasileiro; Sílvia: brasileira; Pablo: espanhol. Nesse exemplo, a variável é a “nacionalidade”, os valores são: “brasileira, espanhola e argentina”. Nacionalidade Freqüência Absoluta (FA) Freqüência Relativa (FR) Brasileira 6 6 ou 0,6 ou 60% 10 Espanhola 3 3 ou 0,3 ou 30% 10 Argentina 1 1 ou 0,1 ou 10% 10 Total 10 10 ou 1 ou 100% 10 REPRESENTAÇÃO GRÁFICA Gráficos de segmentos Os gráficos de segmentos são utilizados principalmente para mostrar a evolução das freqüências dos valores de uma variável durante certo período. A tabela abaixo mostra a venda de livros em uma livraria no segundo semestre de determinado ano. Com base na tabela temos o gráfico de segmentos Gráficos de barras Com base no “desempenho em Química” demonstrando pelos alunos de uma classe, um professor elaborou a seguinte tabela: Com os dados da tabela é possível construir o gráfico de barras Gráficos de setores (ou gráfico “pizza”) Em um shopping há três salas de cinema, e o número de espectadores em cada uma delas num determinado dia da semana foi de 300 na sala A, 200 na B e 500 na C. Observe a tabela de freqüências e depois em gráficos de setores: Em cada gráfico de setores o círculo todo indica o total (1000 espectadores ou 100%) e cada setor indica a ocupação de uma sala. Na construção do gráfico de setores, determina-se o ângulo correspondente a cada setor por regra de três. Veja como exemplo o da sala A 300 x x 108 1000 360 30 x x 108 Usando a freqüência relativa (em %), 100 360 Usando a freqüência absoluta, MEDIDAS DE TENDÊNCIA CENTRAL Média aritmética (MA) Considerando um grupo de pessoas com 22, 20, 21, 24 e 20 anos, temos que: 22 20 21 24 20 107 MA 21,4 . 5 5 Assim, a média aritmética ou a média da idade do grupo é 21,4 anos. n x x1 x2 x3 ... xn i 1 MA Logo de forma geral temos: n n i MÉDIA PONDERADA MODA (MO) Moda é a medida de tendência central definida como o valor mais freqüente de um grupo de valores observados. Ex: 1) Do grupo de pessoas com idades de 2, 3, 2, 1, 2 e 50 anos, a moda é 2 anos (Mo = 2). Observação: Quando não há repetição de números, como, por exemplo, para 7, 9, 4, 5 e 8, não há moda. MEDIANA (ME) Dados n números em ordem crescente ou decrescente, a mediana será: O número que ocupar a posição central se n for ímpar; Ex: Numa classe, foram anotadas as faltas durante um período de 15 dias: 3, 5, 2, 0, 2, 1, 3, 4, 5, 7, 0, 2, 3, 4 e 7 Em ordem crescente, temos: 0 ,0 , 1,2,2 ,2 ,3, 3, 3 ,4 , 4,5,5 ,7 ,7, 7 valores Me 3 7 valores A média aritmética dos dois números que estiverem no centro se n for par. Ex: As idades dos alunos de uma equipe são 12, 16, 14, 12, 13, 16, 16 e 17 anos Colocamos inicialmente na ordem crescente ou decrescente: 12,12,13, 14 , 16 ,16,16,17 As duas posições centrais 14 16 Me 15 2 MEDIDAS DE DISPERSÃO As medidas de dispersão são usadas quando as medidas de tendência central são insuficientes. Variância (V) n É dado pela fórmula V ( x MA) i 1 2 i n para diferenciar a dispersão das variáveis e é suficiente Desvio Padrão (DP) DP V . Ele É a raiz quadrada da variância facilita a interpretação dos dados da variância. Observe a seguinte situação: Uma pessoa é encarregada de organizar atividades de lazer para um grupo de 6 pessoas e recebe a informação de que a média de idade do grupo é 20 anos. Nesse caso, apenas a informação da média não é suficiente para planejar as atividades, pois podemos ter grupos com média de idade de 20 anos e características totalmente diferentes. Observemos alguns grupos possíveis: Grupo A: 20 anos; 20 anos; 20 anos; 20 anos; 20 anos; 20 anos. MA Grupo B: 22 anos; 23 anos; 18 anos; 19 anos; 20 anos; 18 anos. MA 20 20 20 20 20 20 120 20 anos 6 6 22 23 18 19 20 18 120 20 anos 6 6 Grupo C: 6 anos; 62 anos; 39 anos; 4 anos; 8 anos; 1 ano. MA 6 62 39 4 8 1 120 20 anos 6 6 Neste tipo de situação devemos usar as medidas de dispersão pois o grupo C é um exemplo claro de um grupo heterogêneo. O cálculo da variância e do desvio padrão dos grupos acima é dado por: Grupo A: 20 anos; 20 anos; 20 anos; 20 anos; 20 anos; 20 anos MA = 20 Desvios: 20 20 0 , todos iguais a zero V=0 DP 0 = 0 ano Grupo B: 22 anos; 23 anos; 18 anos; 19 anos; 20 anos; 18 anos. MA = 20 Desvios: 22 20 2 ; 23 20 3 ;18 20 2 ; 19 20 1 ; 20 20 0 ; 18 20 2 22 32 (2)2 (1)2 02 (2)2 4 9 4 1 0 4 22 V 3,6 6 6 6 DP 3,6 1,9 anos Grupo C: 6 anos; 62 anos; 39 anos; 4 anos; 8 anos; 1 ano. MA = 20 Desvios: 6 20 14 ; 8 20 12 ; 1 20 19 62 20 42 ; 39 20 19 ; 4 20 16 ; (14)2 422 192 (16)2 (12)2 (19)2 196 1764 361 256 144 361 V 6 6 3082 513,6 6 DP 513,6 22,6 anos