Noções de Estatística - I Conceito Estatística é um ramo da Matemática Aplicada. A palavra Estatística provém da palavra Status e é usada em dois sentidos: •Estatísticas (no plural) referem-se a dados numéricos e são informações sobre determinado assunto, coisa, grupo de pessoas etc. obtidas por um pesquisador. •Estatística (no singular) significa o conjunto de métodos usados na condensação, análises e interpretações de dados numéricos. De um modo geral, conceitua-se Estatística da seguinte forma: É ciência, quando estuda populações; é método, quando serve de instrumento a uma outra ciência. POPULAÇÃO E AMOSTRA • População É todo o conjunto de elementos que possuam ao menos uma característica comum observável. • Parâmetros São caracterísiticas numéricas da população. Ex: QI médio dos estudantes do Ensino Médio do Brasil. Ex: Todos os alunos do Ensino Médio do Brasil. • Estimativas •Amostra É uma parte da população que será avaliada por um critério comum. Ex: 500 alunos do Ensino Médio do Brasil. Em geral, por problemas de tempo e dinheiro, trabalha-se com amostras e não com a população. Apostila de Exercícios - pág. 23 – Exercício nº 1 1. As idades dos 25 participantes de uma festa, em anos, estão descritas a seguir: 16, 15, 18, 14, 12, 18, 15, 16, 18, 12, 15, 14, 16, 15, 18, 16, 18, 16, 15, 14, 16, 15, 14, 16, 14. • Dados Brutos É o conjunto de dados numéricos obtidos e que ainda não foram organizados. 16, 15, 18, 14, 12, 18, 15, 16, 18, 12, 15, 14, 16, 15, 18, 16, 18, 16, 15, 14, 16, 15, 14, 16, 14. • Rol É o arranjo dos dados brutos em ordem crescente (ou decrescente). RESOLUÇÃO: a) rol 12, 12, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 15, 16, 16, 16, 16, 16, 16, 16, 18, 18, 18, 18, 18 • Amplitude (H): É a diferença entre o maior e o menor dos valores observados. RESOLUÇÃO: b) H = 18 – 12 = 6 DISTRIBUIÇÃO DAS FREQUÊNCIAS: É o arranjo dos valores das variáveis e suas respectivas frequências. • Frequência absoluta (fi) : É o número de vezes que o elemento aparece na amostra. RESOLUÇÃO: • Frequência relativa (fr): (n é o número de elementos da amostra.) • Frequência relativa percentual (f%): • Frequência absoluta acumulada (fa): É a soma da frequência do valor da variável com todas as frequências anteriores. • Frequência relativa acumulada (fra): É a soma da frequência relativa do valor da variável com todas as frequências relativas anteriores. • Frequência percentual acumulada (f%a): • Moda (Mo): É o valor da frequência máxima. RESOLUÇÃO: • Mediana (Md): Colocando-se os valores da variável em ordem crescente, a mediana é o elemento que ocupa a posição central. RESOLUÇÃO: • MÉDIA: RESOLUÇÃO: IMPORTANTE!!!! Caso o número de elementos do Rol for par, calculamos a mediana pela média aritmética dos dois elementos centrais. Representação Gráfica Setores Circulares (Pizza) Foi feita uma Pesquisa a 400 alunos de uma escola sobre as atividades esportivas que gostariam de ter na escola. O resultado foi o seguinte: Atividade Esportiva Nº de alunos Freqüência Absoluta Freqüencia relativa Voleibol Basquetebol 80 120 20% 30% Futebol 160 40% Natação Total 40 400 10% 100% Representação Gráfica Setores Circulares (Pizza) Preferência 30% Volei Basquete futebol 40% 20% 10% natação Médias Média Aritmética Simples Média Aritmética ( X ) - É o quociente da divisão da soma dos valores da variável pelo número deles: x x 1 x 2 ... x n n Exemplo: Sabendo-se que a produção leiteira da vaca A, durante uma semana, foi de 10, 14, 13, 15, 16, 18 e 12 litros, temos, para produção média da semana: X = 10 + 14 + 13 + 15 + 16 + 18 + 12 = 98 = 14 7 7 Média Aritmética Ponderada Exemplo: O exame de seleção pode ser composto de 3 provas onde as duas primeiras tem peso 1 e a terceira tem peso 2. Um candidato com notas 70, 75 e 90 terá média final: Durante o ano letivo, um professor de matemática aplicou cinco provas para seus alunos. A tabela apresenta as notas obtidas por um determinado aluno em quatro das cinco provas realizadas e os pesos estabelecidos pelo professor para cada prova. (UNESP-09) Se o aluno foi aprovado com média final ponderada igual a 7,3, calculada entre as cinco provas, a nota obtida por esse aluno na prova IV foi: 1.(6,5) 2.(7,3) 3.(7,5) 2.x 2.(6,2) 7,3 56 + 2x = 73 x = 8,5 1 2 3 2 2 Noções de Estatística - II • • MEDIDAS DE POSIÇÃO As medidas de posição servem para localizar os dados sobre o eixo da variável em questão. As mais importantes são: a média, a mediana e a moda. A média e a mediana tendem a se localizar em valores centrais de um conjunto de dados. Por essa razão, costuma-se dizer que são medidas de tendência central. A moda, por sua vez, indica a posição de maior concentração de dados. MEDIDAS DE DISPERSÃO • Servem para indicar o quanto os dados se apresentam dispersos em torno da região central. Caracterizam, portanto, o grau de variação existente no conjunto de valores e, por isso, são também chamadas MEDIDAS DE VARIABILIDADE. MEDIDAS DE DISPERSÃO • Amplitude É a diferença entre o maior valor e o menor valor de um conjunto de dados. Ex.: Os valores seguintes representam o número de gols marcados pela seleção brasileira nas últimas 5 copas do mundo. 11, 14, 18, 10, 9 Amplitude = 18 – 9 = 9 • Desvio Uma maneira de medir o grau de dispersão ou concentração de cada valor da variável em relação às medidas de tendência central é fazer a diferença entre o valor da variável e a média. Ex.: Um aluno obteve as seguintes notas na disciplina de matemática nos 4 bimestres: Média aritmética = 5 8 6 9 7 4 Desvios: nota 1: 5 – 7 = - 2 nota 2: 8 – 7 = 1 nota 3: 6 – 7 = - 1 nota 4: 9 – 7 = 2 • Variância É a média aritmética dos quadrados dos desvios. Desvios: nota 1: 5 – 7 = - 2 nota 2: 8 – 7 = 1 nota 3: 6 – 7 = - 1 nota 4: 9 – 7 = 2 • Desvio Padrão: É a raiz quadrada da variância. • • Quanto mais próximo de zero é o desvio padrão, mais homogênea (regular) é a amostra. Candidatos que obtém menor desvio padrão são considerados mais regulares. Ex.: As notas de dois alunos X e Y estão representadas no quadro abaixo. Paulo João N1 N2 N3 N4 5 2 5 8 4 8 3 5 Por meio do desvio padrão, qual deles apresentou desempenho mais regular? Média aritmética = Paulo 5258 5 4 Desvios: nota 1: 5 – 5 = 0 Paulo nota 2: 2 – 5 = - 3 nota 3: 5 – 5 = 0 nota 4: 8 – 5 = 3 02 (3)2 02 32 VariânciaPaulo 4,5 4 Desvio Padrão V 4,5 2,12 Média aritmética = João 4835 5 4 Desvios: nota 1: 4 – 5 = -1 João nota 2: 8 – 5 = 3 nota 3: 3 – 5 = -2 nota 4: 5 – 5 = 0 (-1)2 32 (2)2 02 Variância João 3,5 4 Desvio Padrão V 3,5 1,87 Logo, como João apresentou o menor desvio padrão, ele será dito o mais regular. Exercício número 1 da página 24: Desvio: