Estatística e Probabilidade Aula 3 – Cap 02 Estatística Descritiva f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Nesta aula... estudaremos medidas de tendência central, medidas de variação e medidas de posição. f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Medidas de tendência central Uma medida de tendência central é um valor que representa uma entrada típica, ou central, de um conjunto de dados. Os três tipos de medidas de tendência central mais usadas são: • Média f. Pro Dr ss . Aly her c a teim S n o • Mediana • Moda f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Média A média de um conjunto de dados é a soma de toda as entradas de dados dividida pelo números de entradas. Em uma população: Em uma amostra: f. Pro ly s s A . Dr a ch m i te on S er Dica de estudo Símbolo Descrição Σ Indica uma soma de valores x Variável que representa uma entrada de dados N Número de entradas em uma população n Número de entradas em uma amostra r μ ma Média de uma i e t nS o população s s ly ch e r. A D . xProf Média de uma amostra Estatística e Probabilidade Mediana A Mediana de um conjunto de dados é o dado que fica no meio quando as entradas são colocadas em ordem crescente ou decrescente. Moda A Moda de um conjunto de dados é o dado que ocorre com maior freqüência. Se nenhuma entrada é repetida, o conjunto de dados não possui moda. er r h Se duas entradas ocorrem com freqüência elevada → dados são e c h a ac eim m t i S e t bimodais on S n sso f. Pro ly s s A . Dr Aly . r f. D Pro Estatística e Probabilidade Exemplo... Um instrutor registra a média de faltas de seus alunos em determinado semestre. Em uma amostra aleatória, os dados são: 2 4 2 0 40 2 4 3 6 Calcule a média, a mediana e a moda. Média: Mediana: Ordene os dados. 0 2 2 2 3 4 4 6 40 er r h e c h a O valor que fica eim mac no meio é 3, logo a mediana é 3. t i S e t on nS s o s s y l r. A Alys . D r . Moda: ocorre mais vezes. r of f. D A moda é 2, pois esse é o valor que P Pro Estatística e Probabilidade Exemplo... Em um debate político pediu-se que uma amostra dos membros do público citasse o partido a qual eles pertenciam. As respostas estão na Tabela abaixo: Partido Político frequência PT PSDB PMDB Outros Qual é a moda das respostas? 34 56 21 9 er r h e c h a ac eim t A moda é aSúnica utilizada S eim medida de tendência central que pode ser t on n s o s s y l para. descrever dados no nível nominal de medida. r. A Alys D r . f f. D Pro Pro Estatística e Probabilidade Média Ponderada Uma média ponderada é a média de um conjunto de dados cujas entradas tem pesos variáveis. Uma média ponderada é dada por: ( x.w) ∑ x= ∑w Onde w é o peso de cada entrada f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Exemplo... Você está fazendo uma disciplina na qual sua nota final é composta por: Fonte f. Pro notas,x Pesos, w xw Média dos testes 8,6 0,5 4,3 Exame no meio do semestre 9,6 0,15 1,44 Exame final 8,2 0,2 1,64 Laboratório de computação 9,8 0,1 0,98 Trabalho extra-classe 10,0 0,05 0,5 ly s s A . Dr her c a teim S n o a ch m i Σ(xw)=8,86 Σw=1 te S n sso y l A r. D . f Assim, sua média ponderada para a disciplina é de 88,6 Pro er Estatística e Probabilidade Média de uma distribuição de freqüência A média de uma distribuição de freqüências de uma amostra é aproximada por: ( x. f ) ∑ x= n n=∑f Onde x e f são os pontos médios e freqüências, respectivamente. f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Aspecto das distribuições de freqüência As distribuições de frequência freqüência podem ser: Simétricas: Uniforme: Quando pudermos traçar uma linha vertical pelo ponto médio do gráfico e as duas metades forem iguais. Quando todas as entradas, ou classes na distribuição tiverem freqüências iguais f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Assimétricas à direita: Se a ‘cauda’ do gráfico se prolongar mais para a direita, a distribuição é chamada de assimétrica à direita. f. Pro Dr ss . Aly her c a teim S n o Média > Mediana Assimétricas à esquerda: Se a ‘cauda’ do gráfico se prolongar mais para a esquerda, a distribuição é chamada de assimétrica à esquerda. ss y l A r. a ch m i te S n o f. D < Mediana Média Pro er Estatística e Probabilidade Medidas de variação • Desvio, • Variância e • Desvio padrão f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Desvio populacional O desvio de uma entrada x em um conjunto de dados de uma população ou amostra é a diferença entre a entrada e a média (μ ou x ) do conjunto de dados Em uma população, o desvio de cada valor x é: Em uma amostra, o desvio de cada valor x é: Como a soma dos desvios de todas as entradas é igual a zero, não faz sentido determinar a média dos desvios. Desta maneira, você pode elevar ao quadrado cada desvio e obter a er r h média... e c h a c teim ima r. D . f Pro Al Ste n o yss r D . f Pro sso y l A . nS Estatística e Probabilidade Variância populacional É a média da soma dos quadrados dos desvios de um conjunto de dados de uma população com N entradas, ou seja σ 2 (x − μ ) ∑ = 2 N Desvio Padrão populacional É a raiz quadrada da variância populacional: r f. D o r P ss . Aly her c a teim S n o σ= σ = 2 ∑ (x − μ ) N 2 f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Variância amostral A média dos quadrados dos desvios padrão é chamada de variância amostral. Para um conjunto de dados de uma amostra com n entradas é: 2 s 2 (x − x ) ∑ = n −1 Uma desvantagem da variância consiste no fato de suas unidades normalmente não terem sentido (como dólares ao quadrado, por exemplo). Assim, pode-se retornar a unidade original dos dados tomando sua raiz quadrada. Desvio Padrão amostral É a raiz quadrada da variância amostral: r f. D o r P ss . Aly her c a teim S n o s= s = 2 2 ( ) x − x ∑ n −1 f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Resumindo... Para obter a variância e o desvio padrão 1. Obtenha a média do conjunto de dados 2. Obtenha o desvio de cada entrada 3. Eleve ao quadrado cada desvio 4. Some os resultados para obter a soma dos quadrados 5. Divida por (n – 1) para obter a variância her c a 6. DetermineStaeim raiz quadrada da n so para obter o desvio padrão s variância y l r. A D . f Pro x ∑ x= n x= x−x (x − x) 2 ∑(x − x ) 2 s2 = 2 ( ) x − x ∑ n −1 ss y l A s = Drs. = f. Pro 2 her c a eim 2 t S on ( x − x ) ∑ n −1 Estatística e Probabilidade Existe ainda... Desvio Padrão para dados agrupados Grandes conjuntos de dados são normalmente mais bem representados por uma distribuição de freqüência. A fórmula para o desvio padrão da amostra de uma distribuição de freqüência é s= 2 ( ) x − x f ∑ n −1 na qual n=Σf é o número de entradas no conjunto de dados. f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er Estatística e Probabilidade Medidas de Posição São utilizadas para identificar a posição de uma entrada dentro de um conjunto de dados. Quartis, por exemplo, são números que dividem em partes iguais um conjunto de dados ordenados. Definição: Os três quartis Q1, Q2 e Q3 dividem aproximadamente um conjunto ordenado de dados em quatro partes. • 1/4 dos dados ficam dentro ou abaixo do primeiro quartil • metade dos dados ficam dentro ou abaixo do segundo quartil (é er igual a mediana do conjunto de dados) r h e c h a eim mac t i S e t on nS s o s s y l • ¾ Ados dados ficam dentro ou abaixo de terceiro quartil ly s r. A . D r . f f. D Pro Pro Estatística e Probabilidade Exemplo: A pontuação nos testes de 15 empregados envolvidos em um curso de treinamento estão dispostos abaixo. Obtenha Q1, Q2 e Q3. 13 9 18 15 14 21 7 10 11 Metade inferior 5 7 9 10 11 13 Q1 her c Q1 = Mediana dos dados a teim S n abaixo de Q2 so s y l r. A D . f Pro 20 5 18 37 16 17 21 37 Metade superior 14 15 16 Q2 Q2 = Mediana 17 18 18 20 Q3 a ch Q3 = Mediana dos dados m i te S n acima de lQ2 sso y A r. D . f Pro er Estatística e Probabilidade Amplitude interquartil (AIQ) A amplitude interquartil (AIQ) de um conjunto de dados é a diferença entre o primeiro e o terceiro quartis. Amplitude interquartil (AIQ)= Q3 – Q1 A AIQ é uma medida da variação que fornece uma idéia de quanto os 50% médios dos dados variam. (AIQ)= Q3 – Q1 = 18-10 = 8 (as pontuações no teste na metade do conjunto de dados varia em 8 pontos) A AIQ também serve para identificar dados estranhos (discrepantes). Qualquer valor acima de 1,5 AIQ à esquerda de Q1 ou a direita de Q3 er r h e c é estranho. h a eim mac t i S e t on nS s o s s y l No rexemplo anterior, 37 é um dado estranho as pontuações. r. A Alys . D . f f. D Pro Pro Estatística e Probabilidade Outras medidas de posição... • Decis → Divide o conjunto de dados em dez partes iguais (D1, D2, D3.......D9) • Percis → Divide o conjunto de dados em cem partes iguais (P1, P2, P3.......P99) f. Pro Dr ss . Aly her c a teim S n o f. Pro D ss y l A r. a ch m i te S n o er