UNIVERSIDADE FEDERAL DO RIO GRANDE DO NORTE CENTRO DE CIÊNCIAS EXATAS E DA TERRA DEPARTAMENTO DE ESTATÍSTICA PROGRAMA DE EDUCAÇÃO TUTORIAL-PET PROCESSO SELETIVO 2012.2 Curso Preparatório: Introdução à Estatística NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos O que é Estatística? Estatística é uma parte da matemática aplicada, que fornece um conjunto de técnicas que permite, de forma sistemática, organizar, descrever, analisar e interpretar dados oriundos de qualquer área do conhecimento com o objetivo de tomar decisão a respeito de um determinado questionamento. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Estatística Descritiva A Estatística Descritiva pode ser definida como um conjunto de técnicas destinadas a coleta, organização, o calculo e a interpretação de coeficientes (exemplo: medidas central, separatrizes, medidas de dispersão e outros). Estatística Inferencial A Estatística Inferencial pode ser definida como um conjunto de técnicas destinadas a análise e a interpretação de dados, associando uma margem de incerteza oriunda de fenômenos de caráter aleatório (teoria matemática das probabilidades). NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Definição: Estatística é, portanto, a ciência que coleta, classifica e avalia numericamente fatos que servirão de base para inferências. É um conjunto de técnicas para se obter conhecimento preciso, a parti de informações incompletas; é um sistema científico para coleta, organizar, análise, interpretação e apresentação de informações que possam ser colocadas sob forma numérica. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos População e Amostra População Estatística é a totalidade dos elementos de características comuns, pertencentes a um universo sobre o qual se deseja estabelecer conclusões ou exercer ações. Ela pode ser finita ou infinita. Amostra Estatística é um subconjunto de elementos extraídos da população, em que a técnica de seleção desses elementos e denominada Amostragem. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Tipos de Amostragem Probabilística Exige que cada elemento da população possua a mesma chance de ser selecionado. Somente com base em amostragem probabilísticas é que se podem realizar inferências sobre a população a parti do conhecimento da amostra. Não Probabilística A escolha do elemento para constituir à amostra é feita de forma deliberada. Neste caso não é possível generalizar os resultados para população. NATUREZA E CAMPO DA ESTATÍSTICA: Tipos de Amostragem Probabilística Não Probabilística Amostragem Aleatória Simples Amostragem Acidental Amostragem Estratificada Amostragem Intencional Amostragem Sistemática Amostragem por Cotas Amostragem por Conglomerados É equivalente a um sorteio lotérico. Pode ser realizada numerando-se a população de 1 a n e sorteando, por meio de um dispositivo aleatório qualquer, k números dessa sequência , em que corresponderão aos elementos pertencentes à amostra. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Tipos de Amostragem Probabilística Não Probabilística Amostragem Aleatória Simples Amostragem Acidental Amostragem Estratificada Amostragem Intencional Amostragem Sistemática Amostragem por Cotas Amostragem por Conglomerados A população é dividida em estratos homogêneos, sendo selecionada uma amostra aleatória de cada estrato considerando alguns fatores (exemplo: Grau de Instrução, nível de renda e outros) NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Tipos de Amostragem Probabilística Não Probabilística Amostragem Aleatória Simples Amostragem Acidental Amostragem Estratificada Amostragem Intencional Amostragem Sistemática Amostragem por Cotas Amostragem por Conglomerados Os elementos são selecionados segundo uma regra predefinida: 1 a cada 10, 1 a cada 15, etc. É bastante utilizada quando os elementos da população estão arranjados em ordem. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Tipos de Amostragem Probabilística Não Probabilística Amostragem Aleatória Simples Amostragem Acidental Amostragem Estratificada Amostragem Intencional Amostragem Sistemática Amostragem por Cotas Amostragem por Conglomerados Empregado nos casos em que algumas populações não permitem, ou tornam extremamente difícil que se identifiquem seus elementos. Não obstante, pode ser relativamente fácil identificar alguns subgrupos da população. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Tipos de Amostragem Probabilística Não Probabilística Amostragem Aleatória Simples Amostragem Acidental Amostragem Estratificada Amostragem Intencional Amostragem Sistemática Amostragem por Cotas Amostragem por Conglomerados Trata-se de uma amostra formada pelos elementos que vão aparecendo, os quais são possíveis de obter até completar o número de elementos da amostra. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Tipos de Amostragem Probabilística Não Probabilística Amostragem Aleatória Simples Amostragem Acidental Amostragem Estratificada Amostragem Intencional Amostragem Sistemática Amostragem por Cotas Amostragem por Conglomerados Os elementos que iram compor à amostra são escolhidos intencionalmente de acordo com um determinado critério em seguida o investigador se dirige ao grupo para coletar as informações. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Tipos de Amostragem Probabilística Não Probabilística Amostragem Aleatória Simples Amostragem Acidental Amostragem Estratificada Amostragem Intencional Amostragem Sistemática Amostragem por Cotas Amostragem por Conglomerados Abrange três etapas: 1ª - classificação da população em termos de propriedades que se conhece ou se presume serem relevantes para a característica a ser estudada; 2ª - determinação da proporção da população para cada característica; 3ª - fixação de cotas para cada entrevistador . NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Variável A variável é a categorização/qualificação ou a quantificação da característica de interesse do estudo. Qualitativa Nominal Ordinal Podem ser do tipo Nominal ou Ordinal (caso exista uma ordem entre as classes). Exemplo.: Sexo e estadiamento de uma doença são exemplos de variável nominal e ordinal, respectivamente. NATUREZA E CAMPO DA ESTATÍSTICA: Definições e Conceitos Variável A variável é a categorização/qualificação ou a quantificação da característica de interesse do estudo. Quantitativa Discreta Contínua Discreta: Assume valores inteiros. são geralmente o resultado de contagens. Exemplo.: número de clientes, etc. Contínua: pode assumir qualquer valor num intervalo. Exemplo.: altura, peso, etc. NATUREZA E CAMPO DA ESTATÍSTICA O Método Estatístico ESTATÍSTICA DESCRITIVA: Representação Tabular Consiste em dispor os dados em linhas e colunas, distribuídas de modo ordenado, segundo as regras práticas e obedecendo à Resolução 886/66, de 26 de outubro de 1966, do conselho Nacional de Estatística. As tabelas devem conter: a) Título • O quê? (fenômeno). Onde? (local). Quando? (época). b) • Indica o conteúdo das colunas. c) • Especifica o conteúdo das linhas. Cabeçalho Coluna Indicadora d) Cabeçalho da coluna indicadora • Indica o conteúdo da coluna indicadora. e) Corpo • Caselas ou células, onde são registrados os dados. f) Rodapé • Notas e identificação de fonte de onde foram coletados os dados. ESTATÍSTICA DESCRITIVA: Definições e Conceitos Exemplo: Tabela 01 – Distribuição de melanomas por localização anatômica, Hospital Universitário da UFES em Vitória-ES, entre 1982 e 1992. Localização anatômica Nº de casos Percentual Cabeça/Pescoço 10 33,3 Tronco 7 23,3 Membros Superiores 6 20,0 Membros Inferiores 2 6,7 Acral 5 16,7 Total 30 100 Fonte: Hospital Universitário da UFES (Universidade Federal de Espirito Santo). ESTATÍSTICA DESCRITIVA: Séries Estatísticas São os dados organizados em forma de tabelas. De acordo com o fenômeno, o local e a época de ocorrência, as séries estão classificadas em: Série Temporal • É a série estatística, em que os dados são observados segundo a época de sua ocorrência. Série Especificativa • É a série estatística, em que os dados são agrupados segundo a modalidade (espécie) de ocorrência. Série Geográfica • É a série estatística, em que os dados são observados segundo o local onde ocorreram. Série Mista • Corresponde a fusão de duas ou mais séries simples. ESTATÍSTICA DESCRITIVA: Série Temporal Exemplo: Tabela 02 – Ligações telefônicas recebidas pelo Centro de Valorização da Vida (CVV), Brasil, 1994- 2001: Anos Nº de ligações 1994 676,468 1995 746,464 1996 771,776 1997 785,336 1998 795,222 Fonte: Ver. Época, Ed. 245, de 27/01/03 ESTATÍSTICA DESCRITIVA: Série Especificativa Exemplo: Tabela 03 – Causas mais comuns de morte materna na gravidez, Brasil, 2002: Causas de Morte Nº de mortes Eclampsia 21 Hemorragias 12 Doenças cardíacas 10 Infecções pós-parto 7 Aborto 4 Fonte: Ver. Época, Ed. 245, de 27/01/03 ESTATÍSTICA DESCRITIVA: Série Geográfica Exemplo: Tabela 04 – Óbitos maternos na gravidez, a cada 100 mil nascidos vivos, no Brasil, por regiões, 2000: Regiões Nº de Óbitos Norte 63 Nordeste 57 Sudeste 46 Sul 53 Centro-Oeste 39 Fonte: Ministério da Saúde, Ver. Época, Ed. 251, de 10/03/03 ESTATÍSTICA DESCRITIVA: Série Mista (temporal-especificativa) Exemplo: Tabela 05 – Matrícula inicial no ensino de graduação no Brasil, 1995-98, por dependência administrativa: Nº de Alunos Anos Universidades públicas Universidades particulares 1995 700540 1059163 1996 735427 1133102 1997 759182 1186433 1998 804729 1321229 Fonte: Época, Ed. 251, de 10/03/03 ESTATÍSTICA DESCRITIVA: Definições e Conceitos Representação Gráfica Os tipos mais usados de gráficos de informação Diagrama de linhas e de superfície simples • Usado unicamente para representar séries temporais. Diagrama de superfície em faixa • Usado para comparar a evolução de duas variáveis ao longo do tempo e a evolução de cada uma, isoladamente Diagrama de colunas/barras • É usado para representar qualquer tipo de série. Diagrama de colunas/barras superpostas e múltiplas • Usado para comparar o comportamento de duas ou mais variáveis. Diagrama de setores em círculo • É empregado quando deseja-se ressaltar a participação do dado total, o qual é representado pelo círculo que fica dividido em tantos setores quantas são as partes. ESTATÍSTICA DESCRITIVA: Diagramaede linhas Definições Conceitos Exemplo: Gráfico 01 – Razão de sexos para a população total, urbana e rural, Baia Formosa, 1980-2010: 120.0 115.0 110.0 Total 105.0 Urbana Rural 100.0 95.0 90.0 1980 Fonte: IBGE 1991 2000 2010 ESTATÍSTICA DESCRITIVA: Diagrama de superfície simples Definições e Conceitos Exemplo: Gráfico 02 – Distribuição percentual da população, por grandes grupos etários (anos), Baia Formosa, 1980-2010: 100.0 65 e + 15 - 64 0 - 14 75.0 50.0 25.0 % 0.0 1980 Fonte: IBGE 1991 2000 2010 ESTATÍSTICA DESCRITIVA: Diagrama edeConceitos colunas Definições Exemplo: Gráfico 03 – Distribuição dos residentes segundo renda familiar (em salários mínimos), UFRN, 2010. 30 47,46% Nº de residentes 25 20 15 20,34% 16,95% 15,25% 10 5 0 1S Fonte: Dados primários 1--|2S 2--|3S Renda Familiar (em salários mínimos) acima 3S ESTATÍSTICA DESCRITIVA: Diagramaede barras Definições Conceitos Exemplo: Gráfico 03 – Distribuição dos residentes segundo o curso, UFRN, 2010. Outros Serviço Social Química Odontologia Música Medicina Matemática Letras Portuguesas Geografia Farmácia Estatística Eng. Elétrica Eng. Computação Enfermagem Ciências Contábeis Ciências Biológicas Biblioteconomia Administração 20,34% 3,39% 6,78% 5,08% 3,39% 5,08% 8,47% 3,39% 3,39% 8,47% 5,08% 3,39% 3,39% 3,39% 3,39% 6,78% 3,39% 3,39% 0 Fonte: Dados primários 2 4 6 8 Nº de residentes 10 12 14 ESTATÍSTICA DESCRITIVA: e Conceitose múltiplas DiagramaDefinições de colunas superposta Exemplo: Gráfico 04 e 05 – Distribuição dos residentes segundo sexo e tipo de atividade remunerada, UFRN, 2010. frequência (%) 100.0 0% 80.0 60.0 66,7% 75% 40.0 20.0 78,3% 100% Feminino 33,3% 25% Bolsa Emprego 21,7% 0.0 frequência (%) Estágio Não possui 100% 100.0 80.0 78,3% 75% 66,7% 60.0 40.0 Masculino 33,3% Feminino 25% 20.0 21,7% 0% 0.0 Bolsa Fonte: Dados primários Emprego Estágio Não possui Masculino ESTATÍSTICA DESCRITIVA: Definições e Conceitos Diagrama de barras superposta e múltiplas Exemplo: Gráfico 06 e 07 – Distribuição dos residentes segundo sexo e tipo de atividade remunerada, UFRN, 2010. Não possui 21,7% Estágio 100% 78,3% Não possui 78,3% Estágio 0% 21,7% 0% 100% Masculino Feminino Emprego Bolsa 0.0 25% 75% 33,3% 66,7% 20.0 40.0 60.0 80.0 100.0 Frequência (%) Fonte: Dados primários Masculino 75% Emprego 25% 66,7% Bolsa 33,3% 0.0 50.0 100.0 Frequência (%) Feminino ESTATÍSTICA DESCRITIVA: Definições e Conceitos Diagrama de setores em círculo Exemplo: Gráfico 08 - Distribuição do número de residentes segundo o sexo, UFRN, 2010. 31% 69% Feminino Fonte: Dados primários Masculino ESTATÍSTICA DESCRITIVA: Definições edeConceitos Distribuição frequência É a série estatística em que os dados são agrupados em classes, com suas respectivas frequências: absolutas, relativas e percentuais. Construção de uma distribuição de frequência Componentes: Dados brutos Rol Amplitude total 𝐴𝑡 = 𝑙𝑠 − 𝑙𝑖 Intervalo de classe 𝐴𝑡 𝑖= 𝑐 Nº de classes 𝑐 = 1 + 3,33 ∙ log(𝑛) ESTATÍSTICA DESCRITIVA: Definições edeConceitos Distribuição frequência Exemplo: Tabela 06 - Distribuição de frequência das Idades dos alunos das residências de graduação da UFRN, 2010 lim inferior lim superior xi (p.m.) fi fi% Fi Fi% Fi* Fi*% 17 20 23 26 29 32 20 23 26 29 32 35 18.5 21.5 24.5 27.5 30.5 33.5 // 18 19 15 2 0 1 55 32.7 34.5 27.3 3.6 0.0 1.8 100 18 37 52 54 54 55 // 32.7 67.3 94.5 98.2 98.2 100 // 55 37 18 3 1 1 // 100 67.3 32.7 5.5 1.8 1.8 // Total Fonte: Pesquisa realizada pelo grupo 6 de EST0030 ESTATÍSTICA DESCRITIVA: Definições Conceitos de frequência Representação Gráfica daedistribuição N º de residentes (fi) Histograma e Polígono de frequência: 20 18 16 14 12 10 8 6 4 2 0 32,7% 34,5% 27,3% 3,6% 0% 1,8% 17--20 20--23 23--26 26--29 29--32 32--35 Idades dos residentes (em anos) ESTATÍSTICA DESCRITIVA: Definições Conceitos de frequência Representação Gráfica daedistribuição 100 100 90 90 Frequência Acumulada Acima de (F*%) Frequência Acumulada Abaixo de (Fi%) Ogiva de Galton crescente e decrescente: 80 70 60 50 40 30 20 10 80 70 60 50 40 30 20 10 0 0 17 20 23 26 29 32 35 17 20 23 26 29 32 35 Idades dos Residentes (em anos) Idade dos Residentes (em anos) ESTATÍSTICA DESCRITIVA: Definições e Conceitos Medidas de Tendência Central São medidas de posição que tendem a se agrupar em torno de valores centrais de uma distribuição, tendo a capacidade de representá-la como um todo. As mais utilizadas são: Média Aritmética Mediana Moda Algumas Separatrizes ESTATÍSTICA DESCRITIVA: Exercícios ESTATÍSTICA DESCRITIVA: Definições Conceitos Medidas dee Dispersão Sevem para medir a dispersão ou a variabilidade de observações e verificar se tais observações se concentram mais para um lado ou outro da curva (histograma alisado) ou se dispõem simetricamente em torno de um valor central tomado como ponto de referência ou comparação. As mais utilizadas são: Amplitude total Desvio médio Desvio Padrão Variância Desvio Quartil Coeficiente de Variação Assimetria ESTATÍSTICA DESCRITIVA: Exercícios ESTATÍSTICA DESCRITIVA: Definições e Conceitos Análise Exploratória de Dados Permite realizar uma análise completa de forma bem mais simples que a utilizada através de uma distribuição de frequência em classes. Seus principais instrumentos são: Ramo e Folhas Esquema dos Cinco Números Box-Plot ESTATÍSTICA DESCRITIVA: Exercícios Obrigado!