Estatística e Probabilidade • Conceitos introdutórios. Distribuição de frequências em tabelas. Medidas de normalidade. Gráficos para avaliação da normalidade. • Exercícios. • • 1. Introdução. A estatística é a parte da Matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. Tem como objetivos: A análise de dados dos (gráficos, resumos numéricos, tabelas, etc). A produção de dados (conceitos básicos de planejamento e amostragem). A inferência consistentes) estatísticas (formulação de conclusões • Introdução Estatística Descritiva. Descreve os dados observados e na sua função dos dados, tem as seguintes atribuições. - A obtenção ou coleta de dados – por questionários ou observações diretas de uma população ou amostra. - A organização dos dados – consiste na ordenação e crítica quanto à correção dos valores observados. - A representação dos dados – os dados estatísticos podem ser mais facilmente compreendidos quando apresentados através de tabelas e gráficos, que permite uma visualização instantânea de todos os dados. • Introdução Estatística Indutiva Obtém e generaliza conclusões para a população a partir de uma amostra, através do cálculo de probabilidade. A tais conclusões estão sempre associados a um grau de incerteza e consequentemente, a uma probabilidade de erro. • 1. Introdução. 1.1 População e amostra. Referem-se ao conjunto de entes cujas propriedades desejamos averiguar. População estatística ou universo estatístico: coleção de todos os elementos cujas características (comuns) desejamos conhecer conhecer. Amostra é um subconjunto finito da população cujas características serão medidas. A amostra será usada para descobrir características da população. Como todo a análise estatística será inferida a partir das características obtidas da amostra, é importante que a amostra seja representativa da população, isto é, que as características de uma parte (amostra) sejam em geral as mesmas que do todo (população). • 1. Introdução. • 1. Introdução. Parâmetro - é uma característica numérica estabelecida para toda uma população. Estimador é uma característica estabelecida para uma amostra. numérica Dados estatísticos – parâmetros ou estimadores, expressos em números reais, a partir de análise estatística. • 1.2 Tipo de amostragem. • 1.2 VARIÁVEIS São quaisquer características atribuídas observado (pessoa, objeto ou animal). Enquadram ou categorizam os indivíduos, como na utilização das variáveis sexo, emprego, etc. Distribuem-se em valores numéricos como como altura e renda, que terão derivações matemáticas. Dividem-se em: ao objeto • 1.2 VARIÁVEIS • 1.2 VARIÁVEIS Variável qualitativa: quando seus valores são expressos por atributos. Qualitativa ordinal: ocorre quando é possível atribuir alguma ordem aos indivíduos depois de atribuída a característica. Exemplos: escolaridade ou grau de Instrução, classe social, etc. Qualitativa nominal: quando não é possível fazer nenhuma classificação depois de atribuída a característica. Exemplos: profissão, procedência, sexo, cor da pele, etnia, padrão de bandas ou cores, etc. • 1.2 VARIÁVEIS Variável quantitativa: quando seus valores são expressos em números (salários dos operários, idade dos alunos de uma escola, número de filhos, etc.). Quantitativa contínua: pode assumir teoricamente qualquer valor entre dois limites de números reais. Exemplo: altura, peso, etc. Quantitativa discreta: só pode assumir valores inteiros, enumeráveis. Exemplo: número de filhos, número de vitórias. • 1.3 Distribuição de frequências. É necessária para a verificação da distribuição da variável na amostra e sua importância na população. Para variáveis qualitativas, serão observadas números de ocorrências (a frequência simples) ou proporções dos eventos (a frequência relativa). Para variáveis quantitativa discretas serão também usadas as frequências simples ou relativa, podendo ser usados intervalos de classe em alguns casos. Para variáveis quantitativas contínuas serão observados os eventos em intervalos de classe destinados a simplificar a amostra. Deriva-se as frequências simples e relativas a partir dos intervalos de classe. • 1.4 Gráficos. • Gráficos são diagramas de expressão dos dados estatísticos tabulados. Geralmente são expressos em duas dimensões e num quadrante, onde a abcissa (linha horizontal) é o eixo X e a ordenada (linha vertical) é o eixo Y. • Seu uso deve ser de acordo com as variáveis propostas para a amostra. • 1.4 Gráficos. • Para variáveis qualitativas ou contínuas discretas, as opções mais adequadas são gráficos de barra para a apresentação das frequências simples. A variável qualtitativa está representada na abcissa, ou no eixo X. • Um tipo especial de gráfico de barra é o histograma. Neste caso as barras correspondem à ordenação dos dados. Pode ser usado para qualtitativas ordinais ou quantitativas discretas intervaladas. É a principal ferramenta para a apresentação de variáveis quantitativas contínuas intervaladas. • Também são usados gráficos de área, ou em pizza, onde as proporções dos eventos são demonstradas. • 1.4 Gráficos. • Gráficos em linha são utilizados frequentemente como diagramas de acompanhamento. O tipo de tabulação neste caso é dito série temporal. No gráfico, a abcissa corresponde à evolução temporal e a ordenada à distribuição da variável. As variáveis são do tipo quantitativa discreta. • • 1.4 Gráficos. • Para variáveis quantitativas principalmente o histograma. • contínuas, é utilizado Este vai refletir o padrão de normalidade da amostra. Frequência relativa (%) Variável em Intervalos de classe • 1.4 Gráficos: barras e pizzas. • 1.4 Gráficos: histogramas; padrão de normalidade. • 2. APRESENTAÇÃO DE DADOS ESTATÍSTICOS APRESENTAÇÃO TABULAR A apresentação tabular dos dados estatísticos consiste na reunião ou grupamento dos dados em tabelas com a finalidade de apresentá-los de modo ordenado e simples, de de fácil percepção. Componentes Básicos Em termos genéricos, uma tabela se compõe dos seguintes elementos básicos: • 3. APRESENTAÇÃO DE DADOS ESTATÍSTICOS Principais Elementos de uma Tabela Título: Conjunto de informações, as mais completas possíveis, localizado no topo da tabela, respondendo às perguntas: O quê? Onde? Quando? Cabeçalho: Parte superior da tabela que especifica o conteúdo das colunas. Coluna Indicadora: Parte da tabela que especifica o conteúdo das linhas. Linhas: Retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as colunas. Casa ou Célula: Espaço destinado a um só número. Rodapé: são mencionadas a fonte se a série é extraída de alguma publicação e também as notas ou chamadas que são esclarecimentos gerais ou particulares relativos aos dados. • 3.1 SÉRIES ESTATÍSTICAS São apresentações tabulares de dados estatísticos em função de características específicas, geralmente: – – – Época ou tempo; Locais; Padrões da espécie. Esses elementos determinam o surgimento de quatro tipos fundamentais de séries estatísticas: Séries Temporais ou Cronológicas: são aquelas nas quais os dados são reunidos segundo o tempo que varia, permanecendo fixos o local e espécie. • 3.1. SÉRIES ESTATÍSTICAS Séries Geográficas: são aquelas nas quais os dados são reunidos segundo o local que varia permanecendo fixos o tempo e a espécie. Séries Específicas: são aquelas nas quais os dados são reunidos segundo o espécie que varia permanecendo fixos o tempo e o local. Séries Composta ou Mista: é a combinação de dois ou mais fundamentais de séries estatísticas. Exemplo: Geográfica – Temporal. • 3.1 SÉRIES ESTATÍSTICAS • 4. Distribuição de frequências São apresentações tabulares em que a distribuição da variável na amostra é apresentada em padrões de ocorrência, ou o número de dados que pertence a cada valor da variável. O valor da variável é codificado como x. A distribuição da variável é demonstrada como frequência simples e relativa. Nos dois casos é também a apresentada a frequência acumulada. Variáveis contínuas devem ser apresentadas em intervalos de classe, o que é chamado de freqüência intervalar. Variáveis quantitativas discretas podem ser apresentadas na forma simples, por valor ou podem também ser apresentadas em intervalos de classe. Exemplos básicos a seguir. • 4. Distribuição de frequências Com base na tab. 1.1 do livro texto, elabore uma tabela de distribuição de frequências simples com os dados obtidos das conchas. Escolha uma variável, CAC, LAC ou PC. Neste exercício considere como uma amostra, não dividida em séries verticais e horizontais. Entregar no final da aula. • 4. Distribuição de frequências com intervalos de classe(exemplo). • 4. Distribuição de frequências com intervalos de classe. 4.1 Elementos Principais: a) Classe – é cada um dos intervalos em que os dados são agrupados. b) Limites de classes são os valores extremos de cada classe. li = limite inferior de uma classe; Li = limite superior de uma classe. c) Amplitude – é a diferença entre o maior valor e o menor valor de certo conjunto de dados. Pode ser referida ao total de dados ou a uma das classes em particular. A amplitude total (At) é calculada pela seguinte expressão: At = Max. (rol) – Min.(rol). • 4. Distribuição de frequências. 4.1 Elementos Principais: A amplitude do intervalo de classes (h) – é a relação entre a amplitude total e o número de classes, conforme mostra a expressão a seguir: Mais adiante veremos como calcular o número de classes (n). • 4.1 Elementos principais. d) Ponto médio de classe (xi) – importante para as medidas de tendência central e dispersão, é calculado pela seguinte expressão: e) Freqüência absoluta ou simples (fi) - freqüência absoluta de uma classe de ordem i, é o número de dados que pertencem a essa classe. f) Freqüência relativa (fri) - freqüência relativa de uma classe de ordem i, é o quociente da freqüência absoluta dessa classe (fi), pelo total, ou seja, Obs: a soma de todas as freqüências absolutas é igual ao total e a soma das frequências relativas é igual a 100. • 4.1 Elementos principais. g) Freqüência acumulada (Fi) - freqüência acumulada de uma classe de ordem i, é a soma das freqüências até a classe de ordem i. h) Freqüência acumulada relativa (Fri) - freqüência relativa acumulada de uma classe de ordem i, é a soma das freqüências relativas até a classe de ordem i. • 4.2. A organização de uma distribuição de fequências em intervalos de classe. • 1. Organização do rol: é colocar os dados em ordem crescente ou decrescente. • 2. Cálculo do número conveniente de classes (n): o número de classe deve ser escolhido pelo pesquisador e geralmente situa-se entre 5 a 15 classes. Usa-se a fórmula • 3. Cálculo da amplitude dos intervalos de classe convenientes (h). Deve ser o mesmo para todas as classes: fi • 4.2. A organização de uma distribuição de fequências em intervalos de classe. • 4. Obtenção dos limites das classes. Geralmente as classes são intervalos fechados à esquerda e abertos á direita. O limite inferior da 1a classe é igual ao mínimo do rol, isto é: l1 = Min.(rol) • • Encontram-se os limites das classes, adicionando-se sucessivamente a amplitude do intervalo de classes aos limites da 1a classe. • 5. Na tabela, colocar as fi (frequências absolutas) e calcular as fri (freqüências relativas). • 7. Apresentar a distribuição em histograma. • 8. Exercício: tabular desta forma os dados obtidos da conchas usados anteriormente e construir o histograma. Entregar no final.