ESTATÍSTICA Professora : Adriane Guarienti Introdução Por causa da enxurrada de dados coletados, referentes a todas as particularidades de negócios, o uso de técnicas estatísticas tornou-se uma ferramenta indispensável, hoje em dia. “Uma amostragem representativa conseguirá a melhor descrição possível de uma população, apesar de se pesquisar apenas parte dela. Contudo, ela depende da possibilidade de um referencial de amostragem, de uma lista ou combinação de listas dos membros de uma população, ou do conhecimento de distribuição de características essenciais na população. Sem listas ou distribuições conhecidas, o trabalho não pode ser executado.” (BAUER e AARTS, 2002, p. 42) Utilizamos estatísticas para levantar tais informações e em cada uma dessas situações você precisa analisar dados quantitativos à luz dos objetivos e tomar decisões com base nesses dados. Daí a necessidade de se entender estatística e a capacidade de empregar as suas várias ferramentas com eficiência para competir em um mercado que depende muito do uso adequado destas ferramentas. A luz do nosso objetivo, definimos a ESTATÍSTICA como o estudo da coleta, do processamento e análise de dados para facilitar a tomada de decisões em uma área de incerteza. A Estatística é um método científico de obter as informações relativas a uma variável, apurar os seus resultados, apresentálos de maneira clara e inteligente, interpretar tais resultados para conhecê-los em sua intimidade, tirar conclusões e definir as suas tendências. Estatística Descritiva: Esta fase se fundamenta na organização, descrição, análise e interpretação dos dados, sem aquela preocupação de fazer generalizações ou tirar conclusões para o conjunto de onde foram retirados tais dados. Estatística Inferencial: Esta é a fase dos estudos amostrais que visam avaliar o comportamento de uma população por meio de suas amostras. Pode-se prever o comportamento de um fenômeno com base nos resultados de uma amostra. Por onde começar, quando se tem um problema estatístico? Essa é uma pergunta um tanto capciosa, porque você não tem um problema de estatística – o que você tem é um problema comercial, um problema de negócios onde o lucro ou prejuízo estão latentes e dependem da sua decisão. E para minimizar as incertezas, seja realista, o quê fazer? Você provavelmente jamais vai eliminar a incerteza, mas você pode minimizar o risco de tomar uma decisão errada, que pode custar-lhe caro, se tiver informações sobre os fatos. População ou Universo A população ou universo é o conjunto de objetos, pessoas, coisas ou itens que apresentam certa característica não se limitando, apenas às pessoas, mas a todas variáveis, com características próprias. População Finita: é aquela que se consegue enumerar todos os elementos que a formam. Refere-se a um universo limitado em uma dada unidade de tempo. Exemplificando podese dizer que a quantidade de automóveis produzidos por uma fábrica em um mês, a população de uma cidade e o número de alunos de uma sala de aula são exemplos de uma população finita. População Infinita: é aquela cujos elementos não podem ser contados. Refere-se a um universo não delimitado. Os resultados (cara ou coroa) obtidos em sucessivos lances de uma moeda, o conjunto dos números inteiros, reais ou naturais são exemplos de populações infinitas. RAMOS DA ESTATÍSTICA A estatística dedutiva (também conhecida como Estatística Descritiva) se encarrega de descrever o conjunto de dado desde a elaboração da pesquisa até o cálculo de determinada medida. A estatística indutiva (ou Estatística Inferencial) está relacionada a incerteza. Inicia-se no cálculo das Probabilidades e se desenvolve por todo a área da inferência. Inferência Estatística Através da parte fazer inferência sobre o todo!! Subconjunto Inferência estatística é o processo pelo qual estatísticos tiram conclusões acerca da população usando informação de uma amostra. ESTATÍSTICA DESCRITIVA - Variáveis - População e Amostra - Técnicas de Amostragem - Séries Estatísticas - Gráficos Estatísticos - Distribuição de Freqüências Variáveis Aleatórias Pode-se dizer que uma variável aleatória é o conjunto de todos os resultados possíveis de um fenômeno aleatório. Variável aleatória é uma variável que depende do resultado de um fenômeno aleatório. A medição dos atributos quantitativos e qualitativos gera valores que são chamados de variáveis. Estas variáveis assumem como o próprio nome indica uma gama de valores. As variáveis podem ser, quanto à natureza, qualitativas e quantitativas. Variáveis Aleatórias As variáveis qualitativas se classificam em nominal e ordinal. As variáveis nominais são sexo, raça, religião, estado civil, etc. As variáveis ordinais representam uma certa ordem natural entre as categorias: nível salarial, classe social, grau de instrução, o professor é regular, bom ou ótimo, o curso é regular, bom ou ótimo, qualquer hierarquia social etc. As variáveis quantitativas se classificam em discretas ou contínuas e quanto às causas e efeitos dependentes e independentes. As variáveis dependentes são aquelas cujos efeitos são esperados de acordo com as causas. Elas se situam, habitualmente, no fim do processo causal e as variáveis independentes são aquelas cujos efeitos queremos medir. Variável Aleatória Discreta É aquela que pode assumir apenas um conjunto limitado de valores em qualquer escala de medida e, em geral inteiros, sendo obtida mediante alguma forma de contagem. É uma variável cujos valores podem ser todos relacionados. Uma variável é discreta quando assume alguns valores dentro de certo intervalo. O número de funcionários de uma empresa, o número de filhos de um casal, o resultado de um sorteio, o número de habitantes de uma cidade, o número de alunos de uma sala são exemplos de variável discreta. Variável Aleatória Contínua É aquela que pode assumir qualquer valor numa escala de valores e resulta freqüentemente de uma medição, sendo usada em geral, em alguma forma de medida, e se trata geralmente de valor aproximado. As medidas de comprimento, peso, altura, volume, etc., são exemplos típicos de variável contínua. Pode-se dizer, ainda que a variável aleatória contínua possa tomar qualquer valor real em um dado intervalo, sendo caracterizada por uma função de densidade tal que a área sob a curva e limitada pelo eixo dos x e entre dois números representa a probabilidade de a variável aleatória estar entre eles. Por outro lado, todas as vezes que construirmos uma distribuição de freqüências e os gráficos que a representam, teoricamente, identificam-se como uma variável contínua. MÉTODO ESTATÍSTICO MÉTODO: conjunto de meios dispostos convenientemente para se chegar a um fim que se deseja. 1.MÉTODO EXPERIMENTAL: consiste em manter constantes todas as causas (fatores), menos uma, e variar esta causa de modo que o pesquisador possa descobrir seus efeitos, caso existam. 2.MÉTODO ESTATÍSTICO: diante da impossibilidade de manter as causas constantes, admite todas essas causas presentes variando-as, registrando essas variações e procurando determinar, no resultado final, que influências cabem a cada uma delas. ESTATÍSTICA Def.: é a parte da matemática aplicada que fornece métodos para a coleta, organização, descrição, análise e interpretação de dados e para a utilização dos mesmos na tomada de decisões. FASES DO MÉTODO ESTATÍSTICO Coleta de dados: pode ser direta ou indireta. a) Direta: quando feita sobre elementos informativos de registro obrigatório ou coletados pelo próprio pesquisador. Essa coleta pode ser contínua, periódica ou ocasional. b) Indireta: quando é feita com base em elementos já pesquisados (revista, jornal, livros, etc.) 2- Crítica dos dados: nesta fase os dados são contados e recontados, em busca de possíveis falhas (omissões, repetições, etc), sendo: a) Externa: informante b) Interna: pesquisador 3- Apuração dos dados: é a soma e o processamento dos dados obtidos. Pode ser manual, eletromecânica ou eletrônica. 4 – Apresentação dos dados: os dados devem ser apresentados sob a forma de tabelas e gráficos. 5 – Análise dos resultados: o objetivo último da Estatística é tirar conclusões sobre o todo a partir de informações fornecidas por uma parte deste representativa, através de técnicas apropriadas 11111111111111111111111 11111111111111111111111111111111111111111111111111111111111111 1111111111111111111111 11111111111111111111111 11111111111111111111111111111111111111111111111111111111111111 1111111111111111111111 11111111111111111111111 11111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 1111111111111111111111 11111111111111111111111 11111111111111111111 11111111111111111111111 11111111111111111111111 1 1111111111111111111111111111111111111111111111111111111111111111 VARIÁVEL: é, convencionalmente, o conjunto de resultados possíveis de um fenômeno. 1.Qualitativa: 1.1 – Nominal: quando seus valores são expressos por atributos. Ex.: cor dos olhos, da pele, do cabelo, religião, sexo, tipo de condução, curso de graduação, nacionalidade, naturalidade, etc. 1.2 – Ordinal: quando, apesar de não poder ser medida, a variável segue uma ordem. Ex.: escolaridade, patente militar, cargos dentro de uma empresa, hierarquia no serviço público civil, etc. 2.Quantitativa: quando as variáveis são expressas em números, e podem ser: 2.1 –Discretas: resultam de um conjunto enumerável de valores (aceita apenas números inteiros). Ex.: quantidade de carros no estacionamento, número de filhos de um casal, quantidade de cursos de uma faculdade, etc. 2.2 – Contínuas: quando uma variável pode assumir qualquer valor entre dois limites (valores inteiros e decimais). Ex.: faixa etária, horas, faixa salarial, comprimento, temperatura, peso, altura, etc. POPULAÇÃO, AMOSTRA e AMOSTRAGEM • POPULAÇÃO: É um conjunto de indivíduos ou objetos que apresentam pelo menos uma característica em comum. • AMOSTRA: Considerando a impossibilidade, na maioria das vezes do tratamento de todos os elementos da população, necessitaremos de uma parte representativa da mesma. A esta porção da população chamaremos de amostra. • Chamaremos de um subconjunto de indivíduos extraídos de uma população. • AMOSTRAGEM: é uma técnica especial para recolher amostras que garante, tanto quanto possível, o acaso na escolha, de modo a garantir à amostra o caráter de representatividade. Amostragem x Amostra Amostragem é uma ferramenta que permite a você analisar um subconjunto de uma população, objetivando levantar informações sobre os fatos relativos a esse subconjunto, com a intenção de inferir o comportamento da população. A amostra é um número limitado de informações tirado de um conjunto da mesma natureza, denominado população. Amostra é uma parte de uma população e deverá reunir as suas características básicas. A importância de uma amostra está na avaliação de grandezas desconhecidas desta população e a qualidade desta avaliação depende basicamente da representatividade desta amostra de alcançar a capacidade de reproduzir as características básicas da sua população. Amostra Uma amostra é considerada parte representativa da população se ela tiver a propriedade de absorver todas as características da população e se as características da população estiverem nela contidas, as conclusões a respeito desta amostra podem ser consideradas como conclusões da respectiva população. A medida que o tamanho de uma amostra for crescendo, as informações relativas à amostra vão se tornando cada vez mais verdadeiras. Diversos fatores justificam os trabalhos com amostras, no lugar de estudar a respectiva população, entre os quais, destacam-se: • Custo: as despesas com a operacionalização estatística da população são geralmente bem maiores que com a averiguação de uma amostra. • Velocidade: as pesquisas realizadas com amostras são mais rápidas, em virtude de conter um menor número de unidades. • Praticabilidade: conforme o próprio conceito, às vezes, a dimensão da população torna as pesquisas impraticáveis. Método Estatístico O método estatístico reúne as técnicas básicas de observação dos fenômenos coletivos, bem como a quantificação e a qualificação de suas características. Estas técnicas ensinam-nos como colher dados numéricos, sintetizá-los e exprimi-los de maneira simples e descrever e interpretar os acontecimentos, fazendo previsões e conclusões. As técnicas a seguir são fundamentais para um trabalho de alto nível, pois o talento só virá com o conhecimento, com a dedicação, com a persistência e com muita luta e o sucesso baterá em sua porta se você for o melhor entre os melhores. E para que este êxito chegue o mais rápido possível, use em cada projeto, trabalho, pesquisa, os conhecimentos que sintetizamos a seguir. Quem determina a amostra a ser estudada? Projeto de Pesquisa: amostra • Qual a relação entre a pergunta da pesquisa e a amostra? • Quem determina a amostra a ser estudada? • Quais são os componentes necessários para determinar a amostra? • Quais são as técnicas de amostragem? • Por que é importante a amostragem na aplicabilidade do estudo? Divisões do Projeto 1. Informações Gerais 2. Projeto de Pesquisa 3. Documentação Complementar 1- Estudo do fenômeno Planejamento O planejamento operacional da pesquisa consiste em prever as ações que deverão ser efetuadas para aplicar a estratégia da pesquisa escolhida. Estas ações dizem respeito à seleção da população a ser estudada, à definição das variáveis e à coleta de dados, assim como à análise dos dados recolhidos. O planejamento é o processo de estabelecer os objetivos e as linhas de ação adequadas para alcançá-los. Os objetivos são importantes por que proporcionam senso de direção, focalizam os esforços, guiam os planos e as decisões e ajudam a avaliar o progresso de sua pesquisa: O que queremos? Formulação de objetivos. O que fazer? Linhas de ação adequadas para alcançar os nossos objetivos. Como fazer? Os meios necessários para atingir os objetivos. Quais as características do fenômeno que interessam à pesquisa? Visão sistêmica do fenômeno. Análise ambiental. Fase do diagnóstico. O que somos capazes de fazer? Fase da identificação das variáveis da pesquisa. O que fazer para obter o que queremos? 2- Coleta de dados A coleta de dados é a busca das informações necessárias à pesquisa. É a fase operacional da pesquisa. Momento de levantar as informações necessárias para a pesquisa. A qualidade de um instrumento de medida se aprecia pela sua fidelidade ou confiabilidade e pela sua validade. A confiabilidade é a capacidade de um instrumento medir fielmente um fenômeno. A validade é capacidade de um instrumento medir com precisão o fenômeno a ser estudado e a confiabilidade de um instrumento de pesquisa é sua capacidade de reproduzir um resultado de forma consistente no tempo e no espaço. Existem três fontes de coleta de dados: utilização de documentos, a observação pelo pesquisador e a informação fornecida pelas pessoas. 2.9. Responsabilidades do pesquisador, da instituição 2.8. Propriedades da informação do promotor e do patrocinador e divulgação da pesquisa 3. Documentação Complementar 2.7. Análise dos riscos e dos benefícios 2.6. Monitorização da pesquisa 2.5. Orçamento 2.4. Relação de materiais 2.3. Etapas da pesquisa e Cronograma 2.2. Plano de trabalho e métodos 2.1. Razões e Objetivos da Pesquisa 2. Projeto de Pesquisa 2.3. Etapas da Pesquisa e Cronograma 2.2.6. Método estatístico 2.2.5. Variáveis 2.2.4. Procedimentos 2.2.3. Amostra III. Documentação Complementar 2.2.2. Local 2.2.1. Tipo de Estudo - Comitê de Ética em Pesquisa A. Razões e Objetivos 1. Informações Gerais 2.2 Plano de Trabalho e Métodos 3- Sumarização do fenômeno É a fase da organização das informações coletadas e a da apresentação do fenômeno em estudo, por meio de tabelas e gráficos. As tabelas organizam as informações coletadas e apresentam de maneira sintética o fato estudado e os gráficos nos dão uma visão do problema e suas tendências. É a parte síntese e bela do trabalho estatístico. A sumarização é a apresentação tabular e gráfica do problema levantado, com suas variáveis, pontos críticos, tendências e flutuações. É a visão clara dos fatos. 3.6. Curriculum vitae Lattes dos pesquisadores envolvidos 3.5. Modelo da tabela de dados individuais 3.4. Cópia do documento de aprovação pelo comitê de hética e pesquisa 3.3. Modelo dos formulários de coleta dedo dados 3.2. Modelo termo de consentimento livre e esclarecido 3.1. Referências 2. Projeto de Pesquisa 3. Documentação Complementar Qual a relação entre pergunta da pesquisa e a amostra? 4- Descrição numérica do fenômeno É a fase da realização de cálculos que darão o suporte necessário para a interpretação dos dados. Uma análise coerente e uma conclusão sedimentada, em primeiro momento, com base em dados concretos e em segundo, com base nas flutuações e perspectivas do mercado definem as metas a serem alcançadas, no próximo passo. 5- Análise e Previsão Obtida a descrição numérica do fato observado, do fenômeno em estudo, do problema em análise, inicia-se a última etapa do processo, visando definir o perfil do problema estudado, suas variações e tendências. Nesta última etapa, o relatório final, a análise descritiva e inferencial, indicando os pontos críticos e as flutuações da variável e as conclusões fundamentadas nas tendências de mercado e nas perspectivas da economia serão fatores para uma tomada de decisão com inteligência e cautela. Diferenças entre os indivíduos incluídos e os estudados Doentes estudados Potencial Benefício Doentes que não participam Não foi convidado a participar Centros/Médicos que não participam Inelegíveis Intervenção A Intervenção B McKee M, Britton A, Black N, McPherson K, Sanderson C, Bain C. Methods in health services research. Interpreting the evidence: choosing between randomised and non-randomised studies. BMJ. 1999 Jul 31;319(7205):312-5. Quais são os itens necessários para determinar a amostra? • • • • Critério de inclusão Critério de exclusão Amostragem Consentimento livre e esclarecido Amostra Critério de inclusão Critério de exclusão 1 Critério de exclusão 2 Critério de exclusão 3 Critério de exclusão 4 Amostra População n = 1000 Elegíveis n = 600 Incluídos n = 400 Final n = 380 Quem excluir? (Critérios de exclusão) Amostra por conveniência Amostra sistemática Probabilística Amostra por cotas Amostra por conglomerado Amostra Estratificada Amostra Sistemática Amostra Casual Simples Amostragem Amostra Não-probabilística Por que é importante a amostragem na aplicabilidade do estudo? População Amostragem randomizada Alocação randomizada Amostra 1,000,000 1,000 500 R N D 500 Extrapolação Todos os sujeitos têm probabilidade igual na seleção. Lavado EL, Castro AA. Projeto de pesquisa (parte V – amostra) Tratamento População estudada n = 50.000 Randomização: Distribuir os indivíduos aleatoriamente. Amostragem Randômica Seleção de um grupo aleatório. Amostra n = 2.000 Critério de exclusão 1 n = 50 Critério de exclusão 2 n = 100 Critério de exclusão 3 n = 250 Não deu o consentimento n = 200 Randomizados n = 1.400 Amostra n = 700 Exclusões n = 15 Final do estudo n = 675 Amostra n = 700 Perdas n = 10 Perdas n = 20 Exclusões n = 30 Final do estudo n = 650 O aluno bem sucedido: Entender qual a relação entre a pergunta clínica e a amostra; Saber quem determina a amostra a ser estudada; Entender quais são os componentes necessários para determinar a amostra; Conhecer quais são as técnicas de amostragem; Entender porque é importante a amostragem na aplicabilidade do estudo. Seleção de Amostras Amostras Probabilísticas servirão como base para a correta estimação dos parâmetros da população a qual se referem. Tipos de Amostras Probabilísticas • Amostra Aleatória Simples • Amostra Aleatória Sistemática • Amostra Aleatória Estratificada Seleção de Amostras Tipos de Amostras Probabilísticas Amostra Aleatória Simples Cada elemento da População é selecionado de maneira aleatória. Exemplo: Pesquisa em uma empresa com 5000 empregados, deseja-se selecionar uma amostra de 100 pessoas Casual ou Aleatória Simples: equivalente a um sorteio, é utilizada quando a população encontra-se desordenada, sendo que por essa técnica, qualquer elemento tem a mesma chance de ser sorteado. -Quando a população é relativamente pequena (até 30, por exemplo), pode-se numerar os elementos e em seguida, realizar o sorteio. - Tratando-se de uma quantidade grande, o processo de numeração torna-se trabalhoso. Para tanto, utilizase a TABELA DE NÚMEROS ALEÁTORIOS (TNA). -A leitura dessa tabela é feita, após escolhido o ponto de início, da esquerda para a direita e vice-versa, de cima para baixo e vice versa, na diagonal, etc. A opção deve ser feita antes de iniciado o processo. 111111111111111111111111111111111111111111111111111111111111111111111 11111111111111111 1111111111111111111111111111111111111111111111111111100 11111111111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111111111111111 11111111111 11111 11111111111 111 Ex.: Suponhamos que uma amostra deverá ter 12 elementos de uma população total de 90 indivíduos, e que se tenha escolhido começar na primeira linha da Tabela de Números Aleatórios (TNA), partindo da esquerda para a direita. O primeiro número escolhido seria 67, o segundo 72, e a seqüência seria: 67 - 72 - 00 - 39 - 84 - 84 - 41 - 79 - 67 - 71 - 40 - 21 – 13 Destes números sorteados seriam utilizados os 12 primeiros: 57 - 72 - 39 - 84 - 41 - 79 - 67 - 71 - 40 - 21 - 13 – 56 Se o procedimento escolhido fosse da direita para esquerda, os elementos utilizados: 83 - 54 - 74 - 68 - 29 - 08 - 86 - 49 - 56 - 13 - 21 - 40 2. SISTEMÁTICA - novamente é feito o sorteio, sendo que nessa amostragem os elementos da população já se encontram ordenados e, nesses casos, não é necessário se construir um sistema de referência (TNA). Exemplos de populações ordenadas: fichas individuais de empregados (alfabética), casas de uma rua (número), notas fiscais (data), etc. Ex.: Suponhamos que uma empresa tenha 720 colaboradores em determinado setor, dentre os quais deseja-se uma amostra formada por 30 destes empregados 1111111111111111111111111111111111111111111111111111111111111111111111111111111111111 1111111111111111111111111111111111111111111111111111111111111111111111111111111111111 11 111111111111111111111111111111111111111111111111111 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 1111111111111111111111111111111111111111111111111111111111111111111111111111111111111 Seleção de Amostras Tipos de Amostras Probabilísticas Amostra Aleatória Sistemática O primeiro elemento da População é selecionado de maneira aleatória os demais de acordo com alguma lei de formação. Exemplo: Empresa com 5000 empregados, deseja-se selecionar uma amostra de 100 pessoas. Ordena-se os empregados, o primeiro é selecionado e os outros serão escolhidos somando 15 a ordenação. Seleção de Amostras Tipos de Amostras Probabilísticas A população é dividida em estratos com mesmas características.São selecionados os elementos da amostra de maneira aleatória e os parâmetros resultantes serão agregados de forma proporcional Amostra Aleatória Estratificada Exemplo: • Pesquisa Eleitoral Experimento Aleatório Os experimentos aleatórios são aqueles cujos resultados não são sempre os mesmos, apesar de se repetirem, várias vezes, em condições semelhantes. Estes experimentos são aqueles que apresentam resultados imprevisíveis. O lançamento de moedas e dados, bem como sorteios e extrações lotéricas são fenômenos aleatórios. Alguns experimentos aleatórios poderão ser repetidos sob as mesmas condições indefinidamente. Amostragem Aleatória É uma técnica que visa selecionar os integrantes de uma amostra de tal forma que cada elemento de uma população tem a mesma probabilidade de ser incluído na amostra. Existem dois tipos de amostras, as probabilísticas, baseadas nas leis de probabilidades, e as amostras não probabilísticas, que tentam reproduzir o mais fielmente possível a população alvo. Entretanto, somente as amostras probabilísticas podem, por definição, originar uma generalização estatística, apoiada no cálculo de probabilidades e permitir a utilização da potente ferramenta que é a inferência estatística. ESTRATIFICADA PROPORCIONAL: utilizada quando a população encontra-se dividida em estratos (ou camadas, faixas, intervalos, etc). Exemplos de populações divididas em estratos: -sexo (homem e mulher); - idade (criança, adolescente, adulto e idoso); -setores de uma empresa (administração, vendas, tesouraria, serviços gerais, etc). -Cursos de uma faculdade (C. Contábeis, administração, Direito, Enfermagem, etc); -Faixa salarial (até 1 SM, de 1 a 2 SM, de 2 a 4 SM, acima de 4 salários-mínimos). 1111111111111111111111111111111111111111111111111111111111111111111111111111111111111 1111111111111111111111111111111111111111111111111111111111111111111111111111111111111 11 111111111111111111111111111111111111111111111111111 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 11 1111111111111111111111111111111111111111111111111111111111111111111111111111111111111 Estimação “Procedimento estatístico que permitirá a determinação de características populacionais com base em dados coletados em amostras.” Exemplo: • 1. Pesquisas eleitorais • 2. Procedimentos de Controle de Qualidade • 3. Pesquisas do IBGE. Estimação Estimador e Estimativa • Estimador: Função matemática que terá a finalidade de avaliar determinada característica populacional Exemplo: média, desvio-padrão etc. • Estimativa: Valor que essa função poderá assumir. Seleção de Amostras O primeiro passo para fazer inferências corretas utilizando amostragem, é fazer o levantamento dessas amostras de maneira adequada. Seleção de Amostras Tipos de Amostras • Amostras Probabilísticas Cada item da amostra tem a mesma chance de ser selecionado que os demais. • Amostras Não – Probabilísticas Cada item selecionado não possui a mesma chance de ser selecionado que os demais. Não há dúvida de que uma amostra não representa perfeitamente uma população. Ou seja, a utilização de uma amostra implica na aceitação de uma margem de erro que denominaremos ERRO AMOSTRAL. Erro Amostral é a diferença entre um resultado amostral e o verdadeiro resultado populacional; tais erros resultam de flutuações amostrais aleatórias Ocorrem erros não-amostrais quando: · Os dados amostrais são coletados, registrados ou analisados incorretamente. · Há uma utilização de um instrumento defeituoso durante a realização de mensurações. · Um questionário ou formulário possui questões formuladas de modo tendencioso [Triola, 1999]. Não podemos evitar a ocorrência do ERRO AMOSTRAL, porém podemos limitar seu valor através da escolha de uma amostra de tamanho adequado. Obviamente, o ERRO AMOSTRAL e o TAMANHO DA AMOSTRA seguem sentidos contrários (Figura 1). Quanto maior o tamanho da amostra, menor o erro cometido e vice-versa. TAMANHO DA AMOSTRA + ERRO AMOSTRAL Figura 1 – Relação intuitiva entre o tamanho da amostra e o erro amostral. DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA COM BASE NA ESTIMATIVA DA MÉDIA POPULACIONAL Suponha, por exemplo, que queiramos estimar a renda média de pessoas que concluíram um curso superior, no primeiro ano após a formatura. QUANTAS rendas devemos incluir em nossa amostra? A determinação do tamanho de uma amostra é problema de grande importância, porque: ·amostras desnecessariamente grandes acarretam desperdício de tempo e de dinheiro; ·e amostras excessivamente pequenas podem levar a resultados não confiáveis. Em muitos casos é possível determinar o tamanho mínimo de uma amostra para estimar um parâmetro estatístico, como por exemplo, a MÉDIA POPULACIONAL (m). A fórmula para cálculo do tamanho da amostra para uma estimativa confiável da MÉDIA POPULACIONAL (m) é dada por: CONTINUAÇÃO Exemplo: DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA COM BASE NA ESTIMATIVA DA PROPORÇÃO POPULACIONAL Outro parâmetro estatístico cuja determinação afeta o tamanho da amostra é a proporção populacional. n Z 2 .0,25 2 E /2 Equação 3 n = Número de indivíduos na amostra Z / 2 = Valor crítico que corresponde ao grau de confiança desejado E = Margem de erro ou ERRO MÁXIMO DE ESTIMATIVA. Identifica a diferença máxima entre a PROPORÇÃO AMOSTRAL e a verdadeira PROPORÇÃO POPULACIONAL (p). 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 111 11 DETERMINAÇÃO DO TAMANHO DA AMOSTRA PARA POPULAÇÕES FINITAS As fórmulas para determinação do tamanho da amostra que vimos até agoratrabalhavam com a idéia de que a população de onde se retirava a amostra era tão grande, que poderíamos considerá-la infinita. Entretanto, a maior parte das populações não é tão grande em comparação com as amostras. Caso a amostra tenha um tamanho (n) maior ou igual a 5% do tamanho da população (N), considera-se que a população seja FINITA. Neste caso, aplica-se um fator de correção às fórmulas vistas anteriormente e teremos as seguintes fórmulas corrigidas: NORMAS PARA CONSTRUÇÃO DE TABELAS ESTATÍSTICAS Um dos objetivos da estatística é sintetizar os valores que uma ou mais variáveis podem assumir, para que tenhamos uma visão global da variação das mesmas. Tabela é uma maneira de apresentar de forma resumida um conjunto de dados. Estas normas visam fornecer elementos que assegurem a padronização e racionalização da apresentação de dados numéricos em tabelas e em gráficos. Tais normas fixam conceitos e procedimentos aplicáveis à elaboração de tabelas e gráficos, visando garantir a clareza das informações apresentadas. A tabela é uma forma de apresentar informações entre as quais o dado numérico se destaca como a informação central. Os espaços de uma tabela são: Topo: é o espaço superior de uma tabela destinado ao seu número e ao seu título. 11111111111111111111111111111111111111111111111111111111111111111111111111111111111 11111111111111111111111111111111111111111111111111111111111111111111111111111 TÍTULO DA TABELA Conjunto de informações, as mais completas possíveis, respondendo às perguntas: O que?, Quando? E Onde?, localizado no topo da tabela, além de conter a palavra “TABELA” e sua respectiva numeração. CORPO DA TABELA: é o conjunto de Linhas e Colunas que contém informações sobre a variável em estudo. a) Cabeçalho da Coluna – Parte superior da tabela que especifica o conteúdo das colunas; b) Coluna Indicadora – Parte da tabela que especifica o conteúdo das linhas; c) Linhas – retas imaginárias que facilitam a leitura, no sentido horizontal, de dados que se inscrevem nos seus cruzamentos com as linhas; d) Casa ou Célula – espaço destinado a um só número; e) Total – deve ser SEMPRE destacado de alguma forma; f) Laterais da tabela – não devem ser fechadas. Caso as feche, passa a ser chamada de “QUADRO”. g) Número – preferencialmente utilizar separador de 1000 (por exemplo: 1.854.985 ao invés de 1854985). Há ainda a considerar os elementos complementares da tabela, que são a fonte, as notas, e as chamadas, localizadas, de preferência, no rodapé. a) Fonte – identifica o responsável (pessoa física ou jurídica) ou responsável pelos dados numéricos; b) Notas – é o texto que irá esclarecer o conteúdo estudado, que poderá ser de caráter geral ou específico de uma tabela; c) Chamadas – símbolo remissivo atribuído a algum elemento de uma tabela que necessita de uma nota específica. Séries/Tabelas Estatísticas As séries se classificam em função de 3 caracteres básicos: • Época: variável temporal, histórica ou cronológica a que se refere o fenômeno; • Local: variável espacial ou geográfica, onde o fenômeno ocorreu ou ocorre; • Espécie: variável espécie do fato ou fato específico que descreve o fenômeno. Séries Simples • A Série Temporal, cronológica, histórica, evolutiva ou em marcha será identificada por meio de uma variável temporal, o quando aconteceu o fato e pelos fatores fixos: geográfico e específico. • A Série Geográfica, territorial, espacial ou de localização. Apresenta como elemento variável o espaço, a localização, o local, onde o fato aconteceu e pelos fatores fixos o tempo e a espécie. • A Série Específica, categórica ou especificativa apresenta como variável a espécie do fenômeno, as divisões do fato estudado, o quê estudado, permanecendo fixos os fatores temporal e geográfico. • Séries Compostas. Uma série é composta quando o fenômeno apresenta mais de uma variável. As séries poderão ser combinadas 2 a 2 ou 3 a 3, resultando daí uma série de dupla entrada. Gráficos Tradicionais O gráfico é uma forma de apresentação dos dados pesquisados com o objetivo de levar ao público uma visão rápida do fenômeno estudado. O gráfico é a forma mais simples de comunicação dos fenômenos estatísticos. O gráfico , usado para espelhar um fenômeno, deve ser construído com simplicidade, clareza e veracidade, devendo atrair a atenção do observador; exprimindo com rapidez e com simplicidade uma mensagem; sendo prontamente explicativo, inteligível, inspirando a confiança e um cuidadoso acabamento. Gráfico Estereograma O estereograma é a representação gráfica dos fenômenos através de figuras de volume Gráfico Setores Algumas referências: • • • • • • • • • • • • • Altman, 1980a. Altman DG. Statistics and ethics in medical research: misuse of statistics is unethical. Br Med J 1980 Nov 1;281(6249):1182-4. Altman, 1980b. Altman DG. Statistics and ethics in medical research: III How large a sample? Br Med J. 1980 Nov 15;281(6251):1336-8. Altman, 1980c. Altman DG. Statistics and ethics in medical research: V--Analysing data. Br Med J. 1980 Nov 29;281(6253):1473-5. Altman, 1983. Altman DG, Gore SM, Gardner MJ, Pocock SJ. Statistical guidelines for contributors to medical journals. Br Med J (Clin Res Ed). 1983 May 7;286(6376):1489-93. Bland, 1998. Bland JM, Altman DG. Survival probabilities (the Kaplan-Meier method). BMJ 1998 Dec 5;317(7172):1572. Borenstein, 1994. Borenstein M. Planning for precision in survival studies. J Clin Epidemiol 1994;47:1277-85. Campbell, 1995. Campbell MJ, Julious SA, Altman DG. Estimating sample sizes for binary, ordered categorical, and continuous outcomes in two group comparisons. BMJ 1995 Oct 28;311(7013):1145-8. Disponível em URL: http://www.bmj.com/cgi/content/full/311/7013/1145 Obrigada !!!