Estatística • tem objeto e métodos próprios • não tem um objetivo em si mesma. • tem como função auxiliar as outras ciências, sendo portando considerada um método científico de trabalho • não é uma ciência. Estatística • UTILIZAÇÃO: aplicável a qualquer ramo do conhecimento onde se manipulem dados numéricos: – – – – Física Química Biologia Engenharia Ciências Sociais Ciências Administrativas, etc. Economia Medicina Estatística • Estatística pode ser dividida em duas partes: – .Estatística Descritiva - cuida da: • Organização • descrição dos dados experimentais; – .Estatística Indutiva - cuida da: • análise • interpretação dos dados Estatística • Conceitos fundamentais: – POPULAÇÃO – AMOSTRA População (Universo Estatístico) • conjunto de elementos com pelo menos uma característica comum. • Esta característica deve delimitar quais os elementos que pertencem à população e quais os que não pertencem. • Exemplo:Vamos estudar o desempenho dos estudantes em 2008. – POPULAÇÃO = todos os estudantes de 2008 População - Universo Estatístico • COMO DEFINIR UMA POPULAÇÃO? • A quem interessa este resultado? • Se o analista dos resultados for o responsável pelos cursos de Administração ou Ciências Contábeis, será que interessa a ele o desempenho dos alunos de Fisioterapia ou Educação Física? • Devemos procurar as características que interessam ao analista dos resultados Levantamento • definida as características da POPULAÇÃO, o passo seguinte é o levantamento de dados acerca das características objeto de estudo. • PERGUNTA-SE... • Deve-se pesquisar dados de toda a população? Levantamento • Em grande parte das vezes não é conveniente e em muitas vezes é impossível • E Por que? Levantamento TEMPO: as informações devem ser obtidas com rapidez PRECISÃO: as informações devem ser corretas CUSTO: no processo de coleta, sistematização, análise e interpretação, o custo deve ser o menor possível. Amostra • Outros motivos para se tomar uma amostra – Exame de doença contagiosa: o pesquisador poderia infectar-se e começar a transmitir a doença a todos os entrevistados. – Testes destrutivos – exame de sangue de um paciente – trabalho extenso: anotações erradas Amostra • Devemos então delimitar nossas observações a uma parte da população, isto é, a uma amostra proveniente dessa população. • AMOSTRA: É um subconjunto de uma população, necessariamente finito, pois todos os seus elementos serão examinados para efeito da realização do estudo estatístico desejado. Amostra • A Estatística Indutiva tira conclusões sobre populações com base nos resultados observados em amostras extraídas dessas populações. • A partir do conhecimento de uma parte, procura-se tirar conclusões sobre a realidade, no todo. • Logicamente a indução não traz resultado exato, dando margem a erro. Amostra • A Estatística Indutiva, entretanto, irá nos dizer até que ponto poderemos estar errando em nossas induções e com que probabilidade. Amostra • Quanto maior a amostra, mais confiáveis serão as induções ? • erros grosseiros e conclusões falsas podem ocorrer devido a falhas na amostragem. POPULAÇÃO E AMOSTRA POPULAÇÃO: – é uma coleção completa de todos os elementos a serrem estudados AMOSTRA: – é um subconjunto da população CENSO: – é uma coleção da dados relativos a todos os elementos de uma população: Variável • Antes de tudo, é necessário que se tenham bem definidas quais características deverão ser verificadas. Ex.: Alunos do unisalesiano . (Universo Estatístico ou População). • Dentro da população, é preciso definir quais as características que nos interessa averiguar. Ex. idade, sexo, estado civil, etc. • A escolha da variável dependerá dos objetivos do estudo estatístico. Variável • é o conjunto de resultados possíveis de um fenômeno. • é a característica ou propriedade da população que está sendo medida. Ex.: – População: moradores de uma cidade – Variável : número de filhos – População: alunos do unisalesiano – Variável : sexo Variável – População: – Variável : moradores de um prédio peso • CLASSIFICAÇÃO DA VARIÁVEL • pode ser: • A) QUANTITATIVA A 1 - DISCRETA A.2 - CONTÍNUA • B) QUALITATIVA B 1 - NOMINAL B.2 - ORDINAL A - Variáveis Quantitativas • quando pode ser expressa em números. Ex: – – – – quantidade de valores de notas de uma moeda quantidade de sabores de refresco duração de uma bateria de telefone celular número de ossos existentes em um animal A - Variáveis Quantitativas • A.1. - Quantitativas DISCRETAS: – quando os valores podem assumir apenas determinados valores e resultam de uma contagem. – O conjunto de valores possíveis que a variável pode assumir é finito ou infinitos enumerável. Ex: • valores das cédulas da moeda brasileira • número de filhos dos casais de Lins A - Variáveis Quantitativas • A.2. - Quantitativas CONTÍNUAS: – quando os valores podem assumir pertence ao conjunto dos números reais. Podem assumir qualquer valor. – Obtido por medição. Ex; • peso de um paciente • altura • tempo de vôo entre duas cidades B - Variáveis Qualitativas • quando a variável é não numérica ou definida através de atributos, categorias. Ex: – – – – sexo religião naturalidade cor dos olhos B - Variáveis Qualitativas B.1. - qualitativas NOMINAIS: não tem ordenamento nem hierarquia; Ex: sexo dos pacientes da clínica; tipo de convênio utilizado. B.2. - qualitativas ORDINAIS: existe uma ordem, uma hierarquia; Ex: presidente, diretor, gerente, etc... Classificação: bom, regular, ruim. ESCALA DE MEDIÇÃO DAS VARIÁVEIS • ESCALA NOMINAL: – dão nome a uma categoria ou classe. – Os dados não podem ser dispostos em um esquema ordenado. Ex: Respostas do tipo “sim”, “não” ou “indeciso” Procedência de qual cidade (Lins, Promissão, etc.) – não se faz cálculos (ex: tirar a média) – algumas vezes são atribuídos números aos dados para serem inseridas no computador: 0 - sim; 1 - não, 2 indeciso. Neste caso são apenas rótulos e não podem ser efetuados cálculos com estes números. ESCALA DE MEDIÇÃO DAS VARIÁVEIS • ESCALA ORDINAL: – dão nome e uma ordem a uma categoria ou classe. – Diferença entre os valores dos dados não podem ser determinadas ou não fazem sentido. • Ex: grau de instrução:1= sem instrução; 2 = primeiro grau; 3 = segundo grau, 4 = superior; 5 = Mestre; 6 = Doutor. Não mantém a propriedade dos números: embora 3 seja maior do que 2, não significa que 3 + 2 = 5. – Não é possível quantificar o quanto o nível 3 é melhor do que 2 ou o 4 é melhor do que 3. ESCALA DE MEDIÇÃO DAS VARIÁVEIS • ESCALA INTERVALAR: elimina a limitação da escala ordinal estabelecendo intervalos iguais com o mesmo significado. Ex: na medição de temperatura tanto de 25º a 30º o aumento é de 5º, como o aumento de temperatura tanto de 30º a 35º o aumento é de 5º. Porém, não se pode afirmar que 60º é o dobro de 30º, pois 0º da escala de temperatura é arbitrário. • ESCALA PROPORCIONAL ou NÍVEL DE RAZÃO: Apresenta um ZERO absoluto. Ex: peso. Peso Zero = ausência de peso. 60 kgs é o dobro de 30 kgs. Variáveis DEPENDENTES E INDEPENDENTES Variável Independente: – é a que influencia, determina ou afeta outra variável; – referida como fator determinante, condição ou causa para ocorrência de determinada resposta. Variável dependente: – a sua resposta varia em virtude dos diferentes valores que a variável independente pode assumir; – modificando-se a variável independente, altera-se o valor da variável dependente. Variáveis DEPENDENTES E INDEPENDENTES • Variável Independente (VI): é o antecedente; • Variável dependente(VD): é o conseqüente Variável Independente idade sexo Variável Dependente comprimento Resistência física Variáveis DEPENDENTES E INDEPENDENTES • Como detectar se uma variável é dependente ou independente ? • Critério de sucetibilidade à influência: – Variável dependente é alterada ou influenciada pela variável independente: – Ex: dependente: predisposição a problemas cardíacos independente: sexo Variáveis DEPENDENTES E INDEPENDENTES • Critérios para identificar o sentido de influência entre as variáveis dependente e independente ? • 1) Ordem temporal: – o que ocorre depois não pode influenciar o que aconteceu antes. Ex: V. independente V. dependente Aumento do U$ em Aumento dos preços relação ao R$ dos combustíveis Variáveis DEPENDENTES E INDEPENDENTES • 2) Fixidez: em Ciência Biológicas, muitas variáveis podem ser consideradas fixas, ou não são sujeitas a influências. Ex: – suscetibilidade a certas doenças está associada ao sexo do indivíduo; – variáveis bioquímicas em animais e no homem são dependentes da idade. – Peso do recém-nascido está relacionado com a ordem de nascimento. CO-VARIÁVEIS • Em todo experimento existe: – variável dependente: a ser analisada; – variável independente: • que são fatores que influenciam os resultados da variável dependente; • determinam as condições sob os quais a variável dependente é obtida. CO-VARIÁVEIS • Qualquer outra variável que possa interferir no resultado deve ser mantido constante. • Isto é possível em procedimentos experimentais e não em processos não controlados. • Ex: Comparação de 2 tipos de cirurgias executadas na rotina hospitalar: CO-VARIÁVEIS • Variáveis como: idade e tempo da doença geralmente devem ser consideradas como co-variáveis. • Desta forma a comparação entre tratamentos pode ser efetuada sem que elas interfiram, – mascarando resultados – levando a conclusões erradas • Esta neutralização é obtida através de processos estatísticos adequados • Ex: Comparação da produção de leite entre vacas de uma mesma raça, alimentadas com duas rações diferentes. – O período de lactação que varia ao longo do experimento influencia a produção – esta influência deve ser adequadamente neutralizada, para que os resultados não sejam mascarados, levando a conclusões falsas. CO-VARIÁVEIS CONCLUSÃO CO-VARIÁVEL: é um fator que o pesquisador procura neutralizar intencionalmente em uma investigação, com a finalidade de impedir que interfira na análise da relação entre as variáveis independentes e dependentes Tabela Primitiva • Dado um levantamento de dados estatísticos de uma variável quantitativa, como por exemplo, a altura dos alunos da FACAC em 2004, que tenha dado os seguintes valores (em cm.): • 165 167 172 160 158 175 157 168 174 179 154 160 173 181 155 166 185 172 157 164 170 168 174 155 Tabela Primitiva • Notamos que a tabela não está numericamente organizada. • A esta tabela denominamos TABELA PRIMITIVA. • com os dados dispostos desta maneira é difícil fazer qualquer análise e tirarmos alguma conclusão a respeito deste levantamento. • Para facilitar a análise vamos dispor em uma ordem crescente ou decrescente. ROL • 154 155 155 157 157 158 160 160 164 165 166 167 168 168 170 172 172 173 174 174 175 179 181 185 • Concluímos que a menor estatura é de 154 e a maior é de 185. • A amplitude é de 185 - 154 = 31. • A leitura da tabela fica mais clara. • A esta tabela organizada denominamos ROL. Estatística • Resumindo: • TABELA PRIMITIVA: é a tabela onde o conjunto de elementos não foram numericamente ordenados. • ROL: a tabela onde os dados foram numericamente ordenados de forma crescente ou decrescente. Distribuição de Freqüência • Para facilitar a análise dos dados: – vamos ordenar em colunas colocando o número de vezes que aparece repetido. • TABULAR: é registrar quantas vezes o termo aparece no rol. • Este processo pode ser inconveniente, pois pode gera uma tabela muito extensa pela quantidade de valores diferentes no levantamento de dados Distribuição de Freqüência • Estaturas dos alunos de FACAC-2004 Altura freqüência 154 1 155 2 Altura freqüência 165 1 166 1 157 158 160 2 1 2 167 168 170 1 2 1 154 1 172 2 Fonte: Dados fictícios Distribuição de Freqüência • Estaturas dos alunos de um determinado curso Altura freqüência 173 1 174 2 175 179 181 1 1 1 185 1 total 24 Distribuição de Freqüência • Para facilitar a análise dos dados obtidos, agrupar os valores em intervalos de classes (principalmente para variáveis contínuas). • Assim dividimos nossa distribuição em INTERVALOS DE CLASSE • INTERVALO DE CLASSE: agrupar valores. é a forma de Distribuição de Freqüência 154 158 162 166 170 174 178 182 ALUNOS DE ANO 2004 Altura freqüência 158.......... 5 162.......... 3 166.......... 2 170.......... 4 174.......... 4 178.......... 3 182.......... 2 186.......... 1 total......... 24 Fonte: Dados fictícios Distribuição de Freqüência • CLASSES DE FREQÜÊNCIA • São intervalos de variação da variável As classes são representadas simbolicamente por “ i ” Assim o intervalo 162 166 define a 3ª classe i = 3 A distribuição é formada por 8 classes Distribuição de Freqüência As classes são: 1ª classe: 2ª classe 3ª classe 4ª classe 5ª classe 6ª classe 7ª classe 8ª classe 154 158 162 166 170 174 178 182 158 162 166 170 174 178 182 186 Distribuição de Freqüência • LIMITES DE CLASSE • São os extremos de cada classe. Temos • li = limite inferior da classe • ls = limite superior da classe • Referente à 3ª classe temos: – 162 – 166 li = 162 inclui limite inferior lS = 166 exclui limite superior Distribuição de Freqüência • • • • • • FREQÜÊNCIA É o número de ocorrências em que uma única característica é observada. FREQÜÊNCIA SIMPLES ou ABSOLUTA (fi) São os valores que representam o número de dados de classe é resultante da contagem. Ex: Na 3ª classe a freqüência foi igual a 2, ou seja duas pessoas têm estatura entre 162 a 166 cm (exclusive). Distribuição de Freqüência • FREQÜÊNCIA ACUMULADA (Fac ou Fi ) • É o valor total (soma) das freqüências dos valores inferiores ao limite superior do intervalo de uma das classes. • FREQÜÊNCIA RELATIVA ( Fr ) • É dado pela razão da freqüência simples e a freqüência total. Fr = freqüência simples (f i) freqüência total Distribuição de Freqüência FREQÜÊNCIA RELATIVA PERCENTUAL (Fr %) Fr % = Fr x 100 PONTO MÉDIO ( PM ) • É o ponto que divide o intervalo de classe em duas partes iguais. PM = li + ls 2 Distribuição de Freqüência AMPLITUDE TOTAL DA DISTRIBUIÇÃO (AT) • AT=limite superior máximo-limite inferior mínimo • No nosso exemplo AT = 186 - 154 = 32 AMPLITUDE DE UM INTERVALO DE CLASSE (h) h = limite superior da classe - limite inferior da classe h = ls - li 1) 2) 3) 4) 5) 6) 7) 8) 9) 10) 11) 12) Quantos elementos foram pesquisados? Quantas pessoas têm altura entre 160 (inclusive) e 170 (excluindo) Isto representa quantos porcento do total? Quantos porcento têm altura entre 160 (inclusive ) e 180 (excluindo)? Quantas pessoas têm altura inferior a 170? Quantos porcento têm altura de no mínimo 160? Quantos porcento têm altura abaixo de 180? Qual a classe (faixa de altura) de maior freqûëncia? Quantos porcento esta classe representa do total? Qual a classe de menor freqüência? Quantos alunos representam? Se for sorteado um elemento ao acaso, qual a probabilidade deste elemento ter altura mínima de 170? Escolhido um aluno ao acaso, sabendo-se que ele têm altura abaixo de 170, qual a probabilidade dele ter altura entre 160 (inclusive) e 170? Escolhido um aluno ao acaso, sabendo que ele tem altura maior ou igual a 160, qual a probabilidade dele ter altura acima de 170?