Curso de Capacitação Docente Prof. Hubert Chamone Gesser, Dr. Graduação em Odontologia - UFSC Graduação em Administração - ESAG/UDESC Especialização em Odontologia em Saúde Coletiva - ABO/SC Doutorado e Mestrado em Engenharia de Produção - UFSC Agradecimentos: Prof. Rafael Villari, Dr. Reitor do Centro Universitário Estácio de Sá de Santa Catarina Profa. Priscila Monteiro Pereira, M.Sc. Pró-reitora Acadêmica do Centro Universitário Estácio de Sá de Santa Catarina Prof. Jorge Dolzan, M.Sc. Pró-reitor de Pós graduação do Centro Universitário Estácio de Sá de Santa Catarina Profa. Patrícia Soberajski Barreto, Dra. Focal de Pesquisa e Extensão do Centro Universitário Estácio de Sá de Santa Catarina - SUMÁRIO - Conceitos Básicos Correlação Linear Conhecendo os Dados Regressão Linear Medidas de Tendência Central Teste de Diferença entre Médias Medidas de Dispersão Bibliografia Conceitos Básicos Prof. Hubert Chamone Gesser, Dr. Retornar ESTATÍSTICA ESTATÍSTICA Origem no latim status (estado) + isticum (contar) Informações referentes ao estado Coleta, Organização, Descrição, Análise e Interpretação de Dados ESTATÍSTICA Elaborando a Definição de Estatística ESTATÍSTICA O Que é Estatística (definição)? “Estatística é um conjunto de técnicas e métodos que nos auxiliam no processo de tomada de decisão na presença de incerteza.” ESTATÍSTICA POR QUE A ESTATÍSTICA É IMPORTANTE? As diferenças são atribuídas a causas erradas; As coincidências ocorrem frequentemente; As pessoas têm dificuldades com probabilidades; Acrescentam polimento às publicações; Faz conhecer o “grau de confiança” das conclusões. BIOESTATÍSTICA POPULAÇÃO E AMOSTRA POPULAÇÃO (N): Todos os estudantes da Estácio Plano de Amostragem AMOSTRA (n): Parte dos estudantes da Estácio ESTATÍSTICA REQUISITOS DE UMA AMOSTRA 1) Ter um tamanho adequado (previamente calculado) Existem fórmulas para o cálculo do adequado tamanho da amostra 2) Constituintes selecionados ao acaso (sorteio) ESTATÍSTICA ESTATÍSTICA Ferramentas para Análise de Dados • • • • • • • SPSS Epidata Bioestat Excel STATA SAS Epi Info Conhecendo os Dados Prof. Hubert Chamone Gesser, Dr. Retornar ESTATÍSTICA TIPOS DE DADOS Dados Nominais (Sexo, Raça, Cor dos Olhos) Dados Ordinais (Grau de Satisfação) Dados Numéricos Contínuos (Altura, Peso) Dados Numéricos Discretos (Número de Filiais) “Estatísticas aplicadas em alguns tipos de dados não podem ser aplicadas a outros.” ESTATÍSTICA TIPOS DE DADOS Dados Intervalares (Temperatura oC) Quando se referem a valores obtidos mediante a aplicação de uma unidade de medida arbitrária, porém constante e onde o zero é relativo. Este tipo de dado tem restrições a cálculos. 30oC não é três vezes mais quente que 10oC Para cálculos se utiliza a escala Kelvin ESTATÍSTICA Medidas de Tendência Central Prof. Hubert Chamone Gesser, Dr. Retornar ESTATÍSTICA MEDIDAS DE TENDÊNCIA CENTRAL Nos dão uma ideia de onde se localiza o centro, o ponto médio de um determinado conjunto de dados. f Medidas: Média, Moda e Mediana. x ESTATÍSTICA MÉDIA É um valor típico representativo de um conjunto de dados. Fisicamente representa o ponto de equilíbrio da distribuição. Modos de calcular 1) para dados simples x=Sx/n 2) para valores distintos x = S fx / n 3) para agrupamentos em classes x = S fx / n ESTATÍSTICA Fonte: renovadoresudf.wordpress.com ESTATÍSTICA MEDIANA É o valor que ocupa a posição central de um conjunto de dados ordenados. Para um número par de termos a mediana é obtida através da média aritmética dos dois valores intermediários. Interpretação: 50% dos valores estão abaixo ou coincidem com a mediana e 50% estão acima ou coincidem com a mediana. ESTATÍSTICA MEDIANA Fonte: http://guiacemtiradentes.blogspot.com.br/2013/03/moda-mediana-media-matematica.html ESTATÍSTICA Interpretação da Mediana: 50% dos valores estão abaixo ou coincidem com a mediana e 50% estão acima ou coincidem com a mediana. Na Empresa ABC o salário mediano é de R$ 2.800,00 ESTATÍSTICA MEDIANA 1) Cálculo da posição da mediana para dados simples 2 3 4 5 6 7 8 9 10 PMd =(n+1) / 2 PMd = (9+1) / 2 PMd = 5o Termo Mediana (Md) = 6 ESTATÍSTICA MODA É o valor que ocorre com maior frequência em um conjunto de dados. Símbolo = Mo 1) Moda para dados simples Exemplos: 2, 3, 4, 5, 6, 7, 8 AMODAL 2, 3, 3, 4, 5, 6 ,7 MODA = 3 2, 3, 3, 4, 5, 5, 6 BIMODAL (Mo = 3 e Mo = 5) ESTATÍSTICA Média, Mediana e Moda. Fonte: http://revistaescola.abril.com.br/fundamental-2/moda-media-mediana-quando-usar-como-interpretar-resultados-732318.shtml#ad-image-2 ESTATÍSTICA USO DAS MEDIDAS DE TENDÊNCIA CENTRAL MÉDIA: Dados Numéricos e Intervalares É a medida mais utilizada. MODA: Dados Nominais MEDIANA: Dados Ordinais Medidas de Dispersão Prof. Hubert Chamone Gesser, Dr. Retornar ESTATÍSTICA DISPERSÃO DOS DADOS É frequentemente chamada de variabilidade. Medidas mais comuns: - Variância, - Desvio Padrão, - Amplitude, - Coeficiente de Variação ESTATÍSTICA Fonte: http://jesseantenado.blogspot.com.br/2012_01_01_archive.html ESTATÍSTICA VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA Variância da Amostra ( s2 ou v ) s2 = S ( x - x )2 / ( n -1 ) Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância s = s2 A dispersão nas amostras é menor do que na população, por isso é que se faz este ajuste matemático ESTATÍSTICA DESVIO PADRÃO SIGNIFICADO: É um modo de representar a dispersão dos dados ao redor da média. f Média x ESTATÍSTICA DESVIO PADRÃO A curva A mostra uma dispersão dos dados maior do que a curva B, logo o desvio padrão de A é maior do que o de B. f f Curva A Média Curva B x Média x ESTATÍSTICA COEFICIENTE DE VARIAÇÃO O desvio padrão depende da unidade de medida usada, assim um desvio medido em dias será maior do que um medido em meses. O coeficiente de variação expressa o desvio-padrão como porcentagem do valor da média. COEF. VARIAÇÃO = 100 . DESVIO PADRÃO MÉDIA Quanto menor for este coeficiente mais homogênea é a amostra. ESTATÍSTICA COEFICIENTE DE VARIAÇÃO Classificação da proporção que o desvio padrão apresenta sobre a média - GRAU DE HOMOGENEIDADE DOS DADOS - até 10% ÓTIMO de 10% a 20% BOM de 20% a 30% REGULAR acima de 30% RUIM ESTATÍSTICA EXERCÍCIOS 1) Determine a média, a amplitude, a variância, o desvio padrão e o coeficiente de variação da seguinte amostra de dados: 4 5 5 6 6 7 7 8 Correlação Linear Prof. Hubert Chamone Gesser, Dr. Retornar ESTATÍSTICA DIAGRAMA DE DISPERSÃO Mostra o comportamento de duas variáveis quantitativas (com dados numéricos). a a b a b b ESTATÍSTICA CORRELAÇÃO LINEAR POSITIVA Quando valores pequenos da variável a tendem a estar relacionados com valores pequenos de b, enquanto que valores grandes de a tendem a estar relacionados com valores grandes de b. a Exemplos: Peso x Altura Nível socioeconômico x Volume de vendas Consumo de Álcool x Preval. Cirrose Hepática b ESTATÍSTICA CORRELAÇÃO LINEAR NEGATIVA Quando valores pequenos da variável a tendem a estar relacionados com valores grandes de b, enquanto que valores grandes de a tendem a estar relacionados com valores pequenos de b. a Exemplos: Renda Familiar x Número de Filhos Escolaridade x Absenteísmo Volume de vendas x Passivo circulante b ESTATÍSTICA CORRELAÇÃO NÃO LINEAR O diagrama de dispersão mostra um conjunto de pontos aproximando-se mais de uma parábola do que de uma reta. a Exemplos: Coef. de Letalidade (a) x Dose do Medicamento (b) Custo (a) x Lote Econômico de Compra (b) b ESTATÍSTICA COEFICIENTE DE CORRELAÇÃO DE PEARSON r = n . S (X.Y) - S X . S Y n . S X2 - (S X)2 . n . S Y2 - (S Y)2 S(X.Y) = Fazem-se os produtos X.Y p/ cada par e depois efetua-se a soma SX = Somatório dos valores da variável X SY = Somatório dos valores da variável Y SX2 = Elevam-se ao quadrado cada valor de X e depois efetua-se a soma SY2 = Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma ESTATÍSTICA EXEMPLO Cálculo do coeficiente de correlação para os dados das variáveis X = população residente e Y = taxa de cresc. populacional, em 12 vilarejos. X Y 101 193 3,2 4,6 . . . 42 1452 . . . 2,8 39,3 X2 Y2 X.Y 10201 10,24 37249 21,16 . . . . . . 323,2 887,8 . . . 1764 7,84 117,6 251538 153,55 5706,2 ESTATÍSTICA r = n . S (X.Y) - S X . S Y n . S X2 - (S X)2 . n . S Y2 - (S Y)2 r = 12 . 5706,2 - 1452 . 39,3 12 . 251538 - (1452)2 . 12 . 153,55 - (39,3)2 r = 0,69 (Correlação Linear Positiva r > 0) ESTATÍSTICA COEFICIENTES DE CORRELAÇÃO Positiva Perfeita Positiva r>0 Negativa r<0 r=1 Negativa perfeita r = -1 ESTATÍSTICA COEFICIENTES DE CORRELAÇÃO Ausência de Correlação r=0 ESTATÍSTICA INTERPRETAÇÃO • O Valor de r (Correlação Linear de Pearson) varia de -1 a +1. • O sinal indica o sentido (correlação positiva ou negativa). • O valor indica a força da correlação (Fraca ou Forte) valor de r Forte -1 Relativa Fraca - 0,6 Muito Muito Ausência Fraca Fraca - 0,3 0 + 0,3 Relativa Fraca + 0,6 Forte +1 ESTATÍSTICA CORRELAÇÃO DE SPEARMAN (Rho) • Estatística não paramétrica • Usada em dados que não têm Distribuição Normal • Usadas com dados Ordinais (Conceitos: A, B, C, D, E) CORRELAÇÃO TAU DE KENDALL • Estatística não paramétrica • Usada em um conjunto pequeno de dados com muitos postos empatados ESTATÍSTICA EXERCÍCIO: 1) Coloque V (Verdadeiro) ou F (Falso): ( ) Quando o valor de r for maior que 0,7 ou menor que -0,7 a correlação entre as duas variáveis em estudo é forte ( ) O sinal negativo de r indica que as variáveis em estudo são inversamente proporcionais ( ) Ao se encontrar um valor de r = 0,6 não se pode afirmar que as variáveis sejam diretamente proporcionais. ( ) O coeficiente de correlação de Pearson pode ser aplicado em dados nominais Regressão Linear Prof. Hubert Chamone Gesser, Dr. Retornar ESTATÍSTICA REGRESSÃO A análise de regressão tem por objetivo descrever, através de um modelo matemático, a relação entre duas variáveis, partindo de n observações das mesmas. A variável a qual desejamos fazer uma estimativa recebe o nome de variável dependente e a outra recebe o nome de variável independente. ESTATÍSTICA REGRESSÃO Supondo X a variável independente e Y a dependente, vamos procurar determinar o ajustamento de uma reta à relação entre essas variáveis, ou seja, vamos obter uma função definida por: Y = a.X + b onde a e b são coeficientes. a = Inclinação ou Gradiente (Coef. Angular) b = Intercepto (Coef. Linear) ESTATÍSTICA REGRESSÃO Sejam duas variáveis X (Notas de Matemática) e Y (Notas de Estatística), entre as quais exista uma correlação acentuada, embora não perfeita, como as que formam a tabela a seguir: ESTATÍSTICA REGRESSÃO Podemos concluir, pela forma do diagrama, que se trata de uma correlação retilínea, de modo a permitir o ajustamento de uma reta, imagem da função definida por: Y = a.X + b ESTATÍSTICA REGRESSÃO Legendre, Adrien-Marie (1752-1833) - Matemático francês, discípulo de Euler e Lagrange. - É autor de um clássico trabalho de geometria, Élements de géométrie. - Também fez importantes contribuições em equações diferenciais, cálculo, teoria das funções e teoria dos números. Eu obtive a equação da reta ... dos mínimos quadrados ordinários ESTATÍSTICA REGRESSÃO Y = a.X + b ESTATÍSTICA REGRESSÃO ESTATÍSTICA CÁLCULO DA REGRESSÃO ESTATÍSTICA RETA IMAGEM DA REGRESSÃO ESTATÍSTICA RETA IMAGEM DA REGRESSÃO (Microsoft Excel) ESTATÍSTICA COEFICIENTE DE DETERMINAÇÃO ( R2 ) n Variação explicada r = Variação total 2 Basta elevar o coeficiente de correlação ao quadrado R2 r = 2 yˆ i =1 n y i =1 i y 2 i y 2 É quanto a variável X pode explicar da variação em Y ESTATÍSTICA INTERPOLAÇÃO E EXTRAPOLAÇÃO Voltando à tabela das notas, vemos que 4,0 não figura entre as notas de Matemática. Entretanto, podemos estimar a nota correspondente em Estatística fazendo X=4,0 na equação: Y = 0,86X 0,89 Assim, X = 4,0 Y = 0,86 4,0 0,89 = 4,33 O mesmo acontece com a nota 1,0: X = 1,0 Y = 0,861,0 0,89 = 1,75 Como 4 pertence ao intervalo [2,10], foi feita uma interpolação; e como 1 não pertence ao intervalo [2,10], foi feita uma extrapolação. Teste de Diferença entre as Médias Prof. Hubert Chamone Gesser, Dr. Retornar ESTATÍSTICA TEST T Serve para comparar as médias de dois grupos amostrais Duas hipóteses possíveis: H0: ma - mb = zero As médias são iguais H1: ma - mb ≠ zero As médias são diferentes ESTATÍSTICA Testes de duas amostras As médias das duas amostras são iguais? ESTATÍSTICA Analisando duas amostras m x ≠ ≠ x m ? ESTATÍSTICA Teste da diferença! H0: ma-mb=zero H1: ma-mb≠zero diferença = 0 Médias iguais ESTATÍSTICA Teste da diferença! H0: ma-mb=zero H1: ma-mb≠zero diferença = 0 Médias iguais Cuidado!!! Antes do emprego do Teste T deve ser testada a homogeneidade das variâncias. ESTATÍSTICA Roteiro do Teste da diferença entre médias 1) Testar a homogeneidade das variâncias: Quando p>0,05 temos variâncias homogêneas Quando p<0,05 temos variâncias diferentes 2) Se as variâncias forem homogêneas realizar o Teste T para homogeneidade das variâncias. 3) Se as variâncias forem diferentes realizar o Teste T para variâncias diferentes. 4) Quando o Teste T apresentar: p>0,05 As médias são iguais p<0,05 As médias são diferentes ESTATÍSTICA Comparando as médias no Microsoft Excel ESTATÍSTICA Comparando as médias no SPSS ESTATÍSTICA Output do SPSS Como p>0,05 as variâncias são semelhantes Como p<0,05 as médias são diferentes p<0,05: Diferentes! Fonte Bibliográfica BARBETA, P. A. Estatística Aplicada às Ciências Sociais. 5.ed. Florianópolis: UFSC, 2006. DAWSON, B.; TRAPP, R.G. Basic & Clinical Biostatistical. 3.ed. New York: Lange Medical Books/McGraw-Hill, 2006. LEVIN, J. Estatística Aplicada às Ciências Humanas. 7.ed. São Paulo: Harbra, 2007. SPIEGEL, M. R. Estatística. 8.ed. São Paulo: Makron Books, 2006. STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo: Harbra, 2007. Retornar