• Dados Bidimensionais. Dados Bidimensionais . Gráfico de pontos O Nuno está a fazer um estudo estatístico. Nesse contexto, já observou 10 respostas acerca da classificação obtida às disciplinas de Matemática e Português, no período passado. Os dados obtidos são os apresentados na tabela ao lado. 1.1 Copie para o seu caderno e complete o gráfico colocando os pontos em falta. Cada ponto corresponde a um nome. Na actividade anterior, os dados observados aparecem sob a forma de pares de valores: as classificações em Matemática e em Português. Trata-se de dados bidimensionais. Dados bidimensionais ou dados bivariados são dados obtidos de pares de variáveis. O gráfico que representa e organiza este tipo de informação tem o nome de diagrama de dispersão. Diagrama de dispersão é uma representação gráfica para os dados bivariados, em que cada par de dados (xi , yi) é representado por um ponto de coordenadas (xi , yi), num sistema de eixos coordenados. Observe os seguintes diagramas de dispersão que dizem respeito ao número do calçado (tamanho da sapatilha) e a altura dos atletas que estão a escalar uma montanha e, no segundo caso, à relação entre a altitude e a temperatura. Pode concluir-se que há uma relação entre a altura de Quantos atletas foram observados relacionando o tamanho À medida que se subia a montanha a temperatura subia ou descia? uma pessoa e ocom número sapatilha que usa? das sapatilhas a suade altura? O diagrama de dispersão é muito útil pois permite observar o tipo de associação entre as variáveis x e y . Variáveis positivamente associadas Observando o gráfico 1 verificase que, em média, quando a variável x aumenta a variável y também aumenta. Podemos traçar a recta que “melhor se aproxime” de todos os pontos do gráfico. Verifica-se que esta recta tem declive positivo. Diz-se que há uma associação positiva entre as variáveis. O diagrama de dispersão é muito útil pois permite observar o tipo de associação entre as variáveis x e y . Variáveis negativamente associadas Observando o gráfico 2 verifica-se que, em média, quando a variável x aumenta a variável y diminui. Podemos também traçar a recta que “melhor se aproxime” de todos os pontos do gráfico. Esta recta tem declive negativo. Diz-se que existe uma associação negativa entre as variáveis. O diagrama de dispersão é muito útil pois permite observar o tipo de associação entre as variáveis x e y . Não há associação clara entre as variáveis Observando o gráfico 3 verifica-se que a nuvem de pontos se encontra bastante dispersa, o que faz prever que não existe uma associação clara entre as duas variáveis. Diz-se que não existe associação entre as duas variáveis. Observe os seguintes diagramas de dispersão. 2.1 Indique, pela letra correspondente, aqueles em que se observa: a) uma associação positiva; b) uma associação negativa. 2.2 Indique, pela letra correspondente, o diagrama em que não há uma associação clara entre as duas variáveis. Grau de associação Observe os diagramas de dispersão. Em qual deles lhe parece haver um maior grau de associação entre as variáveis x e y ? Explique o seu raciocínio. Para quantificar o grau da associação linear entre duas variáveis utiliza-se uma estatística a que se dá o nome de correlação linear ou coeficiente de correlação linear, que se representa por r e é dado pela fórmula: O coeficiente de correlação indica o grau de associação linear entre as duas variáveis. Prova-se que r é um valor do intervalo [- 1 , 1] . Conhecido o valor de r pode avaliar-se o grau de associação linear entre as duas variáveis de acordo com a seguinte tabela: Recta de regressão. Utilização da calculadora gráfica Quando duas variáveis estão fortemente correlacionadas os pontos do diagrama de dispersão colocam-se em torno de uma recta. Há muitas rectas que se podem desenhar, mas um dos critérios mais comuns para definir essa recta é o de tornar mínima a soma dos quadrados dos desvios dos pontos em relação à recta. A essa recta chama-se recta de regressão ou recta dos mínimos quadrados. A recta de regressão pode ser definida por uma equação do tipo y = ax + b . Suspenderam-se objectos de diferentes massas numa mola deformada e registaram-se os correspondentes alongamentos da mola, como se mostra na tabela seguinte: Suspenderam-se objectos de diferentes massas numa mola deformada e registaram-se os correspondentes alongamentos da mola, como se mostra na tabela seguinte: Use a calculadora para obter a equação da recta de regressão, o coeficiente de correlação e a imagem gráfica da recta de regressão. A recta de regressão para fazer estimativas A recta de regressão adapta-se à nuvem de pontos e descreve, aproximadamente, a sua regularidade”. Se conhecermos o valor de uma variável, a partir da recta de regressão obtemos, de uma forma aproximada, o valor esperado da outra variável. Em linguagem estatística dizemos que podemos inferir o valor de x para um dado valor de y ou vice-versa. A estes valores também se chamam estimativas. A recta de regressão para fazer estimativas Os valores obtidos para a variável desconhecida são sempre valores aproximados, por isso se diz “o valor que inferimos é…”. Uma forma de organizar a informação correspondente a dados bivariados consiste em utilizar uma tabela de frequências em que se utilizam contagens ou frequências e que tem o nome de tabelas de contingência. Uma tabela de contingência é uma tabela de dupla entrada em que as linhas correspondem a uma variável e as colunas a outra variável, como se mostra neste exemplo. Na última coluna apresentam-se os totais de linha; na última linha apresentam-se os totais de coluna. A estas quantidades chamam-se totais marginais (porque se apresentam nas margens da tabela). Representação gráfica de dados bivariados Admita que numa escola foi feito um inquérito aos professores de três disciplinas, Português, Matemática e História, sobre o que pensavam acerca das bases dos alunos que todos os anos recebiam nas suas turmas. Os resultados foram os seguintes: onde X representa a disciplina que o professor lecciona e Y , o nível dos alunos no que respeita a bases necessárias ao sucesso, na opinião dos professores. Verdadeiro ou falso? Diga se é verdadeira ou falsa a seguinte afirmação: “68,18% dos professores de Português da escola pensam que as bases dos alunos que recebem nas suas turmas são insuficientes para o sucesso.” Partindo da tabela podemos construir outra dividindo o valor de cada célula pelo total da coluna correspondente. Assim, por exemplo, lendo a tabela, pode dizer-se que 18,18% dos professores de Matemática pensam que os alunos que recebem têm bases suficientes para o sucesso. Construção de um diagrama de barras por segmentos Construa um diagrama correspondente à tabela construída em que a variável que está a condicionar é a variável X . • Essencial Diagrama de dispersão Diagrama de dispersão é uma representação gráfica para os dados bivariados, em que cada par de dados (xi , yi) é representado por um ponto de coordenadas (xi , yi), num sistema de eixos coordenados. Interpretar um diagrama de dispersão Associação positiva Associação negativa Coeficiente de correlação Para representar dados bivariados de natureza qualitativa usam-se tabelas de contingência e gráficos de barras segmentadas. • Dados Bidimensionais.