•
Dados Bidimensionais.
Dados Bidimensionais . Gráfico de pontos
O Nuno está a fazer um estudo
estatístico. Nesse contexto, já
observou 10 respostas acerca da
classificação obtida às disciplinas de
Matemática e Português, no período
passado.
Os dados obtidos são os apresentados
na tabela ao lado.
1.1 Copie para o seu caderno e complete o gráfico colocando os
pontos em falta.
Cada ponto corresponde a um nome.
Na actividade anterior, os dados
observados aparecem sob a forma de
pares de valores: as classificações em
Matemática e em Português. Trata-se de
dados bidimensionais.
Dados bidimensionais ou
dados bivariados são dados
obtidos de pares de variáveis.
O gráfico que representa e
organiza este tipo de informação
tem o nome de diagrama de
dispersão.
Diagrama de dispersão é uma
representação gráfica para os
dados bivariados, em
que cada par de dados (xi , yi) é
representado por um ponto de
coordenadas (xi , yi), num
sistema de eixos coordenados.
Observe os seguintes diagramas de dispersão que dizem respeito ao
número do calçado (tamanho da sapatilha) e a altura dos atletas que
estão a escalar uma montanha e, no segundo caso, à relação entre a
altitude e a temperatura.
Pode
concluir-se
que há
uma relação
entre a altura
de
Quantos
atletas foram
observados
relacionando
o tamanho
À medida que se subia a montanha a temperatura subia ou descia?
uma
pessoa e ocom
número
sapatilha que usa?
das sapatilhas
a suade
altura?
O diagrama de dispersão é
muito útil pois permite observar
o tipo de associação
entre as variáveis x e y .
Variáveis positivamente
associadas
Observando o gráfico 1 verificase que, em média, quando a
variável x aumenta a variável y
também aumenta. Podemos
traçar a recta que “melhor se
aproxime” de todos os pontos do
gráfico. Verifica-se que esta recta
tem declive positivo.
Diz-se que há uma associação
positiva entre as variáveis.
O diagrama de dispersão é
muito útil pois permite
observar o tipo de associação
entre as variáveis x e y .
Variáveis negativamente
associadas
Observando o gráfico 2 verifica-se
que, em média, quando a variável
x aumenta a variável y diminui.
Podemos também traçar a recta
que “melhor se aproxime” de todos
os pontos do gráfico. Esta recta
tem declive negativo. Diz-se que
existe uma associação negativa
entre as variáveis.
O diagrama de dispersão é
muito útil pois permite
observar o tipo de associação
entre as variáveis x e y .
Não há associação clara entre as
variáveis
Observando o gráfico 3 verifica-se
que a nuvem de pontos se encontra
bastante dispersa, o que faz prever
que não existe uma associação
clara entre as duas variáveis. Diz-se
que não existe associação entre as
duas variáveis.
Observe os seguintes diagramas de dispersão.
2.1 Indique, pela letra correspondente, aqueles em que se observa:
a) uma associação positiva;
b) uma associação negativa.
2.2 Indique, pela letra correspondente, o diagrama em que não há
uma associação clara entre as duas variáveis.
Grau de associação
Observe os diagramas de dispersão.
Em qual deles lhe parece haver um maior grau de associação
entre as variáveis x e y ?
Explique o seu raciocínio.
Para quantificar o grau da associação
linear entre duas variáveis utiliza-se
uma estatística a que se dá o nome
de correlação linear ou coeficiente
de correlação linear, que se
representa por r e é dado pela
fórmula:
O coeficiente de correlação indica o grau de associação linear
entre as duas variáveis.
Prova-se que r é um valor do intervalo [- 1 , 1] .
Conhecido o valor de r pode avaliar-se o grau de associação
linear entre as duas variáveis de acordo com a seguinte tabela:
Recta de regressão. Utilização da calculadora gráfica
Quando duas variáveis estão fortemente
correlacionadas os pontos do diagrama de
dispersão colocam-se em torno de uma recta.
Há muitas rectas que se podem desenhar, mas
um dos critérios mais comuns para definir essa
recta é o de tornar mínima a soma dos quadrados
dos desvios dos pontos em relação à recta.
A essa recta chama-se recta de regressão ou
recta dos mínimos quadrados.
A recta de regressão pode ser definida por uma equação do tipo y = ax + b .
Suspenderam-se objectos de diferentes massas numa mola
deformada e registaram-se os correspondentes alongamentos
da mola, como se mostra na tabela seguinte:
Suspenderam-se objectos de diferentes massas numa mola
deformada e registaram-se os correspondentes alongamentos
da mola, como se mostra na tabela seguinte:
Use a calculadora para obter a equação da recta de regressão, o coeficiente
de
correlação e a imagem gráfica da recta de regressão.
A recta de regressão para fazer estimativas
A recta de regressão adapta-se à nuvem
de pontos e descreve, aproximadamente, a
sua regularidade”.
Se conhecermos o valor de
uma variável, a partir da recta
de regressão obtemos, de uma
forma aproximada, o valor
esperado da outra variável.
Em linguagem estatística
dizemos que podemos inferir o
valor de x para um dado valor
de y ou vice-versa.
A estes valores também se
chamam estimativas.
A recta de regressão para fazer estimativas
Os valores obtidos para a
variável desconhecida são
sempre valores aproximados,
por isso se diz “o valor que
inferimos é…”.
Uma forma de organizar a informação
correspondente a dados bivariados consiste
em utilizar uma tabela de frequências em que
se utilizam contagens ou frequências e que
tem o nome de tabelas de contingência.
Uma tabela de contingência é uma tabela de dupla entrada em que
as linhas correspondem a uma variável e as colunas a outra
variável, como se mostra neste exemplo.
Na última coluna apresentam-se os totais de linha; na última linha
apresentam-se os totais de coluna. A estas quantidades chamam-se totais
marginais (porque se apresentam nas margens da tabela).
Representação gráfica de dados bivariados
Admita que numa escola foi feito um inquérito aos professores de três
disciplinas, Português, Matemática e História, sobre o que pensavam acerca
das bases dos alunos que todos os anos recebiam nas suas turmas.
Os resultados foram os seguintes:
onde X representa a disciplina que o professor lecciona e Y , o nível dos alunos
no que respeita a bases necessárias ao sucesso, na opinião dos professores.
Verdadeiro ou falso?
Diga se é verdadeira ou falsa a seguinte afirmação:
“68,18% dos professores de Português da escola pensam que as bases dos
alunos que recebem nas suas turmas são insuficientes para o sucesso.”
Partindo da tabela podemos construir
outra dividindo o valor de cada célula
pelo total da coluna correspondente.
Assim, por exemplo, lendo a tabela,
pode dizer-se que 18,18% dos
professores de Matemática pensam
que os alunos que recebem têm
bases suficientes para o sucesso.
Construção de um diagrama de barras por segmentos
Construa um diagrama correspondente
à tabela construída em que a variável
que está a condicionar é a variável X .
•
Essencial
Diagrama de dispersão
Diagrama de dispersão é uma
representação gráfica para os
dados bivariados, em
que cada par de dados (xi , yi) é
representado por um ponto de
coordenadas (xi , yi), num
sistema de eixos coordenados.
Interpretar um diagrama de dispersão
Associação positiva
Associação negativa
Coeficiente de correlação
Para representar dados bivariados de natureza
qualitativa usam-se tabelas de contingência e
gráficos de barras segmentadas.
•
Dados Bidimensionais.
Download

Dados Bidimensionais.