UNIVERSIDADE FEDERAL DA PARAÍBA TABELAS E GRÁFICOS Departamento de Estatística Luiz Medeiros Tabela de dados multidimensionais ► Até agora vimos como organizar, resumir e descrever informações referentes a uma variável. variável. ► Porém, na prática, o interesse pode se tornar mais amplo: amplo: podemos ter o interesse em analisar o comportamento conjunto de duas ou mais variáveis.. variáveis ► O principal objetivo de análises bidimensionais (ou multidimensionais) é explorar situações (similaridades) entre as colunas, ou até mesmo algumas vezes entre as linhas linhas.. ► Da mesma forma que vimos ao tratar uma variável apenas, estaremos interessado em analisar e resumir a distribuição conjunta das frequências analisadas analisadas.. Isso fornecerá uma forma bem mais ampla de compreensão do comportamento de dados estatísticos. estatísticos. Tabela de dados multidimensionais ► A ideia de análise bidimensional é bem intuitiva: intuitiva: pretendemos avaliar o grau de relação (associação) entre variáveis e descrevê descrevê--lo a partir de resultados estatísticos.. estatísticos ► Quando consideramos duas ou mais variáveis, podemos nos deparar com as seguintes situações situações:: Todas as variáveis são qualitativas qualitativas;; Todas as variáveis são quantitativas quantitativas;; Identificamos variáveis qualitativas e variáveis quantitativas presentes no banco de dados. dados. ► Para cada situação, a forma de análise de dados será diferente diferente.. ► Quando temos variáveis qualitativas, os dados são resumidos nas chamadas Tabelas de dupla entrada. entrada. Em áreas de saúde, por exemplo, essas tabelas são chamadas de Tabelas de contingência,e podem utilizadas para cálculos de indicadores epidemiológicos (sensibilidade, especificidade, prevalência, valor preditivo positivo, valor preditivo negativo, etc. etc.). Exemplo Tabela de dados multidimensionais ► Quando as variáveis são quantitativas, podemos analisar os dados através de medidas estatísticas como coeficiente de correlação, quantis quantis,, etc. etc. Podemos analisar estas informações também por meio de um gráfico de dispersão, com o objetivo de se ajustar um modelo de regressão aos dados dados.. ► Quando temos variáveis quantitativas e qualitativas presentes no estudo, buscamos sempre analisar os dados quantitativas de acordo com a classificação dos atributos da variável qualitativa qualitativa.. ► É importante lembrar que podemos ainda ter variáveis quantitativas e agrupá agrupá-las em classes. classes. Por exemplo, podemos ter o interesse em analisar se existe algum grau de associação entre renda e consumo de famílias de uma certa população.. Para a análise, agrupamos as famílias segundo classes de consumo população e renda renda.. ► De uma forma geral, todas as situações anteriores levam o analista de dados a um único objetivo: objetivo: encontrar possíveis relações ou associações entre as variáveis presentes no estudo estudo.. Gráficos ► A representação gráfica dos dados estatísticos tem por objetivo apresentar de forma rápida e concisa os resultados obtidos, permitindopermitindo-se chegar a conclusões sobre a evolução do fenômeno ou sobre como se relacionam os valores da série série.. ► Para tornarmos possível uma representação gráfica, estabelecemos uma correspondência entre os termos da série e determinada figura geométrica, de tal modo que cada elemento da série seja representado por uma figura proporcional. proporcional. A representação gráfica de um fenômeno deve obedecer aos seguintes requisitos primordiais: ► Simplicidade: indispensável devido à necessidade de Simplicidade: levar a uma rápida apreensão do sentido geral do fenômeno apresentado a m de não nos perdermos na observação de minúcias de importância secundária. secundária. ► Clareza: o gráfico deve possibilitar uma correta Clareza: interpretação dos valores representativos do fenômeno em estudo.. estudo ► Veracidade: indispensável qualquer comentário, posto Veracidade: que, se não representa uma realidade, o gráfico perde sua finalidade.. finalidade Quanto ao critério da forma, os gráficos podem ser classificados em: ► Diagramas: São gráficos geométricos dispostos em Diagramas: duas dimensões. dimensões. É o tipo de gráfico mais utilizado na representação de séries estatísticas e se apresentam através de uma grande variedade de tipos tipos.. ► Cartogramas: São ilustrações relativas a cartas Cartogramas: geográficas.. Largamente utilizados em geográfica, geográficas história, demografia e epidemiologia epidemiologia.. ► Estereogramas: Representam volumes Estereogramas: apresentados em três dimensões dimensões.. e são 1) Gráfico de Barra Barra:: Tem a finalidade de comparar grandezas por meio de retângulos de igual largura e alturas proporcionais às respectivas grandezas grandezas.. Neste tipo de gráfico, os retângulos são dispostos horizontalmente, como barras barras.. Cada barra representa a intensidade ou frequência de uma categoria ou atributo. atributo. Os espaços existentes entre as barras devem ser iguais iguais.. 2) Gráfico em Coluna: Coluna: PrestaPresta-se à mesma finalidade que os gráficos em barras, sendo preferíveis a estes últimos quando as legendas das categorias forem curtas curtas.. 3) Gráfico de Setor Setor:: É a representação gráfica dos dados estatísticos em um círculo através de setores setores.. As áreas são proporcionais aos valores da série. série. Utilizado principalmente para verificação de percentuais de cada valor da série com o total total.. ► A construção de um gráfico de setores parte do fato que o número total de graus de um arco de circunferência é 360 360.. Assim, o total de valores corresponderá a 360 360.. Cada uma das parcelas componentes do total de valores poderá, então, ser expressa em graus, e a correspondência se fará através de uma regra de três simples simples.. Ou seja, os ângulos correspondentes a cada componente da série são obtidos através de regra de três simples simples.. ► Por exemplo, se tivermos uma distribuição de frequência da variável sexo, em que observouobservou-se 20 homens e 30 mulheres mulheres.. A área correspondente, por exemplo, para o sexo feminino, será será:: 50 ---- 360 30 ---- X° de onde obtemos que X°=216° 216°. Repetindo o processo, obtemos os ângulos correspondentes às outras componentes da série. série. 4) Gráfico de Linha Linha:: Utilizado usualmente para verificar o comportamento de uma determinada variável ao longo do tempo (série temporal) temporal).. O eixo x representa anos, meses, semestres, entre outros outros.. As linhas são mais eficientes neste tipo de gráfico porque permitem a detecção de flutuações ou mudanças intensas nas séries e também possibilitam a representação de várias séries no mesmo gráfico gráfico.. Para construir um gráfico em linhas, basta marcar os pontos correspondentes às grandezas e uní uní--los através de segmentos de reta reta.. 5) Gráfico de Pontos (Dotplot Dotplot)): Quando construímos uma tabela de distribuição de frequências (por valor ou intervalo), temos o objetivo de apresentar os dados de forma resumida, de modo a analisara distribuição dos dados. dados. Pela simplicidade, pode ser utilizado com muitas ou poucas informações presentes em um conjunto de dados dados.. 6) Gráfico de Ramo e Folhas Folhas:: Este tipo de gráfico também é útil para representar dados usualmente apresentados via distribuição de frequências. frequências. A ideia é a mesma de um histograma e gráfico de pontos pontos:: evidenciar a forma como os dados estão distribuídos distribuídos.. Os dados são distribuídos conforme ramos (dispostos à esquerda), que representam a maior unidade de grandeza utilizada na variável, e folhas (dispostos à direita), que representam a segunda unidade de grandeza utilizada na variável. variável. 7) Diagrama de Dispersão: Dispersão: Utilizado para verificar possíveis relações entre variáveis quantitativas. quantitativas. 8) Pirâmide Etária: Etária: As pirâmides etárias permitem visualizar a forma como a população é distribuída conforme a variável faixa etária. etária. 9) Mapas: Mapas: É uma representação gráfica que permite explorar padrões geográficos nos dados. dados. Representação Gráfica das Distribuições de Frequências (Por intervalo) 10 10)) Histograma Histograma:: É a representação gráfica de uma distribuição de frequência por meio de retângulos justapostos, cujas áreas são proporcionais às frequências das classes. classes. Vale mencionar que, tanto as frequências absolutas simples quanto as relativas simples podem ser representadas através de histogramas histogramas.. 11 11)) Polígono de Frequência Frequência:: É a representação gráfica de uma distribuição de frequência.. É obtido unindofrequência unindo-se os pontos médios das bases superiores de cada retângulo do histograma através de segmentos de retas retas.. 12 12)) Polígono de Frequência (Histograma) Acumulada Crescente ou Decrescente. Decrescente. EXEMPLO 1 Construa um gráfico adequado; EXEMPLO 2 Construa um gráfico adequado; EXEMPLO 3 Construa um gráfico adequado; EXEMPLO 4 Sexo Opinião sobre pena de morte Masc. A Favor Masc. A Favor Masc. A Favor Masc. A Favor Masc. A Favor Masc. A Favor Masc. Contra Masc. Contra Fem. A Favor Fem. A Favor Fem. A Favor Fem. Contra Fem. Contra Fem. Contra Fem. Contra Fem. Contra Fem. Contra Fem. Contra Fem. Contra Construa uma única tabela com as duas variáveis; Os homens e as mulheres possuem a mesma opinião a respeito da pena de morte?