AGRUPAMENTO DE ESCOLAS DA BOA ÁGUA – 172388 MINISTÉRIO DA EDUCAÇÃO E CIÊNCIA Escola Básica Integrada da Boa Água EB1 n.º2 da Quinta do Conde EB1/JI do Pinhal do General JI do Pinhal do General Departamento de Matemática e Ciências Experimentais ORGANIZAÇÃO E TRATAMENTO DE DADOS Nome: _____________________________________________ N.º ____ Turma ____ ______ /______ /201___ Estatística – É um ramo da Matemática que ajuda a recolher, a organizar e a interpretar a informação para tirar conclusões e fazer previsões. População – conjunto de elementos em estudo. Censo ou Recenseamento – estudo estatístico que consiste na análise de dados recolhidos a partir da totalidade da população em estudo. Sondagem – estudo estatístico que se baseia na recolha de dados feita a partir de um grupo de elementos que representam a população. O grupo de elementos representativos da população é selecionado, aleatoriamente e designa-se Amostra. INE – O Instituto Nacional de Estatística é um organismo do Estado, responsável pelo estudo da população portuguesa e das suas características. Além das sondagens, o INE é a entidade que realiza os censos (questionário que tem como objetivo conhecer os portugueses, as suas habilitações, composição dos agregados familiares, tipo de habitação, entre outras características. Quando os dados em estudo são numéricos a variável em estudo é quantitativa. Quando os dados não são numéricos diz-se que os dados recolhidos são qualitativos. Recolha de dados – Os dados podem ser recolhidos através de inquéritos, questionários, pesquisa em livros e na internet, ou por observação direta. Organização de dados – depois de recolhidos os dados têm que ser organizados para facilitar a sua análise. Há vários processos de organização de dados: Diagrama de Venn, Diagrama de Carrol, Diagrama de Caule-e-folhas, Tally Chart (tabelas de contagem), Tabelas de frequência absoluta e relativa, Gráfico de pontos, Grafico de barras, Gráfico de linhas, Gráfico circular, Pictograma. TABELAS DE CONTAGEM Para organizar os dados de forma eficiente torna-se necessário efetuar a sua contagem. Para tal pode recorrer-se a uma tabela de contagem (Tally chart) Exemplo Idades dos elementos da equipa de futebol Contagem 17 | 18 || 19 |||| 20 ||| 1 TABELAS DE FREQUÊNCIA ABSOLUTA E FREQUÊNCIA RELATIVA A frequência absoluta de um dado corresponde ao número de vezes que esse dado foi observado, se repete. A soma das frequências absolutas é igual ao número total de dados. A frequência relativa de um dado é o quociente entre a sua frequência absoluta e o número total de dados observados. Exemplo Completa a tabela de frequências (absolutas e relativas) referentes à idade dos elementos de uma equipa de futebol. 18 19 19 19 20 18 Idades de uma equipa de futebol 20 17 17 18 19 20 19 19 20 Frequência absoluta Frequência relativa Para apresentar os dados organizados nas tabelas de frequências, de forma a facilitar a sua análise, é útil construir gráficos com a informação. GRÁFICOS DE PONTOS O gráfico de pontos é a representação mais simples que se pode construir. Para obter essa representação desenha-se um eixo horizontal ou vertical, onde se assinalam as diferentes categorias ou valores (todos entre o mínimo e o máximo, incluindo estes) da variável em estudo e, por cima destes (ou ao lado), marca-se um ponto sempre que, ao percorrer os dados, se encontra essa categoria ou valor. GRÁFICOS DE BARRAS O gráfico de barras é uma das representações gráficas mais usuais. Se os dados forem quantitativos discretos, deve ser colocada a sequência completa dos valores, entre o mínimo e o máximo, não desenhando barra quando os valores não estão representados nos dados. Devem utilizar-se as frequências relativas quando se pretende comparar amostras de dimensões diferentes. Ao construir um gráfico de barras devem ter-se em atenção os seguintes aspetos: o Tem um título que indica o assunto a que se refere; o Tem um sistema de eixos; o Tem uma unidade de medida gráfica definida e devidamente identificada; o A largura das barras deve ser igual; 2 o o o A distância entre as barras deve ser sempre a mesma; A altura de cada barra indica a frequência que ela representa; As barras são paralelas e podem ser horizontais ou verticais. GRÁFICOS DE LINHAS Os gráficos de linhas são de grande utilidade para descrever processos e registar observações que decorrem/evoluem ao longo do tempo. A utilização de gráficos de linhas facilita a observação da variação temporal de um dado. DIAGRAMA DE VENN Num diagrama de Venn todos os elementos com a mesma propriedade são incluídos no interior de uma mesma linha fechada DIAGRAMA DE CARROL Um diagrama de Carroll é uma tabela de 2x2 em que cada propriedade e a sua negação são representadas por filas (linhas ou colunas). DIAGRAMA DE CAULE-E-FOLHAS Este tipo de representação está entre a tabela e o gráfico, uma vez que apresenta os verdadeiros valores dos dados recolhidos e organiza-os de uma forma que facilita a interpretação dos mesmos. O diagrama de caule-e-folhas é uma outra representação gráfica para dados do tipo quantitativo. Comparativamente com os outros gráficos o diagrama de caule-e-folhas define uma distribuição dos dados mais próxima dos dados originais, permitindo até reconstruí-los. A representação de dados num diagrama de caule-e-folhas é muito simples de fazer, dá uma informação visual sobre a forma como os dados estão distribuídos e permite ordenar os dados e verificar onde há maior concentração dos mesmos. Consiste em escrever do lado esquerdo de uma linha vertical, o dígito (ou dígitos) – caule – da classe de maior grandeza, seguidos dos restantes (folhas). Por vezes há caules sem folhas penduradas, mas estes devem ser representados para se perceber que há lacunas naqueles valores. 3 Para analisar e interpretar a informação recolhida recorre-se às medidas de tendência central. MODA A moda de um conjunto de dados é a observação que ocorre com mais frequência. Há casos em que não existe moda e outros em que há mais do que uma moda. Se tiver dois valores para a moda o conjunto de dados diz-se bimodal. Exemplo 1 Num clube de futebol, perguntou-se a um grupo de jovens qual o número de sapatilhas que calçavam. As respostas foram: 39 39 41 38 40 40 39 41 41 39 38 41 41 38 41 Podemos dizer que o tamanho 41 é o mais usado. Dizemos que a moda é 41. Exemplo 2 A Joana anotou a cor dos carros estacionados no parque de estacionamento da sua escola: Azul Preto Preto Preto Azul Branco Vermelho Azul Azul Beje Beje Verde Beje Branco Azul A cor mais frequente é o azul. A moda é o azul. Exemplo 3 Exemplo 4 A cor das camisolas vendidas: Pontos obtidos em 10 jogos. Amarelo Verde Preto Amarelo Verde Preto 1 0 0 3 3 3 3 0 0 1 Não existe moda. A moda é o 0 e o 3. MÉDIA ARITMÉTICA A média aritmética de um conjunto de dados numéricos determina-se dividindo a sua soma pelo número total de dados. - Só se pode calcular a média quando os dados são numéricos; - a média pode ser ou não um dos valores observados. Curiosidade: “A estatística é a ciência pela qual comendo eu um queijo e tu nenhum comemos em médioa meio queijo cada um!” Exemplos: Os dados da figura indicam a altura dos jogadores de basquetebol de duas equipas de um clube. Qual delas tem, em média, jogadores mais altos? EQUIPA A EQUIPA B 1,80 1,70 1,79 1,68 1,66 1,81 4 Para determinares o valor médio das alturas dos jogadores: 1) Calcula a soma das alturas dos jogadores: EQUIPA A 1,80 + 1,79 + 1,66 = 5,25 EQUIPA B 1,70 + 1,68 + 1,81 = 5,19 2) Determina o quociente entre a soma obtida e o número de jogadores: EQUIPA A 5,25 Média A = = 1,75 A média da altura dos jogadores da equipa A é 3 superior à média da altura dos jogadores da EQUIPA B 5,19 Média B = = 1,73 equipa B. 3 Considera a tabela das idades de todos os jogadores do clube. Como determinar a média das idades? Idade Frequência 10 3 11 12 5 4 13 8 Total 20 Verificas que existem 3 jogadores com 10 anos, 5 jogadores com 11 anos, 4 jogadores com 12 anos e 8 jogadores com 13 anos, ou seja: 3 10 5 11 4 12 8 13 Para determinares a média das idades efectua o quociente: 3 10 5 11 4 12 8 13 = 11,85 20 A média das idades é de 11,85 ou aproximadamente 12 anos. EXTREMOS E AMPLITUDE A amplitude é a medida, mais simples, utilizada para medir a variabilidade apresentada por um conjunto de dados. Obtém-se fazendo a diferença entre o valor máximo e o valor mínimo dos dados, que se designam extremos. GRÁFICOS CIRCULARES Os gráficos que representam num círculo os dados em relação ao total, chamam-se gráficos circulares. As partes do círculo em que está dividido chamam-se setores circulares. O círculo é dividido em setores circulares, tantos quantas as categorias da variável em estudo, e o ângulo de cada setor é proporcional à frequência da categoria que representa. 5 PICTOGRAMAS Os pictogramas são representações gráficas que utilizam figuras, o que faz com que essas representações se tornem bastante apelativas. Começa-se por escolher uma figura ilustrativa da unidade observacional. Cada figura pode representar uma ou mais unidades observacionais. De seguida procede-se como na construção do gráfico de barras mas, em vez de retângulos, empilham-se as figuras que representam as unidades observacionais até perfazer a frequência absoluta observada em cada categoria. Esta representação só pode ser utilizada quando a variável em estudo é qualitativa. Embora seja uma representação gráfica muito sugestiva, é necessário ter os devidos cuidados com as figuras utilizadas e com a forma como são utilizadas, já que, com alguma frequência, dão origem a representações erradas. Classificação de acontecimentos Experiências como: fazer girar uma roleta e observar a pontuação obtida; lançar um dado perfeito e registar o número de pontos obtidos na face voltada para cima; lançar uma moeda perfeita ao ar e observar a face que fica voltada para cima; extrair, sem olhar, uma carta de um baralho e anotar o valor da carta; jogar no Totoloto; são alguns exemplos de experiências que estão sujeitas ao acaso. Ao lançar um dado perfeito, numerado de 1 a 6, não podes afirmar previamente qual a face que vai ficar voltada para cima, mas podes, por exemplo, afirmar que: é impossível sair um número maior que 6; é certo que sai 1 ou 2 ou 3 ou 4 ou 5 ou 6; é tão provável sair o 1 como qualquer outro dos números do dado; é possível sair o 6. Faz agora a tua previsão: Baralhou-se quatro reis e quatro damas de um baralho de cartas de jogar. Ao tirar uma carta, sem olhar, será mais provável sair rei ou dama? Porquê? A probabilidade de um determinado acontecimento aleatório dá-nos a percentagem de vezes que se espera que le aconteça, se se repetir a experiência um grande número de vezes nas mesmas condições. 6