Utilizando o R Exemplos de uso do R Entrada de dados x = c(45,43,46,48,51,46,50,47,46,45) Edição de dados data.entry(x) x = de(x) x = edit(x) 17/8/2008 Técnicas para Predição de Dados 2 Exemplos de uso do R Definindo funções desvio = function(x) sqrt(var(x)) quadrado = function (x) x * x quadrado (3) cubo = function (x) x * x * x cubo 17/8/2008 (5) Técnicas para Predição de Dados 3 Exemplos de uso do R Problema 1 – suponha que você anota a quilometragem do carro a cada abastecimento de 30 litros. As últimas anotações foram: 65311 65624 65908 66219 66499 66821 67145 67447 Qual o consumo médio do seu carro por litro? Km = c(65311, 65624, 65908, 66219, 66499, 66821, 67145, 67447) x = diff (km) mean (x/30) 17/8/2008 Técnicas para Predição de Dados 4 Exemplos de uso do R Dados categóricos Uma pesquisa pergunta se as pessoas fumam ou não. As respostas foram: x=c("Yes","No","No","Yes","Yes","No","No","Yes") Verificando a frequência table (x) factor (x) # verifica os níveis dos dados 17/8/2008 Técnicas para Predição de Dados 5 Exemplos de uso do R BAR charts Uma pesquisa pergunta qual a cerveja preferida. 1 – Brahma; 2 – Kaiser; 3 Bohemia; 4 - schin As respostas foram: 3 411343313212123231111431 cerveja = c(3,4,1,1,3,4,3,3,1,3,2,1,2,1,2,3,2,3,1,1,1,1,4,3,1) barplot (cerveja) # gráfico errado barplot(table(cerveja)) barplot(table(cerveja)/length(cerveja)) 17/8/2008 Técnicas para Predição de Dados 6 Exemplos de uso do R BAR charts Uma pesquisa pergunta qual a cerveja preferida. 1 – Brahma; 2 – Kaiser; 3 Bohemia; 4 - schin As respostas foram: 3 411343313212123231111431 barplot(table(cerveja), col=c("red","blue“,”green”,”yellow”)) legend("topright", c("brama","kaiser","bohemia","schin"), fill=c("red","blue","green","yellow")) 17/8/2008 Técnicas para Predição de Dados 7 Exemplos de uso do R PIE charts Uma pesquisa pergunta qual a cerveja preferida. 1 – Brahma; 2 – Kaiser; 3 Bohemia; 4 - schin As respostas foram: 3 411343313212123231111431 nomes = table (cerveja) names (nomes) = c("brama","kaiser","bohemia","schin") pie (nomes) 17/8/2008 Técnicas para Predição de Dados 8 Exemplos de uso do R Stem-Leaf charts Um treinador de basquete anota quantas cestas um determinado jogador faz por jogo cestas = scan() 2 3 16 23 14 12 4 13 2 0 0 0 6 28 31 14 4 8 2 5 stem (cestas) 17/8/2008 Técnicas para Predição de Dados 9 Exemplos de uso do R Histogramas valores = scan() 29.6 28.2 19.6 13.7 13.0 7.8 3.4 2.0 1.9 1.0 0.7 0.4 0.4 0.3 0.3 0.3 0.3 0.3 0.2 0.2 0.2 0.1 0.1 0.1 0.1 0.1 hist (valores) Hist (valores, probability=TRUE) 17/8/2008 Técnicas para Predição de Dados 10 Exemplos de uso do R Gráfico dos quantis normais x=rnomr(50) qqnorm(x) # apresenta uma “reta” se os dados não forem normais e se não há outliers x[37]=5 qqnorm(x) 17/8/2008 Técnicas para Predição de Dados 11 Boxplots 17/8/2008 Técnicas para Predição de Dados 12 Boxplots 17/8/2008 Técnicas para Predição de Dados 13 Exemplos de uso do R Box-Plots Carregar o arquivo idade.dat Este arquivo representa as idades das atrizes que ganharam o oscar de melhor atriz setwd (“c:/temp”) dataset = scan("idade.dat", what=list(x=0)) boxplot (dataset) boxplot (dataset, horizontal=TRUE) 17/8/2008 Técnicas para Predição de Dados 14 Exemplos de uso do R Box-Plots x = c(5, 5, 5, 13, 7, 11, 11, 9, 8, 9) y = c(11, 8, 4, 5, 9, 5, 10, 5, 4, 10) boxplot(x,y) 17/8/2008 Técnicas para Predição de Dados 15 Exemplos de uso do R Gráfico dos quantis normais – qq plot x = c(5, 5, 5, 13, 7, 11, 11, 9, 8, 9) y = c(11, 8, 4, 5, 9, 5, 10, 5, 4, 10) boxplot(x,y) 17/8/2008 Técnicas para Predição de Dados 16 Exemplos de uso do R Polígono de frequência x=c(.314,.289,.282,.279,.275,.267,.266,.265,.256,.250,.249,.211,.161) tmp = hist(x) lines(c(min(tmp$breaks), tmp$mids,max(tmp$breaks)), c(0,tmp$counts,0),type="l") 17/8/2008 Técnicas para Predição de Dados 17 Utilizando o R