Utilizando o R
Exemplos de uso do R
Entrada de dados
x
= c(45,43,46,48,51,46,50,47,46,45)
Edição de dados
data.entry(x)
x
= de(x)
x = edit(x)
17/8/2008
Técnicas para Predição de Dados
2
Exemplos de uso do R
Definindo funções
desvio = function(x) sqrt(var(x))
quadrado = function (x) x * x
quadrado
(3)
cubo = function (x) x * x * x
cubo
17/8/2008
(5)
Técnicas para Predição de Dados
3
Exemplos de uso do R
Problema 1 – suponha que você anota a quilometragem
do carro a cada abastecimento de 30 litros. As últimas
anotações foram:
65311 65624 65908 66219 66499 66821 67145 67447
Qual o consumo médio do seu carro por litro?
Km = c(65311, 65624, 65908, 66219, 66499, 66821,
67145, 67447)
x = diff (km)
mean (x/30)
17/8/2008
Técnicas para Predição de Dados
4
Exemplos de uso do R
Dados categóricos
Uma pesquisa pergunta se as pessoas
fumam ou não. As respostas foram:
x=c("Yes","No","No","Yes","Yes","No","No","Yes")
Verificando a frequência
table
(x)
factor (x) # verifica os níveis dos dados
17/8/2008
Técnicas para Predição de Dados
5
Exemplos de uso do R
BAR charts
Uma pesquisa pergunta qual a cerveja
preferida.
1 – Brahma; 2 – Kaiser; 3 Bohemia; 4 - schin
As respostas foram:
3
411343313212123231111431
cerveja = c(3,4,1,1,3,4,3,3,1,3,2,1,2,1,2,3,2,3,1,1,1,1,4,3,1)
barplot (cerveja) # gráfico errado
barplot(table(cerveja))
barplot(table(cerveja)/length(cerveja))
17/8/2008
Técnicas para Predição de Dados
6
Exemplos de uso do R
BAR charts
Uma pesquisa pergunta qual a cerveja
preferida.
1 – Brahma; 2 – Kaiser; 3 Bohemia; 4 - schin
As respostas foram:
3
411343313212123231111431
barplot(table(cerveja), col=c("red","blue“,”green”,”yellow”))
legend("topright", c("brama","kaiser","bohemia","schin"),
fill=c("red","blue","green","yellow"))
17/8/2008
Técnicas para Predição de Dados
7
Exemplos de uso do R
PIE charts
Uma pesquisa pergunta qual a cerveja
preferida.
1 – Brahma; 2 – Kaiser; 3 Bohemia; 4 - schin
As respostas foram:
3
411343313212123231111431
nomes = table (cerveja)
names (nomes) = c("brama","kaiser","bohemia","schin")
pie (nomes)
17/8/2008
Técnicas para Predição de Dados
8
Exemplos de uso do R
Stem-Leaf charts
Um
treinador de basquete anota quantas
cestas um determinado jogador faz por jogo
cestas = scan()
2
3 16 23 14 12 4 13 2 0 0 0 6 28 31 14 4 8 2 5
stem (cestas)
17/8/2008
Técnicas para Predição de Dados
9
Exemplos de uso do R
Histogramas
valores
= scan()
29.6
28.2 19.6 13.7 13.0 7.8 3.4 2.0 1.9 1.0 0.7 0.4
0.4 0.3 0.3 0.3 0.3 0.3 0.2 0.2 0.2 0.1 0.1 0.1 0.1 0.1
hist (valores)
Hist (valores, probability=TRUE)
17/8/2008
Técnicas para Predição de Dados
10
Exemplos de uso do R
Gráfico dos quantis normais
x=rnomr(50)
qqnorm(x)
# apresenta uma “reta” se os dados não forem
normais e se não há outliers
x[37]=5
qqnorm(x)
17/8/2008
Técnicas para Predição de Dados
11
Boxplots
17/8/2008
Técnicas para Predição de Dados
12
Boxplots
17/8/2008
Técnicas para Predição de Dados
13
Exemplos de uso do R
Box-Plots
Carregar
o arquivo idade.dat
Este arquivo representa as idades das atrizes
que ganharam o oscar de melhor atriz
setwd (“c:/temp”)
dataset = scan("idade.dat", what=list(x=0))
boxplot (dataset)
boxplot (dataset, horizontal=TRUE)
17/8/2008
Técnicas para Predição de Dados
14
Exemplos de uso do R
Box-Plots
x
= c(5, 5, 5, 13, 7, 11, 11, 9, 8, 9)
y = c(11, 8, 4, 5, 9, 5, 10, 5, 4, 10)
boxplot(x,y)
17/8/2008
Técnicas para Predição de Dados
15
Exemplos de uso do R
Gráfico dos quantis normais – qq plot
x
= c(5, 5, 5, 13, 7, 11, 11, 9, 8, 9)
y = c(11, 8, 4, 5, 9, 5, 10, 5, 4, 10)
boxplot(x,y)
17/8/2008
Técnicas para Predição de Dados
16
Exemplos de uso do R
Polígono de frequência
x=c(.314,.289,.282,.279,.275,.267,.266,.265,.256,.250,.249,.211,.161)
tmp = hist(x)
lines(c(min(tmp$breaks),
tmp$mids,max(tmp$breaks)),
c(0,tmp$counts,0),type="l")
17/8/2008
Técnicas para Predição de Dados
17
Utilizando o R