Formato dos Dados
% 1. Title: Database for fitting contact lenses
@relation contact-lenses
@attribute age
{young, pre-presbyopic, presbyopic}
@attribute spectacle-prescrip
{myope, hypermetrope}
@attribute astigmatism
{no, yes}
@attribute tear-prod-rate {reduced, normal}
@attribute contact-lenses {soft, hard, none}
@data
young,myope,no,reduced,none
young,myope,no,normal,soft
pre-presbyopic,myope,no,reduced,none
pre-presbyopic,myope,no,normal,soft
presbyopic,myope,no,reduced,none
presbyopic,myope,no,normal,none
Formato dos Dados
@relation weather
@attribute outlook {sunny, overcast, rainy}
@attribute temperature real
@attribute humidity real
@attribute windy {TRUE, FALSE}
@attribute play {yes, no}
@data
sunny,85,85,FALSE,no
sunny,80,90,TRUE,no
overcast,83,86,FALSE,yes
rainy,70,96,FALSE,yes
rainy,68,80,FALSE,yes
rainy,65,70,TRUE,no
overcast,64,65,TRUE,yes
sunny,72,95,FALSE,no
sunny,69,70,FALSE,yes
rainy,75,80,FALSE,yes
sunny,75,70,TRUE,yes
overcast,72,90,TRUE,yes
overcast,81,75,FALSE,yes
Filtros
Pacote de algoritmos para remover, inserir ou
transformar atributos e dados no conjunto de
dados
• Remove – seleciona manualmente tributos a
serem removidos
• Add – adiciona um novo atributo
– Parâmetros:
• posição
• Nome
• Valores nominais
• Discretize – discretiza atributos numéricos
(supervisionado e não-supervisionado)
– Parâmetros:
• -B Número de categorias (intervalos de tamanho igual)
• -O número de intervalos determinado automaticamente
• -C especifica a classe para o método supervisionado
• -D tranforma um atributo discretizado com k valores em k-1
atributos binários
• MakeIndicator – converte atributo nominal em
binário. Pode ser usado para transformar um
conjunto com múltiplas classes em vários com
classe binária.
– Parâmetros:
• O atributo a ser transformado e o valor nominal
são definidos pelo usuário
• -N declara se o novo atributo é numérico ou não
• MergeTwoValues – combina dois valores
de um atributo nominal em uma única
categoria.
• O nome do novo valor é uma combinação dos dois
originais
• Normalize – normaliza todos os atributos
numéricos
Seleção de atributos
• Pacote de algoritmos para seleção de
atributos
– Deve ser selecionado um método de busca
• Tipos:
– Filtros
– Wrappers – vinculados a um classificador
Download

Slide 1