ARTIGO
A Teoria de Resposta
ao Item no
novo Enem
O
novo Enem, além de continuar a servir como referência para avaliar o
conhecimento dos alunos
que encerraram o Ensino Médio, será
usado nos processos seletivos de instituições de Ensino Superior. Para
cumprir essas múltiplas funções, o
Inep/MEC, órgão responsável pela
operacionalização do Enem, precisou
recorrer às técnicas oriundas da Teoria de Resposta ao Item (TRI).
A TRI é uma modelagem estatística
de aplicação frequente em testes de conhecimento. Seu uso é consagrado na
área de educação em vários países. No
Brasil, o principal programa de avaliação que utiliza a Teoria de Resposta
ao Item é o Sistema de Avaliação da
Educação Básica (Saeb), que a adotou
em 1995 e desde então a utiliza para a
construção de instrumentos, atribuição
de escores e análise de desempenho,
de forma a viabilizar a comparação
dos resultados, com a construção das
escalas de proficiência.
O que se deseja estimar é o nível
de aptidão de alguém a partir da análise das respostas dadas a um conjunto de questões (ou itens). Para isso,
recorre-se a modelos matemáticos
que relacionam as variáveis envolvidas nessa situação. O modelo que
será utilizado para análise no novo
Enem vai considerar três parâmetros:
o parâmetro da dificuldade de responder corretamente a uma questão, o da
discriminação e também o parâmetro
da probabilidade de acerto ao acaso,
popularmente conhecida como “parâmetro de chute”.
Mauro Luiz Rabelo
Para facilitar o trabalho das escolas,
os especialistas que colaboraram com
o Inep/MEC elencaram os objetos de
conhecimento associados à Matriz de
Referência de acordo com o que está
estabelecido nas Orientações Curriculares Nacionais para o Ensino Médio
(OCNEM). Essa estrutura aproxima o novo Enem dessas orientações
“O que se quer
estimar é a aptidão do
aluno a partir da análise
de suas resposta
”
sem abandonar o modelo de avaliação centrado no desenvolvimento
de habilidades. Isso quer dizer que,
se a escola tem seu projeto pedagógico desenvolvido em conformidade
com essas orientações, então os alunos estarão bem preparados para o
novo exame.
O que é a TRI?
A TRI é um conjunto de modelos
matemáticos que procuram representar a probabilidade de alguém dar
uma resposta a um item como função dos parâmetros do item e da(s)
habilidade(s) de quem responde. Os
modelos relacionam variáveis observáveis – respostas aos itens de um
teste, por exemplo – com aptidões
não observáveis e que são responsá-
veis pelas respostas dadas. De acordo com essa relação, quanto maior a
habilidade, maior a probabilidade de
acerto no item.
O que se deseja estimar é o nível
de aptidão de alguém a partir da análise das respostas dadas a um conjunto de questões. Para isso, recorre-se a
modelos matemáticos que relacionam
as variáveis envolvidas nessa situação.
O modelo que será utilizado para análise no novo Enem vai considerar três
parâmetros para definir o nível de aptidão ou habilidade (θ) do estudante: o
parâmetro da dificuldade de responder
corretamente a uma questão, o da discriminação utilizada na escolha de um
item e também da probabilidade de
acerto ao acaso, popularmente conhecida como “parâmetro de chute”.
Quando alguém responde a uma
sequência de itens, produz um padrão
de respostas, composto de acertos
(valor = 1) e erros (valor = 0). Isso
pode ser esquematizado em uma tabela cujas linhas são os padrões de respostas de alunos submetidos ao teste
e cujas colunas são itens deste, numerados, por exemplo, de 1 a 45 (o novo
Enem será composto de quatro partes
de 45 itens cada uma). Essa tabela de
“uns” e “zeros” coleciona as respostas dadas por todos os indivíduos a
todos os itens de cada parte da prova.
Se forem 5 milhões de participantes,
será, então, uma tabela de 5 milhões
de linhas por 45 colunas, chamada
de matriz de padrão de respostas dos
estudantes. Somente com os recursos
atuais de informática podemos manusear tabelas tão grandes.
Explicando o Enem l 65
ARTIGO
Probabilidade
Na Teoria Clássica dos Testes
(TCT), usada até então na avaliação
de provas, a aptidão para responder a
um teste é simplesmente expressa pelo
número de itens corretos. Compara-se
seu padrão de respostas com o gabarito
e calcula-se o escore bruto fazendo-se
a soma dos acertos. No caso da TRI,
deseja-se descobrir qual o valor do traço latente (da habilidade) de alguém
para que acerte cada item.
Para descobrir isso, a pergunta
inicial que a TRI faz sobre o item é:
qual é a probabilidade de acerto de
um item específico? A resposta a essa
pergunta depende do nível de aptidão
do estudante (θ) e das características
do item – dificuldade (b), discriminação (a) e acerto ao acaso (c).
Assim, na TRI, estuda-se o comportamento diante de cada item que
é respondido. Por isso, a base desse
modelo matemático é a Curva Característica do Item (CCI) – representada na figura abaixo, gráfico de uma
função P(θ) que fornece a probabilidade de um aluno com habilidade
θ responder corretamente ao item do
teste que está sendo analisado. Observe a figura: você verá que a função
P (θ) assume valores que vão de 0 a 1
(correspondentes a porcentagens que
vão de 0% a 100%) e se configura em
uma curva na forma de S. Na curva
estão indicados os parâmetros a, b e
c do item respondido, que serão explicados a seguir. Os valores da habilidade (θ), no eixo horizontal, estão na escala
de média igual a zero e
desvio-padrão 1.
O acerto ao acaso
1
representa as respostas
0,9
dadas por “chute”. Isso
0,8
ocorre principalmente
0,7
com os itens que são
0,6
mais difíceis, para os
0,5
quais alunos de baixa
0,4
aptidão não conhecem
0,3
a resposta correta, mas
0,2
arriscam qualquer uma.
0,1
A TRI estima o acerto
0
ao acaso por meio do
parâmetro c, que representa a probabilidade
de um aluno com baixa
66 l Explicando o Enem
“A TRI avalia quem
responde às questões a
partir da dificuldade,
discriminação ou “chute”
”
cujo parâmetro b está próximo de –3
são considerados fáceis, e os de parâmetro próximo de 3, difíceis. Itens
cujo valor de b cai fora do intervalo
[–3, 3] sugerem problemas de concepção e são, normalmente, excluídos
das análises.
A prova será mais “difícil”?
O nível de dificuldade ideal para
os itens de um teste depende da sua
habilidade responder corretamente finalidade. Em avaliação educacional,
ao item. Assim, se não fosse permi- recomenda-se “uma distribuição de
tido “chutar”, c seria igual a zero. níveis de dificuldade de itens no tesEm geral, são recomendados valores te dentro de uma curva normal: 10%
iguais ou inferiores a 0,2 para itens dos itens em cada uma das duas faixas
com cinco opções de resposta, como extremas, 20% em cada uma das faixas seguintes e 40% na faixa média”
é o caso do Enem.
A dificuldade é o valor da aptidão (Pasquali, 2003).
A discriminação é concebida como
(θ) preciso para se obter uma probabilidade de acerto igual a (1+c)/2. É ne- a capacidade do item de estabelecer
cessário esclarecer isso. Quando não é diferenças entre alunos com habilidapermitido o “chute”, a complexidade des diversas. Na TRI, é definida como
da questão é estabelecida pelo valor o poder do item para diferenciar estuda habilidade para se obter a proba- dantes com magnitudes próximas da
bilidade de 50% de acerto do item. habilidade que está sendo aferida.
A utilização da TRI para análise
Quanto maior for o nível de aptidão
estabelecido para o aluno acertar o de testes de conhecimento veio para
item (e isso é evidenciado pelo mo- sanar algumas limitações da Teoria
delo estatístico), maior será a dificul- Clássica dos Testes (TCT), principaldade desse item. A complexidade de mente no que diz respeito à discrimiuma questão é representada em uma nação dos itens, fidedignidade dos
escala padronizada, que, teoricamen- testes e comparabilidade de desemte, varia de –∞ a +∞. Na prática, seus penho de jovens que se submetem a
valores se situam tipicamente entre testes diferentes.
Tomando as edições do Enem já
–3 e 3, pois, entre esses extremos, estão mais de 99,7% dos casos. Os itens ocorridas desde 1998, é comum ouvirmos inferências comparativas dos resultados de
Curva Característica do Item (CCI)
um ano com o seguinte,
simplesmente observando-se a média dos alunos
na prova. Essas comparações são completamente
desprovidas de fundamento e não podem ser
a
feitas. Os resultados de
um ano para outro não
são comparáveis. Com
a utilização da TRI no
c
Enem, a partir deste ano,
poderemos tirar conclusões interessantes e
-4,0 -3,0 -2,0 -1,0
0 1,0 2,0 3,0 4,0
cientificamente bem fundamentadas sobre o deb
Habilidade ( )
sempenho dos estudantes
e suas Tecnologias; e Matemática e
suas Tecnologias. De posse das informações que serão fornecidas, cada
participante poderá fazer uma análise comparativa do seu nível de aptidão em cada uma dessas quatro áreas. Veja o quadro ao lado: o gráfico
é uma simulação da distribuição dos
participantes do Enem de acordo com
as proficiências.
Distribuição dos participantes de acordo com as proficiências
21,02%
18,10%
19,13%
13,86%
10,95%
7,75%
4,00%
3,58%
1,07% 0,32% 0,04%
0,18%
125
150
175
200
225
250
275
300
325
350
375
400
Diante dessas mudanças, como
agir na preparação dos alunos?
425
Você está aqui!
Como surgiu a TRI?
A TRI surgiu entre os anos 1950 e
1960 para responder a indagações relativas aos testes de inteligência, cujos
resultados variavam em razão dos
instrumentos de medida utilizados.
Qual seria então o resultado correto?
O problema era mais profundo, já que
“o objeto medido, a inteligência no
caso, afeta diretamente o instrumento
utilizado; aliás, ela é definida pelo próprio instrumento utilizado” (Pasquali,
2007). Já pensou se o metro medisse
de forma diferente se estivéssemos
calculando a largura de um livro ou o
comprimento de uma mesa?
A solução dada pela TRI a esse
problema – independência do instrumento de medida em relação ao objeto que se deseja medir – utilizava
modelos e algoritmos matemáticos
difíceis de ser operacionalizados à
época. Por isso, somente após o avanço tecnológico dos anos 1980, com o
desenvolvimento de softwares para
uso prático dos algoritmos complexos
que o modelo contém, essa teoria começou a ser difundida.
Os valores dos parâmetros dos
itens e das habilidades dos indivíduos são obtidos por sofisticadas técnicas estatísticas e matemáticas de
estimação, utilizando-se softwares
específicos, que manipulam tabelas
Devemos capacitar os alunos a selecionar criteriosamente e gerenciar
criticamente as informações que hoje
eles acessam com muita facilidade. O
processo educacional deve contribuir
para tornar o educando um cidadão
responsável e autônomo em suas escolhas, oportunizando o desenvolvimento harmônico de conjuntos de
habilidades que permitam a compreensão integrada, crítica e contextualizada de temas diversos. Esses objetivos estão subjacentes às habilidades
expressas na matriz do novo exame,
que apresenta uma visão ampla das
capacidades que se espera que sejam
desenvolvidas por todos os egressos
do Ensino Médio. O importante é que
tentemos...
“O estudante terá seu
desempenho medido
em uma escala geral de
proficiência
”
(matrizes) gigantescas como a matriz
de padrão de respostas anteriormente
mencionada. De qualquer modo, em
uma população tão grande quanto a
que vai se submeter ao Enem, a distribuição dos estudantes por nível de
habilidade será praticamente normal,
conforme ilustra hipoteticamente a figura acima, que mostra a distribuição
dos participantes de acordo com as
proficiências.
Na TRI, a habilidade pode, teoricamente, assumir qualquer valor
entre –∞ a +∞. Assim, precisam ser
estabelecidas uma origem e uma unidade de medida para a definição da
escala. Esses valores são escolhidos
de modo a representar, respectivamente, o valor médio e o desviopadrão das habilidades das pessoas
que responderam ao teste.
Ao receber o boletim de desempenho, o participante vai se localizar
nessa distribuição, de acordo com seu
desempenho no teste e seu nível de
aptidão em cada uma das quatro áreas
avaliadas no exame: Linguagens, Códigos e suas Tecnologias (incluindo
redação); Ciências Humanas e suas
Tecnologias; Ciências da Natureza
“... dar a todos o mesmo ponto de partida.
Quanto ao ponto de chegada, isso depende
de cada um.” (Mário Quintana)
Neste texto, usamos indistintamente as palavras aptidão, habilidade e proficiência.
REFERÊNCIAS:
ANDRADE, D.F., TAVARES, H.R. & VALLE, R.C. Teoria da Resposta ao Item: conceitos e aplicações.
São Paulo: ABE – Associação Brasileira de Estatística, 2000.
PASQUALI, L. Psicometria: teoria dos testes na psicologia e na educação. Petrópolis: Vozes, 2003.
PASQUALI, L. (no prelo). Teoria de Resposta ao
Item – TRI: Teoria, Procedimentos e Aplicações.
Brasília, 2007.
Arquivo pessoal
e dos egressos do Ensino Médio brasileiro ao longo do tempo.
Uma escala de proficiência para
cada uma das quatro áreas avaliadas
será construída, e essa será a “régua”
que será usada para comparar os resultados no decorrer dos anos.
MAURO LUIZ RABELO
é doutor em Matemática e
professor da Universidade de
Brasília (UnB)
Explicando o Enem l 67
Download

Artigo resposta nova.indd