Cálculo da Nota com base na Teoria de Resposta ao Item (TRI)
(Baseado em nota técnica do Inep)
A Teoria de Resposta ao Item – TRI – modela a probabilidade de um indivíduo
responder corretamente a um item em função dos parâmetros do item e da proficiência
(habilidade) do respondente. Essa relação é expressa por meio de uma função monotônica
crescente que indica que quanto maior a proficiência do avaliado, maior será a sua
probabilidade de acertar o item (ver, por exemplo, Andrade & cols, 2000; Baker & Kim, 2004;
Hambleton & cols, 1991; Klein, 2003; Pasquali, 1997). Estão erradas as explicações que tratam
os parâmetros dos itens como pesos e supõem que a divulgação dos “pesos” possibilitaria a
reprodução dos cálculos a partir apenas de ponderações.
No BB Certificação, a função monotônica é uma função logística de 3 parâmetros
desenvolvida por Birbaum (1968). De acordo com esse modelo, três características do item são
consideradas para cálculo da proficiência do indivíduo: poder de discriminação (parâmetro a),
dificuldade (parâmetro b) e a probabilidade de acerto ao acaso (parâmetro c). Assim, a
estimação da proficiência está relacionada ao número de acertos, aos parâmetros dos itens e
ao padrão de respostas. Apesar de não ser simples e exigir estimativas dos parâmetros
realizadas por métodos estatísticos avançados, o cálculo da proficiência é objetivo, e
participantes com exatamente o mesmo padrão de respostas apresentam exatamente as
mesmas proficiências. O método utilizado para os cálculos das proficiências é denominado
Expected a Posteriori (EAP).
Algumas das principais confusões relacionadas à interpretação dos resultados obtidos
pela TRI e dos resultados obtidos pela Teoria Clássica, cuja nota está relacionada apenas ao
percentual de acertos, são descritas a seguir.
Mínimo e Máximo: na TRI, as proficiências são estimadas em uma escala métrica que
não possui mínimo e máximo pré-estabelecidos. Esses valores variam de acordo com as
características dos itens que compõem a prova de cada edição do Exame. Dessa forma, ao
acertar todos os itens da prova não significa ter uma proficiência igual a 1000, como é comum
imaginar. Para ilustrar este conceito, suponha que um teste de resistência com várias etapas
seja elaborado para um grupo de pessoas e que a etapa mais fácil seja uma corrida de 100
metros e a mais difícil uma corrida de dois quilômetros. A avaliação para uma pessoa que não
conseguiu cumprir com a tarefa mais fácil é de que ela não é capaz de correr 100 metros, mas
não é possível inferir que ela seja incapaz de correr (nota zero), pois no teste não havia etapas
que avaliassem se ela era capaz de correr menos de 100 metros. Da mesma forma, a única
afirmação que se pode fazer a respeito de uma pessoa que conseguiu cumprir todas as etapas
é que ela é capaz de correr dois quilômetros. No entanto, se existisse nesta mesma avaliação
uma corrida de três quilômetros, esta mesma pessoa que correu os dois quilômetros poderia
correr ou não, os três quilômetros. Percebe-se, portanto, que a avaliação sofre influência das
etapas programadas para o teste. O mesmo ocorre com a avaliação do conhecimento, por isso
os valores de mínimo e máximo são diferentes a cada avaliação. Os valores de mínimo e
máximo representam o mínimo e o máximo que o teste pode avaliar. Assim, uma pessoa que
erra todas as questões recebe o valor mínimo do teste, e não uma nota zero, pois não se pode
afirmar, a partir do teste, que ela possui zero conhecimento.
Comparação do número de acertos com a proficiência: há uma correspondência entre
o número de acertos e a proficiência, mas a proficiência não é o percentual de itens acertados.
Outros fatores são considerados nas análises, tais como os parâmetros dos itens acertados e o
padrão de resposta. Inclusive, de acordo com a teoria, pessoas com o mesmo percentual de
acertos podem obter proficiências diferentes, a depender do padrão de resposta. Voltando à
ilustração do teste de resistência anterior, não é coerente uma pessoa que consegue correr
600 metros não concluir uma tarefa de 300 metros; por isso, a performance avaliada será
distinta a depender das tarefas concluídas
Além das possíveis confusões citadas, pode acontecer, em alguma edição ou área do
BB Certificação, que não haja itens suficientes para descrever a escala de proficiência em todos
os seus pontos, principalmente os extremos. Isso se deve ao fato de não haver pessoas ou
itens suficientes nos extremos. Nesse caso, pode-se dizer que os examinandos classificados no
extremo inferior da escala de proficiência, por exemplo, não dominam sequer as habilidades
listadas no nível subsequente e a prova não contou com itens que avaliassem habilidades
inferiores às citadas no primeiro nível interpretado. Isso significa que se um certificando é
posicionado em um nível sem interpretação foi devido à forma como é efetuado o cálculo da
nota, considerando não apenas a proficiência necessária para acertar cada item, mas o padrão
de resposta dos examinandos. Além de considerar que não se pode dizer que aqueles abaixo
do primeiro nível interpretado possuem zero conhecimento na área avaliada. Dessa forma,
sempre será calculada uma proficiência para cada examinando submetido à prova, mesmo
aqueles que erraram todas as questões.
Fonte: Nota Técnica produzida pelo Instituto Nacional de Estudos e Pesquisas Educacionais
(INEP).
Disponível em:
http://download.inep.gov.br/educacao_basica/enem/nota_tecnica/2011/nota_tecnica_proce
dimento_de_calculo_das_notas_enem_2.pdf)
REFERÊNCIAS
Andrade, D. F. de, Tavares, H. R. & Valle, R. da C. (2000). Teoria de resposta ao item: conceitos
e aplicações. São Paulo: ABE – Associação Brasileira de Estatística.
Baker, F. B. & Kim, S. (2004). Item response theory: parameter estimation techniques. Nova
York: Marcel Dekker.
Birbaum, A. (1968). Some latent trait models and their models ant their use in inferring an
examinee´s ability. In F. M. Lord and M.R. Novick (Eds.), Statistical theories of mental test
socres (pp 397-479). Reading, MA: Addison-Wesley
Hambleton, R. K., Swaminathan, H. & Rogers, H. J. (1991). Fundamentals of item response
theory. California: Sage Publications.
Klein, R. (2003). Utilização da Teoria de Resposta ao Item no Sistema Nacional de Avaliação da
Educação Básica (SAEB). Ensaio: Avaliação e Políticas Públicas em Educação, Rio de
Janeiro,v.11, n.40, p. 283-296.
Pasquali, L. (1997). Psicometria: teoria e aplicações. Brasília: Editora Universidade de Brasília.
Download

COMUNICADO - Metodologia de Avaliação