1 Avaliação e Testes em Pedagogia
Preparado por Ridwan Mohamed OSMAN
Traduzido por dr. Osvaldo Omar Hassane
LOGO TRILINGUE PARA INSERIR EM BAIXO DA PRIMEIRA PÁGINA
2 ÍNDICE
I.
Avaliação e testes em pedagogia __________________________________________4
II.
Pré-requisitos / conhecimentos prévios necessários_____________________________4
III.
Volume horário/tempo____________________________________________________4
IV.
Material didáctico_____________________________________________________
4
V.
Justificação/importância do Módulo________________________________________ 4
VI.
Conteúdo______________________________________________________________ 4
6.1 Contorno___________________________________________________________ 4
6.2 Grandes linhas_______________________________________________________ 5
6.3 Representação gráfica__________________________________________________6
VII.
Objectivos Gerais________________________ ________________________________7
VIII. Objectivos específicos para as actividades de aprendizagem_______________________7
IX.
Avaliação dos conhecimentos______________________________________________11
X.
Conceitos - Chaves (glossário)_____________________________________________18
XI.
Leituras obrigatórias____________________________________________________21
XII.
Actividades de aprendizagem______________________________________________27
XIII. Avaliação somativa _____________________________________________________ 84
XIV. Síntese do Módulo _____________________________________________________86
XV.
Autor do Módulo _______________________________________________________87
3 NOTA
Este documento é publicado sob uma licença Criativa Commons
http://en.wikipedia.org/wiki/Creative_Commons
http://creativecommons.org/licenses/by/2.5 /
4 I. Avaliação e Testes em Pedagogia
Por Ridwan Mohamed Osman
II. Pré-requisitos / conhecimentos prévios necessários
As aulas prévias para esta matéria são a Psicologia Geral, Psicopedagogia e a Psicologia
de Aprendizagem.
III. Volume horário/tempo
A duração necessária para este Módulo é de 120 horas. Estas horas são distribuídas de
seguinte maneira:
Unidade I: 25 horas
Unidade II: 25 horas
Unidade III: 25 horas
Unidade IV: 25 horas
Unidade VI: 20 horas
IV. Material didáctico
Um computador dotado de uma conecção à Internet, de um sistema de exploração e um
software de aplicação de base.
V. Justificação / Importância do módulo
A avaliação faz parte integrante da educação. Ela tem um efeito na maneira como os
alunos estudam, nas suas motivações, produções, como também nas suas aspirações. No
contexto escolar, ela permite aos inspectores e aos funcionários do ministério determinar
a qualidade da educação oferecida numa dada escola, numa determinada região ou no
país inteiro. No quadro do programa, ela dá-nos uma idéia da medida na qual o Módulo
que nós organizamos - nossos meios - nos permite alcançar nossas metas e nossos
objectivos - nossos fins. Para vós que sóis professores, este Módulo permitir-vos-á notar
a importância da avaliação na educação. Ele ajudar-vos-á também a decidir a melhor
maneira para avaliar os alunos.
5 VI. Conteúdos
6.1 Contornos
Este Módulo - Avaliação e Testes em Pedagogia - tem como meta permitir-vos serem
capazes de compreender os princípios e os conceitos dos diferentes tipos de avaliações
pedagógicas. Trata-se de uma aula introdutória, o que significa que não se espera que se
tornem peritos de avaliação e testes em pedagogia. Vocês serão, por outro lado, capazes
de melhor compreenderem o processo de avaliação, de medidas e testes e serão também
capazes, doravante, de levar a cabo a planificação e a administração de acordo com
princípios estabelecidos e de práticas eficazes. Quando terminarem o estudo deste
Módulo, serão capazes de entender o que une e diferencia as metas, os objectivos, a
testagem e a avaliação dos programas. Também terão uma nova perspectiva sobre a
utilização dos resultados das avaliações.
6.2 Grandes linhas
Unidade 1: Avaliação em pedagogia
i. A natureza da avaliação
ii. Os tipos de avaliação
iii. As etapas da avaliação
Unidade II: Especificação dos objectivos
i. A natureza dos objectivos
ii. Classificação e enunciado dos objectivos
Unidade III: Classificação e selecção dos testes
i. Classificação dos testes
ii. Selecção dos testes
6 Unidade IV: Elaboração de um instrumento
i. Concepção do teste
ii. Construção dos artigos do teste
iii. Concepção e reprodução do teste
iv. Validação do teste
Unidade VI: Análise, interpretação e uso dos resultados
i. Análise
ii. Interpretação
iii. Uso e exposição dos resultados
6.3 Representação gráfica
INSERIR GRÁFICO AQUI
Texto do gráfico:
Educational Evaluation and Testing: Avaliação e testes em pedagogia
Types of Evaluation: Tipos de avaliação
Curriculun Evaluation: Avaliação do currículo
Project Evaluation: Avaliação do projecto
Schol Evaluation: Avaliação escolar
Evaluation of large population: Avaliação de uma população numerosa
Student Evaluation: Avaliação do estudante
Personnal Evaluation: Avaliação do pessoal
Instructional Objectives: Objectivos pedagógicos
Testing: Testes
7 Selection of Tests: Selecção de testes
Developments of Tests: Elaboração de testes
Administration of tests: Administração de testes
Measurement: Medição
Test resultats: Resultados de testes
Analysis, interpretation and use of results: Análise, interpretação e uso dos
resultados
VII. Objectivos gerais
No final desta matéria, o estudante deverá:
(1) Demonstrar a sua compreensão sobre os princípios de base da avaliação e testes em
pedagogia;
(2) Construir, analisar e melhorar os processos de avaliação que julgam de maneira
adequada os objectivos do ensino gerais e específicos;
(3) Fazer a crítica e a interpretação de resultados de testes unificados;
(4) Integrar os resultados da avaliação à avaliação da produção do aluno;
(5) Explicar os resultados das avaliações aos alunos, aos pais e à colectividade;
(6) Construir e interpretar os testes.
VIII. Objectivos específicos para as actividades de aprendizagem
Unidade 1
Temáticas das unidades
1
Avaliação em pedagogia
Objectivos das actividades de aprendizagem
8 A natureza da avaliação

Definir e descrever a avaliação
Os tipos de avaliação

Descrever
principais do
avaliação

Definir e explicar os termos
‟medidaˮ, ‟avaliaçãoˮ
e
‟testeˮ

Nomear os elementos que têm
em comum todos os modelos de
avaliação válidos

Descrever os diferentes tipos
de avaliação, identificando as
principais variáveis avaliadas
por cada tipo e para cada
decisão tomada

Definir as diferentes etapas
da avaliação e enumerar as
actividades de cada uma destas
fases
As fases da avaliação
2
as
etapas
processo de
Especificação dos objectivos
A natureza dos objectivos
Classificação e enunciado dos
objectivos
 Nomear os componentes de base de
todo o modelo válido de avaliação das
necessidades

Nomear três factores a considerar no
momento de estabelecer a prioridade
das necessidades

Nomear e descrever os diferentes
tipos de objectivos

Nomear os princípios directores da
determinação
do
degrau
de
especificidade requerido para um
9 objectivo
3

Escolher um domínio de interesse e
escrever alguns objectivos relacionados
para cada uma das principais categorias
do componente cognitivo

Escolher um domínio de interesse e
escrever alguns objectivos relacionados
para cada uma das principais categorias
do componente emocional

Escolher um domínio de interesse e
escrever alguns objectivos relacionados
para cada uma das principais categorias
da componente psicomotora

Nomear três meios importantes de
coleccionar os dados e identificar uma
situação que se aplica a cada um dos
meios

Nomear
quatro
diferenças
importantes entre um teste padronizado
e um teste concebido localmente

Nomear as principais categorias de
teste e descrever as suas utilidades

Enumerar as características de um bom
teste

Enumerar os factores que é necessário
tomar em conta no momento de
escolher um teste entre os outros
Classificação e selecção dos
testes
Classificação dos testes
Selecção dos testes
10 4
Elaboração
instrumento
de
um
Concepção do teste

Identificar e descrever as principais
componentes de um quadro de
especificações

Identificar e descrever as instruções
gerais de construção dos artigos do
teste

Descrever os tipos de resultados
pelos quais o teste é a moda de
avaliação a privilegiar

Descrever de forma breve duas
aproximações para notar o teste
(???)

Dar duas instruções importantes
para a construção de testes objectivos

Nomear um objectivo específico e
um artigo que se relaciona com cada
um dos tipos de teste seguintes: teste
curto, teste de desenvolvimento,
escolha múltipla, verdadeiro ou falso e
emparelhamento

Descrever
as
principais
aproximações para organizar os artigos
do teste

Enumerar as principais instruções
relativas ao formato dos testes

Nomear e descrever os principais
aspectos da validação dos testes

Identificar e explicar os principais
aspectos da análise de artigos que se
aplicam a um teste normativo
Construção dos artigos do teste
Concepção e reprodução do
teste
Validação do teste
11 5
Análise, interpretação
utilização dos resultados

Explicar os resultados da análise de
artigos e sua interpretação na colocação
de um teste normativo

Identificar e explicar os principais
aspectos da análise de artigos que se
aplicam aos critérios dos testes

Explicar os resultados da análise de
artigos e a sua interpretação na
colocação de um teste criterial

Descrever os quatro escalões de medida
e dar três exemplos para cada um

Definir e descrever as estatísticas
seguintes
assim
como
sua
interpretação:
tendência
central,
variação, lei normal, grau percentual,
desvio reduzido, nota T e correlação

Definir e descrever as equivalências
de nível e idade

Descrever e explicar os diferentes
modos de interpretação dos dados de
um exame

Explicar o principal uso geral dos
resultados aos testes

Dar quatro princípios gerais de
relatório

Identificar e descrever de forma
breve os componentes principais de um
e
Análise
Interpretação
Uso e exposição dos resultados
12 relatório de avaliação formal
IX. Avaliação do conhecimento
Justificação
Esta avaliação dos conhecimentos para o Módulo tem como fim verificar o vosso
conhecimento dos conteúdos deste Módulo. Depois desta avaliação dos
conhecimentos, vocês estão em condições de conhecer o nível de conhecimentos e
competências ligadas a este Módulo. Esta avaliação dos conhecimentos vos
permitirá de julgar os esforços que vocês deverão prover neste Módulo.
Avaliação do conhecimento
1. A colecta e a análise sistemática de dados a fins decisionais são:
a. a avaliação
b.a medida
c. a apreciação
d. o teste
2. O processo pelo qual se avalia até que ponto uma pessoa ou um objecto possuem uma
característica é:
a. a avaliação
b. a medida
c. a apreciação
d. o teste
13 3. A análise de uma situação faz parte de que etapa do processo de avaliação?
a. planificação
b. processo
c. produto
4. Os objectivos do controlo têm por finalidade transmitir:
a. a prioridade relativa das necessidades
b. os comportamentos julgados necessários para ter sucesso
c. as atitudes que todo o estudante deveria ter
d. a complexidade dos objectivos
5. Entre as habilidades seguintes, qual requer algumas faculdades físicas?
a. a inteligência cognitiva
b. a inteligência emocional
c. as habilidades psicomotoras
6. Os objectivos mais distintos e mensuráveis são:
a. a visão
b. as metas
c. os objectivos intermediários
d. os objectivos específicos
7. Entre os elementos seguintes, qual deveria fazer parte dos objectivos pedagógicos?
a. o comportamento
14 b. a condição
c. o critério
d. todas estas respostas
8. A secção de um teste na qual os estudantes escrevem a resposta é:
a. o teste padronizado
b. a escolha múltipla
c. o verdadeiro ou falso
d. o emparelhamento
9. Os testes de produção têm como meta medir:
a. as atitudes
b. a inteligência geral
c. o progresso ou o produto de uma actividade
d. a personalidade
10. O teste de conhecimento mede:
a. o potencial dos estudantes
b. as características pessoais
c. o domínio dos conhecimentos e das competências
d. a perseverança e a paciência
11. A interpretação das notas de acordo com o modelo normativo faz-se em função:
a. das notas dos outros estudantes do mesmo nível
15 b. da dificuldade do exame
c. de critérios previamente estabelecidos
d. da aquisição do estudante
12. Entre os estudantes seguintes, qual não caracteriza PAS um bom teste?
a. a validez
b. a fiabilidade
c. a representatividade
d. a dificuldade
13. A validez do teste é:
a. nenhuma variação de notas, pouco importa o revisor
b. a descoberta das diferenças de conhecimentos dos estudantes
c. o facto que um teste mede aquilo que deve medir
d. a consistência do teste
14. Um teste frequentemente administrado, dando alguns resultados semelhantes é:
a. válido
b. seguro
c. representativo
d. descriminatório
15. O quadro de especificações tem por finalidade:
a. assegurar a medida de todos os elementos a avaliar
16 b. ajudar os estudantes a melhor compreenderem as instruções
c. promover a segurança de um teste
d. equilibrar as dificuldades do teste
16. Qual é o termo que designa o número pelo qual o seguimento dos sucessos de um
estudante está seguro?
a. a nota bruta
b. a percentagem de exactidão
c. o equivalente do nível escolar
d. a nota padrão
17. Entre os elementos seguintes, que procedimento tem uma incidência sobre a
fiabilidade de um teste?
a. a administração
b. a anotação
c. a normalização
d. as instruções
e. nenhuma destas respostas
18. A validez, ligada ao conteúdo, é um tipo de validade de acordo com o qual:
a. foi demonstrado que o teste previu eficazmente os critérios ou os
indicadores de um conceito
b. os artigos do teste são representativos das noções que o teste tem que cobrir
c. é demonstrada a ligação entre os resultados e os traços teóricos preditos
17 d. nenhuma destas respostas
19. Os dados de avaliação podem ser colectados pela:
a. administração de instrumentos padronizados
b. administração de instrumentos concebidos localmente
c. observação
d. todas as respostas são válidas
20. Entre os elementos seguintes, qual não é um dos objectivos dos testes?
a. descrever o nível de desenvolvimento de um estudante de acordo com um
domínio de avaliação
b. identificar as forças e as fraquezas de um estudante de acordo com a disciplina
c. assegurar o seguimento da progressão anual dos conhecimentos de base de um
estudante.
d. predizer o sucesso futuro de uma pessoa
Respostas
1a
2b
3b
4c
5c
6d
7d
18 8a
9c
10 d
11 a
12 d
13 c
14 b
15 a
16 c
17 e
18 b
19 d
20 d
Pedagogia para os estudantes
Como foi dito anteriormente, a finalidade da avaliação destes conhecimentos era de vos
ajudar a apreender o vosso domínio do conteúdo deste Módulo. Se adquiriram mais de
dez respostas boas, significa que já têm um bom domínio dos conceitos e dos princípios
da avaliação e dos testes em pedagogia. Fazer as actividades deste Módulo ajudar-vos-á a
melhorar os vossos conhecimentos e aptidões neste domínio. Se adquiriram de cinco a
dez respostas boas, não terão muitas dificuldades para estudar este Módulo; mostram que
têm uma boa idéia do que são os principais conceitos, mas deverão também dominar
todos os detalhes. Se adquiriram menos de cinco respostas boas, deverão prover de
tempos e esforços para dominar este Módulo, o que vos permitirá aumentar os vossos
conhecimentos no domínio da avaliação e dos testes em pedagogia.
19 X. Conceitos - Chave (glossário)
A avaliação é a colecta e a análise sistemática de dados para fins decisionais.
A medida é o processo pelo qual avalia-se até que ponto uma pessoa ou um objecto
possui um traço específico, por exemplo, a qualidade, o caráter ou uma certa
característica.
Prévio diz respeito ao comportamento, conhecimento ou habilidades que os estudantes
deveriam ter.
Os objectivos são as declarações específicas daquilo que deve ser cumprido e da medida
na qual deve ser realizada. Eles devem ser mensuráveis e quantificáveis.
A avaliação das necessidades é o processo pelo qual as necessidades são identificadas e
sua prioridade determinada.
Os objectivos centrados nas competências têm por finalidade comunicar os
comportamentos julgados necessários ao sucesso futuro dos estudantes, incitando-os a
adotarem tais comportamentos durante os seus estudos.
Os objectivos de domínio são os objectivos que se deveriam esperar de todos os alunos,
independentemente das suas aptidões assim como das suas aquisições.
A taxonomia dos objectivos de aprendizagem tem por finalidade classificar os
objectivos de acordo com a sua complexidade presumida.
As habilidades afectivas estão ligadas aos objectivos intangíveis nas quais a promoção e
a medida são difíceis. São exemplos os sentimentos, as atitudes, os interesses e os
valores.
As habilidades psicomotoras necessitam das habilidades físicas tais como a
coordenação muscular, as habilidades motoras, a manipulação dos objectos ou a
coordenação neuromuscular.
As metas são as declarações gerais contendo os resultados a longo prazo.
Os objectivos intermediários são mais exactos que os objectivos gerais, mas não tão
detalhados quanto os objectivos específicos.
Os objectivos específicos têm traços nos resultados mais distintos.
Um teste objectivo é um teste para o qual toda a subjectividade de correcção é eliminada.
20 Um teste padronizado é um teste desenvolvido por especialistas de medida que dominam a
matéria.
Um teste concebido localmente é geralmente desenvolvido localmente pelo professor com um
objectivo preciso.
A auto - avaliação é uma resposta individual oral ou escrita.
A escala de anotação é um instrumento que compreende vários artigos que representam uma
gama inteira de categorias entre dois extremos.
Os testes de conhecimentos são testes que medem o estatuto de um indivíduo de acordo com as
suas aptidões em domínios de conhecimento ou de competências diversas.
Os testes de carácter ou de personalidade são concebidos para avaliar características das
pessoas assim como um certo número de qualidades.
Os testes de aptidão medem o potencial de reactividade de uma pessoa em situações para as
quais poderia ser confrontado.
As normas de produção são os critérios a partir dos quais os resultados são comparados para
serem interpretados.
A avaliação normativa é uma avaliação padronizada ou preparada localmente, que informa e
interpreta as notas, comparando-as às outras notas obtidas para o mesmo teste.
O teste criterial é um teste que informa e interpreta a nota de acordo com um padrão absoluto.
A objectividade do teste tem a ver com o facto de que independentemente de quem seja o
revisor, o resultado do teste permanece o mesmo.
A descriminação é a medida pela qual num teste se detecta ou se medem as pequenas variações
de produção.
A representatividade é a medida através da qual um teste reflecte os objectivos principais da
aula.
A validez consiste no facto de que um teste mede aquilo que deve medir.
A validez do conteúdo é a medida na qual os artigos de um teste correspondem à extensão dos
artigos que um teste normalmente deveria cobrir.
A validez criterial é a medida na qual um teste consegue efectivamente predizer algums
critérios ou a indicar uma construção.
21 A validez combinada é conhecida quando a medida dos critérios tem lugar ao mesmo tempo
que a obtenção das notas.
A validez predictiva é conhecida quando a medida dos critérios tem lugar após o teste.
A validez conceitual é a medida na qual um teste demonstra uma ligação entre os resultdos
obtidos no teste e a característica teórica predita.
A fiabilidade é a coerência das medidas. Um teste é considerado fiável quando os mesmos
resultados são adquiridos de maneira repetida.
Um quadro de especificações é essencialmente um projecto de teste cuja meta é assegurar que
todos os resultados visados, e somente os resultados visados, são avaliados e que o teste
contenha um número consequente de perguntas para cada artigo avaliado.
A validação do teste é o processo pelo qual um teste é administrado e revisto até à obtenção de
um nível de validez e fidelidade aceitável.
Uma nota bruta é o número de boas respostas adquiridas por um estudante (supondo que cada
pergunta vale um ponto).
A percentagem de exactidão é adquirida pela divisão da nota bruta pelo número total de
perguntas e este resultado é multiplicado por 100.
O equivalente do nível escolar é o número pelo qual o seguimento dos sucessos de um
estudante está assegurado.
O grau percentual é a percentagem de alunos de um grupo preciso que obteve uma nota inferior
àquela do estudante.
XI. Leituras obrigatórias
Leitura #1
Título: Educação designada para Projectos de Educação
Referência completa: wateroutreach.uwex.edu/use/documents/NOAAEvalmanual-FINAL.pdf
Resumo
A leitura deste texto cobre os princípios fundamentais da avaliação, apresenta análises variadas
sobre uma panóplia de tópicos: tipos de avaliação, maneiras para colectar as informações,
utilização de um avaliador no exterior e considerações morais ligadas à colecta de dados dos
22 participantes no programa. Estas informações visam responder as perguntas relativas à avaliação
do projecto e fornecer alguns conselhos aquando da utilização da avaliação como ferramenta
para a melhoria do projecto.
Justificação
Por muito tempo, os esforços e os recursos são consagrados para o desenvolvimento e para a
colocação de projectos pedagógicos. Evidentemente, a meta é de conceber projectos eficientes
que possam servir de modelos de excelência. Pouco importa se o projecto é uma marcha de uma
hora para ver as espécies em vias de desaparecimento, um festival do dia da família, a
observação dos recursos marinhos ou um fórum comunitário; o fim, que é de fornecer as
experiências pedagógicas de qualidade, não muda. A finalidade desta leitura é de ajudar os
professores, os administradores, os gestores do projecto e os dirigentes do amanhã a
compreenderem o processo de avaliação dos projectos para melhorar a sua eficácia e sua
incidência positiva.
Leitura #2
Título: A Taxonomia de Bloom nos Objectivos Educacionais
Referência completa: www.humboldt.edu/~tha1/bloomtax.html
Resumo
A obra apresenta ao leitor a taxonomia dos objectivos educacionais de Bloom. Cada um dos três
domínios – cognitivo, emocional e psicomotor - é explicado e são fornecidas as subcategorias de
cada um e são também providas categorias de cada. Além disso, o leitor terá as listas de verbos
que o ajudarão a estabelecer alguns objectivos adequados para cada categoria.
Justificação
Neste Módulo, este documento favorecerá a compreensão do estudante dos três domínios da
taxonomia de Bloom. Os verbos fornecidos ajudá-lo-ão a estabelecer os objectivos apropriados
para cada categoria.
Leitura #3
Título: Taxonomia de Objectivos Educacionais
Referência completa: www.humboldt.edu/~tha1/bloomtax.html
23 Resumo
Este artigo fornece um exemplo de cada taxonomia dos objectivos pedagógicos de Bloom ao
estudante. De maneira mais detalhada, os exemplos facilitam a compreensão dos conceitos.
Justificação
Os exemplos acompanham a taxonomia e ajudarão a estabelecer os objectivos eficientes e a
preparar as questões ou actividades para medir o alcance desses objectivos.
Leitura #4
Título: Escrevendo Objectivos Instrucionais
Referência completa: www.naacls.org/docs/announcement/writing - objetivo. pdf
Resumo
No princípio, o artigo sublinha as diferenças dos objectivos pedagógicos, das descrições de aulas.
Em seguida, ele fornece um guia facilitando o estabelecimento dos objectivos pedagógicos. As
regras deste artigo estão também ligadas aos domínios do Bloom.
Justificação
Este artigo incide sobre os objectivos pedagógicos, que constituem importantes pontos de partida
para a avaliação do aluno. Os futuros professores e os outros estudantes deste Módulo serão
capazes de identificar os objectivos específicos quantificáveis predominantes, ou seja, que têm
lugar em todos os domínios de aprendizagem.
Leitura #5
Título: Os fundamentos dos Objectivos Instrucionais
Referência completa:
ed.fullerton.edu/SecEd/Credential_Prog/EDSC_440S_Ma-terials/Instructional_Objectives.ppt
Resumo
Este artigo explica a natureza dos objectivos pedagógicos e seus fins em ensino e em avaliação.
Além disso, este documento distingue os quatro principais elementos dos objectivos
pedagógicos, a saber: o público, o comportamento, as condições e a formação. Este artigo
24 fornece também alguns exemplos de objectivos quantificáveis. No fim deste, algumas distinções
são feitas entre os diferentes tipos de objectivos (resultado contra o processo, aluno contra os
professores e geral contra o específico).
Justificação
Este artigo apresenta ao estudante um resumo dos objectivos pedagógicos e de seus elementos.
Este artigo permitir-vos-á identificar os elementos dos objectivos pedagógicos e verificar se os
objectivos determinados se conformam a esta norma.
Leitura #6
Título: O caso contra os testes padronizados
Referência completa: www.alfiekohn.org/books/tcast.htm
Resumo
Este artigo critica os testes padronizados expondo as principais fraquezas constatadas nas obras
sobre este tema. A que ponto as anotações dos testes são válidas para predizer as notas? Elas são
válidas ou não para predizer o cumprimento actual? Os testes têm um pré-julgamento
desfavorável em relação à sociedade? Este artigo passa em revista as obras críticas e exaustivas
consagradas aos assuntos dos testes padronizados para tentar responder a estas questões.
Justificação
Este artigo permitirá ao estudante ver o lado negativo dos testes padronizados. As fraquezas
expostas neste artigo manifestar-se-ão concretamente em prática quando o estudante for
confrontado com esta escolha difícil: testes padronizados ou testes concebidos localmente?
Leitura #7
Título: Desenvolvendo um quadro de Especificações
Referência completa:
academicaffairs.cmich.edu/caa/assessment/posters/TableofS-pecifications.pdf
Resumo
Neste artigo são apresentados e explicados os aspectos comuns do quadro de especificações.
Uma atenção particular é dada à validez do conteúdo e do processo. Encontram-se também os
25 modelos de quadros de especificações no anexo deste artigo. Estes quadros estão representados
em vários domínios dos programas educativos do ensino secundário.
Justificação
O quadro de especificações é uma ferramenta importante que permite o professor elaborar os
exames que melhor representam os conteúdos e os objectivos que são supostos a serem
avaliados. A finalidade deste artigo é facilitar a elaboração pelos estudantes de quadros de
especificações para os exames na turma.
Leitura #8
Título: Construção de testes: Algumas idéias práticas
Referência completa: www.utexas.edu/academic/cte/sourcebook/tests.pdf
Resumo
Este artigo apresenta algumas idéias práticas e úteis na elaboração de testes e na construção de
artigos que avaliam aquilo que é suposto ser avaliado da melhor maneira possível. No geral, há
12 directivas que abordam sobre o processo de concepção de testes; de conceitos como os planos
detalhados de testes e de outros tipos de questões; e uma análise e abordagem de elementos com
mais profundidade.
Justificação
Este artigo visa fornecer ao estudante um resumo sobre a maneira de elaborar os testes actuais.
Leitura #9
Título: Improving Essay tests
Referência completa: www.theideacenter.org/sites/default/files/Idea_Paper_ 17.pdf
Resumo
Este artigo, que destaca a elaboração de teste, dá uma visão geral de conjunto deste tipo de teste.
Ele começa por descrever o teste e, em seguida, fornece um panorama de forças e das fraquezas
desses testes. Este texto apresenta também algumas recomendações sobre o momento apropriado
26 de utilizacão destes testes e a maneira de elaboará-los. No fim deste artigo, é abordado o
processo de anotação dos testes.
Justificação
Este artigo ajudará os estudantes a ter uma idéia sobre a maneira de conceber questões adequadas
para as respostas dos testes elaborados na turma. O estudante terá também um resumo das
principais fraquezas que travam a eficiência dos testes de questões abertas, que são as
ferramentas pedagógicas.
Leitura #10
Título: Perguntas de Teste de Objectivos artificiosas: Um Seminário Introdutório
Referência completa: http://www.caacentre.ac.uk/dldocs/otghdout.pdf
Resumo
Este artigo apresenta os diferentes tipos de questões para os testes objectivos e o modo de os
construir. O tipo de questões abordadas compreendem as questões de escolha múltipla (QEM), as
de "verdadeiro ou falso", a razão da afirmação, as questões a respostas múltiplas (QRM) e as
questões de emparelhamento.
Justificação
Esta ligação ajudará os estudantes a ter uma idéia geral dos diferentes tipos de perguntas para os
testes objectivos. Em cada categoria, são apresentados alguns exemplos para facilitar a tarefa na
hora da elaboração de questões deste género.
Leitura #11
Título: Como preparar melhor um artigo de testes de escolha múltipla: diretrizes para a
Faculdade Universitária
Referência completa: http://testing.byu.edu/info/handbooks/betteritems. pdf
Resumo
Esta brochura é consagrada inteiramente às questões de escolha múltipla que são o tipo de
perguntas de teste sobre os objectivos mais importantes. Ela trata da estrutura das QEM, das
27 vantagens e fraquezas; dos momentos apropriados para os utilizar e dos diferentes tipos de QEM.
O artigo explica como as QEM podem ser empregadas para avaliar as competências de nível
mais alto. No final desta brochura, encontram-se alguns conselhos para a elaboração deste tipo
de questões de teste.
Justificação
Depois de ter estudado exaustivamente esta brochura e posto em prática o que havia no interior,
o estudante deverá ser capaz de distinguir os objectivos pedagógicos que são avaliados o mais
pertinentemente pelas QEM; de avaliar as QEM, usando os critérios aceites actualmente e
sublinhando os defeitos das QEM; e recomendar os modos para os melhorar. Acima de tudo, o
estudante deverá ser capaz de construir correctamente e por escrito as QEM que avaliam alguns
objectivos específicos.
Leitura #12
Título: Melhores Práticas em Matemática: usando os resultados dos testes para informar as
instruções e melhorar as realizações do estudante
Referência completa:
http://www.ctb.com/media/articles/pdfs/resources/ctb_best_practice_in_math.pdf
Resumo
Este artigo examina as diferentes maneiras de como os professores podem usar os resultados dos
testes para dar algumas instruções e melhorar a produção escolar. Um certo número de conselhos
são dados ao professor que deseja usar os resultados dos testes. Há também um exemplo de
boletim.
Justificação
Este artigo fornecerá aos professores algumas pistas quando estes pensarem em usar os
resultados dos testes. Deste modo, dir-se-á que a sua pedagogia está ligada às necessidades e as
fraquezas dos alunos.
Leitura #13
Título: Estatísticas Descritivas
Referência completa: http://www.sagepub.com/upm-data/9881_040143ch02.pdf
28 Resumo
Este artigo apresenta os conceitos subjacentes às estatísticas descritivas dando alguns exemplos
complexos tirados das ciências sociais. Encontram-se alguns tipos de dados, algumas estatísticas
descritivas visuais assim como algumas estatísticas descritivas numéricas.
Justificação
Depois desta leitura, os estudantes terão uma melhor compreensão das estatísticas descritivas e
estarão em condições de utilizar estes conceitos para os seus testes quotidianos.
XII. Actividades de aprendizagem
Actividades de aprendizagem #1
AVALIAÇÃO PEDAGÓGICA
Resumo
A primeira actividade deste Módulo visa a aquisição pelo aluno de uma compreensão elementar
da avaliação pedagógica e do exame. Será abordada a terminologia de base relativa ao tópico.
Além disso, serão tomados em consideração alguns tipos de avaliação serão. A actividade de
aprendizagem também cobrirá as diferentes fases da avaliação: a preparação e a finalização do
processo. As leituras e os exercícios integrados a esta actividade de aprendizagem deverão
permitir ao estudante alcançar os objectivos estabelecidos para as unidades correspondentes ao
Módulo.
Lista de conceitos-chave
A avaliação é a colecção e a análise sistemática de dados para fins decisionais.
A medida é o processo pelo qual avalia-se até que ponto uma pessoa ou um objecto possui uma
característica específica; por exemplo, a qualidade, o caráter ou uma outra característica.
Prévio diz respeito ao comportamento, conhecimento ou inteligência que os estudantes deveriam
ter.
CONTEÚDO
Avaliação e medida
29 A avaliação é uma parte integrante de todos os sistemas de educação em todas as fases. Ela
permite aos educadores, aos professores, aos administradores, aos dirigentes e a comunidade de
se ter uma idéia do que falta e do que é acessível. A avaliação pode ser definida de duas
maneiras, dependendo daquilo que se pretende adquirir no final do exercício.
Trata-se da colecta e análise sistemática de dados para determinar se os objectivos foram
alcançados e em que medida foram ou estão em vias de serem alcançados.
A avaliação é a colecção e a análise sistemática de dados a fim de tomar decisões.
A primeira parte destas definições (colecta e análise sistemática de dados) é comum a duas
definições formuladas acima. Porém, as principais diferenças entre estas definições dizem
respeito à questão de incluir ou não as decisões ou os julgamentos como parte integrante da
avaliação. A segunda definição parece ser mais inclusiva e não exclui as actividades implicadas
na primeira definição.
Na maioria dos casos, a avaliação quer responder às questões que requerem um nível de
avaliação. Questões como:
a) O programa especial vale a pena por aquilo que ele custa?
b) O novo programa de estudos em leitura de verificação é melhor do que o precedente?
c) O Sr. Ahmed deveria ser colocado num programa para os talentosos?
Necessita a colecta e a análise de dados e a interpretação destes dados no que diz respeito a um
critério ou mais. Quanto mais os critérios são objectivos, mais eles são eficientes, porque há
inevitavelmente uma parte de subjectividade, sendo dado que as pessoas tomam a decisão
concludente. Para dar algumas respostas às perguntas precedentes, a avaliação não consiste
somente em determinar se alguma coisa é " boa " ou " má ". A função ou a meta da avaliação é
de:
- determinar a posição actual do objecto da avaliação;
- comparar o estatuto com um conjunto de normas ou de critérios;
- efectuar uma escolha a fim de tomar uma decisão.
No final do processo, pode acontecer que haja só duas escolhas ou uma combinação de
actividades e de programas complexos concebidos como intervenção para a situação presente.
Em geral, o processo de avaliação inclui a determinação dos tipos de dados que devem ser
colectados, a determinação das pessoas, dos grupos que constituem a amostra, a colecta, a análise
a interpretação dos dados e a tomada de decisão.
30 É crucial que as decisões sejam baseadas num procedimento válido, porque embora todas as
decisões não se revistem da mesma importância, cada uma tem uma incidência directa ou
indirecta nos alunos. Quanto mais uma consequência é importante, mais a decisão será
importante. Porém, cada decisão pedagógica deveria ser tomada logicamente e objectivamente, e
deveria basear se nos dados mais pertinentes, na medida do possível.
Os dados colectados durante o processo de avaliação são também bons quanto às medidas sobre
os quais são fundadas. A medida é o processo pelo qual avalia-se até que ponto uma pessoa ou
um objecto possui uma característica específica, por exemplo, a qualidade, o caráter ou uma
característica.
As medidas permitem uma descrição mais objectiva no que concerne às características de
carácter e facilitam as comparações. Assim, em vez de dizer que Kimani está magro para a sua
idade e seu tamanho, nós podemos dizer que Kimani tem 16 anos, mede 5 pés e 8 polegadas e só
pesa 85 quilos. Também, ao invés dizer que Kimani é mais inteligente que Juma, nós podemos
dizer que Kimani possui um Q.I. de 125 e que o Q.I. de Juma é de 88. Em cada caso, o uso dos
números é mais preciso, mais objectivo e menos sujeita a interpretação que as descrições verbais
que significam a mesma coisa.
A quantificação de todas as características de interesse é possível? Para os profissionais, há
divergência de opiniões nesta pergunta. Nós realmente podemos quantificar um pouco de
qualidades indefiníveis como a empatia, a avaliação, o incentivo ou os interesses? Nós podemos
realmente quantificar os valores e as atitudes? A resposta é " sim ", mas é difícil. Os defensores
desta posição usam o argumento seguinte: se alguma coisa existe, ela existe em quantidades; se
ela existe em quantidade, ela pode ser medido. Se nós aceitamos esta lógica, aos olhos dos
educadores, toda a característica de interesse pode ser quantificada. Assim, o fim da medida
psicopedagógica é de saber em que medida uma pessoa ou uma entidade possui " algo ".
Admitir que, teoricamente, todas as coisas podem ser medidas e medir todas estas coisas são dois
processos completamente diferentes. Em educação, é difícil ter medidas válidas. O principal
problema é que, à excepção da medida das características físicas como o tamanho e o peso, toda
a medida é indirecta; não há critérios ou escalas para medir algumas características como a
inteligência, o sucesso ou a atitude. A avaliação destas características deve necessariamente
basear-se sobre a dedução. Além disso, o problema é agravado pela falta de instrumentos bem
válidos. Em alguns domínios, o problema é menos sério que em outros.
Os termos "medida" não rimam com a administração de testes na sala. Os dados podem ser
colectados pela observação, pela análise e pela avaliação de um produto. Em alguns casos, já se
tem acesso aos dados necessários e estes podem se encontrar nos arquivos. Contudo, talvez já
tenha acesso aos dados exigidos e estes possam estar em arquivos. Porém, em muitas ocasiões,
31 exigem-se algumas combinações de testes padronizados ou de testes autoconcedidos, ou dos
dois.
Tipos de avaliação
Quando nós fazemos referência aos tipos de avaliação, nós fazemos alusão aos diferentes
processos, produtos e às pessoas que podem ser avaliadas, notavelmente os alunos, os programas
educativos, as escolas, os sistemas escolares, as populações numerosas, os programas ou os
projectos especiais e o pessoal. Quando nós falamos dos tipos diferentes de avaliação, não
significa que haja vários processos de avaliação diferentes. Basicamente, o processo de avaliação
permanece o mesmo, pouco importa o que faz o objecto da avaliação. O que difere é o que é
avaliado, como o processo de avaliação é aplicado e o tipo de decisões efectuadas. Os diferentes
tipos de dados colectados variarão de acordo com o que é avaliado; vários critérios se aplicarão
aos diferentes dados e diferentes tipos de decisões serão efectuados. Mas, basicamente, o
processo de avaliação permanece o mesmo assim como os conceitos e princípios gerais de
medida e de avaliação em vigor.
a) Avaliação do aluno
O sucesso é uma das variáveis que constituem o objecto de avaliação do aluno; as outras
variáveis importantes compreendem a aptidão, a inteligência, a personalidade, as atitudes e os
interesses. Para avaliar o sucesso, são usados como dados os testes padronizados e concebidos
pelo professor; os projectos, o procedimento e as apresentações orais avaliados; e a observação
formal e informal efectuada. Um professor serve-se de dados ligados à produção do aluno não só
para avaliar o progresso realizado pelo aluno, mas também para avaliar a sua própria pedagogia.
Em outras palavras, o processo de avaliação dos alunos dá a retroação para a avaliação do
professor.
A retroação sobre o progresso actual do aluno pode também guiar o professor com vista às
actividades pedagógicas ulteriores. Todos os modos de decisões efectuados tem um impacto
directo sobre o aluno e todas estas decisões não são tomadas pelo professor. Este escolhe:
- Se o aluno atingiu os seus objectivos, ou em que medida atingiu esses objectivos, e
prevê um ensino correctivo adequado se for necessário;
- Se o aluno desenvolve um potencial;
- As expectativas de um aluno ou de um grupo de alunos em particular;
- Se a criança tem necessidades particulares que não podem ser satisfeitas na sala
ordinária e pode recomendar que a criança seja colocada num ambiente adaptado.
32 Outras tantas decisões são tomadas que tendo características ligadas aos alunos, não relevam o
professor e este só pode distribuir algumas recomendações. Estas decisões compreendem:
- O lugar da criança num programa particular;
- A admissão de um aluno em turmas superiores;
- A colocação de alunos e sua admissão em outros estabelecimentos escolares.
b) Avaliação do programa educativo
A avaliação do programa educacional inclui a avaliação de todo o programa ou material
pedagógico e de factores como as estratégias de ensino, os manuais, o material audiovisual e a
disposição física e organizacional. A avaliação do programa do ensino pode também
compreender a avaliação de um programa completo ou aquele de um pequeno aspecto de um
programa educativo completo, como para um filme. Embora os programas contidos fassam o
objecto de uma avaliação, a avaliação do programa do ensino está geralmente ligada à inovação,
uma aproximação nova ou diferente; a aproximação pode ser geral ou específico a um
determinado domínio.
A avaliação do programa de estudos implica geralmente alguns critérios internos e externos, e
das comparações. A avaliação interna vê se o novo processo ou o produto cumpre os objectivos
expostos; em outras palavras, ela verifica se faz aquilo que se pretende fazer e também avalia os
objectivos. A avaliação externa vê se o processo ou o produto faz algo a mais que outros
processos ou produtos particulares.
Além do sucesso do aluno, há um certo número de outros factores que deveriam ser tomados em
consideração no momento da avaliação do programa educativo. Os dois factores mais
importantes são a atitude e o custo. A pesquisa provou que há uma relação proporcional entre a
atitude do professor em relação ao programa de ensino e sua última eficiência.
O problema principal ligado à avaliação do programa é que é muito difícil de comparar
equitativamente a eficiência de um programa ou de uma aproximação com outros programas ou
aproximações. Mesmo que dois programas tratam da mesma disciplina, eles podem possuir os
objectivos muito diferentes, e encontrar um teste ou outras medidas que têm a mesma exactidão
ou validez não é uma tarefa fácil. Se um programa de estudos deve ser comparado a um outro, os
objectivos de cada um devem ser examinados atentamente: se não se pode encontrar nenhuma
medida que se aplique adequadamente aos dois programas, então é necessário conceber uma
nova.
33 c) Avaliação da escola
A avaliação de uma escola tem em conta a avaliação da totalidade de seu programa de educação
e inclui a colecta de dados em todos os aspectos do funcionamento da escola. A meta da
avaliação da escola é determinar em que medida os objectivos são alcançados e registar os
pontos fortes e fracos do programa ao todo. As informações colectadas dos programas
pedagógicos fornecem a retroacção que guia as actividades próximas da escola e isso motiva
algumas decisões relativas à distribuição de recursos.
Um aspecto principal da avaliação da escola é o programa de testes para a escola; quanto mais o
programa de testes é completo, mais os dados colectados deste programa são preciosos. Um
programa de testes para a escola deveria incluir a medida do sucesso, da aptidão, da
personalidade e do interesse. Os testes escolhidos para uma escola têm que concordar com os
objectivos da escola e devem ser adequados para os alunos que os suportarão.
Em geral, a avaliação da escola compreende mais que a administração de testes para o élèves;
ela pode necessitar dos questionários, das entrevistas e das observações seguindo de dados
colectados por todas as pessoas dentro da comunidade escolar, inclusive os membros da
direcção, os professores e os conselheiros.
d) Avaliação de populações numerosas
A avaliação de populações numerosas inclui a avaliação da posição presente e o progresso
educativo de um número grande de alunos, geralmente distribuídos numa grande região
geográfica. Os programas de avaliação que cobrem um Estado inteiro são geralmente fundados
na idéia de que o sistema de ensino do Estado é responsável pela realização de algumas
competências fundamentais exigidas ao aluno para funcionar eficazmente na nossa sociedade, e
na idéia de que os programas concebidos para encorajar a realização destas competências
deveriam ser eficientes e económicos, na medida do possível. Uma das principais metas da
avaliação do Estado é de difundir as informações aos dirigentes do Estado e as regiões sobre o
carácter adequado dos programas educacionais de base. A avaliação que geralmente cobre um
Estado inteiro inclui a avaliação de um número mínimo de objectivos educacionais e objectivos
opcionais que usam os testes criteriais e normativos.
e) Avaliação de projectos e programas particulares
Os projectos e os programas particulares comportam todos os esforços combinados que, na
verdade, não fazem parte dos programas de educação ordinários. Geralmente, eles são modernos
e a duração de sua existência varia de acordo com o seu sucesso. Que seja exigido ou não, a
propriedade de uma avaliação é de um interesse primordial para um projecto ou um programa
desde que ela constitua a única maneira válida para verificar a sua eficiência.
34 f) Avaliação do pessoal
A avaliação do pessoal inclui a avaliação de toda a pessoa responsável, directa ou
indirectamente, dos resultados pedagógicos: professores, administradores, conselheiros, etc.
Verificou-se que este sector de avaliação é muito complicado; Com efeito, é difícil determinar os
comportamentos que devem ser avaliados. A melhor solução para o problema da avaliação do
pessoal é de colectar numerosos dados justos provenientes de fontes muito diversificados, até
onde possível.
Fases da avaliação
A avaliação é um processo ininterrupto. Mas ao contrário do que a maioria das pessoas pensa,
aquilo que é efectuado não tem sido o que no fim é avaliado. A avaliação deveria ser planificada
antes da propagação de todo o esforço e deveria fazer parte da actividade desde o princípio até ao
fim. Geralmente, há uma série de fins temporários num ciclo contínuo. Por exemplo, para a
avaliação do aluno, nós começamos por um conjunto de objectivos pedagógicos. Em seguida,
nós avaliamos a produção, que é um fim temporário no ciclo educacional. Em função dos
resultados, nós reavaliamos os nossos objectivos e as nossas estratégias e depois prosseguimos.
Assim, o processo é cíclico e a retroacção, obtida num ciclo, guia o próximo ciclo. Além dos
resultados, nós avaliamos outros aspectos; cada fase do processo é submetida à avaliação e
começa com os objectivos.
O processo de avaliação inclui a tomada de decisão. Todo o esforço educacional requer um
conjunto de decisões que devem ser efectuadas - decisões sobre os objectivos, as estratégias, as
medidas, etc. Estas decisões diversas podem ser classificadas de acordo com o momento onde
elas forem tomadas, quer dizer, a etapa da actividade do estudo. Assim, cada etapa da avaliação
inclui os modos diferentes de decisões. Logicamente, nós podemos distinguir três etapas: a etapa
da planificação, do processo e do produto.
A etapa da planificação
Esta primeira fase da avaliação acontece antes e requer a tomada de decisões sobre o plano de
acção que será adoptada e de suas metas. A fase da programação põe em questão um certo
número de processos que são examinados abaixo.
a) Análise de situação
35 Analisar a situação como ela é presentemente, constitui a primeira iniciativa para estabelecer os
parâmetros do esforço. Esta iniciativa compreende algumas actividades como a colecta de
informações gerais e a avaliação de constrangimentos actuais. Por conseguinte, o professor pode
ser chamado a examinar os arquivos de seus alunos para ter um quadro de referência fundado
sobre as suas habilidades e seus antecedentes. Uma vez os parâmetros estabelecidos, podem-se
definir as metas e os objectivos realísticos.
b) Especificação dos objectivos
As metas são as declarações dos objectivos, ou os resultados desejados, e não são directamente
quantificáveis. Cada objectivo deve ser dividido num objectivo específico ou mais, e estes
objectivos serão mensuráveis. Assim, os objectivos são as declarações específicas concernente
ao que deveria ser realizado e a boa maneira para se conseguir chegar lá e são expressados em
resultados mensuráveis e quantificáveis. Os objectivos podem ser centrados no processo ou no
produto. Os objectivos de processo descrevem os resultados desejados durante a propagação do
esforço e eles estão ligados ao desenvolvimento e a realização. Por seu lado, os objectivos
ligados ao produto descrevem os resultados esperados seguidos de esforço.
Os objectivos guiam todas as actividades ulteriores e o alcance dos objectivos é avaliada em
último lugar. Os objectivos de ensino ou do programa, constituem as bases de todas as
actividades de avaliação subsequente e, por consequente, é essencial que eles sejam avaliados de
acordo com a pertinência, o caráter mensurável, o conteúdo e a precisão técnica.
c) Especificação do prévio
Os objectivos requerem um procedimento único com respeito à avaliação do aluno. Na maioria
dos casos, características de um conjunto dado dos objectivos pedagógicos são baseados na idéia
segundo a qual os alunos adquiriram antes algumas competências e conhecimentos. Se esta idéia
é falsa, os objectivos são inadequados. Os comportamentos anticipados são chamados os
comportamentos prévios ou de entrada. Este comportamento prévio deve ser especificado e
medido, porque a pedagogia e a avaliação sistemática o exigem. A avaliação dos
comportamentos de entrada é especialmente importante no princípio de toda a unidade de
instrução. Para conseguir o prévio você deve se fazer a seguinte questão : O que é que todos os
alunos têm de saber ou estar em medida de cumprir antes do ensino afim de aproveitar deste e de
alcançar todo o objectivo?
d) Escolha e elaboração dos instrumentos de medida
36 A colecta de dados para determinar o grau de alcance dos objectivos exige a administração de
um instrumento ou mais. Estes instrumentos devem ser concebidos ou escolhidos. A escolha dos
instrumentos implica um estudo desses que são acessíveis e a escolha de melhor. Neste caso,
melhor quer dizer aquele que é mais satisfatório para os vossos objectivos e vossos usuários. A
clarificação de um bom instrumento pode levar muito tempo, esforços, e requer algumas
competências particulares. Para se fazer isso, uma formação em avaliação é necessária.
e) Apresentação das estratégias
Normalmente, as estratégias são as aproximações que encorajam o alcance de um objectivo ou
mais. Pode haver algumas estratégias para a pedagogia, os programas educacionais e os
programas. Cada estratégia comporta um certo número de actividades específicas, e geralmente,
pode-se escolher entre uma série de estratégias. A utilização destas estratégias deve ser
planificado para fazer de forma que os recursos necessários sejam acessíveis. As estratégias que
devem ser o fruto de uma reflexão séria antes da apresentação da avaliação compreendem a
análise das tarefas, a revisão dos conceitos, a sequência e o uso da retroacção e da prática.
f) Preparação de um calendário geral
A preparação de um calendário geral realístico é importante para todo o tipo de avaliação; raras
são as vezes onde nós temos tanto tempo que nós queremos para conduzir a nossa avaliação. Na
realidade, um calendário geral compreende uma lista das principais actividades do esforço de
avaliação proposta, do tempo correspondente para cada princípio previsto e do tempo de
execução para cada actividade. Você deveria prever o tempo suficiente; do modo que pudesse
respeitar o seu prazo final no caso de contratempo.
Fase do processo
A fase do processo necessita das decisões tomadas de acordo com eventos que se produzem
durante a colocação actual da pedagogia, do programa ou do projecto previsto. O primeiro passo
na fase do processo é a administração de pretestes, se estes são apropriados. As decisões, que são
fundadas nos resultados do prétestes, podem ser tomados relactivamente à consideração da
exactidão objectiva determinada. Depois do teste inicial, as estratégias e as actividades previstas
são realizados na sequência pre-estabelecida. Os dados colectados a esta fase permitem de
verificar os objectos, se tudo se desenrola como previsto e se as estratégias e as actividades são
eficientes. As metas fundamentais desta fase são de ver se o esforço desdobrado assim foi
considerado, de determinar o grau de alcance dos objectivos do processo e de achar os modos
que trazem algumas melhorias. A fase do processo é designada sob o nome de avaliação
formativa.
37 Fase do produto
A fase do produto necessita de decisões tomadas no fim ou provavelmente no final de um ciclo
de pedagogia, um programa ou um projecto. As decisões tomadas durante a fase do produto são
fundadas sobre os resultados dos postestos e em outros tipos cumulativos de dados. A meta
principal desta fase de produto é de colectar alguns dados a fim de tomar algumas decisões na
eficiência geral da pedagogia, de um programa ou de um projecto. Durante esta fase, determinase se os objectivos relacionados com produto foram alcançados e se sim, em que medid foram
alcançados. Depois da análise e a interpretação de dados, há a preparação de um relatório que
descreve os objectivos, o procedimento e os resultados do esforço. Os resultados da fase do
produto da avaliação são pelo menos empregados de dois modos principais:
i.Eles fornecem a retroação e servem de referência a todos aqueles que participaram no
esforço
ii.Eles fornecem a retroação aos dirigentes no exterior, como os pais, os directores, os
membros do conselho escolar e as ajudas públicas.
Os resultados da etapa do produto devem ser interpretados com prudência. Por exemplo, o nãorespeito dos objectivos não é necessariamente desastroso; o grau de alcance deve ser
considerado. A fase do produto da avaliação é chamada avaliação somativa.
Avaliação formativa
Atividade 1
Depois de ter lido a nota acima sobre os diferentes tipos de avaliação, preencha o quadro abaixo
Tipo
de Principais
avaliação
variáveis
medida
Aluno
Programa
educacional
Escola
População
numerosa
Principais
de decisões
tipos
de Qual é o tipo de avaliação
importante para a educação?
38 Programas
especiais
Pessoal
Actividade 2
Mencione cinco problemas ligados à avaliação final.
1 _________________________________________________
2 _________________________________________________
3 _________________________________________________
4 _________________________________________________
5 __________________________________________________
Actividade 3
Preencha o quadro abaixo.
Etapa da avaliação
Exemplos de decisões
Actividades particulares
Planificação
Processo
Produto
Avaliação - Estudo de caso
Escolha uma das escolas de sua região e entreviste o diretor ou a directora da escola ou alguém
responsável pelos exames da escola em relação aos procedimentos a seguir na hora dos exames.
As perguntas seguintes servirão de guia.
39 1. O que significa uma avaliação para esta escola? O que é que a motiva?
2. Que tipos de avaliação são utilizadas nesta escola? Por que é utilizada?
3. Como é que a escola realiza e planifica a avaliação do aluno? Qual é o passo a seguir para
cada fase? Como é que os resultados são utilizados? Quem tem acesso aos resultados da
avaliação e como eles são utilizados?
Avaliação dos projectos pedagógicos
A avaliação dos projectos pedagógicos faz parte integrante do processo da revista e da avaliação
dos sistemas de educação.
A leitura obrigatória para o estudo #1 (Avaliação designada para os projectos da avaliação) e a
redacção de um teste na avaliação dos projectos do ensino.
1. O que é uma avaliação de projectos?
2. Porque é que uma avaliação de projectos é importante na educação?
3. Quais são as fases a seguir numa avaliação de projectos?
4.
Quais são os diferentes tipos de avaliação de projectos?
5. Quais são os diferentes instrumentos para colectar os dados usados na avaliação de
projectos?
O vosso teste deveria ser redigida e ter entre 1000 e 2000 palavras.
Assegurem-se de ter usado as vossas próprias palavras no resumo.
Actividade de aprendizagem #2
CARACTERÍSTICA DOS OBJECTIVOS
Resumo
Os objectivos encontram-se no centro das actividades da avaliação em educação e guiam o
processo da educação. Eles nos ajudam a determinar aquilo que é necessário medir e como fazelo. Eles mostram se o processo de educação foi um sucesso, e o que pode ser feito de forma que
ele seja um sucesso. Nesta actividade, os estudantes serão capazes de conhecer os objectivos e
40 sua importância na educação. Além disso, eles dominarão os tipos de objectivos educationais e
seus elementos. A taxonomia dos objectivos pedagógicos de Bloom será abordada e servirá de
guia para verificar se os objectivos que nós fixamos e medimos foram bastante exaustivos para
incluir todos os aspectos da educação.
Lista de conceitos - chave
Os objectivos são as declarações específicas daquilo que deve ser realizado e da medida na qual
deve ser realizado. Eles devem ser mensuráveis e quantificáveis.
A avaliação das necessidades é o processo pelo qual as necessidades são identificadas e sua
prioridade determinada.
Os objectivos centrados nas competências têm por meta comunicar os comportamentos
julgados necessários ao sucesso futuro dos estudantes incitando-os a adotarem durante os seus
estudos.
Os objectivos de domínio são os objectivos que deveriam atingir todos os alunos, pouco importa
as suas aptidões e suas aquisições.
A taxinomia dos objectivos de aprendizagem tem por meta classificar os objectivos de acordo
com a complexidade presumida.
As habilidades afectivas estão ligadas aos objectivos intangíveis do qual a promoção e a medida
são difíceis; por exemplo os sentimentos, as atitudes, os interesses e os valores.
As habilidades psicomotoras requerem as habilidades físicas, do quais a coordenação muscular,
as habilidades motoras, a manipulação de objectos ou a coordenação neuromuscular.
Metas: as metas são as declarações gerais contendo resultados a longo prazo.
Os objectivos intermediários são os mais precisos que os objectivos gerais, mas não tão
detalhados quanto aos objectivos específicos.
Os objectivos específicos fazem referência aos resultados mais distintos.
Conteúdo
A natureza dos objectivos
41 Os objectivos são as declarações específicas daquilo que deve ser cumprido e da medida na qual
deve ser realizado. Eles devem ser mensuráveis e quantificáveis. Eles são relizados antes do
desdobramento de um esforço e podem ser o objecto de um exame técnico e aprofundado. Um
objectivo pedagógico é uma meta expressada por uma declaração que descreve uma mudança
proposta ao estudante - uma declaração que explicaria aquilo que o estudante deveria ser depois
de ter terminado uma experiência de aprendizagem com sucesso. A aprendizagem é um processo
inferido que não é directamente observável; assim, deve-se determinar o comportamento ou a
produção que constituirá uma prova suficiente que a faculdade procurada existe. Que a
capacidade seja adquirida ou aprendida seguido do ensino, e não pode ser determinado senão
observando a produção em dois momentos diferentes: antes e depois do ensino, e verificando se
houve uma mudança na realização. A aprendizagem em si, não pode ser observada ou medida
directamente, mas as mudanças na produção podem sê-lo.
Os objectivos guiam as actividades de um esforço. Eles estabelecem uma estratégia e as
actividades gerais que favorecem o seu cumprimento. Por conseguinte, alguns objectivos
diferentes possuirão as diferentes estratégias e actividades. Alguns sustentam que os objectivos
conduzem a um procedimento, das normas e dos comportamentos rígidos e constrangedores que
não deixam as aulas livres à criatividade e a espontaneidade e que não conseguem ter em conta
as diferenças individuais. Eles também põem em dúvida a objectivação de todo o resultado
pedagógico e um dos seus argumentos é que nós temos tendência a fixar os objectivos fáceis a
medir que não são necessariamente importantes. Porém, é necessário notar que a maioria dos
resultados esperados podem ser observáveis e quantificáveis.
Avaliação das necessidades
Para o sistema de educação, seria quase impossível tentar encorajar a realização de todos os
objectivos possiveis; formalmente ou informalmente, cada esforço pedagógico deveria escolher e
colocar em prioridade as metas e os objetivos que são referidos. Conceptualmente, se há um
desvio entre o modo como as coisas são (estatuto presente ou estado actual das coisas) e aqueles
dos quais nós gostaríamos que eles sejam (o resultado querido), há uma necessidade. Tudo
depende do caráter específico da definição da necessidade, ela pode ser exprimida numa meta ou
num objectivo; a intenção sendo de eliminar a necessidade. A avaliação das necessidades é o
processo pelo qual as necessidades são identificadas e sua prioridade, determinada. As metas e os
objectivos fundamentais do sistema de ensino são resididos de maneira estáveis, mas a sua
importância e as suas prioridades mudaram com o transcurso do tempo. A avaliação das
necessidades pode se aplicar ao sistema educativo, notavelmente para as turmas, os programas,
os projectos, as escolas, os sistemas escolares, os Estados e os países, e pode ser utilizada a
todos os níveis e em todos os aspectos.
42 Classificação e formulação dos objectivos
Tipos de objectivos
Os objectivos são semelhantes, pouca importa o tipo de avaliação, e todos os objectivos indicam
os resultados esperados. Uma diferença fundamental é que alguns tipos de avaliação, e os
objectivos que lhes correspondem, tratam especialmente das realizações individuais, enquanto
que os outros tratam sobretudo de produção dos grupos.
Literalmente, milhares e milhares de objectivos cobrem praticamente cada domínio do ensino, e
foram escritos para expressar os comportamentos dos alunos. Por outro lado, muito poucos
objectivos existem sobre o plano dos objectivos de produção para os professores, e há ainda
menos para os administradores, e praticamente nenhum para o programa especial e o pessoal do
projecto; isto explica-se principalmente pela falta de prova empírica que se junta aos
determinados comportamentos e o sucesso no uso.
a) Objectivos centrados nas competências
Os alunos de diversos programas têm que alcançar os objectivos ou competências que
geralmente são concebidos por professores de universidade ou estabelecimento de ensino
superior, por peritos nos seus campos respectivos, e que são passados em revista pela escola
privada ou os grupos comunitários apropriados. Os objectivos centrados nas competências visam
a comunicação de comportamentos que se estima ser necessários para a produção de trabalho
conseguidos e a demonstração destes comportamentos durante estudos.
b) Domínio dos objectivos
Estima-se que alguns objectivos de ensino são necessários, as noções fundamentais de base, ou
seja, os objectivos que, praticamente, deveriam ser alcançados por todos os alunos, o que quer
que seja as suas aquisições e as suas competências; eles são chamados os domínios dos
objectivos ou as competências e os objectivos mínimos. Neste sistema de domínio, a quantidade
de noções aprendidas, como é indicado no objectivo, é constante; o ensino é personalizado e o
tempo exigido para alcançar estes objectivos varia de um aluno para o outro.
Taxonomia dos objectivos pedagógicos
As taxonomias classificam todos os objectivos numa hierarquia de categorias de acordo com o
nível de complexidade suposto. Cada categoria a vir indica que os comportamentos sejam
supostamente mais complexos que o comportamento precedente e estima-se que cada um é
prévio ao próximo. A meta expressada das taxonomias é de encorajar a comunicação. A
43 existência de taxonomias chama também a atenção em muitos resultados comportementais; do
modo que haverá menos vantagens que todos os objectivos para um determinado esforço façam
intervir somente os comportamentos do nível inferior. Acredita-se que todo o objectivo de ensino
pode ser classificado numa das três taxonomias ou num dos três domínios - cognitivo, afectivos e
psicomotor.
1. O domínio cognitivo
Indubitavelmente, a taxonomia dos objectivos cognitivos tem sensibilizado os educadores a um
grande conjunto de competências que intervêm na aprendizagem cognitiva. Cada uma das seis
principais categorias representa um modo diferente do processo de aprendizagem. As principais
categorias da taxonomia cognitiva dos objectivos do ensino são:
a) o conhecimento;
b) a compreensão;
c) a aplicação;
d) a análise;
e) a síntese;
f) a avaliação.
Robert Gagné abordou a classificação dos tipos de aprendizagem de uma perspectiva diferente.
Ele acredita que os tipos ou as classes de aprendizagem podem ser classificadas de acordo com
os critérios necessários para facilitar a aprendizagem de todo o tipo. Ganhé distinguiu oito
classes de aprendizagens e as condições de ensino correspondentes para a aprendizagem que
lhes são conectadas a a) aprendizagem do sinal, b) a aprendizagem por estímulo e resposta, c) o
encadeamento, d) a associação verbal, e) a aprendizagem por descriminação, f) a aprendizagem
do conceito, e g) a resolução de problemas.
Anteriormente, os pedagogos foram criticados por ter tomado uma grande atenção aos resultados
cognitivos e de ter desconsiderado os sentimentos e as atitudes dos alunos. O domínio afectivo
trata de tais resultados.
2. O domínio afectivo
A taxonomia dos objectivos emocionais se ocupa de resultados que são muito mais difíceis de
encorajar e medir, imponderáveis como os sentimentos, as atitudes, os interesses e os valores. As
categorias emocionais representam uma hierarquia de assimilação que vai da vontade a receber,
ou a assistência, a caracterização para um valor. Como com todos os objectivos, a meta é de
identificar os comportamentos observáveis e quantificáveis a partir do qual nós podemos deduzir
44 a aprendizagem; obviamente, é mais difícil para os resultados emocionais. A realização dos
objectivos emocionais pode ser determinada pela administração de auto - avaliação que produz
uma quantidade considerável de problemas. As principais categorias da taxonomia emocional
dos objectivos pedagógicos são:
a) a recepção;
b) a resposta;
c) a avaliação;
d) a organização;
e) a caracterização por valor.
3. O domínio psicomotor
O domínio psicomotor comporta as capacidades físicas, mais particularmente aquelas que fazem
intervir as capacidades musculares ou as habilidades motoras, a manipulação de objectivos, ou a
coordenação neuromuscular. A tarefa para o desenvolvimento da taxonomia no domínio
psicomotor é mais complexo que para os outros domínios. Embora não haja categorias
extensivamente aceites para este domínio, as categorias seguintes são usadas numa parte da
documentação sobre o tópico:
a) os reflexos
b) os movimentos fundamentais
c) as habilidades perceptivas
d) as capacidades físicas
e) os movimentos hábeis
f) a comunicação gestual
Níveis de especificidade
Os objectivos podem ser escritos a vários níveis de especificidades. No extremo de uma escala,
há declarações muito gerais sobre os resultados a longo prazo; normalmente, se chama as metas
ou os objectivos gerais. No outro extremo da escala, há outras declarações muito precisas sobre
45 os resultados mais imediatos, cada um representando um comportamento ou um resultado; eles
são geralmente chamados de objectivos específicos.
Metas / objectivos gerais
As metas são algumas declarações gerais sobre os resultados a longo prazo. O alcance destas
metas ou destes objectivos gerais não pode ser medido directamente. As metas da educação
tendem a ser estabelecidas a escala nacional.
Objectivos intermediários
As metas são frequentemente traduzidas em objectivos intermediários. A este nível, os objectivos
são mais precisos do que dos objectivos gerais, mas não tão detalhados quanto aos objectivos
específicos. Em várias situações, chama-se objectivos cumulativos, os objectivos de uma aula e
as tarefas. Normalmente, tais objectivos são mensuráveis e normalmente representam os
comportamentos complexos previstos seguido da realização de um certo número de objectivos
específicos prévios.
Objectivos específicos
Os objectivos específicos tem traços aos resultados mais distintos. Eles são resultados
quantificáveis e constitui a base das actividades quotidianas como o ensino. O procedimento da
análise das tarefas é um método que permite converter os objectivos cumulativos em objectivos
específicos.
O quadro abaixo apresenta um resumo da terminologia ligada ao nível de especificidade dos
objectivos.
Objectivos
gerais
Definições
Termos ligados
Objetivos gerais
Declarações gerais sobre os resultados a longo Metas
prazo
Objectivos
intermediários
Declaraçõs mais precisas sobre os resultados a Objectivos
curto prazo
nível
do
segundo
Objectivos do módulo
Objectivos das aulas
Objectivos terminais
46 Objectivos da unidade
Objectivos
específicos
Declarações
imediatos
precisas
sobre
os
resultados Objectivos pedagógicos
Objectivos
comportamentais
Um objectivo pode ser vago a um tal ponto que é ambíguo ou detalhado, a um tal ponto que é
insignificante e pouco realístico. Um princípio exclusivo razoável implica que cada objectivo
deveria representar uma tarefa distinta. Uma tarefa pode ser definida como o mais pequeno
aspecto da produção que tem uma meta distinta e independente. Quanto mais um objectivo é
formulado convenientemente, mais ele é claramente prático.
Objectivos expostos
A escolha ou a elaboração de um objectivo é a parte mais importante de todo o programa
educacional. O objectivo guia todos os outros aspectos do programa, inclusive o conteúdo e a
metodologia que serão usados para o ensino e a avaliação. Antes de tudo, nós temos que avaliar a
especificidade do objectivo. O objectivo deveria comunicar o resultado descontado de forma
bastante clara de forma que todo o educador o avalie criteriosamente e que esteja em condições
de dizer se o objectivo foi ou não alcançado.
Elementos dos objectivos
a) Comportamento
Num objectivo o comportamento indica o que acontecerá, ou, como é o caso dos objectivos
pedagógicos, que produção observável e mensurável constituirá uma prova satisfatória de que a
aprendizagem esperada aconteceu. Um objectivo deveria expôr o resultado de aprendizagem
previsto por um verbo de acção que representa um resultado observável. Todo o objectivo
deveria incluir a realização de só um comportamento, caso contrário, a avaliação da produção é
confundida com outros objectivos.
b) Condição
As condições para um objectivo são «dadas», quer dizer, o contexto no qual o comportamento
será demonstrado. Normalmente, eles especificam o material necessário, os recursos autorizados,
ou as restrições impostas e as palavras "dados" necessariamente não são usadas.
c) Critérios
47 Quando formulado, o critério de um objectivo é um aspecto que nos indica a boa maneira que um
comportamento deve ser relizado. Ele é a norma que permite comparar a produção actual. Se o
critério evidente ou cumprido a 100%, não é exposto geralmente.
Avaliação formativa
1. As leituras obrigatórias para os estudos #2 e #3. Para cada um dos comportamentos seguintes,
assinale com «C» se for um comportamento cognitivo e um comportamento emocional.
Também, assinale com «S» se representa os resultados de ordem superior e " I " se representa os
resultados de ordem inferior.
Nº
Comportamento
Tipo
C
1
Recita o artigo 1 da Constituição
2
Equilibra as equações químicas
3
Presta atenção ao filme sobre a genética
4
Interpreta um gráfico
5
Não compres senão a comida halal
6
Define o termo «avaliação» usando palavras próprias
7
Escuta uma estação de rádio clássica diariamente no caminho
para o trabalho e à volta do trabalho
8
Participa numa competição de ortografia
9
Prepara uma declaração fiscal
10
Conhece o significado dos sinais de estrada
Nível
A
S
I
2. Para cada uma das declarações seguintes, assinale com «B» se é uma meta, «I» se é um
objectivo intermediário ou «S» se é um objectivo específico.
Nº
Enunciado
B
I
S
48 1
Tornar um bom cidadão
2
Escrever uma carta comercial na forma correcta
3
Indicar três fontes alimentares de ferro
4
Conseguir três cestos em dez tentativas lançando da linha de
lançadores
5
Dominar as competências fundamentais
6
Escrever frases gramaticalmente correctas
7
Tornar-se auto-suficiente no plano económico
8
Efectuar operações de base em fracções
9
Ser capaz de escrever uma lista de romances do 20º século e
indicar o autor de cada um com precisão de 80%
10
Pedir emprestado de sua própria vontade dois livros da
biblioteca durante uma sessão
3. Estude os conteúdos de leituras #4 e #5 e faça o exercício seguinte.
1. Escolha dois dos tópicos seguintes ensinados num programa de aula da escola secundária:
a. a periodicidade das substâncias químicas
b. o aparelho genital
c. a força de gravidade
d. as rochas
e. os terramotos
f. as guerras mundiais
2. Para cada um dos sujeitos escolhidos, escreva ao menos dois objectivos gerais e cerca de
quatro objectivos específicos que os estudantes têm que alcançar no término da avaliação.
3. Indique o nível de ensino secundário para o qual estes objectivos são adequados.
49 4. Para cada um destes objectivos elaborados, classifique-os de acordo com o domínio
relacionado: cognitivo, emocional ou psicomotor.
5. Para cada um dos objectivos elaborados, indique novamente os seus aspectos como os
comportamentos, as condições e os critérios.
Actividade de aprendizagem # 3
CLASSIFICAÇÃO E ESCOLHA DOS TESTES
Resumo
Esta actividade de aprendizagem visa o domínio de alguns conceitos pelos alunos no domínio da
avaliação e dos testes em educação. A actividade começa com alguns conceitos de base ligados à
medida e aos testes. Em seguida, são examinados brevemente os modos de colecta de dados
empregados para a avaliação. Em detalhes, os sistemas de classificação utilizados para classificar
os diferentes testes. As características mais importantes de um bom teste são expostos
brevemente depois nesta secção do Módulo. Finalmente, vocês terão acesso a alguns elementos
relactivos ao processo da escolha de um teste (geralmente padronizado) que provêm de um certo
número de opções.
Lista de conceitos - chave
Um teste compreende um certo número limitado de questões e os respondentes têm que escrever
as respostas.
Um teste objectivo é um teste no qual a subjectividade na correcção é eliminada.
Um teste padronizado é um teste elaborado por especialistas da matéria e da avaliação.
Um teste concebido localmente é geralmente concebido localmente pelos professores para uma
fim particular.
Os dados na auto - avaliação são respostas orais ou escritas.
A escala de anotação é um instrumento que inclui vários artigos ligados a uma variável
determinada; cada elemento representa uma quantidade contínua de categorias entre dois
extremos.
Os testes de conhecimento são os testes que medem o estatuto de um indivíduo de acordo com
as suas aptitudes nos diversos domínios de conhecimento.
50 Os testes de caráter ou personalidade são concebidos para avaliar características das pessoas
assim como de um certo número de qualidades.
Os testes de aptidão são os modos para medir o potencial emregado para predizer a produção
provável de uma pessoa numa situação ulterior.
As normas de produção são o critérios que servem comparar os resultados das avaliações afim
de se interpretar.
Uma avaliação normativa é todo o teste, padronizado ou concebido localmente, que apresenta e
interpreta cada nota de acordo com a sua posição em relação às outras notas obtidas no mesmo
teste.
Um teste criterial é todo o teste que apresenta e interpreta cada nota relativamente a um padrão
absoluto.
A objectividade do teste é o facto que, pouco importa o revisor, a nota do teste permanece
apreciavelmente o mesmo.
A discriminação é o facto que um teste detecta ou mede as pequenas variações de produção ou
de realização.
A representatividade indica a que grau um teste cobre os principais objectivos da aula que
devem ser medido.
A validez indica aquilo que um teste é suposto medir.
A validez do conteúdo é a medida na qual os artigos de um teste correspondem à extensão dos
artigos que um teste normalmente deveria cobrir.
O critério de validez é a medida na qual um teste consegue efectivamente predizer os critérios
ou a indicar uma construção.
A validez concorrente é conhecida quando a medida dos criterios tem lugar ao mesmo tempo
que a obtenção das notas.
A validez predictiva é conhecida quando a medida dos critérios acontece depois do teste.
A validez conceitual é a medida na qual um teste demonstra uma ligação entre os resultados
adquiridos ao teste e o traço teórico predito.
A fiabilidade é a coerêcia das medidas. Um teste é considerado fiável quando os mesmos
resultados são adquiridos de maneira repetida.
51 Conteúdo
Avaliação e teste
Como vimos anteriormente, a avaliação é um aspecto essencial do processo de avaliação. Ela
desempenha um papel essencial, pois as decisões que dela resultam são tão boas quanto aos
dados que serviram a esta tomada de decisão. De modo geral, a colecta de dados está presente
em todas as fases da avaliação - a fase da programação, do processo e do produto. Porém, a
avaliação que é a medida na qual alguém ou algo possui uma determinada característica,
geralmente acontece na fase do processo e do produto.
O teste é necessário para alguns lugares e útil a outros. Pode ser efectuado ao término de um
ciclo de instrução - Semestre, sessão ou unidade. Tais pós-testes servem para determinar em que
medida os objectivos (formal ou informal) foram alcançados, quer sejam objectivos pedagógicos
ou os objectivos de programa. Os dados sobre os pré-testes ou os dados de referência são
frequentemente colectados no princípio do ciclo. Os pré-testes tem várias utilidades, o mais
importante sendo que o conhecimento do estado presente de um grupo pode guiar as actividades
ulteriores e pode constituir uma base de comparação para os resultados do pós-testes.
O teste é útil numa panóplia de situações. Um professor pode administrar alguns testes para os
comportamentos de entrada para determinar se o prévio hipotético foi obtido efectivamente. Um
projecto especial concebido para reduzir o desaperto pode usar os testes de atitude e os testes de
variáveis de personalidade como o introversão, a agressividade e a ansiedade tentar identificar os
problemas potenciais e compreender melhor os alunos que têm algumas dificuldades. Uma
escola pode administrar os testes de aptidões aos estudos afim de determinar os objectivos de
realização para os alunos e de participar no processo de orientação.
Colecta de dados
Há três modos principais para colectar os dados
i) Usar um instrumento padronizado
ii) Empregar um instrumento concebido localmente
iii) Assinalar os dados acessíveis naturalmente (como as médias ponderadas cumulativas e o
absentismo).
Tudo dependendo da situação, uma destas maneiras pode ser muito adequado ou uma
combinação pode ser requerida. A colecta de dados acessíveis, que requer um mínimo de
esforços parece muito atraente. Contudo, estes tipos de dados convém a poucas situações.
Mesmo quando eles são apropriados – quer dizer, quando eles facilitam a decisão prevista - tem
52 alguns problemas inerentes a este tipo de dados. Por exemplo, a mesma quota gráfica não
representa necessariamente o mesmo nível de produção, até mesmo para duas turmas diferentes
na mesma escola ou duas escolas diferentes no mesmo sistema. Além disso, os arquivos pelos
quais os dados são colectados, podem estar incompletos e confusos. Elaborar um instrumento
para uma meta específica implica também várias inconveniências importantes. A elaboração de
um «bom» instrumento requer muito tempo e esforço, e de competências particulares. Para
adquirir as competências necessárias para a clarificação de um bom instrumento, é preciso uma
formação que equivale pelo menos a uma aula para os testes e a avaliação.
Por outro lado, o tempo requerido para escolher um instrumento adequado (normalmente, esta
escolha é feita entre os instrumentos padronizados e oferecidos no mercado) é menos que aquele
necessário para conceber um instrumento que mede a mesma coisa. Outros instrumentos
padronizados são geralmente concebidos por peritos que possuem as competências requeridas.
Milhares de instrumentos padronizados são oferecidos e dão acesso a um grande conjunto de
dados a vários fins. Muitos instrumentos de medida foram concebidos para os principais
domínios que incidem sobre a produção, a personalidade e a aptitude. Cada uma destas
categorias pode ser por sua vez divididas em sob-categorias. Em geral, fazer pesquisas para saber
um instrumento adequado ja é oferecido antes de investir na concepção de um instrumento é
bom. Porém, existem algumas situações onde o uso dos instrumentos oferecidos provam-se ser
pouco realístico ou inadequado. Por exemplo, um teste elaborado pelo professor é mais
apropriado ou válido para determinar em que medida os alunos alcançaram os objectivos para
uma dada unidade.
Sistemas de classificação
A esta fase, deveria-se insistir no facto que um teste não é necessariamente um conjunto de
perguntas as quais uma pessoa responde afim de se determinar se ela conseguiu. Uma definição
mais inclusiva de um teste é o «meio para avaliar o conhecimento, as competências, inteligência
ou a aptidão de uma pessoa ou de um grupo». Os testes dão os resultados numéricos que podem
ser usados para identificar, classificar ou avaliar aqueles que o fazem. Embora que na prática, a
maioria dos testes usam a técnica «papel e lápis », existem diferentes tipos de testes e numerosas
maneiras para os classificar. Os sistemas de classificação variados se cobrem muito e as
categorias estão longe de se excluirem mutuamente. Todo o teste pode ser classificado em mais
de um sector.
Comportamentos por resposta
O termo «comportamentos por resposta» se relacionam a maneira do qual os comportamentos
que devem ser medidos são mostrados. Embora em alguns casos, as respostas para as perguntas
53 ou a outros estímulos sejam dadas oralmente, elas são geralmente escritas ou tomam a forma de
uma produção real.
A. Respostas escritas
Os testes escritos podem ser classificados em testes padronizados (subjectivo) ou unificado ou
concebidos localmente (objetivo).
Testes padronizados em relação aos testes objectivos
i) Testes padronizados
Um teste padronizado um número de questões limitadas e os respondente têm que escrever as
suas respostas, geralmente bastante longas. Um exemplo de questão é «Identificar as reformas
principais de África em educação aquando do período colonial e comente». Determinar a
exactidão das respostas a tais questões inclui uma certa parte da subjectividade.
ii) Testes objectivos
Um teste objectivo é um teste onde não há nenhuma parte da subjetividade na cotação. Em
outras palavras, se duas pessoas fizerem a cotação de um dado teste, eles deveriam chegar ao
mesmo resultado. Existem vários tipos de testes objectivos: testes escolha múltipla, verdadeiro
ou falso, testes de emparelhamento e testes a curto desenvolvimento.
Testes padronizados relativamente aos testes concebidos localmente
i) Um teste padronizado é elaborado por especialistas da matéria e da avaliação e é verificado
na prática conforme um procedimento administrativo uniforme. Este teste também é revisado
para satisfazer a alguns critérios e corrigido e interpretado de acordo com um procedimento e as
normas uniformes. A padronização cobre todos os aspectos do teste para fazer de forma que ele
pode ser administrado e notado precisamente do mesmo modo toda a vez que é dado. Embora os
outros instrumentos de medida possam ser padronizados, a maioria dos testes padronizados são
objectivos e os testes escritos necessitam de respostas escritas. Apesar de algumas excepções, a
maioria dos testes padronizados foi administrado a grupos que são chamados o grupo de
referência. Os resultados do grupo de referência para um determinado teste constitui uma base de
comparação e interpretação para os outros grupos que submeterão o teste. Os resultados de um
grupo de referência são chamados as normas. O ideal seria que o grupo de referência seja um
grande grupo bem definido e representativo do grupo e dos sub-grupos pelos quais o teste é
concebido.
ii) Teste concebido localmente
54 A oposição do teste padronizado é evidentemente o teste não padronizado. Normalmente, os
testes são concebidos localmente para um fim preciso. Os testes usados na turma pelos
professores são um exemplo dos testes concebidos localmente. Estes testes não possuem as
características dos testes padronizados. Um teste também elaborado localmente pode ser tão bom
quanto a um teste padronizado, mas não chega frequentemente. O uso de teste concebido
localmente é geralmente mais prático e mais adequado. Se se compara os testes padronizados aos
testes concebidos localmente, os testes concebidos localmente reflectiriam mais aquilo que foi
ensinado na sala.
B. Testes de produção
Para muitos objectivos e domínios de aprendizagem, o uso de testes escritos é uma maneira
inadequado de medir o comportamento. Por exemplo, não se pode determinar bem em que
medida um aluno pode escrever bem uma carta com um teste a escolha múltiplas ou uma
questão aberta. A produção é um destes domínios. Ele pode tomar a forma de um procedimento
ou de um produto. Um procedimento é uma série de fases, geralmente numa ordem precisa,
executadas na realização de um acto ou de uma tarefa. Os exemplos de procedimento
compreendem : a regularização de um microscópio, a passagem de uma bola de futebol, a
regularização das margens numa máquina de escrever, desenhar umas figuras geométricas ou
calcular uma soma de números com Excel. Um produto é um resultado tangível. Uma carta
escrita na máquina, uma pintura, um poema e um projecto em ciências são alguns exemplos de
produto. Em cada caso, a produção é observada e avaliada num certo sentido. Assim, a produção
requer a execução de um acto ou o desenvolvimento de um produto para determinar se uma
aptidão ou uma característica dada existe, e em que medida.
Métodos para colectar os dados
Existem várias maneiras para colectar os dados e classificar os métodos de colecta de dados mas
não é uma tarefa fácil. Porém, uma maneira lógica de os classificar a partida é de verificar se os
dados são obtidos por intermediário de uma auto - avaliação ou de uma observação.
a) Auto - avaliação
Os dados de auto - avaliação são compostas de respostas orais ou escritas provindo de pessoas.
Os dados oriúndos da administração de testes escritos padronizados concebidos localmente (isto
corresponde a alguns testes de produção, de personalidade e da aptidão) constituem um bom tipo
de dados de auto - avaliação. Um outro tipo de instrumento de auto-avaliação empregados em
certos esforços de avaliação é o questionário, que você conhece bem provavelmente. Também, as
entrevistas são por vezes usadas.
b) Observação
55 Quando se usa a observação, os dados são colectados por observação e não são seguidos de
perguntas e respostas. Geralmente, uma pessoa observada não leva nada em nota; ela faz alguma
coisa e este comportamento é observado e é notado. Para algumas questões de avaliação, a
observação é obviamente a aproximação mais adequada. Por exemplo, você poderia pedir aos
alunos para falar de seus desportos favoritos e perguntar aos professores como eles administram
os seus problemas de comportamento, mas de facto, as informações mais objectivas
provavelmente seriam adquiridas pela observação dos alunos a manifestações desportivas e a
observação dos professores nas suas turmas. A observação natural e a observação de simulação
são dois tipos de observação usados nos esforços de avaliação. Alguns tipos de comportamento
podem ser somente observávéis, porque eles acontecem naturalmente. Para tais situações, o
observador não domina e não manipula nada e desdobra muitos esforços para não influenciar o
progresso de quaisquer maneiras. Por exemplo, a observação é o melhor meio de abordar o
comportamento na sala. Para a observação de simulação, o avaliador reproduz a situação que
deve ser observada e diz aos participantes a que actividades eles se entregam. Esta técnica
permite ao avaliador de observar os comportamentos que se produzem raramente ou jamais em
situações naturais.
c) A escala de anotação
É um instrumento que inclui vários elementos ligados a uma dada variável; cada elemento
representa uma continuidade de categorias entre os dois extremos; pessoas que respondem as
perguntas põem uma marca para indicar as suas posições em cada questão. As escalas de
anotações podem ser usadas como instrumentos para a auto - avaliação ou a observação, de
acordo com a meta pelos quais eles são usados.
Comportamentos medidos
Quase todos os comportamentos possíveis que podem ser medidos se encontram numa das três
categorias principais: a produção, o carácter e a personalidade. Cada uma delas pode ser
padronizada ou concebidos localmente. Estas categorias se aplicam também aos três domínios de
resultado pedagógico: cognitivo, emocional e psicomotor.
1. Produção
O teste de produção avalia o estado correcto das pessoas em relação ao nível das disciplinas
dadas de conhecimentos ou de competências. É adequado para muitos tipos de avaliação além da
avaliação individual do aluno. O teste de produção pode ser padronizado (é concebido para
cobrir a matéria comum a muitas aulas do mesmo tipo) ou concebidos localmente (preparados
para avaliar um conjunto preciso de resultados de aprendizagens, estabelecidos por um professor
em particular). Os testes padronizados são acessíveis para os domínios individuais do programa
educacional ou tomam a forma de baterias, que avaliam as produções em vários domínios
diferentes.
56 Um teste de diagnóstico é um tipo de teste de produção que dá alguns resultados múltiplos para
cada domínio de resultados de produção; estes resultados facilitam a identificação de domínios
precisos, defeitos ou dificuldades de aprendizagens. Os elementos de um teste de diagnóstico
visam a identificar as competências e os conhecimentos que os alunos devem ter adquiridos antes
do próximo nível. O ideal seria que o diagnóstico seja um processo contínuo e o professor tem
que conceber os testes de forma que os ajudem a descobrir os problemas encontrados pelos
alunos aquando de seus progressos no processo de aprendizagem.
2. Carácter e personalidade
Os testes de carácter e de personalidades são concebidos para avaliar as características das
pessoas como também um certo número de qualidades e para avaliar os sentimentos e as atitudes
relativamente a si, aos outras e várias actividades, instituições e situações. A maioria dos testes
de carácter e personalidade são instrumentos de auto - avaliação e vocês podem pedir as pessoas
que respondam a uma série de questões ou enunciados. Nesta categoria, há instrumentos
concebidos para avaliar a personalidade, as atitudes, a criatividade, e o interesse dos alunos.
3. Aptidão
Os testes de aptidão são as maneiras de medir o potencial. Eles são usados para predizer a
produção provável de uma pessoa numa situação ulterior. Os testes de aptidão são também
chamados de diferentes maneiras: testes de aptidão aos estudos, testes de inteligência e testes de
eficiência intelectual. Os testes de aptidão permitem também predizer o nível de produção
provável de uma pessoa depois que ela tenh recebido algumas instruções ou formações precisas.
Eles se apresentam sob forma de baterias ou de teste individual sobre uma matéria ou um tópico
preciso. Embora praticamente todos testes de aptidão sejam padronizados e dados no quadro de
um programa de testes escolar, os resultados são úteis para os professores, os conselheiros e os
administradores. Os teste de aptidão ao estado de preparação (ou testes prognósticos) são dados
antes do ensino ou a formação num domínio preciso para determinar se um aluno está pronto
receber um ensino ou beneficiar disto, e em que medida. Os testes de aptidão ao estado de
preparação, que fazem parte dos testes de aptidão, geralmente compreendem a avaliação de
variáveis como a discriminação auditiva, a discriminação visual e as habilidades motoras.
Normas de produção
As normas de produção são o critérios que permitem comparar os resultados da avaliação afim
de se interpretar. Um resultado só não quer dizer nada. Se eu vos digo que Ahmed teve 18
respostas boas, o que é que isso vos diz em relação a sua produção? Absolutamente nada. Agora,
se eu vos digo que a média é 15, pelo menos você sabe que teve mais alto que a média. Ao invés,
se eu vos digo que tem uma nota de 17 é requerida para um objectivo de domínio, não sabe nada
57 sobre a produção do resto da turma, mas você sabe que Ahmed alcançou o objectivo de
domínioo. Nós podemos interpretar o resultado a um teste de duas maneiras, uma sendo por
comparação aos outros resultados dos alunos da turma (que é uma medida normativa) e o outro
sendo por comparação do resultado a um critério predeterminado (que é a medida criterial).
Padrões normativos
Todo o teste, padronizado ou concebido localemente, qui apresente e interpreta cada resultado de
acordo com a sua posição relativa em relação às outras notas obtidas no mesmo teste, é
normativo. Por exemplo, se alguém tiver um Q.I. total de 100, a interpretação que se pode fazer
disso é que a inteligência medida é media quando se comparar aos resultados obtidos por um
grupo de referência. As contagens brutas resultantes da administração são convertidas num outro
indicador que mostra a posição relativa. O percentil, que vocês conhecem bem, se aparenta a
uma tal técnica. Um determinado percentil indica a percentagem das notas que eram mais baixas
que a nota correspondente do percentil. Por exemplo, o sr. Ahmed poderia ter obtido uma nota
que équivale a um percentil de 42 num teste de matemática padronizada, o que significa que 42%
dos alunos que fizeram o teste adquiriram um resultado mais baixo que o do Ahmed. Quando se
comunica os resultados dos alunos deste modo, nada permite indicar o que o Ahmed sabe ou não
sabe. As únicas interpretações que se pode disso tirar concerne a produção de Ahmed em relação
a aquele dos outros.
Os testes normativos são fundados na idéia de que as características avaliadas concernem as
propriedades da curva normal. A idéia da curva normal é que as características avaliadas existem
em quantidades diferentes nas pessoas diferentes. Algumas pessoas têm muito disto, enquanto as
outras têm pouco, e a maioria das pessoas possuem uma certa quantidade disto, o que é chamado
a quantidade «média» . Por exemplo, se você dá um teste de matemática a 100 alunos, sendo
dado que ele é de um nível adequado – quer dizer não muito fácil nem muito difícil - uma
pequena parte da turma terá bons resultados e uma outra parte igual terá alguns resultados fracos,
enquanto a maioria terá obtido uma nota média.
A curva normal é ilustrada abaixo.
Insira o gráfico:
A maioria das notas são (a freqüência mais elevada) médias, e poucas notas estão acima ou
debaixo da média, e muito pequeno extensivamente acima ou debaixo da média. O grupo que
teve as notas médias compreende 65% dos resultados aproximadamente. A medida normativa
usada nesta distribuição hipotética de notas é aplicada em situações verdadeiras na turma e de
avaliação. Ou seja, quando os melhores 2-3% têm A (pouco importa as suas contagens), os
próximos 15% adquirem B, os próximos 65% recebem C, os próximos 15% têm D, e os últimos
2-3% recebem o F. As notas em letras são atribuídas sem ter em conta a real produção do aluno.
58 Há um problema com os padrões normativos. Algumas pessoas podem adquirir boas notas (ou
inversamente, más notas) sem necessariamente exibir o nível de produção correspondente. Um
tam método pode estimular os alunos, mas também pode causar um problema particular quando
a turma for mais homogênea.
Interpretações criteriais
Todo o teste que apresenta e interpreta cada resultado de acordo com um padrão absoluto é
criterial. Em outras palavras, a interpretação do resultado de uma pessoa não tem nada a ver com
o resultado de qualquer um. Uma contagem é comparada com uma norma ou uma produção, e
não com as contagens dos outros. Quando o teste criterial é usado, cada pessoa que passa pode
obtêr um resultado forte ou fraco. Neste contexto, um critério pode ser definido como sendo um
domínio de comportamentos que medem um objectivo.
Características de um bom teste
Algumas características são desejáveis para todo o teste. Os testes padronizados, que são
elaborados por peritos em suas matérias e em avaliação, são os mais susceptíveis de responder a
estas normas. Estas características, que são abordadas mais em detalhes compreendem:
a) a objectividade do teste
b) a discriminação
c) a perspectiva global
d) a validez
e) a fiabilidade
f) a especificação das condições nas quais o teste será submetido
g) a orientação da cotação e a interpretação
Objectividade do teste
A objectividade do teste é o facto que, pouca importa o revisor, a nota do teste permanece
sensivelmente o mesmo. Um teste é objectivo quando a opinião, a parcialidade ou o julgamento
individual não constituíem factores determinantes na cotação. Os testes podem ser feitos por
mais de uma pessoa, a um momento diferente ou simultaneamente. Em educação, nós nos
perguntamos em que medida a cotação destes revisores individuais é a mesma. Se a diferença
59 possível entre as correcções de um mesmo teste é grande, este teste é pouco objectivo. Embora as
pessoas podem discernir a informação de modo diferente, naturalmente, que nós presumimos que
quanto mais um teste é objectivo, mais ele aspira a avaliação de alta qualidade que nós
desejamos todos em educação. Isto não significa que os testes não possuem um nível elevado de
objectividade (como os testes subjectivos) são de má qualidade. Até mesmo os testes subjectivos,
embora eles sejam concebidos para avaliar as informações podendo ser abordadas de ângulos
diferentes, uma certa parte de objectividade é necessária. O conceptor individual tem que ter algo
em cabeça que constitui uma boa produção para um tal teste. Esta coisa pode ser múltipla, mas o
critérios devem ser estabelecidos para garantir que toda a cotação seja bastante justa para
contribuír para estabelecer uma discriminação entre os alunos sobre uma tal base. A
objectividade, é relativa.
Discriminação
O teste deveria ser construído para descobrir ou avaliar as pequenas diferenças na produção ou
no alcance; é essencial se o teste deve ser usado para classificar os alunos de acordo com a sua
produção individual ou para atribuír notas. Por outro lado, não é um factor importante se o teste é
usado para medir o nível da turma inteira tendo como meta principal o ensino de preferência que
a avaliação. Como é verdade para a validez, a fiabilidade e a objectividade, o poder
discriminativo de um teste é aumentado quando concentra em cada artigo de teste individual e o
aperfeiçoa. Depois de ter dado o teste, uma análise de artigos pode ser realizada, o que mostrará
a dificuldade relativa de cada artigo e em que medida cada um faz a distinção entre os bons e
maus alunos. Frequentemente, como no caso da obtenção da fidelidade, é necessário prolongar o
comprimento do teste para ter uma discriminação clara. Um teste descriminativo:
(1) produz uma grande variedade de resultados quando é dado aos alunos que têm
produções apreciavelmente diferentes.
(2) incluirá os artigos que cobrem todos os níveis de dificuldade. Somente os melhores
alunos responderão correctamente a alguns artigos; os outros serão relativamente fáceis e
a maioria dos alunos responderá a isso correctamente. Se todos os alunos respondem a
um artigo correctamente, o teste falta de discriminação.
Representatividade
Para que um teste seja representativo, ele deveria cobrir os principais objectivos das aulas. Não é
necessário nem conveniente de avaliar cada objectivo ensinado na sala, mas um número
suficiente de objectivos deveriam ser incluídos para assegurar uma medida válida da produção
do aluno na aula completa.
Validez
60 A validez é a característica mais importante de um bom exame; isso significa que ela indica
aquilo que um teste é suposto medir. É primordial que um teste seja válido de forma a que os
resultados sejam aplicados e interpretados precisamente.
A validez não é determinada por uma única estatística, mas sim por uma pesquisa que demonstra
a relação entre o teste e o comportamento que ela quer avaliar. Há três tipos de validez:
a) Validez do conteúdo
Quando um teste tiver a validade do conteúdo, os artigos do teste representam a extensão
completa de artigos possíveis que o teste deveria cobrir. As questões do teste individual podem
ser tomadas de uma grande lista de artigos que incluem uma grande variedade de tópicos.
Em certos casos onde um teste avaliado tem uma característica difícil a definir, um juíz
especializado pode avaliar a relevância de cada artigo. Dois juízes independentes avaliam o teste
separadamente, porque cada juiz funda sua avaliação sobre a opinião. Quando os dois juízes
considerarem que alguns artigos são muito aplicáveis, eles serão incluídos no exame final.
b) Critério de validez
Diz-se que um teste tem a validade criterial quando é eficaz para predizer os critérios ou indicar
uma construção. Existem dois tipos diferentes de validez criterial:
A validez concorrente é quando os critérios são adquiridos ao mesmo tempo que os resultados.
Ela indica em que medida os resultados estimam com precisão o estado actual de uma pessoa
para o que é de critérios. Por exemplo, se um teste avalia os níveis de depressão, teria-se dito que
este teste que teve uma validez concorrente se tivesse avaliado os níveis de depressão actuais
daquele que submeteu o teste.
A validez predictiva é quando os critérios são adquiridos depois do teste. Os testes de carreira
ou de aptidão, que são úteis para determinar quem são os mais suscetíveis para ter sucesso ou
não em certos assuntos ou matérias, são exemplos de testes que possuem a validade predictiva.
c) Validez conceitual
Um teste possui a validez conceitual se houver uma associação entre os resultados e a predição
de uma característica teórica. Os testes de inteligência são um exemplo de instrumentos de
medida que deveriam possuir a validez conceitual. O professor pode se assegurar que os artigos
de seu teste são válidos enquanto seguindo o procedimento aceite para a construção de teste que
compreeende:
61 (1) A utilização de objectivos de aulas que servem de base para as exigências do teste. Um
exame construído deste modo terá tendência a avaliar o que foi ensinado.
(2) Uma revisão dos artigos do teste e o exame completo pelos outros professores.
(3) A selecção da forma mais adequada de teste e o tipo de artigos de teste. Assim, se o
professor desejar avaliar «a aptidão a fazer» , ele tem que escolher esta forma de teste que
requererá que o aluno demonstre «aptidão para fazer» . Se uma outra forma menos desejável é
usada, a pessoa tem que reconhecer que a validez desta avaliação esteve reduzida.
(4) As exigências do teste devem ser claramente apresentadas e sem equívoco. Se o material de
exame não pode ser interpretado correctamente pelo aluno, este não entenderá o que é coberto;
por isso, ele não será capaz responder como previsto. Um tal teste não é válido.
(5) A eliminação dos factores não ligados a a avaliação dos pontos a ensinar, na medida do
possível. Um teste que está por cima dos meios dos alunos em relação ao tempo ou ao nível
escolar não pode conseguir avaliar a sua real aprendizagem nas aulas.
Fiabilidade
A fiabilidade se assemelha à fidelidade de uma medida. Estima-se que um teste é fiável quando
se obtêm o mesmo resultado repetidamente. Por exemplo, se um teste é concebido para avaliar
uma característica (como a introversão), toda vez que é dado a um tópico, deveria dar
apreciavelmente os mesmos resultados. Infelizmente, é impossível avaliar a fiabilidade com
exactidão, mas existem várias maneiras de avaliar.
a) Fiabilidade do teste - reteste
Para avaliar a fiabilidade de teste – reteste, o teste é dado duas vezes em dois momentos
diferentes. Este tipo de viabilidade é usada para avaliar a constância de um teste com o
transcurso do tempo. Este tipo de fiabilidade supõe que não haverá uma mudança na qualidade
ou no conceito avaliado. O melhor uso de fiabilidade teste - reteste é quando ela serve para as
coisas que não mudam com o transcurso do tempo, como inteligência. Geralmente, confiança
será melhor se pouco tempo se esgota entre os testes.
b) Coeficiente de objectividade
Este tipo de fiabilidade é avaliado por dois juízes independentes ou mais que corrigem o teste.
Os resultados são comparados entre eles para determinar a constância das avaliações dos juízes.
Uma maneira de avaliar o coeficiente de objectividade é pedir a cada juíz de conferir um
resultado de cada artigo do teste. Por exemplo, cada juíz poderia corrigir os artigos usando uma
escala indo de 1 a 10. Em seguida, poderia calcular a correlação entre as duas avaliações para
62 determinar o nível do coeficiente de objectividade. Um outro meio para avaliar o coeficiente de
objectividade é de pedir aos juízes de determinar em que categoria cada observação se encontra e
em seguida, de calcular a percentagem certa entre os juízes. Então, se os juízes se entendem 8
vezes sobre 10, o teste tem uma taxa de 80% de coeficiente de objectividade.
c) Fidelidade das formas paralelas
A fidelidade das formas paralelas é avaliada comparando os diferentes testes que foram
concebidos com o mesmo conteúdo. Para se chegar lá, produz-se uma grande lista de artigos de
teste que avaliam a mesma qualidade e depois, separa-se os artigos ao acaso em dois testes
diferentes. Os dois testes deveriam em seguida ser administrados simultaneamente aos mesmos
tópicos.
d) Fidelidade da coerência interna
Este tipo de fidelidade é usado para estimular a coerência dos resultados pelos artigos do mesmo
teste. Essencialmente, compara-se os artigos dos testes que avaliam o mesmo conceito para
determinar a coerência interna dos testes. Quando você ver uma pergunta que se parece muito a
uma outra pergunta do teste, isto pode indicar que as duas perguntas são usadas para avaliar a
fidelidade. As duas perguntas são semelhantes e elaboradas para avaliar a mesma coisa, aquele
que submete o teste deveria responder as duas perguntas da mesma maneira, e isto indicaria que
o teste possui uma coerência interna.
Os factores seguintes terão uma incidência na fidelidade de um teste:
(1) Administração. É primordial que todo aluno tenha o mesmo tempo, o mesmo
equipamento, as mesmas instruções, a mesma assistência e o mesmo ambiente para efectuar o
teste. As instruções dos testes deveriam ser aplicadas estreitamente.
(2) Anotação. A objectividade na anotação contribui à fidelidade. Todo o esforço deveria ser
desdobrado para adquirir a uniformidade das normas e das práticas da cotação.
(3) Normas. As normas de produção estabelecidas para uma turma deveriam ser conforme a
aquelas usadas em outras turmas. Uma mudança nas políticas de classificação não fundadas
sobre os factos, das normas uniformes ed os factores de experiências adquiridas das outras
turmas terá uma incidêcia na fidelidade dos resultados do teste.
(4) Instrução. A fiabilidade dos resultados dos testes será modificada se a instrução
apresentada a turma tem tendência a conceder muita importância aos pontos a ensinar cumpridos
no exame. Chama-se a este fenómeno «o ensino do teste» e não é desejável. Quando o professor
fornece algumas indicações óbvias aos alunos sobre as exigências do teste, não só ele modifica a
fiabilidade do teste mas ele insulta a inteligência de sua turma.
63 (5) comprimento. Quanto mais os alunos respondem as perguntas, mais o teste ou o dispositivo
de medida serão fiáveis.
Especificação das condições de administração
Um bom teste tem que especificar as condições das quais o teste será dirigido. Eles têm que
fornecer a todos os alunos uma boa oportunidade de demonstrar as suas competências, porque
isso melhorará a fidelidade do teste. O teste padronizado tem que vir com a especificação das
condições nas quais os alunos têm que realizar o teste. Dar o teste em condições muito variadas
terão um impacto muito grande nos resultados do teste. Em geral, quando se administra um teste,
deve-se guardar ao espírito os pontos seguintes:
- a disposição física
-a iluminação, ventilação, o silêncio, etc.
- o estado psicológico
-evitar provocar a ansiedade ligada ao teste
- tentar diminuir a ansiedade ligada ao teste
-não dar o teste quando outros eventos serão uma fonte de distração
- as sugestões
-não falar inutilmente antes do teste
-minimizar as interrupções
-não fornecer os sinais a pessoas que pedem informação sobre os artigos
-desencorajar a trapaça
-alocar aos alunos o mesmo tempo fazer o teste
Indicações para a anotação e a interpretação dos resultados do teste
Um bom teste deve ser acompanhado de indicações que explicam como notar e interpretar os
resultados do teste, e isto prevalece especialmente para os testes padronizados, que são usados
por outras pessoas que aquelas que prepararam em primeiro. Tais indicações são também
importantes para os testes concebidos localmente, porque outras pessoas podem tomar parte no
processo de anotação e da interpretação do teste, por causa de circunstâncias imprevistas.
As instruções seguintes permitem ter algumas indicações claras para os testes.
64 - Usar as descrições claras para o procedimento detalhado a seguir para administrar os testes de
uma maneira padronizada.
-Fornecer as informações a aqueles que submetem ou usam o teste com respeito aos formatos das
perguntas, o procedimento para responder as perguntas e o uso de todo o material ou
equipamento requerido.
-Estabelecer e instituir um procedimento para garantir a segurança do material para o teste
durante todas as fases de elaboração, a administração, a anotação e o boletim do teste.
-Dar o procedimento, o material e as indicações para a anotação dos testes e a vigilância da
exactidão do processo de anotação. Se o inventor do teste é responsável pela anotação, dispensar
a formação adequada aos revisores.
-Corrigir os enganos que têm uma incidência na interpretação dos resultados e transmitem
imediatamente os resultados corrigidos.
-Definir e instaurar um procedimento para se assegurar da confidêncialidade dos resultados.
Escolha de um teste
Geralmente, quando nós falamos da escolha dos instrumentos de medida ou dos testes, nós
fazemos referência aos instrumentos padronizados. Na maioria das situações, podem acontecer
que você seja forçado a uma só opção. Contudo, em alguns casos, você poderá ser confrontado,
para o desafio de comparar alguns instrumentos e escolher o que é muito satisfatório as suas
necessidades e sua situação. Se tal é o caso, você deveria fundar sua decisão em factos objetivos
e princípios sólidos de avaliação.
Acima de tudo, você tem que pensar na técnica de avaliação que responde a meta de testagem e
aos objectivos devendo ser avaliados. Por exemplo, o plano de avaliação para um programa de
estudos em leitura ao teste implicaria uma combinação de instrumentos concebidos localmente e
padronizados. Este plano também pode implicar os formatos normativos e criteriais. Por outro
lado, o programa de teste da escola requereria somente o uso dos testes padronizados.
Quando você tiver que escolher um teste padronizado entre um certo número de opções, você
também tem que considerar que os factores seguintes para serem seguros, vossas informações
devem ser completas nas características do teste. Isto pode parecer surpreendente, mas há uma
ligação entre a quantidade de informação fornecida pelo publicador e a qualidade do teste. A
validez do teste é a informação mais importante requerida. Além disso, os dados relativos à
fidelidade do teste deveriam ser acessíveis e conforme às normas que nós estabelecemos para
65 nosso exercício de teste. Os outros dados que deveriam ser transmitidos compreendem as
informações sobre a administração, a anotação e a interpretação do teste.
Avaliação formativa
Responda as perguntas seguintes.
1. Que tipos de dados de avaliação são colectadas nas escolas secundárias de sua região? Qual é
a meta de cada um destes dados? Para si, que dados estão faltando e qual será a utilidade de tais
dados?
2. Entre os seguintes tipos de testes, quais são usados em sua região? A que nível cada um é
usado e para que fins?
a. Testes padronizados
b. Testes concebidos localmente
c. Testes de produção
3. Leitura obrigatória para o estudo #6 e escrever um curto teste padronizado (com cerca de 500
palavras) para defender os testes padronizados contra os argumentos expressados no artigo.
4.Que norma de produção (criterial ou normativa) é usada em sua região? Quais são as suas
vantagens e suas desvantagens?
Actividade de aprendizagem #4
CONCEPÇÃO DE INSTRUMENTOS
Resumo
Esta actividade de treinamento é elaborada para vos ajudar a entender os princípios subjacentes à
concepção dos instrumentos de teste. A unidade começa pelo processo de limitação, definição e
selecção do conteúdo que deveria ser coberto pelo teste. O uso de quadro de especificação
simplifica o processo e permite ao inventor de teste de ver o conteúdo a ser avaliado, a que nível
é necessário avaliar e a maneira para se avaliar. Em seguida, as indicações sobre a construção
dos artigos do teste são abordados compreendem o processo de selecção de objectivos e de
questões de testes padronizados eficientes. Encontra-se algumas recomendações sumárias para a
elaboração e o formato dos testes ao término da actividade de aprendizagem. No último lugar,
deveria-se insistir no facto que os instrumentos de testes devem ser examindos minuciosamente
antes de ser administrados aos testes.
66 Lista de conceitos - chave
Um quadro de especificações é essencialmente um projecto de teste cuja meta é de se assegurar
que todos os resultsdos visados, e só os resultados visados, são avaliados e que o teste contém
um número consequente de perguntas para cada artigo avaliado.
A validação do teste é o processo pelo qual um teste é administrado e revisto até a obtenção de
um nível de validez e fiabilidade aceitável.
Conteúdo
Limitação, definição e selecção do conteúdo
Quando se concebe um teste, a primeira fase é de circunscrever o que será tratado. Normalmente,
os objectivos fornecem o projecto para o tópico ou o grupo de tópicos que serão incluídos num
teste, e um teste deveria constituir uma unidade significante do ensino. Normalmente, um teste
cobre o equivalente de vários dias ou semanas de ensino. Limitar o alcance do teste impede os
alunos de ter uma sobre carga cognitiva e permite uma amostragem mais representativa dos
comportamentos representados pelos objectivos escolhidos. Evidentemente, alguns testes
cumulativos como os exames finais requerem um alcance maior e podem representar duas
semanas ou os meses de ensino. Se os testes individuais foram concebidos rigorosamente, a
tarefa da clarificação de teste cumulativa é facilitada, porque os resultados avaliados através de
tais testes representam uma amostragem das produções avaliadas por todos outros testes
precedentes.
A próxima fase na concepção de um teste é de fazer um plano detalhado do conteúdo (ou
planano de aula), se um tal plano não é acessível. O plano deve ser suficientemente detalhado e
compreender os resultados pesquizados do conhecimento e das competências nos alunos.
Embora todos os resultados não possam ser avaliados num teste, todos deveriam pelo menos ser
candidatos para se encontrar. Se alguns objectivos precisos foram estabelecidos, então os
objectivos precisos foram estabelecidos, então as produções queridas associadas a cada ponto do
plano já serão especificados. Se isto não está já feito, os comportamentos devem ser
identificados, e nós temos que manter à mente que nós nos ocupamos de outros aspectos que
somente a posse do saber. Esta maneira de descrever o conteúdo é chamada «descrição do
domínio» e a sua meta é de identificar todos os possíveis artigos determinando as regras para a
sua criação.
A terceira fase na elaboração de um teste é a concepção de um plano para provar o domínio de
comportamento. Com a excepção de alguns testes criteriais, um teste representa invariavelmente
um modelo de comportamento. É praticamente impossível avaliar cada aspecto de cada
resultado. Além disso, se nós escolhermos minuciosamente os aspectos que nós realmente
avaliamos, nós podemos generalizar em domínio completo com um grau de confiança razoável.
67 É necessário que os artigos do teste constituam uma amostra representativa dos comportamentos
queridos. É isso que nós temos chamado a validez do conteúdo. Quanto mais o conteúdo é
estruturado e bem definido, mais fácil é de realizar as tarefas. A selecção aleatória, que permite a
todo o resultado de ter uma chance independente e igual de ser posto no teste conduz ao processo
de alcance da validez do conteúdo de um teste. Você pode também escolher os resultados que
devem ser escolhidos para o teste estratificando o conteúdo de acordo com critérios próprios ao
conteúdo (ou para outros critérios lógicos).
A concepção de um quadro de especificações é uma aproximação metódica para elaborar um
teste. Depois de ter especificado e definido o conteúdo do teste e os resultados behavioristas, a
próxima fase lógica é a construção de um quadro de especificações.
Quadro de especificações
Essencialmente, um quadro de especificações é um plano para um teste. Como seu nome o deixa
supôr , ele define o conteúdo do teste. A meta principal do quadro é assegurar que todos os
resultados desejados, e só os resultados desejados, sejam avaliados e que o teste inclui o número
apropriado de artigos para cada artigo avaliado. Um quadro de especificações é um quadro de
duas entradas que possui um eixo que é essencialmente um sumário da aula e um outro que
indica os comportamentos desejados em relação ao conteúdo.
Resumo da aula
Os principais títulos e subtítulos do sumário da aula são indicados ao longo de um eixo do
quadro de especificações. Este pode compreender todos os tópicos e sob - tópicos ou somente
aqueles especialmente precisos. Quanto mais um eixo é detalhado, mais um teste tem vantagens
para incluir alguns artigos para os tópicos queridos. Também, numa mais grande medida a
complexidade do sumário é uma função da complexidade do domínio de interesse avaliado.
Resultados behavioristas
Ao longo do eixo do quadro, os comportamentos ou as produções para cada tópico são indicados.
Esta aproximação chama a atenção sobre os resultados de ordem superior e garante que o teste
não será composto principalmente ou completamente de artigos de nível de conhecimento. O
nível dos artigos dependerá especialmente do nível dos alunos e dos objectivos estabelecidos
anteriormente. Porém, é necessário notar que os professores são os mais susceptíveis de
negligenciar os artigos que avaliam as competências de ordem superior, como a aplicação, a
68 síntese e a análise. Alguns quadros de especificações podem ser muito precisos e podem indicar
o sub-domínio que é ligado ao resultado. É necessário notar que seja mais fácil de elaborar um
quadro de especificações para um teste criterial de preferência que para um teste normativo,
porque os resultados desejados para o primeiro já foram examinados em detalhes e determinados.
Número de artigos
A intersecção dos títulos do sumário das aulas e das categorias behavioristas formam as células
na qual o número satisfatório (ou a percentagem) de artigos é indicado. O número de artigos
atribuídos para cada célula deveria ser fundada no número de objectivos ou sua influência (ou
importância). De facto, isto significa que nós temos que pensar maduramente «o que leva » para
avaliar um resultado behaviorista preciso para um determinado tópico. A concepcção de um
quadro de especificações é uma actividade de programação e idealmente, deveria ser feito
durante a fase de planificação da avaliação. No plano lógico, o melhor momento para elaborar a
tabela e depois o estabelecimento de objectivos específicos. Se os objectivos são concebidos para
uma sessão completa, uma próxima fase lógica é de os separar em conjunto representando as
unidades de ensino domináveis. Como para os objectivos, se eles são estabelecidos antes do
ensino, um quadro de especificações serve de guia para o ensino, porque nós sabemos que
resultados são desejados para cada tópico e que importância é necessário conceder a cada um.
Construção dos artigos do teste
Visão geral
Existe um certo número de instruções para a concepcção de um certo número de diferentes tipos
de artigos. Quando os alunos lêem um artigo, nós queremos que o único factor que tem um
impacto nas suas respostas seja a posse ou não do comportamento medido, que significa, o
alcance do objectivo. E portanto, um artigo possui numerosas características que podem impedir
um aluno bem informado de ter a resposta correcta ou permitir um aluno mal informado de
adquirir uma boa resposta. Alguns factores como a maneira de formular a pergunta, a natureza
das opcções e os avisos para responder as perguntas podem influenciar a capacidade dos alunos a
demonstrar ou não uma realização.
Na realidade, há dois tipos de artigo de teste, o teste padronizado e o objectivo. Os artigos
objectivos compreendem as respostas curtas, as escolhas múltiplas e o verdadeiro ou falso. Os
artigos de teste também podem ser classificados em artigos de resposta construída ou em artigos
de selecção. Os artigos de testes padronizados e das respostas curtas são os artigos de resposta
construída, porque a resposta deve ser construída pelo aluno. Os artigos para a escolha múltipla,
os artigos do tipo verdadeiro ou falso e emparelhamento são chamadas os artigos de selecção,
porque o aluno escolhe uma resposta entre as opcções. Os tipos de artigos adequados para um
determinado teste depende essencialmente da natureza dos comportamentos avaliados e do
ensino . Não há um tipo de artigo preciso para certos géneros precisos de resultados; todo o tipo
69 de artigo pode ser usado para avaliar todo o resltado behaviorista, o que quer que seja seu
taxinómico.
Instruções gerais
É geralmente recomendado para não conceber um teste à pressa. O professor ou a pessoa
responsável da avaliação deveria ter suficientemente de tempo para planejar, elaborar e revisar os
artigos. Alguns testes, como o pos-testes, devem ser preparados antes do ensino. Por outro lado,
os testes de unidade podem ser concebidos depois do ensino. É recomendado de desenvolver os
testes cedo e revisar se for necessário, ou vocês podem os conceber progressivamente. Esta
aproximação apresenta várias vantagens, o mais importante sendo que a tarefa difícil que é a
construção de um teste pode se desenrolar num espaço de tempo.
Os artigos deveriam ser precisamente conforme ao resultado behaviorista ou para o objectivo
esperado. Em outras palavras, o comportamento provocado pelo artigo deveria ser precisamente
o comportamento indicado no objectivo. Se um objectivo indica que o aluno deveria ser capaz de
manipular um microscópio, o artigo correspondente não lhe deveria pedir que fizesse a lista das
partes de um microscópio ou de suas utilizações; deveria de preferência lhe pedir de o manipular.
Trata-se de correspondência objectivo-artigo.
O carácter suficiente do artigo está estreitamente ligado ao conceito de correspondência
objectivo- artigo. O carácter suficiente do artigo significa que uma boa resposta para um artigo
(ou vários artigos) representa uma prova suficiente que o aluno demonstrou o comportamento
querido, ou atingiu o objectivo. Tudo dependendo da natureza do objectivo, pode acontecer que
seja impossível desenvolver um tal artigo; vários artigos podem também ser exigidos para ser
conforme as instruções ligadas ao carácter suficiente. Porém, é necessário apontar esta meta.
O artigo deveria comunicar claramente o sentido querido do inventor do teste a aqueles que o
submetem; trata-se de uma exigência fundamental. Por outras palavras, o artigo não deveria
possuir nenhuma ambiguidade, até onde possível. O aluno deveria interpretar o artigo da mesma
maneira que o inventor do teste desejaria que ele seja interpretado. O artigo deveria também estar
claro para todo o corrector competente.
A dificuldade do artigo é uma característica do artigo que pode ser controlado pelo inventor de
teste. Os níveis de dificuldade apropriados são asfunções do tipo de testes e dos objectivos sobre
os quais os testes se baseiam. Em todo caso, aqueles que preparam o teste deveriam equilibrar a
dificuldade dos artigos pondo os artigos cobrindo todos os níveis contínuos.
A novidade do artigo é um conceito que se aplica sobretudo à avaliação dos resultados de ordem
superior. Ela se relaciona às condições onde o aluno não está familiarizada com a situação
presente no artigo, quer dizer que o aluno não encontrou anteriormente tal situação durante o
70 ensino. Se esta condição não estiver cheia, um artigo que aponta a avaliação de um resultado de
ordem superior pode ser de facto um artigo de conhecimento.
Testes padronizados
Os testes padronizados são especialmente usados pelos professores para avaliar o aluno. Alguns
testes padronizados incluem os artigos de testes padronizados, e um esforço de avaliação formal
pode de vez em quando se servir de tais artigos, mas a sua utilização se limita geralmente a
turma. Um teste padronizado inclui os artigos que pedem ao aluno de escrever as respostas
geralmente longas. O teste padronizado é adequado para avaliar os resultados que requerem as
competências de ordem superior, como a aplicação e a análise. É necessário notar que a cotação
de testes objectivos é geralmente subjectiva. Isto significa que não existe uma única resposta,
mas bem que pode existir um grande número de outras opcções que responderiam corretamente a
questão dada. Menos questões podem ser postas por um dado período, porque as respostas dos
testes padronizados são mais longas que aqueles dos testes objectivos.
Os artigos objectivos são os mais difíceis de construir, mas mais fácéis de corrigir; ao contrário
os testes padronizados são difíceis de corrigir, mas relativamente fácil construir. As instruções
gerais para a construção de artigo - correspondência objectivo-artigo, carácter suficiente,
comunicação, dificuldade e novidade – se aplicam com uma importância particular na
comunicação, porque não há opcções de resposta para ajudar a clarificação da pergunta e é por
isso primordial que as opções de resposta queridas sejam claramente delimitadas, até onde
possível. Os alunos deveriam receber alguns avisos sobre as exigências e a maneira de responder
as perguntas. Além disso, eles deveriam receber algumas instruções gerais sobre o comprimento,
o tempo e a anotação.
Como vimos previamente, a anotação dos testes padronizados é um processo longo e difícil.
Embora que ela seja potencialmente um processo muito subjectivo que conduz à uma fraca
fiabilidade do revisor, a parte de subjectividade pode ser minimizada consideravelmente por uma
programação e uma correcção meticulosas. Nós podemos objectivar os testes padronizados de
forma a que nós pudessemos especificar as respostas e as outras respostas aceitáveis; então, todo
o corrector bem informado deveria ser capaz determinar se as respostas estão lá. Existem duas
aproximações essenciais para a correcção dos testes padronizados: o método analítico e o método
global.
a) O método analítico inclui a identificação de todos os aspectos de uma resposta perfeita e a
consignação de um valor disto a cada um.
b) O método global, também nomeado o método de cotação ou a aproximação holística, tem por
resultado uma correcção mais subjectiva e menos segura, mas exige menos tempos. Ela
71 comporta a identificação de todos os aspectos de uma resposta perfeita, mas nenhum valor em
ponto não é conferido a cada um; neste lugar, cada resposta é avaliada em tanto que todo e
unidade total, e uma avaliação global é efectuada. Alguns pontos são concedidos de acordo com
a exaustividade das respostas.
Como directriz geral para os testes padronizados, se recomenda de corrigir cada resposta sem
saber quem a escreveu, quer dizer, anonimamente. Esta maneira de fazer previne a parcialidade
da correcção através de factores estrangeiros, como os sentimentos diante de alguns alunos.
Também, uma boa idéia é de ler e corrigir as perguntas do teste padronizado duas vezes, antes de
conceder os pontos. O ideal seria que seja efectuado por duas pessoas diferentes.
Testes objectivos
Os testes objectivos, nos quais os alunos não devem redigir as respostas, mas sim escolher entre
várias opções dadas, são mais válidas e fiáveis que os artigos de testes padronizados, e a
fiabilidade do revisor é muito maior. Estes testes podem ser usados para avaliar alguns
objectivos a todos os níveis, e não são limitados aos artigos de níveis de conhecimento, como
vários o afirmam. As instruções gerais para a construção de artigo, que nós abordamos
previamente, se aplicam geralmente. As recomendações seguintes podem vos ajudar a evitar
algumas armadilhas comuns.
1. Presta atenção para não dar sinais de boas respostas.
2. Evite alguns artigos dependentes (uma boa resposta para um artigo é necessário para
responder ao outro artigo).
3. Evite complexificar inutilmente o teste, intencionalmente ou não, pelo uso de um vocabulário
complexo ou tornando mais complicado para nada.
4. Evite construções negativas e especialmente a dupla negação.
5. Evite citações directas.
6. As perguntas insólitas não deveriam ser avaliadas.
7. Um artigo deveria ter somente uma boa, ou uma melhor resposta, salvo se é especificado.
Os artigos objectivos compreendem
a) Os artigos de respostas curtas
b) Os artigos de escolha múltipla
72 c) Os artigos do tipo verdadeiro ou falso
d) Os artigos de emparelhamento
Instruções gerais para a organização, as instruções e o formato dos testes
Organização dos artigos de teste
Se houver um tipo de artigo, os artigos do mesmo tipo deveriam ser reagrupados.
Os artigos podem também ser organizados numa quantidade contínua, do menos difícil ao mais
difícil.
Um outro modo lógico de organizar os artigos é o de classificá-los por tópicos. Todos os artigos
relacionados com o mesmo objectivo ou resultado deveriam ser reagrupados.
Instruções gerais
Se a meta e a importância do teste não forem evidentes, eles deveriam ser examinados com os
alunos de forma a que estes sejam guiados e motivados para se destacarem.
Além dos avisos para escolher (ou fornecer) as respostas, os alunos deveriam receber algumas
instruções para notar as respostas.
Se as instruções são complicadas ou colocarem um procedimento que os alunos não conheçam,
dever-se-ia apresentar aos alunos um exemplo.
Uma idéia acertada seria considerar que aquele que submete o teste procede à correcção do
revisor.
Se alguns tópicos importam mais do que os outros, é melhor ter mais artigos para estes tópicos
de preferência que de conferir um maior valor a alguns artigos.
Se o tempo requerido para este teste é insuficiente, os alunos deveriam receber algumas
indicações para usá-lo eficazmente.
Se não houver uma penalização para as respostas adivinhadas, os alunos deveriam ser incitados a
responder a cada artigo, mesmo quando eles não estão seguros sobre a correcção da resposta.
Se houver uma penalizacão para as respostas adivinhadas, a pessoa deveria indicar aos alunos
responder os artigos para os quais eles são suficientemente alguns para ter a resposta boa
somente.
Precisões no formato
73 Os artigos deveriam ser numerados consecutivamente e as instruções deveriam ser colocadas
bem à vista e isolados dos artigos.
Os espaços para as respostas deveriam ser do mesmo tamanho e suficientemente grande para
contêr a resposta mais longa, especialmente para os testes de respostas curtas, e os espaços para
as respostas deveriam ser colocados numa coluna vertical na margem direita ou esquerda ou
numa folha de respostas separada.
Se um artigo é acompanhado por uma ilustração de todo o tipo, como um diagrama, ele deveria
ser justo e colocados depois do artigo, directamente em cima se possível ou paralela ao artigo.
Revisão do teste
Na realidade, a revisão do teste pode ter lugar antes de sua utilização prevista como também
depois de sua administração formal. Os os instrumentos concebidos para uma avaliação precisa e
formal podem ser administrados e revisados cada vez mais até que eles alcançam os níveis
aceitáveis de validez e fiabilidade. O processo é chamado «teste na terra» ou “validação do
teste”.
Avaliação formativa
Escolhe dois domínios de sua especialização ou campos de interesse do programa de sua escola
secundária. Pode usar os mesmos tópicos usados no momento da actividade de aprendizagem 2.
Expõe brevemente os sub-tópicos dos assuntos que escolheu. Eles deveriam provir do programa
(mas se o programa não fornece tais informações, pode desenvolvê-los com a ajuda de um
professor de escola secundária ou manuais pertinentes).
A leitura para o estudo #7 e conceba um quadro de especificações para os dois tópicos. Um plano
de amostragem para o quadro de especificações apropriado é fornecido abaixo.
Prepare as perguntas dos testes conforme as instruções especificadas em leituras #8, #9, #10 e
#11.
INSERIR QUADRO
Quadro de especificações
Tópico:
Curso:
#: 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12.
Tópicos/sob - Tópico:
74 Conhecimento:
Níveis dos objectivos:
Compreensão:
Aplicação:
Análise:
Síntese:
Avaliação:
Número total de perguntas:
Tipo apropriado de perguntas:
Percentagem total:
Actividade de aprendizagem #5
ANÁLISE, INTERPRETAÇÃO E USO DOS RESULTADOS DE TESTE
Resumo
Como o título indica, esta actividade é concebida para rever os conceitos ligados à análise, a
interpretação e o uso dos resultados de teste. No processo de análise, faz-nos notar que as
estatísticas descritivas são muito úteis ao professor para resumir a maneira inteligível os
resultados dos alunos. Nós já explicamos que um resultado nele mesmo está sem importância, a
menos que seja interpretado com ajuda de critérios. Diferentes Métodos de interpretação de
resultados de teste são apresentados brevemente nesta atividade de aprendizagem. A unidade se
termina por uma análise sumária de diferentes maneiras para utilisar os resultados de teste por
diferentes partes interessadas no processo do ensino.
Lista de conceitos - chave
A nota bruta é o número de questões correctas obtidas a um teste pelo aluno (se se supõe que
cada pergunta vale um ponto).
A percentagem de exactidão é adquirida quando a nota bruta é dividida pelo número total de
perguntas e este resultado é multiplicada por 100.
75 O equivalente de nível escolar é um número que descreve a posição do aluno numa
continuidade de cumprimento.
O grau percentil é um resultado que indica a percentagem de alunos num grupo preciso que
adquiriu as notas notas cruas mais baixas a um teste que um aluno em particular.
Conteúdo
Análise dos resultados de teste
A análise dos resultados de teste permite ao professor e a todos os usuários de ter acesso a dados
resumidos que podem ser interpretados facilmente em vez de ter longas folhas compreendendo o
nome dos alunos e os resultados. A primeira fase na análise de dados é descrever ou resumir os
dados por intermediário das estatísticas descritivas. Por exemplo, pode acontecer que um
professor se interesse somente na descrição da produção da turma e o nível de produção de
pessoas em relação à produção média da turma. As estatísticas descritivas nos permitem de
descrever muitos resultados validamente com poucos sinais dando respostas a questões como:
qual foi a nota média do teste? A maioria das notas eram próximas da média ou
consideravelmente dispersas? E assim sucessivamente. As estatísticas descritivas nos permitem
também de formular algumas declarações interpretativas (normativas e critériais, mas
especialmente normativas) sobre as contagens individuais e de responder perguntas como: a
contagem está acima ou abaixo da média? Qual é a desvio desta contagem com a média? Que
percentagem das contagens era mais baixa que este resultado? E assim sucessivamente. Que
instrumentos concebidos localmente ou padronizados sejam administrados, as estatísticas
descritivas constituem uma ferramenta importante para interpretar os resultados dos resultados.
Aqui estão os tipos de estatísticas descritivas:
1. Avaliação da tendência central
a. A moda
b. A mediana
c. A média
2. Medidas de variação
a. A extensão
76 b. O desvio quartil
c. O desvio tipo
d. A curva normal
3. Medidas da posição relativa
a. Graus percentis
b. notas padronizadas
c. Equivalente do nível escolar e equivalente de idade
4. Medida da relação
a. R de Pearson
Interpretação dos resultados de teste
Três das metas fundamentais do teste são: (1) de descrever o nível de desenvolvimento de cada
aluno numa área de experiência, (2)de identificar as forças e as fraquezas relativas do aluno
através de matérias e (3) supervisionar o desenvolvimento de um ano ao outro que tenha traços
as competências de base. Para cumprir não importa qual destas metas é importante escolher o
tipo de contagem entre aqueles expostos que permitirá a boa interpretação. Das contagens como
os graus percentis, os equivalentes de nível escolar e as notas padronizadas diferem em matéria
das metas procuradas, da precisão com a qual elas descrevem a produção e do tipo de informação
que eles procuram. Um estudo mais aprofundado destes tipos de contagens vos ajudará a
diferenciar as funções suas funções e as significações que eles podem expressar.
Tipos de contagens
Nota Bruta (NB)
A nota bruta do aluno é o número de perguntas correctas obtidos num teste pelo aluno (se se
supõe que cada pergunta vale um ponto). Uma nota bruta em si mesmo não significa muito ou
nada. A significação depende do número de perguntas presentes no teste e do nível de
dificuldades de questões. Por exemplo, se Olouch obteve 10 boas respostas num teste de
matemática e 10 respostas boas num teste em ciências, seria ilógico concluir que seu nivel de
77 produção nas duas matérias é o mesmo. Este exemplo ilustra bem porquê as notas brutas são
geralmente convertidas em outros tipos de contagens aos fins da interpretação.
Percentagem de exactidão (PE)
A percentagem de exatidão é obtida quando a nota bruta é dividida pelo número total de
perguntas e este resultado é multiplicado por 100. Assim como as notas brutas, a percentagem de
exactidão em si não significa muito. Ela indica a percentagem das perguntas correctas obtidas
pelo aluno num teste, mas a menos de saber um pouco disto sobre a dificuldade geral do teste,
esta informação não é muito útil. Às vezes, a percentagem de exactidão é mal interpretado como
um grau percentil, que é descrita mais longe. Os dois são completamente diferentes.
Equivalente de nível escolar (ENE)
O equivalente de nível escolar é um número que descreve a posição do aluno numa continuidade
de realização. A continuidade é uma linha numerada que descreve o nível mais baixo de
conhecimentos ou de competências a uma extremidade (os números mais baixos) e o nível mais
elevado de desenvolvimento para a outra gorjeta (os números mais elevados). O ENE é um
número decimal que descreve a produção de acordo com o nível escolar e meses. Por exemplo,
se um aluno de sexta classe adquiri um ENE de 8,4 a um teste de vocabulário, ele adquiriria
provavelmente o mesmo resultado que um aluno típico de oitava classe ao final do seu quarto
mês. O ENE é uma nota bruta dada para todo o teste, indica o nível escolar para o qual o aluno
típico adquire esta nota bruta. Os números à esquerda do sinal decimal representam o ano e
aqueles a direita representam o mês do ano.
O equivalente do nível escolar é particularmente útil e prático para avaliar o desenvolvimento
individual de um ano ao outro e o estado de desenvolvimento do aluno de acordo com o nível
escolar. Porém, o ENE foi criticado, porque é por vezes usado a mau conhecimento e se
considera «que é facilmente mal interpretado». Um problema de é saber se o ENE indica o nível
escolar no qual um aluno deveria ser colocado e este problema é uma fonte de confusão. Por
exemplo, se um aluno de quarta classe obtêm um ENE de 6,2 a um teste de leitura de quarta
classe, deveria ela ser transferida na sexta classe? É óbvio que o nível de desenvolvimento do
aluno em leitura é elevado em relação aos seus colegas de quarta classe, mas os resultados do
teste não fornecem nenhuma informação sobre a maneira que ele abordaria o material lido
normalmente pelos alunos de sexta classe, aquando dos primeiros meses. Assim, o ENE não
avalia senão o nível de desenvolvimento do aluno; não faz a recomendação para a mudança do
nivel escolar. Um ENE muito mais alto ou baixo que o nível escolar do aluno é essencialmente
um sinal de produção excepcional.
Em resumo, toda a contagem de teste, pouco importa o tipo de contagem ou o teste, é susceptível
de ser mal interpretado ou usado a mau conhecimento. Toda a contagem possui os limites ou as
fraquezas que são exageradas por causa de um uso incorrecto da contagem. O segredo é de
78 escolher o tipo de contagem apropriado que lhe permitirá melhor de realizar as suas metas para o
teste. O equivalente do nível escolar convém particularmente a avaliação do estado de
desenvolvimento do aluno ou do desenvolvimento individual de um ano ao outro. O equivalente
do nível escolar é inadequado para encontrar a ordem do aluno num grupo ou para identificar
forças e fraquezas relativas.
Nota padronizada do desenvolvimento (NP)
Como o equivalente do nível escolar (ENE), a nota padronizada do desenvolvimento é também
um número que descreve a posição do aluno sobre uma contínuidade de realização. A principal
inconveniência da interpretação de nota padronizada do desenvolvimento é que elas não têm
significações inerentes. Ao contrário dos equivalentes de nível escolar, que estabelece o nível
escolar na contagem, as notas padronizadas do desenvolvimento não são conhecidos pela maioria
dos pedagogos, pais e alunos. Para interpretar as NP, os valores conectados à produção típica de
cada ano devem ser utilisados como pontos de referência.
A vantagem principal da nota padronizada do desenvolvimento é que ela reflecte melhor a
realidade que o equivalente do nível escolar, isso significa que ela indica que o desenvolvimento
de um ano ao outro não é normalmente tão bom para os últimos anos mas sim para os primeiros
anos. (Não esqueça que o equivalente do nível escolar indica o mesmo desenvolvimento anual
medio - 10 meses – entre todo o par de anos.) Apesar desta vantagem, a nota padronizada do
desenvolvimento é muito mais difícil a interpretar que o equivalente do nível escolar. Por
consequente, quando os professores e os conselheiros desejam avaliar o desenvolvimento anual
de um aluno ou o nível de desenvolvimento actual, o equivalente do nível escolar é uma escolha
de predilecção.
As fontes potenciais de confusão e de má interpretação descritas no parágrafo precedente no
ENE se aplicam também as NP. Em relação ao ENE, a NP não é também fácil a utilizar para
descrever o desenvolvimento, mas ela é inadequada para identificar as forças e as fraquezas
relactivas de um aluno ou para descrever a ordem do aluno num grupo.
Grau percentil (GP)
O grau percentil é um resultado que indica a percentagem de alunos num grupo preciso que
obteve algumas notas brutas a um teste que um aluno em particular. Ele mostra a posição ou a
ordem relativa dos alunos num grupo de alunos que estão no mesmo ano e que submeteram o
teste no mesmo momento do ano (outono, meio - ano ou primaveira) que o aluno. Por exemplo,
se Toni obteve um grau percentil de 72 no teste de línguas, isso significa que teve um resultado
mais alto que 72 por cento dos alunos no grupo com que é comparado. Evidentemente, isso
significa também que 28 por cento do grupo obteve uma melhor nota que Toni. Os graus
percentis vão de 1 a 99.
79 O grau percentil de um aluno pode variar de acordo com o grupo utilizado para determinar a
classificação. Um aluno faz parte simultaneamente de vários grupos diferentes : todos os alunos
de sua turma, sua escola, sua circunscrição escolar, seu estado e o país.
Tipos de interpretação dos resultados
Um teste de produção é concebido para ajudar a determinar a quantidade de competências ou de
conhecimentos adquiridos pelo aluno num assunto preciso. Nós usamos tais testes para descobrir
se os alunos sabem tanto quanto nós desejamos ou se eles sabem algumas coisas precisas que nós
estimamos importantes. Em si, a nota bruta adquirida a um teste de produção não indica a
quantidade de coisas dominadas pelo aluno ou competências adquiridas. Mais informações são
necessárias para decidir a «quantidade» . A contagem do teste deve ser comparada ou fazer
referência a algo para ser significante. Este «algo», normalmente (a) os resultados obtidos por
outros alunos no teste ou (b) uma série de descrições detalhadas que indicam o que sabem os
alunos a cada ponto da contagem ou que competências eles tem demostrados com sucesso. Estas
duas maneiras de dar sentido a uma contagem através de referências chamam-se geralmente
interpretação normativa e interpretação criterial.
Interpretação normativa
As baterias padronizadas de testes de produção escolar são concedidas principalmente para dar
interpretações normativas dos resultados por eles obtidos. Por esta razão, eles são chamados
geralmente de testes normativos. Porém, os resultados também permitem interpretações
criteriais, o que fazem também os resultados da maioria de outros testes. Assim, os testes
normativos são concebidos para melhorar as interpretações normativas e permitem também
interpretações criteriais.
Uma interpretação normativa implica a comparação do resultado do aluno com os resultados
obtidos no mesmo teste por outros alunos. A quantidade de conhecimentos dominados pelo aluno
é determinada por sua ordem no grupo de referência. Uma ordem elevada significa que o aluno
sabe muitas coisas ou que ele é muito inteligente e uma ordem baixa significa o contrário.
Evidentemente, as competências globais do grupo de referência têm um impacto significativo na
interpretação. Um grau elevado num grupo pouco hábil, pode representar uma produção absoluta
mais baixa que a ordem baixa num grupo muito performativo.
A maioria dos resultados sobre o extracto de notas de testes padronizados fundam-se sobre a
normatividade, ou seja, a comparação com um grupo de referência. Para aquilo que é de ordens
80 percentuais, e os equivalentes de curva normal, a comparação efectua-se com um único grupo de
alunos num ano de estudos precisos que se submeteu ao teste a um certo momento do ano. Eles
são chamados os resultados de posição, porque eles indicam a posição ou o grau do aluno num
grupo preciso. Contudo, no caso de equivalentes de nível escolar e das notas padronizadas do
desenvolvimento, a comparação faz-se com uma série de grupos de referência. Por exemplo, as
produções dos alunos de terceira classe, de quarta classe, de quinta classe e sexta classe são
reeligados para formar uma contínuidade do desenvolvimento. (De facto, a escala é composta de
grupos de anos de estudo que vão da escola materna ao fim da escola secundária.) Aqueles são
chamados os resultados de desenvolvimento, porque eles implicam as posições dos alunos numa
escala de desenvolvimento. Assim, os resultados de posição dependem de um único grupo para
elevar as comparações e os resultados de desenvolvimento dependem de vários grupos que
podem ser reeligados para constituir uma escala de desenvolvimento.
Uma bateria de testes de produção escolar é um conjunto de testes em várias disciplinas e estes
testes foram todos padronizados com o mesmo grupo de alunos; isso significa que as normas
para todos os testes foram obtidas a partir de um único grupo de alunos para cada nível escolar.
Este aspecto particular da bateria de testes de produção escolar torna possível o uso de contagens
para determinar as forças e as fraquezas relativas por competências para os alunos ou os grupos
de turmas, e a avaliação do desenvolvimento de um ano ao outro. O uso de uma bateria de teste
que possui um grupo de referência comum permite aos pedagogos enunciar as afirmações como
«Asha é melhor em matemática que em leitura» ou «Ayan está a um nível mais baixo de
desenvolvimento em aptidões linguísticas que o aluno típico no seu ano de estudos». Se as
normas não fossem acessíveis, não haveria uma fundamentação para afirmações como aquelas.
As normas também permitem a comparação de alunos com outros alunos e a comparação de
escolas com outras escolas. Se a única razão para usar uma bateria padronizada de testes de
produção escolares fosse o estabelecimento destas comparações, então o tempo, os esforços e os
custos em causa ligados aos testes deveriam ser remetidos. Porém, tais
comparações dão a oportunidade aos pedagogos para olhar os níveis de produção do aluno em
relação a um grupo representativo de alunos numa escala nacional. Assim, os professores e os
administradores podem ter um olhar «externo» sobre a produção dos seus alunos, um olhar
independente das próprias avaliações da escola na aprendizagem.
Considerando também
que a nossa população continua sendo extremamente móvel e que os
alunos competem numa escala de preferência nacional que o local das
possibilidades de instrução e económicas, as comparações com os
alunos, as escolas e um grupo de referência nacional deveriam ser de
interesse para os alunos, os pais e os pedagogos.
81 Um engano frequente no uso das normas reside no efeito do teste em diferentes momentos do
ano. Por exemplo, muitas pessoas pensam que os alunos que fazem um exame na primavera na
quarta classe terão um melhor resultado que aqueles que fazem o mesmo exame em outono.
Sobre o plano de equivalentes de nível escolar, é especialmente verdade, porque os alunos
deveriam ser situados mais alto na continuidade do desenvolvimento na primavera que em
outono. Por outro lado, na matéria dos graus percentis esta opinião é falsa. Se os alunos de quarta
classe tiveram um progresso típico do outono a primavera, as suas ordens entre os alunos do seu
nível deveriam ser o mesmo para as duas estações. (O aluno que tem um grau percentil de 60 em
leitura ao outono é susceptível de ter o mesmo grau percentil quando ele submeterá o mesmo
teste na primavera.) Evidentemente, se explica pelo facto que diferentes normas para os alunos
de quarta classe são acessíveis durante o outono e a primavera. Certamente, os graus percentis
seriam tão diferentes que os equivalentes de nível escolar se as normas para a quarta classe
seaplicassem para todo o ano, conta não tida do momento do teste. Aqueles que pensam que os
alunos deveriam somente fazer testes na primavera, porque os seus resultados «soariam melhor »
estão mal informados sobre a natureza das normas e os seus papeis na interpretação dos
resultados.
Os resultados que vêm de um teste normativo não indicam o que os alunos sabem ou não sabem;
eles só mostram como os conhecimentos ou as competências de um dado aluno se comparam
com aqueles dos outros no grupo de referência. Somente depois de ter revisado o plano detalhado
sobre o conteúdo do teste ou depois de ter examinado os artigos no sentido exacto, é possível
avançar algumas interpretações sobre aquilo que um aluno sabe. Porém, esta advertência não
interessa somente as interpretações normativas. Para utilizar uma contagem de teste para
determinar aquilo que um aluno sabe, nós temos que examinar as tarefas do teste que lhe são
apresentadas, e deduzir ou generalizar à propósito o que ele sabe.
Interpretação criterial
Uma interpretação criterial põe em jogo a comparação do resultado de um aluno com uma norma
subjectiva de produção de preferência que com a produção de um grupo de referência. A
interpretação criterial é necessário quando se toma uma decisão para saber um aluno dominou
uma competência ou alcançou a produção mínima aceitável. Normalmente, as percentagens de
exactidão são usadas e o professor determina a contagem requerida para o domínio das noções
ou o sucesso.
Quando der as interpretações criteriais, é primordial que a matéria coberta pelo teste domínio - o
domínio - seja descrita exaustivamente. Importa também que as perguntas do teste cobrem os
aspectos centrais do domínio. Além disso, deveriam ter suficientemente questões sobre o assunto
para dar a ocasião aos alunos de mostrar o que eles sabem e para minimizar a influência dos
erros nos seus resultados.
82 Alguns testes criteriais cobrem uma variedade muito grande de assuntos ou de competências que
é difícil dar boas interpretações criteriais a partir das contagens do teste. Contudo, na maioria dos
testes, as competências distintas são definidas cuidadosamente e há perguntas suficientes que os
avaliam para que se possa dar boas interpretações concretas criteriais a partir das contagens.
A percentagem de exactidão é o género mais largamente usado nas interpretações criteriais. As
contagens criteriais que determinam diversos níveis de produção de testes são em geral as
percentagens de exactidão obtidas graças à análise e ao julgamento do professor.
Uso dos resultados do teste
A avaliação é a colecção e a análise sistemática de dados para fins decisionais. Assim, os
resultados da análise de dados são usados para a tomada de decisões. Os tipos de decisões que
vêm depois da avaliação são extremamente variados. Eis dois exemplos: pode-se decidir que um
aluno X não tem uma progressão satisfatória durante uma determinada fase escolar e daí
concluir-se que o sistema de ensino do país não alcançou os seus objectivos. As pessoas
seguintes, dentro e fora do sistema escolar, que se interessam pelos resultados dos testes:
a) os legisladores
b) as comissões escolares
c) os administradores
d) os pais
e) os alunos
f) os dirigentes
Avaliação formativa
No quadro abaixo, são fornecidos os dados para a obtenção dos resultados dos exames de
matemática e inglês. Estes dados foram colectados no fim do ano escolar. Os alunos que fizeram
os exames estavam na segunda classe nas suas escolas secundárias.
Efectue as actividades seguintes usando os dados fornecidos.
1. A leitura para o estudo #13 e a compreensão dos diferentes métodos de análise dos resultados
dos exames; e, em seguida, a realização das seguintes tarefas:
a. Trace um diagrama de barras para ilustrar a distribuição dos alunos.
b. Calcule a média, a mediana e a moda dos dados.
83 c. Calcule o desvio de dados.
d. Calcule a correlacção entre os resultados dos alunos obtidos nos dois exames.
2. Interpreta os dados usando as duas principais maneiras de interpretar os resultados de exame.
a. Use primeiro a aproximação normativa.
i. Trace a curva normal para ilustrar a distribuição dos alunos.
ii. Quantos alunos se encontram em cada categoria da curva?
iii. O que se pode dizer em relação ao resultado do aluno #19? Como foi a produção deste
aluno?
iv. Como se podem usar estes resultados?
v. Quais são as fraquezas deste método de interpretação dos resultados dos testes?
b. Agora, use a aproximação criterial para interpretar os mesmos dados.
i. Estabeleça os critérios hipotéticos para interpretar os dados
ii. Trace um histograma para ilustrar o número de alunos que se encontram em cada
categoria de vossos critérios.
iii. Que pode-se dizer a propósito do resultado do aluno #19? Como foi a produção deste
aluno?
iv. Como pode-se usar estes resultados?
v. Quais são as fraquezas deste método de interpretação dos resultados de teste?
3. A leitura para o estudo #12 e determine como as partes como as partes interessadas seguintes
em educação podem usar tais resultados.
a. o professor
b. o aluno
c. o Pai
84 d. o administrador escolar
e. o conselheiro escolar
f. o Ministério da educação
Universidade Amoud
Faculdade de Educação
Notas dos alunos
Classe: primeiro ano
Identificação do aluno
Matemática
Inglês 1
1
62
56
2
45
57
3
68
78
4
90
8
5
89
56
6
67
88
7
55
99
8
44
90
9
68
98
10
98
80
11
78
60
12
79
40
13
20
56
14
49
78
85 15
33
88
16
88
56
17
99
88
18
100
77
19
34
66
20
56
55
21
100
23
22
77
67
23
78
88
24
65
34
25
54
100
26
21
90
27
23
99
28
47
100
29
67
87
30
68
77
A nota global para os dois exames é 100.
XIII. Avaliação somativa
Esta actividade deseja avaliar aquilo que o estudante pôde aprender neste Módulo. Trata-se do
momento em que nós tiramos proveito das noções aprendidas até aqui sobre a avaliação e os
testes em pedagogia para os aplicar. Por isso, em colaboração com os vossos professores e vosso
estabelecimento de ensino, deverão ter a possibilidade de acesso ao ensino numa escola
(recomenda-se a escola secundária, mas se for impossível, o nível primário ou o estabelecimento
colegial convirá). Antes do início do ensino em si, deverão obter os programas de aulas e os
manuais necessários. Também, antes do começo do vosso ensino, deverão preparar o método de
86 avaliação e a avaliação que realizarão depois de ter terminado o ensino. Depois do términus de
ensino e da realização do exame, devem escrever um relatório de 1000 a 2000 palavras.
Conteúdo do relatório
Cobertura de página
Resumo
Índice
Contexto
5. Etapa de planificação
a. Análise de situação
b. Especificação dos objectivos
c. Especificação prévia
d. Escolha e elaboração dos instrumentos de medida
e. Apresentação das estratégias
f. Preparação de um calendário geral
6. Fase do processo
a. Pré-teste
b. Progresso da avaliação
7. Fase do produto
a. Resultados do teste
b. Análise dos resultados
c. Interpretação dos resultados
d. Recomendações as partes interessadas
e. Auto - Avaliação
8. Conclusão
87 Modelo de avaliação
As notas globais para o relatório são 100%. As instruções seguintes ajudarão o professor do
Módulo a notar o relatório e dão uma idéia daquilo que é esperado.
1. Cobertura de página (5 pontos)
2. Resumo (5 pontos)
3. Índice (5 pontos)
4. Contexto (5 pontos)
5. Fase da planificação (30 pontos)
a. Análise da situação
b. Especificação dos objectivos
c. Especificação prévia
d. Escolha e elaboração dos instrumentos de medida
e. Apresentação das estratégias
f. Preparação de um calendário geral
6. Fase do processo (15 pontos)
a. Pré-teste
b. Progresso da avaliação
7. Fase do produto (25 pontos)
a. Resultados do teste
b. Análise dos resultados
c. Interpretação dos resultados
d. Recomendações às partes interessadas
e. Auto-Avaliação
8.Conclusão (10 pontos)
88 XIV. Síntese do Módulo
Este Módulo cobriu a maioria dos conceitos importantes subjacentes à avaliação e aos testes em
pedagogia. No fim do Módulo, esperamos que os alunos que dominaram o conteúdo abordado
neste Módulo estejam em condicões de compreender o processo do progresso de uma avaliação
eficiente em educação e dirigí-la. Este Módulo possui cinco unidades. A unidade 1 (a avaliação
em pedagogia) apresenta o conceito, a natureza, os tipos e as fases da avaliação. Esta unidade
serve como introdução a este Módulo, porque dá aos estudantes uma idéia da avaliação e de sua
função na educação. A segunda unidade (especificação dos objectivos de educação) apresenta
em detalhe uma das fases mais importantes no processo da avaliação. A avaliação começa com
objectivos e visa verificar o nível de alcance destes objectivos. Nesta unidade ensina-se aos
estudantes como estabelecer os objectivos de educação mensurável que representam toda a gama
dos domínios de aprendizagem. Na terceira unidade, são abordados o processo de classificação
dos testes e a selecção daqueles que respondem às necessidades do professor. Nesta unidade, o
estudante tem a oportunidade de ver como pode aproveitar os testes padronizados actuais em
seus testes. A quarta unidade é consagrada à elaboração dos instrumentos que devem ser usados
no processo de avaliação. Várias técnicas de concepção de testes, de construção de artigos e sua
revisão são aqui apresentadas ao estudante. A quinta e última unidade concentra-se sobre as
maneiras de analisar, de interpretar e de utilizar os resultados do teste. Esta unidade quer ajudar o
estudante a pensar no uso dos resultados dos testes e fornecer-lhe aptidões que o ajudam a se
servir dos resultados de maneira apropriada.
XV. Autor do Módulo
O sr. Ridwan Mohamed Osman é actualmente o Decano da Faculdade de Educação na
Universidade de Amoud, em Somaliland. É também o Coordenador do Programa AVU de
Formação de Professores na Universidade. Ele foi encarregado de aulas em metodologia de
pesquisa e em educação na mesma universidade e em outros estabelecimentos de ensino durante
os últimos cinco anos. O sr. Osman obteve o seu nível médio em educação na Universidade de
Amoud. Ele obteve também a sua licenciatura em educação na Universidade de Egerton no
Quénia. As suas pesquisas actuais incidem sobre o ensino da ciência nas escolas secundárias
africanas, na administração da turma, na avaliação, nos testes em pedagogia e na educação dos
indígenas. Para mais amplas informações, pode enviar uma mensagem ao endereço eletrónico
seguinte:
[email protected]
Tél: +25224457020
89 
Download

Avaliação e Testes em Pedagogia