APRENDIZAGEM: EFEITOS DE DIFERENTES FORMAS EM UMA ANÁLISE
EXPERIMENTAL
Celso Apparecido Athayde Neto
Centro Universitário Filadélfia – UniFil
Nas ciências psicológicas existem diversas correntes filosóficas que se detêm
em estudar e discorrer sobre os aspectos da aprendizagem, é possível constatar tal
diversidade quando se trata de definir este fenômeno. Segundo Piaget (1974)
Aprendizagem pode ser o fato de uma resposta particular ser adquirida em função da
experiência, sendo que está pode ser sistemática ou não. Muito embora, Jean Piaget
delimite a aprendizagem à aquisição de uma resposta particular, ele vai dar grande
importância no processo de desenvolvimento do ser humano. O desenvolvimento no ser
humano se deve à soma das aprendizagens com o estágio de desenvolvimento anterior,
o equilíbrio destas duas características produz desenvolvimento. Para Piaget o
desenvolvimento pode se dar durante a vida toda, mas fica mais evidente até o final da
infância, neste sentido o desenvolvimento pode ser divido em quatro fases: Sensório
Motor, que dura em torno de 0 à dois anos; Pré operatório, que se desenvolve entre os
dois aos sete anos; Operatório concreto, que compreende a idade de oito à 11 anos; e,
por fim Operatório formal, sendo este desenvolvido a partir dos 11 anos. Cada etapa é
definida pelo desenvolvimento cognitivo da criança, por exemplo, no estágio operatório
concreto, a criança interioriza a noção de distância, velocidade, espaço, causalidade.
Outro autor que se propõem a dividir a aprendizagem em etapas de desenvolvimento é
Lev Vygotsky (1987). Segundo Vygotsky a aprendizagem desperta processos internos
de desenvolvimento, que operam quando o indivíduo interage com seu ambiente. Tais
visões de aprendizagem se baseiam na interiorização/internalização de conteúdo,
entretanto quando se questiona a respeito da avaliação da aprendizagem, o critério para
verificar tal interiorização é sempre o comportamento observado de forma “aberta”. Por
exemplo, a avaliação da fase de desenvolvimento operatório concreto na criança se dá
quando ela emite um comportamento “adequado” em relação à noções espaciais.
Admitindo que a aprendizagem ocorra no ambiente externo e a avaliação desta
aprendizagem acontece por critérios comportamentais (também externo) o conceito de
aprendizagem abordado neste artigo é o proposto por Skinner (1953) ao relatar que
aprendizagem é o processo que produz mudança no comportamento, sendo que os
critérios de mudança devem vir do próprio comportamento e comportamento sendo
avaliado através da frequência em que uma resposta ocorre, em outras palavras uma
pessoa aprende na medida em que a frequência do seu comportamento se altera.
COMPORTAMENTO APRENDIDO POR REGRAS OU CONTROLADO POR
CONTINGÊNCIAS – SENSIBILIDADE
A frequência de um comportamento pode sofrer alteração a depender da
instrução que é dada a pessoa, isso pode ser constatado pelo estudo de Ayllone Azrin
(1964) que foi realizado em dois experimentos. No primeiro participaram 18 pacientes
de um hospital psiquiátrico que tinham rejeição por utilizar talheres durante as
refeições. O experimento constituiu da observação da frequência de utilização de
talheres em três etapas distintas da pesquisa: 10 refeições ocorridas sem nenhuma
alteração (Fase de linha de base), 20 refeições com liberação de um pedaço de doce,
copo extra de café, copo de leite ou um cigarro logo após a refeição para aqueles que
utilizassem talheres (Fase de consequências operantes) e 10 refeições em que o instrutor
dizia ao paciente: “Por favor, pegue seu garfo, faca ou colher e você terá a escolhe de
copo de leite, café, doce ou cigarro” (tradução nossa) e caso os pacientes usassem os
talheres, seria disponibilizado as mesmas consequências da fase anterior (Fase de
instrução mais consequência operante). No segundo experimento a fase de instrução foi
realizada logo após a Fase de linha de base e por fim houve a Fase de instrução mais
consequência operante por último.
Foi possível notar que o comportamento não se alterou significativamente em
função da introdução das consequências operantes no primeiro experimento, entretanto
a utilização média de talheres foi acima de 70 % da utilização nas fases anteriores,
sugerindo que as instruções foram uteis para a aprendizagem de utilização de talheres.
No segundo experimento, quando se finalizou a Fase de linha de base e foi dadas
instruções sem consequência operante, a média de utilização de talheres subiu para 50%
nos pacientes e para 100% de utilização de talheres na etapa onde houve instruções mais
consequências operantes. Isso tornou possível a conclusão que a instrução produz
aprendizagem, entretanto as consequências daquilo que é aprendido parece exercer
papel importante na manutenção do comportamento (AYLLON & AZRIN, 1964).
A partir do resultado de Ayllon e Azrin (1964) levantou-se a questão de se a
instrução exerce um papel mais importante ou menos importante na aprendizagem de
comportamentos novos, para investigar esta questão Lippman e Meyer (1967)
instruíram participantes a ganhar pontos por pressionar botão baseado, ou no número de
pressões, ou no intervalo entre o ponto ganho e a próxima pressão. Entretanto, todos os
participantes ganharam pontos de acordo com Intervalo Fixo 20 s1. Todos os
participantes que receberam instruções enfocando a contingência temporal emitiram
respostas com padrão de scallop2 a partir do terceiro ponto ganho, enquanto que dois de
três sujeitos que receberam instruções baseadas no numero de resposta não
apresentaram esse padrão, e um dos três que recebeu instruções baseadas no número de
respostas respondeu com um padrão de scallop após o décimo primeiro ponto recebido.
Estes resultados parecem identificar que o comportamento aprendido por regra pode se
manter a despeito das consequências programadas.
Galizio (1979) ponderou a conclusão de que a instrução deixaria a pessoa
insensível às consequências do seu comportamento e que ela seguiria a regra a despeito
de qualquer consequência. Para tanto expôs estudante a um esquema de perda de pontos
que poderia ser evitado caso um comportamento fosse emitido. Foi possível concluir
1
Programa de reforço que libera uma consequência para a primeira resposta após a
passagem de um tempo fixo decorrido da última liberação da consequência (Lattal,
1991). Por exemplo, e um FI 10 s, a consequência é liberada contingente à primeira
resposta após a passagem de 10 segundos decorridos desde última liberação da
consequência. Respostas que ocorrem antes de terminado o intervalo não têm
consequências programas.
2
Definido pelo aumento gradual no numero de resposta conforme vai se aproximando o
final do intervalo. Em curvas de registro cumulativo é possível verificar a formação de
curvas pouco acentuadas, identificadas pela palavra em inglês scallop.
que em programas de consequência onde fica evidente a discrepância entre a regra e a
liberação da consequência para o comportamento, o comportamento varia em função da
consequência e em programas em que a pessoa não tem a oportunidade de entrar em
contato com tal discrepância então o seguimento da regra se mantém a despeito da
consequência.
COMPORTAMENTO APRENDIDO POR REGRAS OU CONTROLADO POR
CONTINGÊNCIAS – VELOCIDADE
Muito embora a discussão sobre a melhor forma de produzir aprendizagem
tenha causado discordâncias entre experimentadores no quesito sensibilidade as
consequências programadas, alguns dados sugerem fortemente que o comportamento
aprendido por regra é adquirido mais rápido do que o comportamento que fica sobre
controle das consequências programadas. O estudo de Hayes, Brownstein, Hass
eGreenway(1986) expôs participantes a um programa múltiplo3 FR 18-DRL 6 s. Os
valores dos componentes não mudaram durante todas as sessões e se alternavam a cada
2 minutos, independente do desempenho do participante. Os participantes foram
distribuídos em quatro grupos de acordo com a instrução que receberam. O Grupo 1 não
recebeu instrução acerca da taxa de respostas; o Grupo 2 recebeu orientação para
responder devagar; o Grupo 3 recebeu instrução para responder rápido e o Grupo 4
recebeu instruções para responder rápido no componente FR e devagar no componente
DRL. A aprendizagem foi avaliada por meio da diferenciação na taxa de respostas entre
os componentes e esta foi avaliada por meio da divisão do número total de respostas no
componente com menor taxa de respostas pela soma do total de respostas nos dois
3
Programa de reforço com dois componentes que vigoram independentes. No primeiro
componente (neste exemplo, FR) a consequência é liberada após a emissão de um
número fixo de respostas, enquanto que no segundo componente (neste exemplo, DRL)
a consequência é liberada para a primeira resposta após a passagem de um tempo fixo
decorrido da emissão da resposta imediatamente anterior [i.e., a consequência
programada ocorre para todas as respostas com intervalo entre respostas (IRT) maiores
ou igual a t segundos (IRT >= t segundos)]. Cada componente é acompanhado por um
estímulo distinto (Lattal, 1991).
componentes. Diferenciação da taxa de respostas foi admitida quando tal divisão
resultava em um número menor que 0,25 (desde que a taxa de respostas mais baixa
tivesse ocorrido no componente DRL). De 19 participantes que compunham o Grupo 1,
nove não apresentaram diferenciação na taxa de respostas, e dos 10 participantes que
apresentaram diferenciação, quatro emitiram maior taxa de respostas no componente
DRL do que no componente FR, enquanto que 15 dos 16 participantes do Grupo 4
emitiram taxa de respostas maiores no FR em relação àquelas do DRL.
Estes resultados foram replicados por do estudo de Hayes, Brownstein,
Zettle,RosenfarbeKorn (1986, Experimento 1) que, ao fazerem o mesmo procedimento,
constataram que nenhum participante do Grupo 1 emitiu taxa de respostas diferenciadas
de modo a ganhar mais do que dois pontos em ambos componentes. Embora a taxa de
respostas dos participantes do Grupo 1 tenha sido maior no componente FR do que no
DRL, apenas na última sessão foi notada larga diferença na taxa de respostas para dois
de quatro participantes. Por outro lado, todos os quatro participantes do Grupo 4
emitiram taxas de respostas diferenciadas desde o início da primeira sessão.
De acordo com os resultados descritos até este momento conclui-se que o
comportamento pode ser ensinado mais rápido com regras do que com a exposição
direta as consequências do comportamento. Okouchi (1999) questiona esta conclusão e
sugere que o tipo de apresentação das consequências pode interferir na consumação da
aprendizagem do comportamento. Para chegar esta conclusão ele expôs quatro
participantesinicialmente a um múltiplo FR 18-DRL 2 s e os parâmetros dos programas
de reforço eram aumentados gradualmente, sessão a sessão, até que os valores dos
componentes do programa múltiplo fossem estabelecidos em FR 45 e DRL 5 s. Cada
componente era apresentado uma vez por sessão. Durante o componente FR o botão de
respostas era de cor verde e durante o componente DRL o botão de respostas era
vermelho. Quando os valores finais dos componentes do programa múltiplo foram
estabelecidos, a cor verde e vermelha no centro do botão era substituída pela instrução
para responder devagar durante o componente FR e responder rápido durante o
componente DRL. Os resultados indicaram que, para três de quatro participantes, as
taxas de respostas foram aumentando gradualmente na presença do botão verde e
diminuindo na presença da cor vermelha. Apenas um participante não emitiu taxa de
respostas diferenciada entre os componentes. Além disso, foi observado que as taxas de
respostas se mantiveram diferenciadas, mesmo após a substituição das cores pelas
instruções consideradas “incompatíveis” com a exigência do programa de reforço,
indicando a importância da história de aquisição sob o controle de estímulos na
manutenção da diferenciação na taxa de respostas.
Soares (2008) realizou um estudo sobre história comportamental, no qual taxas
de respostas diferenciadas foram obtidas para todos os participantes. Quatro
universitários foram expostos a um programa múltiplo FR-DRL de liberação de pontos
trocáveis por dinheiro, sendo os valores dos componentes aumentados gradualmente.
Nas duas primeiras sessões, o valor do FR foi mantido em 10 e o valor do DRL foi
aumentando gradualmente de dois em dois segundos até atingir 20 segundos. Na
terceira sessão, o valor do DRL foi fixado em 20 segundos e a razão do FR foi
gradualmente aumentada de 10 para 40 respostas. Os resultados indicaram que a
diferenciação na taxa de respostas foi obtida para todos os participantes.
Diante do exposto parece prudente admitir que a aprendizagem possa ocorrer
tanto pelas instruções quando pela programação das consequências do comportamento
aprendido. Athayde Neto (2010) em um único estudo se propôs investigar as diferenças
da aprendizagem por regra ou por consequências programadas diretas ou graduais, na
velocidade da aprendizagem e sensibilidade do comportamento às mudanças. Para isso
distribuiu 15 participantes em três grupos que receberam diferentes tipos de
aprendizagem, a saber: aprendizagem por exposição gradual às consequências (Grupo
1), aprendizagem por exposição direta às consequências (Grupo 2) e aprendizagem por
regra (Grupo 3). O Grupo 1 passou por três sessões em que os valores de um programa
de reforço múltiplo FR-DRL foram aumento gradualmente, o Grupo 2 foi exposto aos
valores finais do programa de reforço múltiplo FR-DRL e o Grupo 3 foi exposto aos
valores finais do programa de reforço múltiplo ao FR-DRL mas receberam instrução
para responder rápido no componente de FR e devagar no componente de DRL. Após a
este período os participantes que adquiriram um comportamento diferenciado (critério
para determinar a aprendizagem) foram exposto a um programa de reforço múltiplo
EXT-EXT mantendo os mesmo estímulos do programa anterior, esta última etapa teve
por objetivo avaliar a sensibilidade do comportamento frente a uma alteração na
programação das consequências.
Os participantes do Grupo 1 precisaram de três a quatro sessões para atingirem
os critérios de aquisição do comportamento (dada a programação para esse grupo, três
sessões era o mínimo de sessões para que os participantes completassem a fase de
aquisição). Dos participantes que foram expostos diretamente ao múltiplo FR-DRL, sem
instrução acerca da taxa de respostas (Grupo 2), um atingiu o critério de aquisição do
comportamento em duas sessões, dois participantes atingiram o critério de aquisição do
comportamento na quarta sessão de exposição ao múltiplo e dois não atingiram o
critério de aquisição do comportamento em quatro sessões e foram dispensados da
pesquisa. Os participantes do Grupo 3 (Exposição direta com instrução) necessitaram de
duas a três sessõespara atingirem os critérios de aquisição do comportamento. Apesar de
os integrantes do Grupo 3 (com instrução) terem adquirido o comportamento
diferenciado em menos sessões seus comportamentos se alteraram menos em função da
alteração do programa de reforço do que os outros participantes. Esses resultados
sugerem fortemente que o comportamento instruído de fato produz uma aprendizagem
mais rápida quando comparada a exposição as consequências mas também resiste mais
se mantém mais forte a despeito de alterações nas consequências programadas.
CONCLUSÃO
Levando em consideração que a aprendizagem é a alteração do comportamento
sendo medido como frequência em relação a sua frequência inicial torna possível a
investigação de diferentes tipos de aprendizagem. Os resultados experimentais da
aprendizagem por regra ou por exposição ás consequências traz contribuições
importantes na medida em que vai identificando as características de cada tipo de
aprendizagem sobre o comportamento aprendido. Desta forma, o gestor de ensino tem a
possibilidade de planejar estratégias de ensino para promover uma aprendizagem que
privilegia as características do que tem que ser aprendido. Um vendedor, por exemplo,
tem que estar sempre sensível a mudança de ambiente social para conseguir agradar os
diferentes tipos de cliente, neste sentido, um treinamento que produziria um
comportamento sensível as mudanças ambientais seria privilegiado em detrimento de
outros que podem produzir uma aprendizagem mais rápida, mas menos sensíveis às
mudanças.
REFERÊNCIAS
ATHAYDE NETO, C. A. Efeitos da história de aquisição do comportamento sobre
o desempenho de humanos em um programa múltiplo FR-DRL e sobre a
resistência à extinção. Dissertação apresentada ao Programa de Pós-Graduação em
Análise do Comportamento da Universidade Estadual de Londrina, Paraná, Brasil. 52
p.2011
AYLLON, T. & AZRIN, N. H. Reinforcement and instructions with mental patients.
Journal of the Experimental Analysis of Behavior. v. 7, n. 4, p.327-331, 1964.
GALIZIO, M. Contingency-shaped and rule-governed behavior: Instructional control
of human loss avoidance. Journal of the Experimental Analysis of Behavior, 31,
p.53-70, 1979.
HAYES, S. C., BROWNSTEIN, A. J., HAAS, J. R., & GREENWAY, D. E.
Instructions, Multiple Schedules, and Extinction: Distinguishing Rule-Governed from
Scheduled-Controled Behavior. Journal of the Experimental Analysis of Behavior, v.
46, n.2, p.137-147, 1986.
HAYES, S. C., BROWNSTEIN, A. J., ZETTLE, R. D., ROSENFARB, I., & KORN, Z.
Rule-governed behavior and sensitivity to changing consequences of responding. Journal
of the Experimental Analysis of Behavior, n.45, p.237-256, 1986.
LATTAL, K. A. Scheduling positive reinforcers.In I. H. Iversen& K. A. Lattal
(Eds.).Techniques in the behavioral and neural sciences, v. 6, Experimental analysis of
behavior, p. 87-171. Amsterdam: Elsevier. 1991.
LIPPMAN, L. G. & MEYER, M. E. Fixed-interval performance as related to instruct
ions and to subjects'verbalizations of the contingency. Psychonomic Science, 8, p.135136, 1967.
OKOUCHI, H. Instructions as discriminative stimuli. Journal of the Experimental
Analysis of Behavior, 72, p.205-214, 1999.
PIAGET, Jean. Aprendizagem e Conhecimento. In.: Aprendizagem e conhecimento.
Tradução Equipe da Livraria Freitas Bastos. Rio de Janeiro: Freitas Bastos. 1974.
SOARES, P.G. Controle de Estímulos e História Comportamental em Humanos.
Dissertação apresentada ao Programa de Mestrado em Análise do Comportamento da
Universidade Estadual de Londrina. 2008.
SKINNER, B.F. Science and Human Behavior. New York, 1953: MacMillan. 1953
VYGOTSKY, L. S. Pensamento e Linguagem. São Paulo: Martins Fontes. 1987
Download

EFEITOS DE DIFERENTES FORMAS EM UMA ANÁLISE