Condicionamento Operacional: Definição, Características e Exemplos

Condicionamento operante ou O condicionamento instrumental é um tipo de aprendizado em que o comportamento é controlado com conseqüências.

Baseia-se na ideia de que os comportamentos de reforço tendem a aparecer em mais ocasiões, enquanto os comportamentos que são punidos se extinguem.

Qual é a diferença entre o condicionamento operante e o condicionamento clássico? No condicionamento operante, uma resposta voluntária é seguida por um reforçador. Dessa forma, a resposta voluntária (por exemplo, estudar para um exame) é mais provável de ocorrer no futuro. Pelo contrário, no condicionamento clássico, um estímulo ativa automaticamente uma resposta involuntária.

O condicionamento operante pode ser descrito como um processo que tenta modificar o comportamento através do uso de reforços positivos e negativos. Através do condicionamento operante, um indivíduo faz uma associação entre um comportamento particular e uma conseqüência. Exemplos:

  • Os pais recompensam boas notas por uma criança com doces ou algum outro prêmio.
  • Um professor recompensa aqueles alunos que são calmos e educados. Os alunos percebem que, ao se comportarem assim, recebem mais pontos.
  • Um alimento é dado a um animal toda vez que uma alavanca é pressionada.

BF Skinner (1938) cunhou o termo condicionamento operante. Skinner identificou três tipos de respostas ou operandos que podem seguir o comportamento:

  • Operadores neutros : respostas do ambiente que não aumentam ou diminuem a probabilidade de um comportamento se repetir.
  • Reforçadores : respostas do ambiente que aumentam a probabilidade de repetição de um comportamento. Reforçadores podem ser positivos ou negativos.
  • Punições : respostas do ambiente que diminuem a probabilidade de um comportamento se repetir. Punição enfraquece o comportamento.

Antecedentes do condicionamento operante

Thorndike foi o primeiro a reconhecer que esse condicionamento inclui mais do que apenas uma resposta e um reforçador. A resposta é dada na presença de certos estímulos, considerando três eventos: o estímulo, a resposta e a conseqüência da resposta ou reforçador.

Essa estrutura facilita o desenvolvimento de diferentes ligações, como a associação entre o estímulo e a resposta, que foi fundamental para Thorndike na formulação da lei do efeito. Com isso, ele afirmou que as respostas que são seguidas por reforçadoras consequências serão mais prováveis ​​de ocorrer quando o estímulo reaparecer.

Pelo contrário, aquelas respostas que são seguidas por consequências negativas terão uma menor probabilidade de ocorrência quando o estímulo reaparecer. A lei do efeito é o antecedente do condicionamento operativo ou do condicionamento instrumental, como foi nomeado por Thorndike.

Mas para Skinner, um psicólogo do behaviorismo, o condicionamento foi o fortalecimento dos comportamentos de acordo com as consequências que anteriormente teriam sido obtidas.

Nesta linha, existem duas formas de condicionamento:

  • O clássico ou pavloviano: baseia-se na associação de estímulos incondicionados e condicionados, sendo as respostas controladas por estímulos antecedentes.
  • Condicionamento operante: os estímulos conseqüentes ou de reforço fazem com que um determinado comportamento seja emitido. Skinner explica que, se o comportamento for seguido por um reforçador positivo, aumentará a probabilidade de tal conduta ser emitida no futuro. Pelo contrário, se uma resposta não for seguida por um reforçador ou se o reforçador for negativo, a probabilidade de emitir o dito comportamento no futuro será menor.

Conceitos básicos de condicionamento operante

Reforço

É responsável pela emissão de respostas, ou seja, a probabilidade de que elas aconteçam, seja ela maior ou menor no futuro. É um estímulo reforçador e consistente, uma vez que ocorre uma vez que a resposta tenha ocorrido.

É impossível saber se um determinado reforçador influencia o comportamento até que ele seja apresentado contingentemente a uma resposta e verifica-se que o comportamento muda como conseqüência do reforçador.

Existem dois tipos de reforço: positivo e negativo. Ambos têm o mesmo propósito de aumentar a probabilidade de que a resposta seja emitida em situações futuras. Além disso, os reforçadores de Skinner são definidos por comportamentos observáveis ​​e mensuráveis.

Reforço positivo

Reforço positivo reforça um comportamento, fornecendo uma conseqüência que um indivíduo acha gratificante.

Reforço Negativo

A remoção de um reforçador desagradável também pode fortalecer um comportamento. Isso é conhecido como reforço negativo porque é a eliminação de um estímulo adverso que é "recompensador" para o animal ou para a pessoa. Reforço negativo reforça o comportamento porque interrompe ou elimina uma experiência desagradável.

Reforçadores Primários

Seriam todos aqueles reforçadores básicos que não precisam de nenhuma história de condicionamento prévio para funcionar como tal. Alguns exemplos seriam água, comida e sexo.

Reforços secundários

Os reforçadores secundários se baseariam em histórias prévias de condicionamento graças à associação com estímulos incondicionados. Alguns exemplos seriam dinheiro e qualificações.

Contingência de três termos

É o modelo básico do condicionamento operante e consiste em três componentes: o estímulo discriminativo, a resposta e o estímulo reforçador.

Um estímulo discriminativo seria aquele que indicaria ao sujeito que o reforçador está disponível, indicando que se ele realizar um determinado comportamento ele poderá obter o referido reforçador. Em contraste, temos o estímulo delta ou estímulos que indicam que o comportamento não levará à obtenção de nenhum tipo de reforçador.

A resposta seria o comportamento que o sujeito irá realizar, cuja execução levará ou não a obtenção do estímulo reforçador.

Um estímulo reforçador, como mencionado acima, é responsável pela emissão do comportamento, já que, graças a sua aparência, a probabilidade de emitir uma resposta aumentará ou diminuirá no futuro.

Conceitos a serem conhecidos sobre o condicionamento operante

Punição

A punição também é medida pelos seus efeitos no comportamento do sujeito. Por outro lado, ao contrário do reforço, o que se pretende é a redução ou supressão de um determinado comportamento.

Uma punição reduz a probabilidade de emitir um comportamento em situações posteriores. No entanto, isso não elimina a resposta, porque se a ameaça de punição diminuir, o comportamento pode reaparecer.

Na punição há também dois tipos ou procedimentos diferentes, punição positiva e punição negativa.

Punição positiva

Isso envolve a apresentação de um estímulo aversivo após a realização de um determinado comportamento. É dado contingentemente à resposta dada pelo sujeito.

Punição negativa

Consiste na eliminação de um estímulo como consequência de um determinado comportamento, isto é, consiste na retirada de um estímulo positivo após a realização de um determinado comportamento.

Extinção

Na extinção, uma resposta é interrompida porque o reforçador não aparece mais. Este processo baseia-se em não fornecer o reforçador correspondente que se espera alcançar e que fez com que esse comportamento fosse mantido ao longo do tempo.

Quando uma resposta é extinta, o estímulo discriminativo torna-se um estímulo de extinção. Esse processo não deve ser confundido com o esquecimento, que é dado quando a força de um comportamento diminui quando ele não é emitido em um período de tempo.

Generalização

Em resposta a uma situação ou estímulo específico, uma resposta é condicionada, que pode aparecer antes de outros estímulos ou situações semelhantes.

Discriminação

Esse processo é o oposto da generalização, na qual ele responde de maneira diferente dependendo do estímulo e do contexto.

Programas de reforço

Skinner também estabeleceu vários programas de reforço, incluindo programas de reforço contínuo e programas de reforço intermitente.

Programas de reforço contínuo

Eles são baseados no constante reforço da resposta a cada vez que é apresentado, ou seja, cada vez que o sujeito executa o comportamento desejado, ele ou ela obterá um estímulo reforçador ou positivo.

Programas de reforço intermitente

Em contraste, aqui o sujeito nem sempre obtém o reforçador ao executar o comportamento desejado. Estes são definidos com base no número de respostas dadas ou no intervalo de tempo entre as respostas, dando origem a diferentes procedimentos.

Programas de taxa fixa

Nestes programas, o reforçador é fornecido quando o sujeito gera respostas fixas e constantes. Por exemplo, em um programa de razão 10, a pessoa obtém o reforçador depois de ter feito dez respostas quando o estímulo é apresentado.

Programas de razão variável

Isto é construído como o anterior, mas neste caso o número de respostas que o sujeito deve dar para obter o reforçador é variável.

O reforçador continuaria a depender do número de respostas emitidas pelo sujeito, mas com uma razão variável, graças à qual o sujeito é impedido de prever quando o reforçador será obtido.

Programas de intervalos fixos

Em programas de intervalo, a obtenção do reforçador não depende do número de respostas que o sujeito dá, mas é determinado pelo tempo decorrido. Consequentemente, a primeira resposta produzida após ter passado por um certo período de tempo é reforçada.

Nos programas de intervalo fixo, o tempo entre reforçador e reforçador é sempre o mesmo.

Programas de intervalo variável

Nestes programas o reforçador é obtido depois de um tempo, embora o tempo seja diferente para cada reforçador recebido.

Mudança comportamental

Aproximações sucessivas ou modelagem

A moldagem consiste na mudança comportamental através da moldagem de comportamentos ou no reforço diferencial de aproximações sucessivas.

Uma série de etapas é seguida para moldar um comportamento concreto. Em primeiro lugar, identifica-se o comportamento inicial que se pretende moldar para saber qual você quer alcançar.

Em seguida, os possíveis reforçadores que serão utilizados são delimitados e o processo é separado em etapas ou etapas para atingir o comportamento final, reforçando cada passo ou abordagem sucessiva até chegar ao último.

Com este procedimento dinâmico, ambos os comportamentos e suas conseqüências são transformados. Nesse sentido, as sucessivas abordagens para um comportamento objetivo são reforçadas.

No entanto, para ser realizado, é necessário partir de um comportamento anterior que o sujeito já realiza, a fim de reforçar gradualmente seu comportamento até atingir o objetivo.

Cadeia

Com ele, um novo comportamento é formado a partir da decomposição em etapas ou sequências mais simples, reforçando cada resposta dada em cada uma das etapas, a fim de levar ao estabelecimento de uma resposta mais complexa no repertório comportamental do sujeito.

Cadeias longas de respostas podem ser formadas usando reforços condicionados, adotando uma unidade funcional cujo estabelecimento leva à aquisição e definição de uma habilidade particular.