Qual é a teoria de reforço de Skinner?

A teoria do reforço de Skinner, também conhecida como teoria do condicionamento operante, é uma das bases da chamada psicologia cognitivo-comportamental. Baseia-se na ideia de que os organismos aprendem comportamentos ou outros baseados em prêmios (chamados reforços) ou punições.

Apesar da aceitação pela comunidade científica do condicionamento clássico de Pavlov, Skinner acreditava que esse modelo era simples demais para explicar completamente a aprendizagem humana.

Portanto, com base na lei do efeito de Thorndike, ele começou a investigar como os animais aprenderam a realizar diferentes comportamentos. Depois da formulação da teoria, o operativo conodicionamiento serviu durante muitos anos como a única explicação do comportamento humano.

Mais tarde, surgiram muitas outras abordagens psicológicas que desafiaram alguns dos fundamentos da Psicologia Comportamental, com base nas teorias de Skinner.

Especificamente, nos anos 70 surgiu outra abordagem (psicologia cognitiva), que complementou a teoria do condicionamento. Dessa forma, o modelo predominante atualmente surge na psicologia, a teoria cognitivo - comportamental.

Bases da teoria do reforço de Skinner

Skinner acreditava que a melhor maneira de entender o comportamento (humano e animal) era observar as causas de uma ação e suas conseqüências. Essa abordagem foi mais tarde conhecida como "condicionamento operante".

O nome surge devido aos chamados "operantes", que são ações que um organismo realiza e que afetam o meio ambiente. Esse efeito pode ser positivo (como um animal encontrando comida se descer um certo caminho) ou negativo (como queimar sua mão ao tocar o fogo).

Se o organismo atinge um efeito positivo, considera-se que o comportamento é "reforçado" e, portanto, é mais provável que ocorra novamente no futuro. Pelo contrário, se o efeito obtido for negativo, o comportamento é "punido" e tenderá a diminuir sua freqüência no futuro, ou até mesmo a desaparecer.

Skinner estudou as leis do condicionamento operante usando animais, especialmente pombos, que ele introduziu na chamada "Caixa de Skinner".

Nele, os animais eram recompensados ​​ou punidos com base nos comportamentos que exibiam, permitindo ao cientista observar os efeitos de diferentes tipos de reforços e punições, sua freqüência e ...

Tipos de respostas na teoria de Skinner

Apesar de comumente ouvirmos falar apenas de reforços e punições, Skinner dividiu as possíveis respostas ao comportamento de um organismo em cinco tipos: resposta neutra, reforço positivo, reforço negativo, punição positiva e punição negativa.

Embora cada um deles tenha um efeito diferente sobre o comportamento do organismo, eles podem ser agrupados em três tipos: aqueles que não provocam mudanças no comportamento, aqueles que aumentam a probabilidade de que eles ocorrerão novamente no futuro, e aqueles que eles diminuem.

Resposta neutra

Os operadores neutros são todas as conseqüências de uma ação que não aumenta nem diminui a probabilidade de que isso aconteça novamente no futuro. Eles são os menos comuns de todos os tipos de respostas: em geral, muito poucos operadores são totalmente neutros.

Um exemplo de operante neutro seria o seguinte. Se um aluno sai para mostrar um trabalho na frente de sua classe e não recebe uma resposta calorosa (aplausos, parabéns ...), mas não uma resposta ruim, ele provavelmente não se sente mais ou menos predisposto do que antes a apresentar um novo. Eu trabalho em público.

Reforço positivo

Como já sabemos, um reforço é um operante que aumenta a probabilidade de um comportamento ocorrer novamente no futuro. No entanto, o que significa que um reforço é positivo?

O rótulo de "positivo", tanto para reforços quanto para punições, não tem nada a ver se a resposta é boa ou ruim. Pelo contrário, um operante é considerado positivo se algo é dado ao organismo, e como negativo, se algo é tirado dele.

Portanto, um reforço positivo é um operante no qual o organismo recebe algo que torna mais provável a repetição do comportamento premiado no futuro.

O exemplo clássico é o seguinte: se um rato apertar uma alavanca e receber comida, será mais provável que a pressione novamente no futuro.

Reforço Negativo

Já vimos que "reforço" significa que a probabilidade de um comportamento no futuro aumenta, e "negativo", que algo é eliminado em resposta ao organismo.

Ou seja, um reforço negativo seria um operante no qual algo desagradável é eliminado para o animal, o que faz com que a probabilidade de o comportamento reaparecer aumente.

Um exemplo em que é claro como esse tipo de reforço funciona é com o comportamento de coçar. Quando uma parte do corpo nos morde, temos uma sensação desagradável da qual queremos nos livrar; quando nos coçamos, esse desconforto desaparece, então o comportamento é reforçado e é mais provável que o façamos novamente no futuro.

Punição positiva

O outro lado da moeda dos reforços são as chamadas "punições": operantes que fazem com que o comportamento se repita com menos frequência, ou até mesmo desapareça completamente.

Punição positiva é o que comumente entendemos como castigo em linguagem coloquial. Consiste em uma resposta desagradável ao organismo, que ao recebê-lo tenderá a diminuir o comportamento que o levou a experimentar a punição.

Exemplos de punição positiva seriam os seguintes: queimar ao tocar algo quente, receber um grito depois de fazer algo errado, sentir-se enjoado depois de comer alguma coisa em mau estado ...

Punição negativa

O último tipo de operante é, talvez, o mais complicado de entender para a maioria das pessoas. É uma punição, então sua principal função é reduzir a frequência de um comportamento; no entanto, a maneira de punir o organismo é remover algo que lhe agrade.

Um exemplo muito claro é pegar um brinquedo de uma criança se ele estiver se comportando mal, parar de fazê-lo ou retirar a atenção de alguém se ele estiver nos tratando mal.