BF Skinner: Teoria do Behaviorismo e Condicionamento Operante

Burrhus Frederic Skinner, mais conhecido como BF Skinner, era um psicólogo americano conhecido por suas contribuições no desenvolvimento da teoria do behaviorismo e por seu romance utópico Walden Two (1948).

O behaviorismo assume que todos os comportamentos são respostas a certos estímulos no ambiente, ou conseqüências da história do indivíduo. Embora os behavioristas geralmente aceitem o importante papel da herança na determinação do comportamento, eles se concentram principalmente em fatores ambientais.

Ele é o psicólogo mais reconhecido dentro da corrente do behaviorismo e sua teoria tem sido uma das mais influentes na psicologia.

Nascido na Pensilvânia em 1904, ele começou a trabalhar em suas idéias de comportamento humano depois de obter seu doutorado em Harvard. Os trabalhos de Skinner incluem O Comportamento dos Organismos (1938) e um romance baseado em suas teorias, Walden Two (1948). Ele explorou o behaviorismo em relação à sociedade em livros posteriores, incluindo Beyond Freedom and Human Dignity (1971).

Como aluno do Hamilton College, Skinner desenvolveu uma paixão pela escrita. Ele tentou se tornar um escritor profissional depois de se formar em 1926, mas recebeu pouco sucesso. Dois anos depois, ele decidiu seguir uma nova direção para sua vida; Ele se matriculou na Universidade de Harvard para estudar psicologia.

Skinner considerou o livre-arbítrio uma ilusão e ação humana como dependentes das conseqüências de ações anteriores. Se as conseqüências forem ruins, há uma alta probabilidade de que a ação não seja repetida. Pelo contrário, se as consequências forem boas, é provável que a ação seja repetida. Skinner chamou isso de princípio de reforço.

Para fortalecer o comportamento, Skinner usou o condicionamento operante e, para estudá-lo, inventou a câmara de condicionamento operante, também conhecida como caixa Skinner.

Na década de 1920, Watson havia deixado a psicologia acadêmica e outros behavioristas estavam começando a ser influentes, propondo novas maneiras de aprender além do condicionamento clássico.

O modo de pensar de Skinner era um pouco menos extremo que o de Watson. Skinner acreditava que temos uma mente, mas que é simplesmente mais produtivo estudar comportamentos observáveis em vez de eventos mentais internos.

Introdução ao behaviorismo

O behaviorismo foi o principal paradigma da psicologia entre 1920 e 1950, fundado por John Watson e baseado na crença de que os comportamentos podem ser medidos, treinados e modificados. O behaviorismo poderia ser resumido com a seguinte citação de Watson, considerado o "pai" dessa corrente psicológica:

"Dê-me uma dúzia de crianças saudáveis e bem-educadas, para que eu possa educá-las, e prometo escolher uma ao acaso e treiná-la para me tornar especialista em qualquer coisa que eu possa escolher: médico, advogado, artista, empresário, mendigo ou ladrão, independentemente do seu talento, inclinações, tendências, aptidões, vocações e raça dos seus antepassados ".

John Watson, Behaviorism, 1930

De acordo com os princípios do behaviorismo, todos os comportamentos são aprendidos do ambiente em que crescemos. Os behavioristas não acreditavam em determinações biológicas.

Além disso, eles estavam preocupados principalmente com os comportamentos que poderiam ser observados e acreditavam que não havia muita diferença entre o aprendizado que ocorre nos seres humanos e o que acontece nos animais.

Como o behaviorismo começou?

O médico russo Pavlov foi o primeiro a estudar teorias sobre o behaviorismo na década de 1890. O condicionamento clássico pavloviano foi descoberto por acaso, quando ele descobriu, em um experimento sobre a digestão de seus cães, que eles salivavam quando ele entrava na sala., sem sequer trazer comida com ele.

Para resumir, o condicionamento clássico implica um aprendizado que associa um estímulo incondicionado que traz por padrão uma resposta no organismo (por exemplo, um reflexo) com um novo estímulo, de modo que o último também carrega a mesma resposta.

Esta teoria foi posteriormente desenvolvida por Watson (1913), que foi o psicólogo americano que fundou a escola psicológica comportamental, publicando um artigo chamado "Psicologia como vista por um behaviorista". Mais tarde, ele condicionou uma criança a temer um rato branco.

Thorndike, o psicólogo e pedagogo americano, formalizou o termo "Lei do efeito" em 1905. Em 1936, Skinner, o psicólogo americano que compôs o verdadeiro foco deste artigo, publicou "O comportamento dos organismos" e introduziu os conceitos. de condicionamento operante e modelagem.

Behaviorismo de acordo com Burrhus Frederic Skinner

O trabalho de Skinner estava enraizado na visão do condicionamento clássico como simples demais para constituir uma explicação completa do comportamento humano complexo. Skinner acreditava que a melhor maneira de entender o comportamento humano era verificar as causas de uma ação e suas conseqüências. Ele chamou essa abordagem de "condicionamento operante".

O condicionamento operante tem a ver com o operante: ações intencionais que afetam o ambiente que nos rodeia. Skinner começou a identificar os processos que tornavam a ocorrência de certos comportamentos operantes mais ou menos prováveis.

A teoria de Skinner do condicionamento operante é baseada no trabalho de Thorndike (1905). Edward Thorndike estudou a aprendizagem em animais usando uma caixa de quebra-cabeças para propor a teoria conhecida como "A lei do efeito".

Condicionamento operante de Skinner

Como já dissemos, Skinner é considerado o pai do condicionamento operante, mas seu trabalho é baseado na lei do efeito de Thorndike. Skinner introduziu um novo termo na lei do efeito: reforço. O comportamento que é reforçado tende a se repetir; comportamento que não é reforçado tende a desaparecer (enfraquece).

Skinner estudou o condicionamento operante conduzindo experimentos em animais, que ele colocou em uma "caixa de Skinner", semelhante à caixa de quebra-cabeças de Thorndike.

Skinner cunhou o termo "condicionamento operante", que envolve a mudança de um comportamento usando reforços dados após a resposta desejada. Skinner identificou três tipos de respostas ou operandos que podem seguir o comportamento:

Operadores neutros. São respostas do ambiente que não aumentam nem diminuem a probabilidade de que o comportamento se repita.
Essas respostas aumentam a probabilidade de que o comportamento se repita. Reforços podem ser positivos ou negativos.
São respostas que diminuem a probabilidade de que um comportamento se repita; punições enfraquecem o comportamento em questão.

Todos nós já experimentamos exemplos de comportamentos que foram afetados por reforços e punições. Quando éramos crianças, por exemplo, se falávamos durante uma aula, a professora nos dizia para ficar em silêncio. Essa resposta do professor é uma punição que, pelo menos supostamente, deveria enfraquecer o comportamento de falar com o colega durante a aula.

Durante a adolescência, por exemplo, o uso de um estilo específico ou marca de roupas poderia ser reforçado positivamente por colegas da mesma idade através de bajulação, aceitação social ou simplesmente um gesto gentil. Isso reforça e torna mais provável a repetição do comportamento de usar uma determinada roupa de marca.

Reforço positivo

Skinner demonstrou como o reforço positivo funciona colocando um rato com fome em sua caixa de Skinner. A caixa continha uma alavanca de um lado e o rato, quando se movia pela caixa, acidentalmente pressionava a alavanca. Imediatamente, um grânulo de comida caiu em um pequeno recipiente ao lado da alavanca.

Os ratos rapidamente aprenderam a ir diretamente para a alavanca depois de terem estado algumas vezes na caixa. A conseqüência de receber a comida, se eles pressionassem a alavanca, assegurava que eles repetissem o comportamento repetidas vezes.

O reforço positivo fortalece um comportamento ao fornecer uma consequência que o indivíduo considera gratificante. Por exemplo, se seu professor lhe der dinheiro toda vez que concluir o dever de casa, é mais provável que você repita o comportamento de fazer o dever de casa no futuro, fortalecendo esse comportamento.

Reforço Negativo

A remoção de um reforço desagradável também pode fortalecer um certo comportamento. Isso é conhecido como reforço negativo, porque é a eliminação de um estímulo adverso que é "recompensador" para a pessoa ou para o animal. O reforço negativo fortalece o comportamento porque interrompe ou elimina uma experiência desagradável.

Por exemplo, quando você está com dor de cabeça, você toma uma aspirina para aliviá-la. O fato de que a dor desaparece é um reforço negativo para o comportamento de tomar uma aspirina, tornando mais provável que ocorra novamente no futuro quando você tiver uma dor de cabeça.

Skinner estudou como o reforço negativo funcionava, novamente, colocando um rato em sua caixa de Skinner e expondo-o a uma corrente elétrica desagradável que lhe causou algum grau de desconforto. Desta vez, a alavanca da caixa fez com que a corrente elétrica parasse.

Os ratos, a princípio, pressionaram a alavanca por acidente, mas logo aprenderam a pressioná-la para interromper a corrente elétrica. A consequência de escapar para o riacho garantiu que eles repetissem a ação toda vez que fossem colocados na caixa ou sempre que sentissem a eletricidade.

Na verdade, Skinner ensinou aos ratos até mesmo para evitar a corrente elétrica, acendendo uma luz imediatamente antes da corrente elétrica aparecer. Os ratos aprenderam cedo a pressionar a alavanca quando a luz se acendeu, porque sabiam que isso impediria que a corrente elétrica fosse ligada.

Essas duas respostas aprendidas são conhecidas como "aprender pela fuga" e "aprender pela evitação".

Punição

A punição é definida como o oposto do reforço, uma vez que é projetada para enfraquecer ou eliminar uma resposta em vez de aumentar sua probabilidade. É um evento aversivo que diminui o comportamento que se segue.

Como no reforço, a punição pode funcionar diretamente, aplicando-se um estímulo desagradável, como um choque elétrico após uma resposta, ou eliminando um estímulo potencialmente recompensador.

Por exemplo, descontando dinheiro do pagamento de alguém para punir comportamentos indesejáveis. É necessário salientar que nem sempre é fácil distinguir entre punições e reforços negativos.

Existem vários problemas ao usar punições, como os seguintes:

O comportamento punido não é esquecido, é suprimido. Esse comportamento retorna quando a punição não está presente.
A punição pode causar um aumento na agressão. Pode mostrar que a agressividade é uma maneira de lidar com problemas.
As punições criam medo que generaliza para comportamentos indesejáveis, por exemplo, medo de ir à escola.
Muitas vezes, a punição não modela o comportamento em direção ao objetivo desejado. O reforço diz-lhe o que fazer, enquanto a punição só lhe diz o que não fazer.

Comportamentos de modelagem

Outra importante contribuição de Skinner é a noção de modelagem comportamental por meio de aproximações sucessivas. Skinner argumenta que os princípios do condicionamento operante podem ser usados para produzir comportamentos extremamente complexos se as recompensas e punições forem feitas de uma maneira que encoraje o organismo em questão a estar mais perto e mais perto do comportamento desejado.

Para que este resultado ocorra, as condições (ou contingências) necessárias para receber a recompensa devem mudar cada vez que o organismo dá um passo para estar mais próximo do comportamento desejado.

De acordo com Skinner, a maior parte do comportamento humano (incluindo a linguagem) pode ser explicada como um produto desse tipo de aproximação sucessiva.

Modificação do comportamento

A modificação do comportamento é um conjunto de terapias ou técnicas baseadas no condicionamento operante. O princípio básico é mudar os eventos ambientais relacionados a um determinado comportamento de uma pessoa. Por exemplo, reforce os comportamentos desejados e ignore ou castigue os indesejados.

No entanto, isso não é tão simples quanto parece. Reforçar sempre um comportamento desejado, por exemplo, é basicamente subornar alguém.

Existem vários tipos de reforço positivo. O reforço primário ocorre quando uma recompensa fortalece um comportamento por conta própria. O reforço secundário ocorre quando algo reforça um comportamento porque leva a um reforçador primário.

Aplicações educacionais práticas

Na situação da aprendizagem convencional, o condicionamento operante aplica-se a tópicos relacionados a salas de aula e estudo, em vez de ser aplicado a conteúdos relacionados à aprendizagem.

Com relação à aplicação educacional da modelagem comportamental, uma maneira simples de modelar um comportamento é fornecer feedback (feedback) sobre o desempenho do aprendiz (por exemplo, elogios, sinais de aprovação, encorajamento).

Por exemplo, se um professor gostaria de encorajar seus alunos a responder perguntas em sala de aula, ele deve elogiá-los a cada tentativa, independentemente de a resposta estar correta ou não. Gradualmente, o professor só elogiará os alunos quando suas respostas estiverem corretas e, com o tempo, apenas respostas excepcionais serão elogiadas.

Comportamentos indesejados, como atrasos na hora de ir para a aula e dominar as discussões em sala de aula, podem ser extinguidos por serem ignorados pelo professor, em vez de serem reforçados por atrair a atenção do professor para esses comportamentos.

Saber que você teve sucesso também é importante, pois motiva a aprendizagem futura. No entanto, é importante variar o tipo de reforço que é fornecido, para que o comportamento seja mantido. Esta não é uma tarefa simples, já que o professor pode parecer desonesto se pensar muito sobre como deve se comportar ao elogiar um aluno.

Outras aplicações práticas e avaliação crítica

O condicionamento operante pode ser usado para explicar um grande número de comportamentos, desde o processo de aprendizado até o vício e a aquisição da linguagem. Ele também tem aplicações práticas, como as educacionais que descrevemos anteriormente, e nas prisões, hospitais psiquiátricos e economia.

Em economia, uma aplicação conhecida de condicionamento operante é a economia simbólica, um sistema pelo qual a pessoa recebe fichas logo após realizar o comportamento desejado. Os chips são coletados e depois trocados por algum objeto significativo para o indivíduo.

O uso de pesquisas com animais no condicionamento operante também levanta a questão da extrapolação dos achados.

Alguns psicólogos afirmam que não podemos generalizar para o comportamento humano resultados concluídos de pesquisas com animais, uma vez que sua anatomia e fisiologia é diferente e não podem refletir sobre suas experiências ou invocar razão, paciência e memória como seres humanos.