- Antecedenti del condizionamento operante
- Concetti di base del condizionamento operante
- - Rinforzo
- Rinforzo positivo
- Rinforzo negativo
- Rinforzi primari
- Rinforzi secondari
- - Imprevisto a tre termini
- - Punizione
- Punizione positiva
- Punizione negativa
- - Estinzione
- - Generalizzazione
- - Discriminazione
- Programmi di rinforzo
- Programmi di rinforzo continuo
- Programmi intermittenti di rinforzo
- Programmi a rapporto fisso
- Programmi a rapporto variabile
- Programmi a intervalli fissi
- Programmi a intervalli variabili
- Cambiamento comportamentale
- Approcci o shaping successivi
- chaining
- Riferimenti
Il condizionamento operante o condizionamento strumentale è un tipo di apprendimento in cui il comportamento è controllato con le conseguenze. Si basa sull'idea che i comportamenti rinforzati tendono a manifestarsi più spesso, mentre i comportamenti puniti vengono estinti.
Qual è la differenza tra condizionamento operante e condizionamento classico? Nel condizionamento operante, una risposta volontaria è seguita da un rinforzo. In questo modo, è più probabile che la risposta volontaria (ad esempio, studiare per un esame) abbia luogo in futuro.
Scatola Skinner
Al contrario, nel condizionamento classico, uno stimolo innesca automaticamente una risposta involontaria. Ad esempio, il cibo che un cane vede fa sì che produca saliva.
Il condizionamento operante può essere descritto come un processo che tenta di modificare il comportamento attraverso l'uso di rinforzi positivi e negativi. Attraverso il condizionamento operante, un individuo crea un'associazione tra un particolare comportamento e una conseguenza. Esempi:
- I genitori ricompensano i buoni voti di un bambino con caramelle o qualche altra ricompensa.
- Un insegnante premia quegli studenti che sono calmi ed educati. Gli studenti scoprono che comportandosi in questo modo ricevono più punti.
- Ogni volta che si preme una leva viene dato un alimento a un animale.
BF Skinner (1938) ha coniato il termine condizionamento operante. Skinner ha identificato tre tipi di risposte o operanti:
- Operatori neutri : risposte dall'ambiente che non aumentano né diminuiscono la probabilità che un comportamento si ripeta.
- Rinforzi : risposte dall'ambiente che aumentano la probabilità di ripetere un comportamento. I rinforzi possono essere positivi o negativi.
- Punizioni : risposte dall'ambiente che diminuiscono la probabilità che un comportamento si ripeta. La punizione indebolisce il comportamento.
Antecedenti del condizionamento operante
Thorndike è stato il primo a riconoscere che il condizionamento include più di una semplice risposta e un rinforzo. La risposta avviene in presenza di determinati stimoli, considerando tre eventi: lo stimolo, la risposta e la conseguenza della risposta o rinforzo.
Edward Thorndike. A cura di: Popular Science Monthly Volume 80
Questa struttura facilita l'associazione tra stimolo e risposta. Nella sua legge dell'effetto, Thorndike ha affermato che le risposte che sono seguite da conseguenze rinforzanti avranno una maggiore probabilità di accadimento quando lo stimolo riappare.
Al contrario, quelle risposte che sono seguite da conseguenze negative avranno una minore probabilità di accadimento quando lo stimolo riapparirà. La legge dell'effetto è l'antecedente del condizionamento operante o del condizionamento strumentale, come è stato chiamato da Thorndike.
Per Skinner, psicologo comportamentale, il condizionamento era il rafforzamento dei comportamenti in base alle conseguenze che erano state ottenute in precedenza.
conciatore
Lungo queste linee, ci sono due forme di condizionamento:
- Il classico o pavloviano: si basa sull'associazione di stimoli incondizionati e condizionati, le risposte essendo controllate dagli stimoli antecedenti.
- Condizionamento operante: stimoli conseguenti o rinforzanti provocano l'emissione di un determinato comportamento. Skinner spiega che se il comportamento è seguito da un rinforzo positivo, aumenterebbe la probabilità di emissione di tale comportamento in futuro. Al contrario, se una risposta non è seguita da un rinforzo o tale rinforzo è negativo, la probabilità di emettere tale comportamento in futuro sarà inferiore.
Il topo in scatola di Skinner
Concetti di base del condizionamento operante
- Rinforzo
È responsabile dell'emissione delle risposte, ovvero la probabilità che si verifichino, è maggiore o minore in futuro. È uno stimolo di rinforzo e conseguente, poiché si verifica una volta avvenuta la risposta.
È impossibile sapere se un particolare rinforzo influenza il comportamento fino a quando non è subordinato a una risposta e viene mostrato che il comportamento cambia come conseguenza del rinforzo.
Esistono due tipi di rinforzo: positivo e negativo. Entrambi hanno lo stesso scopo di aumentare la probabilità che la risposta venga emessa in situazioni future. Inoltre, per Skinner, i rinforzi sono definiti da comportamenti osservabili e misurabili.
Rinforzo positivo
Il rinforzo positivo rafforza un comportamento fornendo una conseguenza che un individuo trova gratificante. Ad esempio, dare da mangiare a un cane dopo che si è seduto. In questo caso, il comportamento di seduta sarebbe rafforzato.
Rinforzo negativo
Anche la rimozione di uno spiacevole rinforzo può rafforzare un comportamento. Questo è noto come rinforzo negativo perché è la rimozione di uno stimolo avverso all'animale o alla persona che fa condizionare il comportamento.
Il rinforzo negativo rafforza il comportamento interrompendo o eliminando un'esperienza spiacevole.
Ad esempio, se un bambino subisce abusi a casa e quando esce in strada non subisce abusi, il comportamento di uscire sarebbe rafforzato.
Rinforzi primari
Sarebbero tutti quei rinforzi di base che non hanno bisogno di alcuna storia di condizionamento precedente per funzionare come tali. Alcuni esempi potrebbero essere l'acqua, il cibo e il sesso.
Rinforzi secondari
I rinforzi secondari sarebbero basati su precedenti storie di condizionamento grazie all'associazione con stimoli incondizionati. Alcuni esempi potrebbero essere soldi e qualifiche.
- Imprevisto a tre termini
Fonte: Joshua Seong / Verywell
È il modello di base del condizionamento operante ed è costituito da tre componenti: lo stimolo discriminante, la risposta e lo stimolo di rinforzo.
Uno stimolo discriminante sarebbe quello che indicherà al soggetto che il rinforzo è disponibile, indicando che se esegue un certo comportamento, potrà ottenere detto rinforzo. Al contrario abbiamo lo stimolo delta o stimoli che indicano che il comportamento non porterà all'ottenimento di alcun tipo di rinforzo.
La risposta sarebbe il comportamento che il soggetto eseguirà, la cui esecuzione porterà o meno ad ottenere lo stimolo di rinforzo.
Uno stimolo rinforzante è responsabile dell'emissione del comportamento, poiché grazie alla sua comparsa la probabilità di emissione di una risposta aumenterà o diminuirà in futuro.
- Punizione
La punizione si misura anche dai suoi effetti sul comportamento del soggetto. Invece, a differenza del rinforzo, ciò che si intende è la riduzione o la soppressione di un determinato comportamento.
Una punizione riduce la probabilità di emettere un comportamento in situazioni successive. Tuttavia, non elimina la risposta perché se la minaccia di punizione diminuisce, il comportamento può ricomparire.
Nella punizione ci sono anche due diversi tipi o procedure, punizione positiva e punizione negativa.
Punizione positiva
Ciò implica la presentazione di uno stimolo avversivo dopo aver eseguito un determinato comportamento. È dato in modo contingente alla risposta data dal soggetto.
Ad esempio, quando il liquido viene messo sulle unghie dei bambini per prevenire l'onicofagia. Il bambino assapora il cattivo sapore del liquido (punizione positiva) e la probabilità che si morda di nuovo le unghie è ridotta.
Punizione negativa
Consiste nell'eliminazione di uno stimolo come conseguenza di un determinato comportamento, ovvero consiste nel ritiro di uno stimolo positivo dopo aver eseguito un determinato comportamento.
Ad esempio, se un bambino si ritira dall'uso della console di gioco dopo aver fallito un esame.
- Estinzione
In estinzione, una risposta viene interrotta perché il rinforzo non compare più. Questo processo si basa sulla mancata fornitura del rinforzo corrispondente che ci si aspetta di ottenere e che ha determinato il mantenimento di quel comportamento nel tempo.
Quando una risposta si spegne, lo stimolo discriminante diventa lo stimolo di estinzione. Questo processo non deve essere confuso con l'oblio, che si verifica quando la forza di un comportamento diminuisce non essendo stato emesso in un periodo di tempo.
Ad esempio, se un bambino non riceve denaro nonostante le continue lamentele, il comportamento lamentoso si estinguerebbe.
- Generalizzazione
Di fronte a una data situazione o stimolo, viene condizionata una risposta, che può manifestarsi prima di altri stimoli o situazioni simili.
- Discriminazione
Questo processo è l'opposto della generalizzazione, risponde in modo diverso a seconda dello stimolo e del contesto.
Programmi di rinforzo
Skinner ha anche stabilito vari programmi di rinforzo attraverso la sua ricerca, inclusi programmi di rinforzo continuo e programmi di rinforzo intermittente.
Programmi di rinforzo continuo
Si basano sul rafforzamento costante della risposta ogni volta che si verifica, cioè ogni volta che il soggetto esegue il comportamento desiderato, otterrà uno stimolo rinforzante o positivo.
Programmi intermittenti di rinforzo
D'altra parte, qui il soggetto non sempre ottiene il rinforzo eseguendo il comportamento desiderato. Questi sono definiti in base al numero di risposte fornite o all'intervallo di tempo tra le risposte, portando a procedure diverse.
Programmi a rapporto fisso
In questi programmi il rinforzo viene fornito quando il soggetto genera risposte fisse e costanti. Ad esempio, in un programma rapporto 10 la persona ottiene il rinforzo dopo aver dato dieci risposte quando viene presentato lo stimolo.
Programmi a rapporto variabile
Questo è costruito come il precedente, ma in questo caso il numero di risposte che il soggetto deve dare per ottenere il rinforzo è variabile.
Il rinforzo continuerebbe a dipendere dal numero di risposte emesse dal soggetto ma con un rapporto variabile, grazie al quale si impedisce al soggetto di prevedere quando sarà ottenuto il rinforzo.
Programmi a intervalli fissi
Nei programmi a intervalli, l'ottenimento del rinforzo non dipende dal numero di risposte che il soggetto dà, ma è determinato dal tempo trascorso. Di conseguenza, la prima risposta prodotta dopo un certo periodo di tempo viene rafforzata.
Nei programmi a intervalli fissi, il tempo tra il potenziatore e il potenziatore è sempre lo stesso.
Programmi a intervalli variabili
In questi programmi il rinforzo si ottiene dopo un tempo, anche se il tempo è diverso per ogni rinforzo ricevuto.
Cambiamento comportamentale
Approcci o shaping successivi
Lo stampaggio consiste nel cambiamento comportamentale attraverso la modellazione dei comportamenti o il rinforzo differenziale di approcci successivi.
Viene seguita una serie di passaggi per modellare un comportamento specifico. In primo luogo, si individua il comportamento iniziale che si vuole plasmare per sapere cosa si vuole raggiungere.
Successivamente, vengono delimitati i possibili rinforzi da utilizzare e il processo per raggiungere il comportamento finale viene suddiviso in passaggi o stadi, rinforzando ogni stadio o approccio successivo fino a raggiungere l'ultimo.
Con questa procedura dinamica vengono trasformati sia i comportamenti che le loro conseguenze. In questo senso vengono rafforzati i successivi approcci verso un comportamento oggettivo.
Tuttavia, affinché possa essere attuato, è necessario partire da un comportamento precedente che il soggetto già compie, in modo da rinforzare gradualmente i propri comportamenti fino a raggiungere l'obiettivo.
chaining
Con esso, un nuovo comportamento si forma dalla scomposizione in passaggi o sequenze più semplici, rafforzando ogni risposta data in ciascuno dei passaggi per portare così alla creazione di una risposta più complessa nel repertorio comportamentale del soggetto.
Lunghe catene di risposte possono essere formate utilizzando rinforzi condizionati, adottando un'unità funzionale e la cui costituzione porta all'acquisizione e alla definizione di una particolare abilità.
Riferimenti
- Condizionamento operante. Estratto da wikipedia.org
- Condizionamento operante. Recuperato da e-torredebabel.com.
- Recupero da biblio3.url.
- Legge di effetto. Estratto da wikipedia.org.
- Estinzione. Recuperato da wikipedio.org.
- Domjan, M. Principi di apprendimento e comportamento. Auditorium. 5a edizione.