Apprendimento condizionamento

Post on 05-Jul-2015

2.517 views 0 download

Transcript of Apprendimento condizionamento

Il condizionamento operante

• La “gabbia di Skinner” (Skinner box):

gabbia con una leva che consente di

accedere al cibo o all’acqua.

• La gabbia ha un pavimento elettrificabile

(per eventuale somministrazione di stimoli

avversativi), e un dispositivo per la

registrazione automatica delle risposte.

Skinner box

© Marina Cosenza

Gli esperimenti di Skinner

• Soggetti: ratti o piccioni.

• All’interno della gabbia venivano create le condizioni affinché l’animale premesse la leva.

• Gli animali premevano accidentalmenteuna leva e ottenevano cibo o acqua.

• L’animale affamato o assetato tendeva a ripetere l’operazione (risposta operante) se essa produceva un effetto positivo (cibo = rinforzo).

Variabili in gioco

• Nel condizionamento operante:

L’acquisizione dell’apprendimento avviene

se il nuovo comportamento è seguito da

un rinforzo. Una risposta non rinforzata

tende a diminuire.

• L’estinzione della risposta dovrebbe

avvenire a seguito di ripetuta assenza di

rinforzo.

Nel condizionamento operante …

• Generalizzazione: il rinforzo dato ad un

certo comportamento avrà effetto anche

per comportamenti simili.

• Discriminazione: i soggetti vengono

condizionati e solo la risposta

desiderata viene rinforzata.

Il concetto di rinforzo

• Rinforzo = effetto che segue un certo comportamento e determina la probabilità che quel comportamento venga emesso. Nel condizionamento operante il rinforzo è condizione necessaria e sufficiente per l’apprendimento.

• I rinforzi si distinguono in positivi e negativi(valenza del rinforzo).

• I rinforzi agiscono su bisogni di varia natura. Pertanto si distinguono in primari e secondari.

• La modalità di somministrazione dei rinforzi può variare: i rinforzi possono essere continui o intermittenti (parziali).

Valenza del rinforzo

• I rinforzi positivi producono un effetto

piacevole e agiscono da ricompensa. Essi

aumentano la probabilità che un comportamento

si manifesti.

• I rinforzi negativi aumentano la probabilità di

apprendimento di comportamenti che eliminano

attivamente una fonte di sofferenza (premere

una leva nella gabbia di Skinner per evitare

scosse elettriche), oppure consentono di

eliminare uno stimolo sgradevole e penoso

tramite comportamenti di evitamento e fuga.

Evitamento e fuga

Luce Scossa

elettrica.

Il ratto impara a

rifugiarsi nella

zona non

elettrificata

appena viene

presentato lo

stimolo luminoso.

Soddisfazione di bisogni

• Rinforzi primari e secondari: relativi a

bisogni primari o secondari.

Modalità di somministrazione

• Rinforzi continui (dati a seguito di ogni

risposta desiderata) e rinforzi parziali

(intermittenti, saltuari)

• Efficacia del rinforzo intermittente, basato

sul tempo (intervallo fisso o variabile) o sul

numero delle risposte (a rapporto fisso o

variabile)

Schema di rinforzo a intervallo fisso

• La risposta viene rinforzata dopo un tempo

prefissato che viene mantenuto costante

(rinforzo ogni X

secondi, indipendentemente dall’attività

del soggetto).

• L’animale calibra le sue azioni sui tempi

del rinforzo.

Rin

forz

o

Rin

forz

o

Rin

forz

o

Rin

forz

o

Pau

sa

Pau

sa

Pau

sa

Schema a intervallo variabile

• La risposta viene rinforzata lo stesso

numero di volte ma a intervalli irregolari.

Il soggetto non può fare “previsioni”.

• L’apprendimento è più rapido e procede

per progressione costante.

• Il soggetto lavorerà di più e apprenderà di

più.

Schema a rapporto fisso

• Il rinforzo viene dato dopo un numero

prefissato di risposte.

• Il ratto di Skinner può essere rinforzato

dopo 5 o 10 pressioni della leva.

• Il soggetto lavora intensamente (come nel

lavoro a cottimo) e può programmare dei

periodi di riposo.

Schema a rapporto variabile

• Il rinforzo viene dato dopo un numero di

risposte variabile.

• Il soggetto non può fare previsioni.

• La risposta viene emessa

continuativamente e i tempi di riposo si

riducono (gioco d’azzardo).

• Per Skinner lo schema a rapporto variabile

è il più efficace.

La punizione

• Punizione Rinforzo.

• La punizione riduce la probabilità che un

comportamento venga prodotto. La

punizione inibisce temporaneamente il

comportamento, ma non lo estingue.

• La punizione è meno efficace del rinforzo.

E’ preferibile utilizzare il rinforzo positivo

(premiare) piuttosto che punire.

Quando la punizione serve

• Comportamento 1 (socialmente non

desiderato)

• Comportamento 2 (socialmente desiderato)

• Ipotesi 1: Il soggetto conosce il

comportamento 2 e non lo assume. La

punizione è inevitabile.

• Ipotesi 2: Il soggetto non conosce il

comportamento 2. Si insegna il comportamento

2 e si rinforza il soggetto quando lo assume. Il

rinforzo positivo funziona meglio.

L’impotenza appresa

• Seligman (1976).

• L’esperimento: due gruppi di cani ai quali

venivano somministrate scosse elettriche. Il

primo gruppo (gruppo di scampo) poteva

premere una leva e interrompere il flusso

elettrico. Il secondo gruppo non aveva questa

possibilità.

• In sessioni successive i cani di questo gruppo

non erano in grado di apprendere

comportamenti di fuga e restavano immobili.

Variabili nel condizionamento

operante

• Forza e salienza dei rinforzi o delle

punizioni

• Intervallo di tempo tra comportamento e

rinforzo

• Frequenza della conseguenze (tipo di

schema di rinforzo)

• Il modellamento (shaping)

• Rinforzare ogni risposta che si avvicina

alla risposta desiderata

• Studi sull’uomo

• Le macchine per insegnare.

• Il principio di Premack, ovvero: premiare

a condizione che ...

“Un’attività piacevole può agire come

rinforzo per un’attività spiacevole”.

Il comportamentismo intenzionale di

Tolman

• Si possono postulare costrutti

mentali per spiegare taluni

comportamenti?

• I teorici S-O-R (Stimolo,

Organismo, Risposta)

ritengono che ci sia una

mediazione mentale tra

stimolo e risposta.

La teoria di Tolman (1886-1959)

• Comportamento = azione o serie di azioni finalizzate ad uno scopo (comportamento intenzionale)

• Variabili interferenti (Costrutti ipotetici: caratteristiche dei soggetti, natura e intensità dei bisogni da soddisfare).

• Il concetto di mappa cognitiva = la rappresentazione mentale della meta e dello spazio che porta alla meta. La meta sarà raggiunta secondo il percorso più semplice e meno dispendioso (principio del minimo sforzo).

Esperimento di Tolman e Honzik

• Exp. di Tolman e

Honzik (1930a) I ratti

agivano sulla base di

una rappresentazione

dello spazio del labirinto,

una mappa cognitiva

che veniva “consultata”

e favoriva un

comportamento

parsimonioso

Studi recenti sulle mappe cognitive

• Uso di un labirinto con

piattaforma centrale e otto

bracci uguali.

• Alla fine di ogni braccio è

posto del cibo.

• Dopo 20 prove i ratti non

tornano più in bracci che

hanno già visitato (Olton,

1978; 1979).

L’apprendimento latente

• Si apprende anche senza rinforzi per fare fronte ad una situazione problematica, ma il comportamento non viene esibito se non si individua uno scopo da realizzare.

• Exp. di Tolman e Honzik(1930b)

• Tre condizioni sperimentali e tre gruppi di ratti. Tutti i ratti vengono posti una volta al giorno nel labirinto.

© Marina Cosenza

• Gruppo 1: Nessun rinforzo all’uscita - Risultato:

debole riduzione degli errori nel tempo.

• Gruppo 2: Rinforzo all’uscita - Risultato: rapida

riduzione degli errori nel tempo.

• Gruppo 3: Per 10 giorni nessun rinforzo.

All’undicesimo giorno rinforzo all’uscita. I

soggetti commettevano molti errori per 10

giorni, ma si registrava una drastica riduzione

degli errori dopo l’undicesimo giorno. Per i primi

10 giorni il loro comportamento era analogo a

quello dei soggetti del gruppo

1, successivamente diventava simile a quello dei

soggetti del gruppo 2.

Uno sguardo ai risultati

Interpretazione dei risultati

• La mappa spaziale costruita vagando per

il labirinto è stata utilizzata quando si è

profilato uno scopo da realizzare.

• Il rinforzo è utile perché si manifesti un

comportamento e non perché lo si

apprenda.

• La conoscenza appresa può rimanere

latente in mancanza di motivazione

specifica.

L’apprendimento osservativo

• Il contributo dei teorici dell’apprendimento sociale: Bandura

• Si apprende anche osservando un modello e cercando di imitarlo.

• L’apprendimento imitativo perché sia efficace richiede che siano attivi alcuni processi cognitivi:

a) che si presti attenzione al modello

b) che ci si rappresenti in memoria la sequenza di azioni che il modello compie

c) che si sia in grado di riprodurre la sequenza a livello motorio (riproduzione motoria)

d) che vi sia una certa autoconsapevolezza

Il ruolo dei rinforzi

il rinforzo è necessario per l’esecuzione

della risposta più che per l’apprendimento.

Il rinforzo crea motivazione.

Se il modello riceve rinforzi positivi questi

avranno un effetto sull’apprendimento

dell’osservatore che vorrà compiere la

stessa azione per essere ricompensato.

I rinforzi diretti possono consolidare la

risposta.

La teoria dell’apprendimento osservativo

coniuga le istanze del comportamentismo

con le posizioni della psicologia

cognitivista.

L’apprendimento nella teoria della

Gestalt

• L’apprendimento come soluzione dei

problemi: analisi della situazione

presente (secondo le leggi

dell’organizzazione percettiva) e uso

dell’esperienza passata per la

risoluzione del problema.

• Gli esperimenti di Köhler (1887-

1967) sulle scimmie antropoidi

(1913-1917 a Tenerife)

L’apprendimento per insight

• Per Köhler i tentativi degli animali non erano casuali ma intelligenti (l’animale valutava la situazione, formulava una ipotesi di soluzione del problema e poi verificava la soluzione).

• La ristrutturazione cognitiva avveniva all’improvviso per intuizione. Dopo la prima intuizione gli scimpanzé erano in grado di ripetere l’azione (apprendimento per insight).

Una sintesi