Apprendimento Automatico: Introduzione Roberto Navigli 1 Apprendimento Automatico: Introduzione.
Apprendimento
-
Upload
iva-zigghyova-martini -
Category
Leadership & Management
-
view
2.466 -
download
4
Transcript of Apprendimento
Apprendimento
Eleonora Bilotta
Definizione
Apprendimento: modificazione relativamente
duratura e stabile del comportamento a seguito di
una esperienza, di solito ripetuta più volte nel
tempo.
Va distinto dalle modificazioni del comportamento
dovute a condotte istintive o processi maturativi.
L’apprendimento comporta un vantaggio evolutivo,
anche se implica un costo; la specie umana è in
grado di “costruire” il proprio apprendimento
Aspetti dell’apprendimento
Una caratteristica che accomuna molti esseri viventiè la capacità di cogliere i nessi (legami) associativitra eventi.
Questi nessi sono causali (un evento ne segue unaltro; uno stimolo produce una risposta).
Il primo ad aver studiato sperimentalmente questinessi fu Pavlov, Nobel nel 1904.
Egli notò che mettendo del cibo (stimolo) nellabocca di una cane, si aveva un aumento dellasalivazione (risposta).
Questa è una risposta riflessa (automatica).
Panoramica
sull’apprendimento
Gli studi sull’apprendimento si richiamano a
tre indirizzi tradizionali:
Il condizionamento classico o Pavloviano.
L’apprendimento strumentale o operante, i cui
pionieri sono stati Thorndike e Skinner.
L’apprendimento cognitivo, basato sulle ricerche
della scuola della Gestalt.
Pavlov
Casualmente Pavlov (1849-1936) si accorseche i cani producevano saliva anche conrumori che precedevano il cibo (passidell’inserviente, vista della ciotola)
Questi rumori però producono un riflesso chenon è innato … perciò è appreso ocondizionato
Così Pavlov decise di studiarli in modosistematico con una metodologiasperimentale
Fasi del condizionamento
Prima del condizionamento Durante il condizionamento Dopo il condizionamento
Pavlov e i riflessi condizionati
Pavlov riuscì a dimostrare che uno stimolo
inizialmente neutro, presentato per molte
volte in stretta contiguità temporale con uno
stimolo che per sua natura evoca una
risposta riflessa è in grado di evocare una
risposta riflessa simile.
Rappresentazione dei principali
processi di base del condizionamento
Estinzione
Se dopo un certo numero di tentativi con loSC, si tralascia lo SI, può succedere che ilcomportamento appreso continui per un po’di tempo, ma poi scompaia o si estingua.
La velocità con cui compare l’estinzionedipende dalla frequenza con cui ilcomportamento è stato eseguito,dall’intensità dello SI e da molti altri fattori.
Se le prove di estinzione sono sufficienti, larisposta appresa scomparirà completamente.
Recupero spontaneo
Se, però, si lasciava riposare il cane e poi losi sottoponeva di nuovo al test, la risposta disalivazione che era stata appresaricompariva.
Questo recupero spontaneo segnala che unarisposta estinta non viene completamentesradicata.
Evidentemente, anche se il soggetto smettedi rispondere, non dimentica la rispostaappresa.
Generalizzare e discriminare
La generalizzazione è il processo per cui le risposte condizionatevengono estese a tutta la gamma degli stimoli prossimi allostimolo condizionato.
La discriminazione è l’inibizione della risposta per stimoli simili.
Generalizzare
Il recupero spontaneo dimostra che le risposte
apprese, anche se non più rinforzate, non vengono
distrutte o dimenticate, ma solo inibite e si possono
ripresentare a distanza di tempo, anche se con
intensità minore (Hilgard et al., 1953).
La generalizzazione sta alla base della capacità di
comportarsi in situazioni nuove, nella misura in cui il
nuovo presenta analogie con il già noto (il cane che
impara a salivare all'accensione di una luce
gialla, saliverà anche se la luce è bianca).
Discriminare
È possibile addestrare il cane a discriminarespecifici stimoli.
Es. dopo un addestramento classico in cui ilcibo veniva associato a un tono di 1000 Hz(addestramento che inizialmente prevedevauna certa generalizzazione anche per tonisimili).
In seguito il cane veniva addestrato a salivaresolo con toni di 1000 Hz e non con toni di 900o 1100 Hz).
Apprendimento per prove ed
errori
Questa particolare forma di apprendimento è
stata studiata da Thorndike (1874-1949).
Nei suoi esperimenti utilizzava una gabbia
(problem box).
I gatti messi in questa gabbia cercavano la
maniera di uscire.
Così facendo compievano movimenti alla
“cieca”, fornendo casualmente risposte giuste e
sbagliate.
Apprendimento per prove ed
errori
L’animale prova diversi comportamenti
(graffia, morde, ecc.), ma riesce ad uscire
solo premendo la leva (risposta corretta).
Thorndike notò che le risposte non corrette
tendono ad essere abbandonate; viceversa
quelle corrette ad essere ripetute (legge
dell’effetto e dell’esercizio).
Apprendimento per prove ed
errori
Legge dell’effetto: l’apprendimento dipende dalleconseguenze che il comportamento produce.
Legge dell’esercizio: comportamenti più spesso esercitatihanno maggiori probabilità di essere impiegati in condizionisimili.
L’approccio di Skinner
L’estensione del condizionamento classico
venne realizzata da Skinner (1904-1990), che
riprese le ricerche di Thorndike e distinse fra
comportamenti rispondenti e operanti.
Rispondente: comportamento che deriva da
riflessi innati o appresi.
Operante: comportamento che è emesso
spontaneamente dall’organismo.
L’approccio di Skinner
Nel condizionamento operante (strumentale) ilsoggetto opera (agisce) nell’ambientemodificandolo.
In quello classico il soggetto non controlla la rispostaincondizionata (salivazione) provocata dallo stimolo.
Skinner era interessato solo alla catena S-R; lamente essendo una black box, cioè nonosservabile, era da ignorare.
Queste idee sono quelle riprese e utilizzate daWatson, e che hanno permesso la diffusione delcomportamentismo.
L’esperimento di Skinner
Un ratto viene messo in una gabbia (Skinner box).
La gabbia ha una leva, un distributore di cibo, un
pavimento elettrificabile e un dispositivo per la
registrazione automatica delle risposte.
L’esperimento di Skinner
Gli animali compiono molte azioni e soloaccidentalmente premono la leva.
Alla pressione della leva ottengono del cibo (stimolorinforzante). Il cibo ha la funzione di ricompensa.
In pochi minuti l’animale apprende l’associazione frapremere la leva e l’erogazione di cibo.
Nel momento in cui l’animale preme ripetutamentela leva (risposta rinforzata), allora ha appreso perassociazione. L’animale affamato o assetato tende a ripetere
l’operazione (condizionamento operante).
Analisi dell’esperimento
I comportamenti operanti aumentano infunzione del rinforzo (cioè qualsiasi tipo dievento conseguente ad una risposta e ingrado di incrementare la probabilità che essavenga prodotta) e diminuiscono in funzionedella punizione.
Il rinforzo è positivo (cibo, acqua) o negativo(scossa, rumore fastidioso).
La punizione è positiva (stimolo doloroso) onegativa (sottrarre qualcosa di gratificante).
Rinforzo negativo e positivo
Il rinforzo negativo e l'apprendimento di
evitamento hanno un ruolo importante nel
comportamento umano.
Un neonato piange perché ha fame, la
mamma accorre e gli porta il cibo.
Il bambino ha ricevuto un rinforzo positivo: il
cibo.
La mamma un rinforzo negativo: il pianto del
bimbo è cessato.
I rinforzi possono essere
primari o secondari
I rinforzi primari soddisfano i bisogni
fondamentali (fame, sete, sonno, ecc.).
I rinforzi secondari soddisfano bisogni non
legati alla sopravvivenza, ma che tendono a
modificare il comportamento umano (denaro,
lodi, approvazioni, ecc.).
Questi sono legati alla storia del soggetto, e
la connotazione di rinforzo avviene in seguito.
Esempio
Un bambino piange e riceve subito il lattematerno. Il latte agisce come rinforzoprimario alla risposta del pianto, come taleaumenta le probabilità che il bambino pianganuovamente quando avrà di nuovo fame.
Tuttavia, anche la presenza della madreviene associata alla riduzione della fame,acquistando così proprietà di rinforzosecondario. La presenza della madre finiràper essere ricercata di per se stessa.
Rinforzi continui o parziali
In quelli continui il rinforzo segue in maniera
sistematica ogni comportamento corretto
dell’organismo.
In quelli parziali il rinforzo viene fornito solo
ogni tanto.
Il primo conduce al fenomeno
dell’assuefazione (abituazione).
Skinner ha utilizzato 4 programmi di rinforzo.
Programma a intervallo fisso
La risposta viene rinforzata dopo un tempoprefissato che viene mantenuto costante(rinforzo ogni X secondi, indipendentementedall’attività del soggetto).
L’animale calibra le sue azioni sui tempi delrinforzo.
È un esempio lo stipendio mensile.
Programma a intervallo
variabile
La risposta viene rinforzata lo stesso numero
di volte ma a intervalli irregolari. Il soggetto
non può fare “previsioni”.
L’apprendimento è più rapido e procede per
progressione costante.
Il soggetto lavorerà di più e apprenderà di
più.
Sono un esempio gli elogi occasionali.
Programma a rapporto fisso
Il rinforzo viene dato dopo un numero
prefissato di risposte.
L’animale può essere rinforzato ad es., dopo
5 o 10 pressioni della leva.
Nel versante umano, il soggetto lavora
intensamente per un determinato periodo e
può programmare dei momenti di riposo.
Programma a rapporto
variabile
Il rinforzo viene dato dopo un numero di
risposte variabile.
Il soggetto non può fare previsioni.
La risposta viene emessa continuativamente
e i tempi di riposo si riducono (gioco
d’azzardo, lotteria, macchine per il poker).
Il concetto di modellamento
A Skinner si deve inoltre l’introduzione della tecnica
del modellamento (shaping).
Un animale poteva impiegare molto tempo prima di
premere a caso la leva.
Skinner dava una ricompensa ogni volta che si
avvicinava alla leva.
Veniva rinforzata quindi la risposta di avvicinamento,
rendendola più probabile.
L’animale capiva che quella era la risposta corretta.
Il concetto di modellamento
Studi sull’uomo:
Le macchine per insegnare.
Corsi in autoistruzione.
Il principio di Premack, ovvero: premiare a
condizione che ...
“Un’attività piacevole può agire come rinforzo
per un’attività spiacevole”.
Il concetto di modellamento
Modellare il comportamento per mezzo diapprossimazioni successive è una tecnicaadottata ampiamente per modificare ilcomportamento umano.
Per la acquisizione della parola, ad es., è noto che igenitori adottano frequentemente la tecnica delleapprossimazioni successive.
Dapprima rinforzando i loro bambini per ogni formadi vocalizzazione (mediante l'attenzione, il sorriso ealtre forme di rinforzo sociale): poi, più selettivamente, rinforzando quei balbettii che si
avvicinano alle parole, in seguito rinforzano solo la correttapronuncia e così via.
L’apprendimento secondo
Tolman
Secondo Tolman (1886-1959) è possibile che
vi sia apprendimento anche in maniera
latente.
Tolman dimostrò l’esistenza di questa forma
di apprendimento.
Si apprende anche senza rinforzi, per fare
fronte ad una situazione problematica, ma il
comportamento non è esibito se non si ha
uno scopo da realizzare.
L’apprendimento secondo
Tolman
Comportamento = azione o serie di azioni
finalizzate ad uno scopo (comportamento
intenzionale).
Il concetto di mappa cognitiva = la
rappresentazione mentale della meta e dello
spazio che porta alla meta. La meta sarà
raggiunta secondo il percorso più semplice e
meno dispendioso (principio del minimo
sforzo).
L’esperimento di Tolman e
Honzik
I ratti agivano sulla base
di una rappresentazione
mentale interna dello
spazio del labirinto, una
mappa cognitiva che i
ratti “consultavano” e
favoriva un
comportamento
parsimonioso.
Descrizione dell’esperimento
Gruppo 1: Nessun rinforzo all’uscita - Risultato: debole
riduzione degli errori nel tempo.
Gruppo 2: Rinforzo all’uscita - Risultato: rapida
riduzione degli errori nel tempo.
Gruppo 3: Per 10 giorni nessun rinforzo. All’undicesimo
giorno rinforzo all’uscita. I soggetti commettevano molti
errori per 10 giorni, ma si registrava una drastica
riduzione degli errori dopo l’undicesimo giorno.
Per i primi 10 giorni il loro comportamento era analogo a
quello dei soggetti del gruppo 1, successivamente
diventava simile a quello dei soggetti del gruppo 2.
Risultati dell’esperimento
Analisi dei risultati
La mappa spaziale costruita vagando per illabirinto è stata utilizzata quando si è profilatouno scopo da realizzare.
Il rinforzo è utile perché si manifesti uncomportamento e non perché lo si apprenda.
La conoscenza appresa può rimanere latentein mancanza di motivazione specifica.
L’apprendimento osservativo
Il contributo dei teorici dell’apprendimento sociale:
Bandura. Si apprende anche osservando un
modello e cercando di imitarlo.
L’apprendimento imitativo perché sia efficace
richiede che siano attivi alcuni processi cognitivi:
a) che si presti attenzione al modello.
b) che ci si rappresenti in memoria la sequenza di
azioni che il modello compie.
c) che si sia in grado di riprodurre la sequenza a
livello motorio (riproduzione motoria).
d) che vi sia una certa autoconsapevolezza.
Il ruolo dei rinforzi
Il rinforzo è necessario per l’esecuzione della
risposta più che per l’apprendimento. Il
rinforzo crea motivazione.
Se il modello riceve rinforzi positivi questi
avranno un effetto sull’apprendimento
dell’osservatore che vorrà compiere la stessa
azione per essere ricompensato.
I rinforzi diretti possono consolidare la
risposta.
L’apprendimento nella teoria
della Gestalt
Tolman non fu l’unico a concepire l’apprendimento
come modificazione del comportamento in modo
non associativo.
Prima di lui Köhler (1887-1967) si oppose al
principio per prove ed errori.
L’apprendimento è l’esito di un processo intelligente.
Presuppone la capacità di collegare insieme in
modo unitario elementi distribuiti e considerati (fino
ad allora) isolati.
Köhler e l’insight
Gli elementi del campo vengono connessi in modo
unitario e all’improvviso, grazie ad una illuminazione
intuizione: insight.
L’insight comporta una ristrutturazione del campo
cognitivo.
Secondo una prospettiva Gestaltista, sugli elementi
prima sconnessi avviene una “chiusura”.
Gli elementi sono riorganizzati secondo una nuova
configurazione mentale: si ha l’apprendimento.
Köhler e l’insight
Sono classici gli esperimenti del 1917 con gliscimpanzè.
Dove Kölher pone l’animale in una situazioneapparentemente irrisolvibile.
L’animale si trova dentro una gabbia, fuori (o in alto)c’è un casco di banane, ma non sono raggiungibili.
L’animale prova a prenderle ma non vi riesce.
Si rassegna e ritorna alle attività precedenti.
Manipola gli oggetti presenti all’interno della gabbia.
Ha un insight: afferra e sposta le scatole usandolecome estensione delle braccia per prendere lebanane.
Köhler e l’insight
L’apprendimento per insight
Per Köhler i tentativi degli animali non erano
casuali ma intelligenti (l’animale valutava la
situazione, formulava una ipotesi di soluzione
del problema e poi verificava la soluzione).
La ristrutturazione cognitiva avveniva
all’improvviso per intuizione. Dopo la prima
intuizione gli scimpanzé erano in grado di
ripetere l’azione (apprendimento per insight).
Percorso di autoverifica
Definizione di apprendimento.
Cosa si intende per generalizzazione e discriminazione.
Apprendimento per prove ed errori.
Watson e la nascita del comportamentismo.
Skinner e il condizionamento operante.
I programmi di rinforzo elaborati da Skinner.
Descrivere il concetto di rinforzo.
Qual è la differenza tra rinforzo positivo e negativo.
Descrivere il concetto di modellamento.
Descrivere l’apprendimento latente.
Descrivere l’apprendimento osservativo.
Che cosa si intende per insight e ristrutturazione cognitiva.
L’apprendimento secondo i cognitivisti.