l'ho scritto anche sul mio...l'ho letto e' mi e' rimasto impresso per quanto sia vero
riguarda l'intelligenza artificiale ma e' pertinente
.......
C'è un problema qui: per scoprire azioni migliori, l'agente dovrebbe continuare a esplorare, provando mosse che non hanno mai fatto prima. Per stimare l'effetto di un'azione in modo affidabile, un agente deve eseguire ciascuna azione molte volte.
Quanto sopra è molto simile alle sfide che affrontiamo da bambini quando dobbiamo imparare a camminare. All'inizio proviamo diversi tipi di movimento e partiamo da un semplice movimento che produce risultati soddisfacenti: gattonare.
Quindi, vogliamo migliorare il nostro comportamento per diventare più efficienti. Per imparare un nuovo comportamento, dobbiamo fare movimenti che non abbiamo mai fatto prima: proviamo a camminare. All'inizio, eseguiamo diverse azioni che producono risultati insoddisfacenti: cadiamo molte volte. Una volta scoperto il modo corretto di muovere le gambe e bilanciare il nostro corpo, diventiamo più efficienti nel camminare. Se non esplorassimo ulteriormente e ci fermassimo al primo comportamento che produce risultati soddisfacenti, strisciamo per sempre. Esplorando, apprendiamo che possono esserci diversi comportamenti più efficienti