GiuliaP
The Dark Side
EDIT 7/1: inserisco un post per me importante da cui è partito il dicorso:
--------------------------------------------------------------------------------
Skarso, questo non è evitare overfitting, questo è evitare di guardare al futuro relativo per prevederlo. Del resto se vuoi prevedere l'andamento futuro, non hai certo a disposizione le quotazioni di domani per farlo.
Ovvero significa semplicemente evitare un banale errore computazionale.
Addirittura malafede?
"Overfitting" significa modellare rumore piuttosto che la legge di funzionamento del sistema reale che si vuole controllare/prevedere; questa non è una mia opinione: è una definizione.
Inutile dire che modellare rumore passato non serve certo a prevedere rumore futuro, per definizione stessa di rumore.
Tutti gli algoritmi da te citati possono essere efficaci per sistemi dove il rumore è trascurabile rispetto agli effetti delle leggi reali che li regolano. In questi casi riescono a "simulare" leggi di comportamento senza la necessità di conoscerle.
Quando invece il sistema è estremamente soggetto a rumore e reagisce ad ogni tentativo di "controllo" (una specie di legge di Heisenberg per i mercati
), questi sistemi generano overfitting più di qualunque altro metodo.
Ovvero non sono adatti allo scopo.
Se si vuole una prova pratica di quanto detto, basta generare una serie casuale e verificare che una rete neurale sarà capace di generare su di essa una equity di tutto rispetto. Ex-post. Ex-ante, ovviamente, fallirà miseramente.
Per concludere, la ricerca empirica può anche essere fatta in maniera esaustiva, purchè si abbia tempo infinito. Altrimenti è fondamentale saper riconoscere al più presto le strade che possono avere più speranze di altre con logiche del tipo qui sopra descritte. Che si traduce metodologicamente parlando nel tagliare i rami morti della ricerca prima di doverli esplorare completamente (senza trascurare il rischio che questo tipo di operazione comporta).
Come al solito il tempo è un valore che si trascura sistematicamente, pur essendo il più importante di tutti.
---------------------------------------------------------------------------------------------------------------------------------------------
Qui credo si stia discutendo di serie storiche date in pasto ad algoritmi caratterizzati da parametri ottimizzati empiricamente sulle stesse.
La possibilità che questi algoritmi riescano a distinguere rumore da qualche reale principio di causa-effetto degli andamenti finanziari, per loro stessa struttura, è estremamente scarsa, per non dire nulla. Questa è una mia semplice opinione, basata su esperienza personale e quanto detto sopra.
E mi fa piacere esprimerla su questo forum, per chi vuole avere una diversa prospettiva su tutti questi ragionamenti.
Hai capito male. Soprattutto riguardo il random walk, che è provato non avere niente a che fare con gli andamenti di borsa.
In ogni caso in generale considero il backtest molto più adatto alla verifica di una strategia piuttosto che alla sua progettazione o peggio ottimizzazione.
--------------------------------------------------------------------------------
...forse non c’ è nessuno che teme l’ overfitting più di me ed infatti per ridurre al minimo almeno quello dovuto al training ho cura di effettuare sempre stime ex-ante, cioè nel fare la previsione per il giorno N non fare mai conoscere all’ algoritmo il risultato del giorno N, ma solo quelli precedenti fino al giorno N - 1...
Skarso, questo non è evitare overfitting, questo è evitare di guardare al futuro relativo per prevederlo. Del resto se vuoi prevedere l'andamento futuro, non hai certo a disposizione le quotazioni di domani per farlo.
Ovvero significa semplicemente evitare un banale errore computazionale.
...quindi stando così le cose come è facile verificare nei files open source, parlare di overfitting senza conoscere è pura illazione ed anche malafede . . .![]()
Addirittura malafede?

"Overfitting" significa modellare rumore piuttosto che la legge di funzionamento del sistema reale che si vuole controllare/prevedere; questa non è una mia opinione: è una definizione.
Inutile dire che modellare rumore passato non serve certo a prevedere rumore futuro, per definizione stessa di rumore.
Tutti gli algoritmi da te citati possono essere efficaci per sistemi dove il rumore è trascurabile rispetto agli effetti delle leggi reali che li regolano. In questi casi riescono a "simulare" leggi di comportamento senza la necessità di conoscerle.
Quando invece il sistema è estremamente soggetto a rumore e reagisce ad ogni tentativo di "controllo" (una specie di legge di Heisenberg per i mercati

Ovvero non sono adatti allo scopo.
Se si vuole una prova pratica di quanto detto, basta generare una serie casuale e verificare che una rete neurale sarà capace di generare su di essa una equity di tutto rispetto. Ex-post. Ex-ante, ovviamente, fallirà miseramente.
Per concludere, la ricerca empirica può anche essere fatta in maniera esaustiva, purchè si abbia tempo infinito. Altrimenti è fondamentale saper riconoscere al più presto le strade che possono avere più speranze di altre con logiche del tipo qui sopra descritte. Che si traduce metodologicamente parlando nel tagliare i rami morti della ricerca prima di doverli esplorare completamente (senza trascurare il rischio che questo tipo di operazione comporta).
Come al solito il tempo è un valore che si trascura sistematicamente, pur essendo il più importante di tutti.
---------------------------------------------------------------------------------------------------------------------------------------------
dipende molto cosa dai in pasto
se dai spazzatura ottieni spazzatura
invece cosi' ha un senso
http://www.palisade.com/images3/product/NeuralTools/55NeuralToolsDataSet.png
certo se do in pasto la prod. ind..e' capace anche mio nonno....ma questo e'
Qui credo si stia discutendo di serie storiche date in pasto ad algoritmi caratterizzati da parametri ottimizzati empiricamente sulle stesse.
La possibilità che questi algoritmi riescano a distinguere rumore da qualche reale principio di causa-effetto degli andamenti finanziari, per loro stessa struttura, è estremamente scarsa, per non dire nulla. Questa è una mia semplice opinione, basata su esperienza personale e quanto detto sopra.
E mi fa piacere esprimerla su questo forum, per chi vuole avere una diversa prospettiva su tutti questi ragionamenti.
Giulia mi ha impressionato il tuo msg molto eloquente e didattico, ma riflettendoci meglio mi sembra che, portando avanti il tuo ragionamento, si arriverebbe a concludere che ogni backtest è superfluo e non c'è altro che random walk, oppure ho capito male?
Hai capito male. Soprattutto riguardo il random walk, che è provato non avere niente a che fare con gli andamenti di borsa.
In ogni caso in generale considero il backtest molto più adatto alla verifica di una strategia piuttosto che alla sua progettazione o peggio ottimizzazione.
Ultima modifica: