E quindi che si fa? Una volta messo un sistema a mercato lo si lascia andare in eterno fino a quando o mi brucia il conto o mi rende milionario o semplicemente senza criteri oggettivi mi dichiaro sfinito?
SECONDO ME:
Abbiamo già discusso molte volte questo punto. Per capire se il sistema ha speranza basta confrontare il comportamento out-of-sample con quello atteso. Questo semplice compito potrebbe svolgerlo facilmente anche l'econometria (ma non chiedere a me come
). Non c'è bisogno ne di aspettare in eterno ne di restare in mutande.
Tuttavia se dopo il primo fallimento out-of-sample tornerai a modificare il tuo sistema per ulteriori prove, commetterai inevitabilmente overfitting. In forma proporzionale al numero di feedback. Lo stesso succede accendendo e spegnendo il sistema, perchè è come fosse una ulteriore regola aggiunta allo stesso.
La tua stessa esperienza, essendo selettiva, genera overfitting, se non ragioni mettendo il problema overfitting al centro della tua progettazione (e dei tuoi pensieri).
Io comprendo l'importanza che si da all'evitare overfitting, ma anche facendo il massimo sforzo in questo senso e riuscendoci, non mi sono garantito un sistema performante nei secoli dei secoli......o sbaglio?
SECONDO ME:
Non sbagli, soprattutto se parli di secoli
. Tuttavia se i tuoi sforzi vengono fatti nell'ottica giusta, dovrebbe essere più o meno intuibile quando il sistema smette di funzionare senza necessariamente dover aspettare che ciò accada, e senza neanche scomodare l'econometria.
Se io utilizzo un criterio di gestione sulla EQ immutato per qualsiasi sistema, ovvero senza che l'algoritmo sappia mai come quella eq è stata generata e da cosa mi dici dove è l'ovrfitting che aggiungo?
SECONDO ME:
La risposta a questa domanda sta nel mio messaggio precedente. Copio incollo:
Infatti questa gestione andrà necessariamente fatta in maniera sistematica, con una procedura precisa di controllo e decisione (magari ottimizzata). Questo porterà inevitabilmente a fare altro overfitting (per intenderci quello che Bar chiama "invisibile"). Che sarà tanto maggiore quanto più alto sarà il numero di sistemi e quanto più complesse e ottimizzate saranno le regole di controllo e decisione. Questo sia muovendosi in orizzontale che in verticale, ovvero sia nello spazio che nel tempo (quest'ultima osservazione è espressa molto sinteticamente, ma è molto importante).
Provo a farti capire meglio l'overfitting con un esempio: se vuoi selezionare personale e proponi dei test a risposta multipla con soluzioni ricavabili solo con strumenti non a disposizione degli esaminandi, alla fine qualcuno risulterà comunque migliore, ma non perchè lo sia veramente, ma semplicemente perchè "giocato dal caso". E tu avrai fatto "totalmente" overfitting su un sistema impossibile da fittare per definizione, visto che il suo output è completamente rumore.
Un pò quello che intendeva Imar a proposito delle selezioni di trader
E menomale che almeno tu sai con certezza che non siamo la stessa persona