AndrewLR
Nuovo forumer
Non capisco il ridicolo, in quella conclusione (propugnata da me ed altri) non vi è nessuna pretesa di attenuare l’overfitting, né di aver scoperto chissà quale furbata.
Fare tutto “in sample” è solo un gesto di consapevolezza che spezzettando la serie in due tronconi (di cui il secondo, spesso molto breve, e potenzialmente soggetto a fattori di mercato “particolari”), non si ha alcuna informazione aggiuntiva rispetto al backtesting sull’intera serie.
Ed allora, visto che richiede software dedicati, tempo, lavoro e può ingenerare pericolose illusioni, è assolutamente logico non farlo.
Certo, magari non ridicolo, ma è sempre curioso e divertente toccare con mano quale sia il grado di incomunicabilità che si raggiunge sui forum…..
Imar, capisco quello che vuoi dire e concordo che fare tutto in-sample in alcuni casi specifici ha il suo valore, per me pero' non c'e' bisogno di riunnciare sistematicamente all'out-sample, ma bisogna un po' adattarsi al gioco che si sta giocando:
- anche tralasciando il cross-validation e assumendo un'unica fase di fitting e selezione del modello, i tronconi insample-outsample non devono essere per forza due...
- a seconda di quello che si fa, il data sample non deve per forza essere piccolo...
- e' bene usare misure robuste per provare a capire se l'outsample puo' effettivamente dirsi diverso dall'insample, come accennavo in un altro thread
Ho specificato questi punti in particolare perche' non li vedo praticamente mai discussi.
Nessuna magia ovviamente e nessuna garanzia di non overfitting, ma per me sono passi nella giusta direzione (ovviamente inutili se si cade in altre trappole, ma questo va da se')
PS: per gli interessati, sto leggendo questo libro:
Learning From Data: Yaser S. Abu-Mostafa, Malik Magdon-Ismail, Hsuan-Tien Lin: 9781600490064: Amazon.com: Books
e lo sto trovando davvero ben fatto (il tipo ha anche un MOOC su edx). Tratta solo le basi, ma mi sembra farlo davvero bene. PG se lo conosci e vuoi dare un parere... (perdono per aver messo da parte per ora le tue precedenti raccomandazioni )
Ultima modifica: