Ronzy2001
Forumer storico
Eppure quello stesso concetto l'ho ripetuto mille volte.
Ma detto da me non ti piaceva!
Si ma a me bisogna spiegarmi le cose come ai bambini, meglio se con disegnino...
Eppure quello stesso concetto l'ho ripetuto mille volte.
Ma detto da me non ti piaceva!
L'overfitting, prima ancora di capire se è misurabile, è "osservabile".
Anche se Paolo è sicurissimo che "una cosa che non si può misurare non può far parte di un discorso scientifico"
Avrei voluto lasciargli almeno questa "granitica sicurezza", soprattutto per evitare il protrarsi di un infinito OT di polemiche fini a se stesse (anche su questo stea aveva ragione).
Perchè è polemico partecipare ad una discussione senza aver letto o potuto comprendere (mi riferisco alla parte opzionistica) per lo meno le linee guida.
E' polemico cercare per tentativi una definizione che si è già deciso a priori di criticare, come ignorare link di ulteriori definizioni del tutto assonanti.
E' polemico ipotizzare che io abbia manipolato la definizione wiki en di "overfitting".
E' polemico voler a tutti i costi invalidare una definizione di un concetto che viene discusso in base a quella stessa definizione, e non per come si chiama (si può decidere di chiamare quella definizione "overtopolino" e parlarne ugualmente). Come se fosse una questione semantica.
E' polemico voler lasciare l'overfitting (quello di topolino) al di fuori della ricerca, scientifica e non, perchè "non misurabile".
"Last but not least", è polemico il procedere per lenti ed incespicanti passi senza voler mai dare una risposta definitiva, dando l'idea che tale risposta neanche la si abbia.
Beh, mica deve per forza emergere che mi sono rovinato.bla bla bla
Ma, per passare dal magico regno della misura e dei segnali a quello reale, misurare l'overfitting a posteriori non equivale forse a mettere il TS a mercato e vedere l'equity ? Non la definirei propriamente un'attivita' utile a mero fine autoconsolatorio.
Rimane consolidato l'assunto che il tuo cambiare strategia a fronte di una osservazione dell'overfitting è una stima composta da: la stima su un fenomeno negativo pari alla sovraottimizzazione dei parametri, con probabilità x e la stima che una strategia diversa possa risultarne esente con probabilità y...
Quindi, la misura ex post è diversa da una misura ex ante, essendo la prima certa, la seconda impossibile da certificare...
Fortunatamente hai pochi post quindi mi ci e' voluto un attimo.No pprlo, purtroppo no, per nessun punto. Ma ti ringrazio di avermelo chiesto.
Se quoti le mie parole sarò felice di commentarle, se ne sei interessato.
Quindi il terzo passo dovrà essere verificare questo, e soprattutto verificare che in rete non esista alcun minimo riferimento a questa idea.
Cercando non certo solo con google, ma su tutti i forum/siti specialistici in lingua inglese.
A questo punto potremo procedere non sapendo di avere ancora niente di buono ma almeno sapendo di aver utilizzato in maniera più efficiente il nostro tempo.
In realta' si legge piu' chiaramente la (2), ma la (1) mi pare necessario corollario, dato che all'aumentare del numero di variabili testate, ceteris paribus, aumenta anche la probabilita' di trovare una variabile con un buon potere esplicativo e poco conosciuta. Inoltre quaglia con il tuo successivo insistere sull'automatizzabilita' del metodo. Se non ci fosse un problema "quantitativo" uno potrebbe pure andare "a occhio" (alla fine di regole non e' che bisogna trovarne 3000).In generale il problema è guardare dove il mercato non guarda, non riesce a guardare, o non riesce a quantificare quello che guarda. Sia studiando il presente che il passato.
4) L'intera piattaforma deve essere quanto piu' possibile automatizzata allo scopo di minimizzare i bias e risparmiare tempo.Il quarto passo inevitabilmente sarà quello di testare l'idea quando possibile ricostruendo lo storico adatto ad essa, e quando non possibile impiegando il futuro prossimo per farlo, avendo cura di costruirci un adeguato database che ci tornerà utilissimo in fase di ottimizzazione.
Infatti quest'ultima sarà il quinto passo dove, se il quarto passo avrà dato esito sufficientemente positivo senza alcuna modifica all'idea iniziale, dovremmo sperabilmente ottenere più fitting che overfitting. E quindi potremo dare via libera a tutte le fantasiose tecniche esposte in questa sezione, dalla fazzy logic, passando per gli algoritmi genetici, per finire alle magnifiche reti neurali, ideale connubio.
Tuttavia è importante tener presente che se il quarto passo non avrà dato immediato riscontro senza la seppur minima ottimizzazione, molto meglio cambiare subito idea e ricominciare da capo. Pena ritrovare in maniera massiccia e annichilente il nostro amico overfitting nella fase successiva.
Per inciso preferisco il C++, che e' quello con cui ho iniziato, scio' a voi C-isti ed alle vostre funzioni con 400 argomenti, di cui 399 puntatori.Il primo passo è osservare il mercato, ma assolutamente non attraverso le sue serie storiche. Osservare il mercato nella sua struttura, nelle sue dinamiche nelle sue poche evidenti causalità. Oggi. Ci sono vari metodi per farlo in maniera più o meno efficiente: ognuno dovrà usare quelli che ha a disposizione. Quindi fortunato chi avrà a disposizione un'approfondita conoscenza del C .
L'unico punto del tuo discorso in cui non mi ritrovo e' questo:Si può fare anche a "occhio", ma così ti sfugge moltissimo e devi essere fortunato. Il metodo di ricerca, quanto più efficace è, meno richiede l'intervento della fortuna
che peraltro mi pare in contraddizione con questo:Il primo passo è osservare il mercato, ma assolutamente non attraverso le sue serie storiche.
Ma mi viene il dubbio che tu con "osservazioni sulle serie storiche" intenda un tipo particolare di osservazione, ovvero quella che ricerca correlazioni variamente caratterizzate tra i valori di una singola serie storica. Dubbio che sembra confermato da questo passaggio qui:In generale il problema è guardare dove il mercato non guarda, non riesce a guardare, o non riesce a quantificare quello che guarda. Sia studiando il presente che il passato.
Il primo corollario al principio di Heisenberg-GiuliaP ci anticipa che testare questa idea sugli storici disponibili dovrà essere impossibile.
Ovvero, per me un test su una serie storica "ricostruita" e' un test su serie storiche, per te apparentemente no.Il quarto passo inevitabilmente sarà quello di testare l'idea quando possibile ricostruendo lo storico adatto ad essa
Non ho capito perche' "non misurabile usando gli stessi dati usati per il fitting" sarebbe equivalente a "non misurabile".Ma certo. Se l'overfitting si riuscisse a misurare, il problema lo si risolverebbe a monte, e l'overfitting non lo si produrrebbe affatto, ovvero lo si ridurebbe ad una forma tollerabile. Come già detto anche da Kilroy.
L'overfitting non è misurabile per definizione.
...1) Piu' variabili esplicative indipendenti si testano, maggiore e' la possibilita' di individuare delle relazioni robuste...
Non ho capito perche' "non misurabile usando gli stessi dati usati per il fitting" sarebbe equivalente a "non misurabile"...
...Paolo poneva il problema in termini fisici di misurabilita' o meno della grandezza, il fatto che l'overfitting fatto in T possa essere misurato solo in T+DT e' irrilevante da questo punto di vista, no ?
...PS: In fisica osservabile e misurabile sono la stessa cosa. Come per il concetto di overfitting, non e' un fatto di opinioni, ma di definizioni.