OT molto piacevole
Condivido.
Non ho conoscenze specifiche in merito, quindi parlo per parlare, seguendo il mio intuito. Mi perdonerai sicuramente qualunque fesseria possa scrivere.
A primo acchitto posso notare che le costanti non sono relazioni e non hanno rumore, se non un errore di calcolo magari minimizzabile computazionalmente. Probabilmente l'overfitting non esiste neanche. Non so quanto si possa associare questo tipo di fitting (senza overfitting) con quello discusso in questo thread.
Cerco di spiegarmi ed arricchisco di esempio simpatico.
Voglio trovare il valore di una costante universale.
Formulo un esperimento tale che prendo una serie di misure A, B, C, ..
E poi ottengo una legge del tipo:
F(A, B, C, ...) = K * G(A, B, C, ...)
dove F e G sono note.
I risultati che ottengo saranno effetti da errori di vario tipo, alcuni eliminabili, altri no. In definitiva ottengo anche qui un "segnale + rumore" che utilizzo per ricavare il mio valore di K.
Tra qualche anno pero', arriva un altro ricercatore che fa lo stesso esperimento, trovando un modo per ridurre gli errori di misura, e trova che avevo, pur minimamente, "overfittato" ! Ovvero il valore di K che avevo individuato (e quindi la forma definitiva che avevo dato alla relazione F(...) = K * G(...) in realta' descriveva, seppure in minima parte, il rumore.
E ora faccio un esempio di un caso celebre ed anche istruttivo !
Oil drop experiment - Wikipedia, the free encyclopedia
Queste due condizioni non sono rispettate neanche da gran parte dei sistemi fisici: nella peggiore delle ipotesi si rischia di fare la fine del tacchino, ingrassato fino al Ringraziamento.
Non saprei, onestamente penso che la "underlying relationship" nella scienza si assuma generalmente costante in tempi "umani".
Se non altro perche' altrimenti tutto il discorso della falsificazione e della verita' come asintoto delle successive approssimazioni andrebbe a ramengo (se la verita' saltella in giro come faccio a tenderci asintoticamente ?
)
In ogni caso è una buona occasione per precisare che non solo non abbiamo informazioni sulla relazione sottostante, ma neanche sul rumore che la corrompe. Altra cosa data per scontata e mai specificata fino ad ora.
Mi pare che da qualche parte qualcosa sul rumore l'avevi scritta.
Se ragioniamo sulla relazione sottostante come funzione anche del tempo, questi due concetti si fondono. Ovvero dire che non abbiamo la garanzia che sia costante nel tempo, equivale a dire che non conosciamo la relazione sottostante "in funzione del tempo".
Concordo.
Dipende. Troppo generale come affermazione
Ti diro' che a me e' capitato ad esempio che un cambiamento drammatico nel "rumore" mi aveva quasi condotto a pensare che la underlying relationship fosse "morta" ... Invece poi era ancora li'. Quindi si' in effetti forse era troppo tranchant.
Per concludere sul punto di partenza ed il tuo ragionamento generale: l'esperienza out-of-sample, qualora fatta con criterio (e su questo criterio si apre praticamente un altro mondo) ci dirà se il nostro overfitting è tollerabile o meno. E questo vale sicuramente anche per i mercati
Tuttavia è importante notare che i dati out-of-sample non sono i dati utilizzati per il fitting, e lo stesso procedimento di verifica esula dallo stesso.
Il problema di illogicità nella misurabilità dell'overfitting discusso con Paolo, e toccato già in passato su altro forum, sorge nel voler misurare l'overfitting a posteriori, e con gli stessi strumenti con i quali lo si è prodotto.
Fermo restando che il problema di misurabilità resta comunque anche out-of-sample sia per la mutabilità dei mercati, sia per Heisenberg-GiuliaP.
Che non si possa misurare in-sample e', direi, fuori da ogni dubbio.
Oh, ma sto prinpio di H-GP l'ho cercato scritto in chiaro tra i post, ma mi sfugge insistentemente ! Me lo scriveresti per esteso ? Anche link va bene !