Overfitting

Poteva essere benissimo che PGiulia avesse collaborato a wiki en.
Io avevo interpretato così le sue parole.

Il mio discorso, o pippone che dir si voglia è astratto e cavilloso perché nelle materie scientifiche parlando a braccio si rischia di usare le parole in modo errato e si finisce per intendere cose diverse.

La questione dell'underlying relationship non era centrale, ma chissà, potrebbe diventarlo.

Quello che volevo sottolineare è che si tratta di un concetto complesso e scivoloso, anche in quelle che voi chiamate scienze deterministiche.

Quello che accade in genere è che un sistema anche semplice dipende da un numero molto alto e forse infinito di esplicative. Ma se noi abbiamo la fortuna di poter considerare praticamente costanti alcune di queste esplicative nell'esperimento, e magari altre producono effetti che sono molto piccoli nelle condizioni date, allora noi presentiamo una bella ed elegante regola che chiamiamo boriosamente legge fisica. Se poi le deviazioni da questa legge hanno la fortuna (per noi) di elidersi in media, allora diciamo che possiamo fare predizioni in base a questa legge. Siamo contenti e diamo un Nobel allo scopritore.

L'ho messa un po' sul ridere ma in buona parte è così.

E hai fatto tutto sto casino tra definizioni, filosofie, e pittoresche interpretazioni di manipolazione dell'informazione, per dire questo?

Cioè che secondo te l'overfitting è quello che si fa quando si crea/modifica una teoria fisica su misura per l'ultimo fenomeno osservato? (detto in una riga invece che in un papiello)

Non era meglio parlarne in un forum di fisica teorica, dove magari potevi anche battezzarlo "φύσις overfitting" in omaggio a stea?

Perchè magari esiste un overfitting anche in finanza (oltre che nella teoria dei sistemi ed in statistica), seppur non se ne riesca a accettare, o a capire (perdonami), il significato.

E magari è proprio quello l'oggetto del thread.
 
Fisica teorica?

Chi ha mai parlato di fisica teorica?

Il metodo scientifico è uno, sia che tu parli di pere che di elettroni invece che di rendimenti.

Esiste in finanza un problema di selezione e trattamento dei dati? Certo che esiste, come in tutti gli altri settori.

Allora, se l'overfitting esiste in finanza, e non ho nessun dubbio che esista, deve essere un qualcosa di misurabile (perché una cosa che non si può misurare non può far parte di un discorso scientifico). O per meglio dire io devo essere in grado almeno di stabilire un 'grado' di potenziale overfitting con un certo intervallo di confidenza.

Vi torna o no?

:)
 
:ciao:

Sono lo stesso pprllo che bazzica saltuariamente dall'altra parte.

Paolo, l'overfitting e' misurabilissimo. Infatti si puo' benissimo misurare il fatto che la goodness-of-fit out of sample si annulla o si abbassa vertiginosamente.

Cerco di spiegare anche il concetto di fittare il rumore, almeno come lo vedo io:

Abbiamo una serie:

Y = Y(X)

In generale possiamo scrivere:

Y = F(X) + epsilon(X)

Dove F e' il fenomeno ed epsilon l'errore.

Nel caso peggiore, la serie e' puro rumore:

Y = epsilon(X)

Tuttavia, in linea di principio e' sempre possibile scrivere una funzione G(X) tale che:

G(X) = epsilon(X) [su tutto l'intervallo considerato]

E quindi stimare Y come:

Y' = G(X)

Tuttavia quando andiamo a stimare Y(X+1), otterremo un errore quadratico pari a:

[Y(X + 1) - Y'(X+1)]^2 = [G(X+1) - epsilon]^2

Andando a fare l'errore quadratico medio abbiamo:

E[(G - epsilon)^2] = E[G^2] + 2E[G*epsilon] + E[epsilon]^2

Poiche' ricordando che COV(G, epsilon) = 0

E[G^2] + 2E[G*epsilon] + E[epsilon^2] = E[G^2] + 2E[epsilon]*E[G] + E[epsilon^2]

E poiche' E[epsilon] = 0

E[(G - epsilon)^2] = E[G^2] + E[epsilon^2] >= E[epsilon^2]

Cioe' ottieniamo una stima che fa peggio di una non-stima. La ragione per cui quando si usano molti parametri si rischia maggiormente l'overfitting e' che generalmente la G(X) che fitta il rumore e' una funzione piuttosto complicata. Tuttavia se studiamo a sufficienza un ampio numero di forme della G(X) con pochi parametri ed un altrettanto ampio numero di segnali di puro rumore, prima o poi sicuramente troviamo un rumore che puo' essere fittato da una G(X) semplice, per cui avere pochi parametri e' una condizione prudenziale, ma sicuramente non e' sufficiente.
 
Ultima modifica:
...Paolo, l'overfitting e' misurabilissimo...

L'overfitting, prima ancora di capire se è misurabile, è "osservabile".

Anche se Paolo è sicurissimo che "una cosa che non si può misurare non può far parte di un discorso scientifico" :D

Avrei voluto lasciargli almeno questa "granitica sicurezza", soprattutto per evitare il protrarsi di un infinito OT di polemiche fini a se stesse (anche su questo stea aveva ragione).

Perchè è polemico partecipare ad una discussione senza aver letto o potuto comprendere (mi riferisco alla parte opzionistica) per lo meno le linee guida.

E' polemico cercare per tentativi una definizione che si è già deciso a priori di criticare, come ignorare link di ulteriori definizioni del tutto assonanti.

E' polemico ipotizzare che io abbia manipolato la definizione wiki en di "overfitting".

E' polemico voler a tutti i costi invalidare una definizione di un concetto che viene discusso in base a quella stessa definizione, e non per come si chiama (si può decidere di chiamare quella definizione "overtopolino" e parlarne ugualmente). Come se fosse una questione semantica.

E' polemico voler lasciare l'overfitting (quello di topolino) al di fuori della ricerca, scientifica e non, perchè "non misurabile".

"Last but not least", è polemico il procedere per lenti ed incespicanti passi senza voler mai dare una risposta definitiva, dando l'idea che tale risposta neanche la si abbia.
 

Users who are viewing this thread

Back
Alto