pprllo
Nuovo forumer
Mi sono ritagliato due minuti di tempo.@pprillo: secondo me azzardi troppi paragoni. Tu puoi sviluppare con taylor perché c'è un teorema che te lo garantisce (cosa che non puoi fare con un random walk).
Prendiamo due esempi limite opposti:
- il trader A esamina lo storico del titolo Acme, ci appiccica sopra una media, poi una seconda media, poi un rsi al quale applica delle bollinger. Infine qualche numerino magico e ottiene una equity che reputa soddisfacente. A questo punto va a mercato.
- il trader B, che in questo caso identificherò ad es. in PAT, fa un ragionamento a priori sugli aumenti di capitale bancari in questo momento storico e decide una strategia. Non ha quindi uno storico con cui confrontarsi, ciononostante va a mercato.
Il primo caso è sospettabile di overfitting e c'è un forte argomento di tipo probabilistico per ritenere che il sistema a mercato fallirà (se interessa approfondisco).
Il secondo caso viene usato completamente al buio, o bene bene o male male, non ci sono esempi passati sui quali testare la strategia.
Cosa preferiremmo e perché?
Secondo esempio:
Tiriamo 100 volte una moneta: viene la sequenza TTCTCCCT........TCTTC.
Possiamo ipotizzare che se tiriamo nuovamente la moneta 100 volte troveremmo la stessa frequenza?
E se invece fosse venuta la sequenza TCTCTCTC......TC ?
In entrambi i casi le probabilità sono le stesse, 1/2^100, ma nel secondo caso ci parrebbe ragionevole pensare che la sequenza si ripeterà. Perché ?
Partiamo dal trader B, che e' sicuramente meno "convenzionale". Il fatto di avere un ragionamento a priori che conduce al risultato e' sicuramente un punto a favore, ma non bisogna dimenticare il problema del Keynesian beauty contest. Dato che tutti i giocatori sono (in teoria) razionali ed il gioco e' competitivo, sarebbe a mio avviso necessaria una prova empirica che dimostri che siamo piu' "avanti" degli altri nel ragionamento. Alternativamente nel ragionamento stesso dovrebbe scaturire qualche elemento che porti a pensare che tutti i giocatori cooperano. Molto vago ma e' il meglio che mi viene in mente in due minuti.
Per il giocatore A, secondo me quello che dice PGiulia e' piuttosto sensato:
E vorrei cercare di ricongiungerlo ad un argomento di tipo probabilistico, che non so se e' il tuo stesso argomento.Chiedere al sign.X come ha ricavato le informazioni, o sarebbe meglio dire l'"esperienza", per costruire il suo TS.
Se la risposta sarà "attraverso lo studio delle serie storiche dei prezzi battuti" (mettiamoci anche gli OI, volumi, e qualche altra cosuccia ), puoi stare sicuro al 100% che ci sarà overfitting (quello di wiki en). Ed in maniera massiccia, proporzionale alla complessità del TS.
Una equity "soddisfacente" corrispondera' ad una distribuzione dei ritorni che si discosta da quella del mercato con una certa significativita'. Ora, la "significativita'" non e' altro che la risposta alla domanda: "quanto e' probabile che questo risultato esca tirando a caso ?". Benissimo.
Quello che pero' la significativita' non ci dice e' QUANTE volte abbiamo tirato "a caso", cioe' quali sono i gradi di liberta', espliciti ed impliciti, del nostro sistema.
Se aggiungo un numerino non scelto aprioristicamente, ho aggiunto un grado di liberta'.
Se aggiungo un indicatore non scelto aprioristicamente, ho aggiunto N grado di liberta' (uno per l'indicatore e uno per ogni parametro dell'indicatore).
Se scelgo un titolo non aprioristicamente, ho aggiunto un altro grado di liberta'.
Ogni piccolo layer di complessita' aggiunto al sistema, aumenta i nostri gradi di liberta', e cosi' il numero di prove "casuali" che implicitamente o esplicitamente abbiamo fatto.
Mettersi la serie storica davanti agli occhi a questo punto e' suicida, perche' crea comprensibile e pericolosa impressione di aver fatto scelte "aprioristiche" mentre quello che abbiamo fatto e' stato fittare "a occhio" quello che abbiamo davanti. Addirittura l'esperienza in questo caso gioca contro dato che un trader discrezionale relativamente esperto puo' facilmente guardare un grafico e dire a occhio quali sono gli indicatori che ci funzionano. Peccato che anche in questo caso si tratti di un fitting, sebbene fatto dal calcolatore che sta nella scatola cranica.
Cosi' se il nostro, con la serie dei prezzi davanti ha messo 4 indicatori e altrettanti parametri piu' qualche numerino, e stimiamo conservativamente uno spazio di 5 valori per ogni grado di liberta', iniziero' a valutare la possibilita' che il suo sistema possa essere "buono" senza un test out-of-sample quando mi fa vedere una distribuzione di returns che rigettano H0 con una confidenza di 0.99999999 (ovviamente senza aggiungere altri gradi di liberta'). In realta' il problema e' che lavorando in-sample e' impossibile stimare in modo veramente conservativo quanti gradi di liberta' si introducono, senza contare che credo di non aver mai visto uno di questi sistemi rigettare il nullo oltre 0.99 - 0.999 su prove statistiche di un minimo spessore (ad esempio il fetentissimo Kolmogorov - Smirnov), quindi un po' di rigore statistico, sia pure chiaramente insufficiente (come detto, non credo ci sia veramente modo per stimare in modo accettabile quanti gradi di liberta' introduciamo nel costruire la stima, sarebbe interessante discutere al riguardo), almeno aiuterebbe a mettere le cose in prospettiva.
Riguardo invece le due serie di testa o croce, il problema e' a mio avviso interessante e manifesta il modo in cui la mente si approccia agli eventi stocastici.
E' vero che quelle due serie sono uguali se le confronti dal punto di vista della probabilita' di realizzo.
E' altrettanto vero pero' che esse differiscono in modo radicale dal punto di vista del grado di entropia che le caratterizza.
In altre parole la seconda serie e' molto piu' "improbabile" della prima entropicamente. Il tuo cervello lo riconosce e dice "dai cazzarola non e' casuale".
Se ho capito il senso di cio' che dici (cioe', tornando alla mia brutta terminologia, pensi che il tempo sia utilizzabile come "variabile esplicativa"), ti dico che non solo condivido ma ho ragioni per pensare che la cosa sia piu' un fatto che un'opinione.Quando tu hai scritto...
...pensavo volessi intendere che la relazione non "dipenda" dal tempo. Anche perchè una relazione che, a prescindere dalle sue dipendenze, "cambia" nel tempo, non sarebbe assolutamente modellabile, a meno di avere informazioni sulle sue metamorfosi.
Volendo rituffarci in maniera interessante nell'ambito del topic, io personalmente sono convinta (opinione personale) della "dipendenza" temporale della relazione.
Piuttosto, posto che ci ho smanettato ben poco e senza mai cavare un ragno dal buco posso chiederti il perche' del tuo scetticismo sui volumi, che teoricamente non sono un prodotto diretto dei prezzi ? Per la eccessiva notorieta' del dato ?
@Imar: interessante il discorso dei time-frame. Io tendo invece ad avere una preferenza per operativita' a frequenze relativamente alte (nei limiti di cio' che e' resiliente rispetto a slippage, spreads, varie ed eventuali), dato ch a parita' di tutti gli errori di sviluppo che si possono fare, un'operativita' a frequenza piu' alta ti permette di imporre soglie sensibilmente piu' elevate alla significativita' dei test (sia in-sample che out-of-sample), dato che raccogli un volume di dati molto maggiore.
Ultima modifica: