Al contrario io noto piuttosto un'enorme differenza: la biglia, le cellule e la vita media di un utensile rispettano leggi fisiche ben precise che consentono di effettuare previsioni praticamente senza overfitting, visto che non c'è alcuna influenza della volontà umana.
Il tasso di crescita del PIL, per quanto correlato ad altre variabili economiche, deriva invece da comportamenti umani, e quindi non sarà mai prevedibile come il movimento di una biglia, le qualità di una cellula, la durata di un utensile.
I limiti nella qualità previsionale dell'economia rispetto a quella della fisica, della biologia, della meccanica, oltre ad essere evidenti, sono l'esatto confine che non le consente di essere considerata alla loro stregua.
Tutto ciò detto con il massimo rispetto per l'economia, materia validissima e utilissima di cui voglio semplicemente sottolineare la diversità rispetto ad altre scienze ben più affidabili; per quanto comprenda gli sforzi (inutili) degli economisti nel voler annullare differenze che per quanto mi riguarda risultano lapalissiane.
Capisco perfettamente la tua opinione, e per questo le considerazioni che voglio portarti in risposta non sono critiche, ma approfondimenti per farti capire come la vedo.
In particolare non confondere i seguenti tre oggetti:
- oggetto della previsione e sue caratteristiche peculiari;
- modelli utilizzati per validare ipotesi;
- bontà e affidabilità del risultato ottenuto.
Quello che hai scritto è sicuramente vero nel senso che la componente di aleatorietà del tasso di crescita del PIL è infinitamente più grande di quella che classifica una cellula sulla base dei suoi attributi; ma, allo stesso modo, la componente di aleatorietà nelle caratteristiche di una cellula è infinitamente più grande di quella che predice la velocità istantanea di una biglia di acciaio che scivola lungo un piano inclinato di marmo bagnato.
Non per essere monotono negli argomenti, ma c'è un ottimo
data set in R che è usato spesso per provare tutti i modelli di classificazione:
Iris flower data set; è il famoso
set di Ronald Fisher, è vecchio di quasi un secolo.
Hai tre specie di fiori e conosci un po' dei loro attributi, se ti do un nuovo fiore sulla base dei suoi attributi devi metterlo nella categoria giusta.
(Sono sicuro che conosci meglio di me questo genere di "addestramento", visto che il
data set che ti ho descritto è spesso il primo banco di prova delle tecniche di
machine learning, come NN e SVM).
Se la componente di casualità del tasso di crescita del PIL rispetto alla classificazione dei fiori è altissima a causa della enorme complessità dell'indole umana, allo stesso modo anche la classificazione dei fiori risente di tutti quella casualità che la vita biologica esprime generando nuove Iris con petali di forme e colori leggermente diversi gli uni dagli altri... e quindi sicuramente la casualità nelle caratteristiche di una cellula rispetto alla velocità istantanea di una biglia su un piano sono su due ordini di grandezza diversi.
Il punto è che, dalla prospettiva di uno scienziato che usa la statistica per analizzare dei dati, questo finisce per tradursi unicamente in dispersione degli errori commessi: quasi nulla per la biglia, altissima per le variazioni del PIL.
Ma questo non altera il metodo deduttivo (semmai nel caso di un modello che cercasse di spiegare le variazioni del PIL o, peggio ancora, dei mercati finanziari si finirebbe in un
loop senza fine

):
Quindi, concludendo: è verissimo che gli stessi metodi e strumenti usati sulle biglie
non producono risultati altrettanto affidabili che se usati sullo S&P 500; è altrettanto vero, però, che il processo che ci porta eventualmente a usare quel metodo di indagine è lo stesso in entrambi i casi: osservazione, formulazione di una ipotesi,
test dell'ipotesi con quante più informazioni abbiamo a disposizione.
Che poi ciò che vogliamo misurare non abbia caratteristiche tali da poter essere agevolmente indagato con gli stessi
test di ipotesi e modelli che uso per la biglia è un caso che "fa parte del gioco" (vuoi per scarsità di dati, vuoi per eteroschedasticità, vuoi per distribuzioni dei dati pazzesche - ricordo Imar discutere con vampyro1 sul famoso esempio del latte e del FTSE MIB con varianza infinita...): bisognerà usare altro o alla fine ammettere a se stessi che non si dispone degli strumenti adatti per indagare fenomeni così complessi con sufficiente confidenza.
_________________________________
Aggiungo un esperimento logico per assurdo che dovrebbe piacerti, un po' sulla falsariga di quelle cose in stile "paradosso di Zenone".
Per farti intendere che la transizione tra ciò che è effettivamente indagabile con la statistica e ciò che non lo è è "sfumata" e non "netta" come la intendi tu, considera sempre il caso di voler prevedere le variazioni del PIL con buona precisione.
Tu dici giustamente che questo sarà impossibile da fare come vorremmo: la natura umana e la componente di casualità saranno così grandi ed erratiche che al meglio potremo affermare che l'anno prossimo il PIL non crescerà del 20% né scenderà del 30% (ma anche in quel caso non ne saremmo così convinti se dovessimo giocarci la vita su quella previsione

).
Allora io ti propongo questo esperimento logico: immagina una economia completamente chiusa agli scambi con l'esterno e supponi di sostituire una per una tutte le persone di un Paese con degli automi (automi che però consumano, lavorano etc. etc.) di cui conosci in modo deterministico i comportamenti.
Ad ogni individuo sostituito, rifai tutto il processo deduttivo per prevedere il PIL: ipotizzi, osservi, sottoponi a validazione, cerchi di correggere l'errore e via da capo.
Ecco, a forza di sostituire individui con automi, raggiungerai un livello di aleatorietà paragonabile a quello delle famose cellule di cui sopra; se vai avanti a sostituire tutte le persone con automi, arriverai alla fine ad avere una specie di programma in cui ogni individuo è una classe coi suoi metodi, cioè un "affare" che dovrebbe avere un comportamento non solo deterministico ma anche perfettamente noto (o comunque a bassissima varianza rispetto a quando c'erano solo umani in giro): siamo al livello di aleatorietà della biglia su un piano inclinato solo leggermente viscoso.
Vado in palestra, leggerò repliche stasera o domattina.