Novità

Chi vuole provarlo

Da analista: il codice è scritto bene, backtest incluso e onesto ma il motore non può funzionare per ragioni matematiche di base, indipendentemente da quanti dati storici si usino.
Il backtest su 25 anni di archivio (7/3/2001 – 7/3/2026) lo dimostra in modo definitivo.
La probabilità casuale di indovinare almeno 1 numero su 2 proposti in una estrazione da 5 su 90 è:
P = 1 - C(88,5) / C(90,5) = 10,86%
RuotaTestVinti%
Bari380644211,61%
Cagliari380641210,83%
Firenze380640710,69%
Genova38063739,80%
Milano380642211,09%
Napoli380641010,77%
Palermo380645712,01%
Roma380642111,06%
Nazionale33483259,71%
Torino380639710,43%
Venezia380639710,43%
TOTALE41408446310,78%
Il totale generale è 10,78% contro il 10,86% atteso dal caso puro. La differenza è di 8 centesimi di punto percentuale su 41.408 test , siamo letteralmente nel rumore di campionamento.
Mattia73
@mattia73 quello che hai scritto è statisticamente corretto, ho stimato quanto è grande l'errore, 10,86% ± 0,30% (intervallo 95%) ≈ 10,56% – 11,16% dunque hai ragione quando scrivi che siamo nel rumore di campionamento. Tuttavia, non contestando la matematica, posso solo aggiungere che: concordo sul fatto che la probabilità teorica P=1− (88 / 5) (90 / 5) sia corretta.
Il punto interessante del mio esperimento non era confutarla, ma verificarla empiricamente con un metodo deterministico di selezione dei numeri basato su dati storici. Il backtest su oltre 41.400 simulazioni mostra una frequenza di successo del 10,78%, quindi sostanzialmente coincidente con il valore teorico di 10,86%. Questo suggerisce che il metodo non introduce alcuna informazione predittiva rispetto al caso, e conferma l’ipotesi di indipendenza delle estrazioni. Saluti e stamani sul lavoro non potevo fare molto per una risposta migliore.
 
@mattia73 quello che hai scritto è statisticamente corretto, ho stimato quanto è grande l'errore, 10,86% ± 0,30% (intervallo 95%) ≈ 10,56% – 11,16% dunque hai ragione quando scrivi che siamo nel rumore di campionamento. Tuttavia, non contestando la matematica, posso solo aggiungere che: concordo sul fatto che la probabilità teorica P=1− (88 / 5) (90 / 5) sia corretta.
Il punto interessante del mio esperimento non era confutarla, ma verificarla empiricamente con un metodo deterministico di selezione dei numeri basato su dati storici. Il backtest su oltre 41.400 simulazioni mostra una frequenza di successo del 10,78%, quindi sostanzialmente coincidente con il valore teorico di 10,86%. Questo suggerisce che il metodo non introduce alcuna informazione predittiva rispetto al caso, e conferma l’ipotesi di indipendenza delle estrazioni. Saluti e stamani sul lavoro non potevo fare molto per una risposta migliore.
Esatto e aggiungo una considerazione più generale.
Qualsiasi metodo per quanto elaborato matematicamente, correlazioni lag, ML, reti neurali, analisi varie si scontra sempre con lo stesso muro: il valore atteso negativo.
Nel lotto italiano varia dal -37% circa per l'ambata fino a oltre il -60% per terno e quaterna, in media si parla di circa il 36-40% di perdita su ogni euro giocato a seconda della giocata. Nessun algoritmo di selezione dei numeri può spostare quel numero, perché agisce sulla scelta non sulla struttura del gioco.
Il gioco va preso per quello che è: intrattenimento con un costo, esattamente come un cinema o una cena fuori. Chi lo usa come metodo per arricchirsi parte già sconfitto indipendentemente da quanto sia sofisticato il suo sistema.
Sul tema IA hai centrato un punto che condivido pienamente.
Uno strumento come ChatGPT o Claude o qualsiasi altra intelligenza artificiale usato per costruire previsioni lotto produce output che sembrano autorevoli, codice pulito, analisi strutturata, grafici, numeri "elaborati" ma il risultato finale è identico al caso con l'aggravante che l'utente ci crede di più perché "lo ha detto l'intelligenza artificiale". L'IA andrebbe usata esattamente per dimostrare con i numeri che non esiste bordo predittivo, non per alimentare l'illusione che ce ne sia uno.
Il previsionista vuole la previsione e l'IA gliela fa.
È il classico caso in cui lo strumento viene piegato alla conferma di ciò che l'utente vuole sentirsi dire.
Mattia73
 
Scusa @mattia73 se aggiungo ancora una cosa, come suggerito dalla discussione precedente, ho esteso il backtest utilizzando l’archivio completo disponibile dal 1939 al 2026. Naturalmente su un normale portatile il tempo è di 5 o 6 minuti e non ho intenzione di velocizzare il backtest, manca il tempo e poi dovrei fare delle verifiche, accontentiamoci. Il test complessivo ha prodotto i seguenti risultati aggregati:
TOTALE GENERALE
test: 75.559
vinti: 8.206
percentuale osservata: 10,86%
Il risultato osservato nel backtest coincide quindi praticamente in modo perfetto con il valore teorico.
Questo conferma quanto discusso nella tua risposta precedente: il metodo di selezione dei numeri, pur essendo deterministico e basato su analisi dello storico, non introduce alcuna informazione predittiva utile rispetto al caso. In altre parole, su un campione molto ampio di oltre 75.000 simulazioni, la frequenza empirica converge esattamente alla probabilità combinatoria prevista dal modello.
Il risultato rappresenta quindi una verifica empirica piuttosto chiara dell’ipotesi di indipendenza delle estrazioni e del fatto che l’analisi delle estrazioni passate non produce un vantaggio statistico nella previsione delle successive. Grazie ancora per le osservazioni precedenti, che hanno aiutato a interpretare correttamente i risultati del test. A presto!
 

Allegati

  • 1939.png
    1939.png
    267,6 KB · Visite: 6
Ho modificato un piccolo script al quale stavo lavorando per renderlo più compatibile a quanto qui in discussione.

Riguarda la ruota di Bari e nello stesso periodo conferma 422 presenze della sorte con poche differenze in +/-

Nel periodo più lungo dalla estrazione 3950 ad oggi, invece, si vede chiaramente

come +/- Ritardatario ha esattamente le stesse probabilità di estrazione che diventano le stesse Presenze Reali.

Nei primi 45 ritardatari al confronto con gli ultimi omologhi ci sono differenze infinitesimali.

Per esempio il più ritardatario (1) è stato estratto 387 volte mentre l'ultimo (90) solo 370 volte.

Mentre il 4° ritardatario è stato estratto 377 Volte ed il corrispondente 87-esimo 391 volte.

In questo caso sarebbe da preferire il meno in ritardato.

Ma è di tutta evidenza che chi scrive che i ritardi o le frequenze sono da preferire l'uno all'altro

o scrive per ignoranza del fatto che sono esattamente identici o scrive in malafede

di cose assolutamente prive di riscontro ed utili solo a propagandare falsità.



Fre_Rit.jpg

Perché 17153 e 17182 Casi ... sono praticamente la stessa grandezza.

:)
 
Scusa @mattia73 se aggiungo ancora una cosa, come suggerito dalla discussione precedente, ho esteso il backtest utilizzando l’archivio completo disponibile dal 1939 al 2026. Naturalmente su un normale portatile il tempo è di 5 o 6 minuti e non ho intenzione di velocizzare il backtest, manca il tempo e poi dovrei fare delle verifiche, accontentiamoci. Il test complessivo ha prodotto i seguenti risultati aggregati:
TOTALE GENERALE
test: 75.559
vinti: 8.206
percentuale osservata: 10,86%
Il risultato osservato nel backtest coincide quindi praticamente in modo perfetto con il valore teorico.
Questo conferma quanto discusso nella tua risposta precedente: il metodo di selezione dei numeri, pur essendo deterministico e basato su analisi dello storico, non introduce alcuna informazione predittiva utile rispetto al caso. In altre parole, su un campione molto ampio di oltre 75.000 simulazioni, la frequenza empirica converge esattamente alla probabilità combinatoria prevista dal modello.
Il risultato rappresenta quindi una verifica empirica piuttosto chiara dell’ipotesi di indipendenza delle estrazioni e del fatto che l’analisi delle estrazioni passate non produce un vantaggio statistico nella previsione delle successive. Grazie ancora per le osservazioni precedenti, che hanno aiutato a interpretare correttamente i risultati del test. A presto!
Grazie per il contributo preciso e ben documentato.
Concordo pienamente con la tua interpretazione: la convergenza al 10.86% su 75.559 test è una verifica empirica difficile da contestare.
Per completare il quadro aggiungo un test parallelo che ho fatto io.
Ho modificato il backtest perché nella versione originale con archivi grandi il programma si bloccava completamente, il problema era un algoritmo O(n²) che riscansionava tutto lo storico ad ogni passo. Ho riscritto la logica con un approccio incrementale che mantiene i contatori aggiornati passo per passo e ho spostato il calcolo su un thread separato così la GUI rimane reattiva.
Ho quindi generato un archivio completamente casuale di 30.000 estrazioni (numeri estratti con random.sample da 1 a 90, nessuna struttura, nessun pattern) e lanciato il backtest. Il risultato è nell'immagine allegata:

backtest.png


329.659 test — 10.92% — valore atteso teorico 10.86%
Scarto di 0.06%. Sostanzialmente identico al tuo risultato su dati reali dal 1939.
La conclusione è la stessa su entrambi gli archivi: che i dati siano reali o puramente casuali non fa differenza. Il metodo non riesce a distinguere un archivio dall'altro perché non c'è nulla da trovare, le estrazioni sono indipendenti e l'analisi dello storico non produce informazione predittiva. Il 10.86% è il pavimento matematico dal quale non si esce, né con 87 anni di archivio reale né con 30.000 estrazioni inventate al computer.
Mattia73
 
Ho modificato un piccolo script al quale stavo lavorando per renderlo più compatibile a quanto qui in discussione.

Riguarda la ruota di Bari e nello stesso periodo conferma 422 presenze della sorte con poche differenze in +/-

Nel periodo più lungo dalla estrazione 3950 ad oggi, invece, si vede chiaramente

come +/- Ritardatario ha esattamente le stesse probabilità di estrazione che diventano le stesse Presenze Reali.

Nei primi 45 ritardatari al confronto con gli ultimi omologhi ci sono differenze infinitesimali.

Per esempio il più ritardatario (1) è stato estratto 387 volte mentre l'ultimo (90) solo 370 volte.

Mentre il 4° ritardatario è stato estratto 377 Volte ed il corrispondente 87-esimo 391 volte.

In questo caso sarebbe da preferire il meno in ritardato.

Ma è di tutta evidenza che chi scrive che i ritardi o le frequenze sono da preferire l'uno all'altro

o scrive per ignoranza del fatto che sono esattamente identici o scrive in malafede

di cose assolutamente prive di riscontro ed utili solo a propagandare falsità.



Vedi l'allegato 2312897

Perché 17153 e 17182 Casi ... sono praticamente la stessa grandezza.

:)
Ottima analisi precisa e ben documentata.
I tuoi dati confermano esattamente quello che la matematica prevede.
La questione ritardatari vs frequenti è forse la più dibattuta nei forum del lotto da decenni e il tuo lavoro sulla ruota di Bari la chiude in modo difficilmente contestabile: 17.153 casi da un lato, 17.182 dall'altro su un periodo che va dall'estrazione 3950 ad oggi. Una differenza di 29 casi su oltre 17.000 , rumore statistico puro.
Il motivo è semplice: ritardo e frequenza sono la stessa informazione vista da angolazioni opposte. Un numero molto ritardatario è per definizione poco frequente nel periodo recente e viceversa.
Scegliere i ritardatari invece dei frequenti o il contrario equivale a girare la stessa moneta dalla parte che preferisci: il risultato non cambia perché la moneta è equilibrata.
L'unica cosa che conta è che ogni estrazione è indipendente dalle precedenti, e nessun numero "deve" uscire né "tende" a non uscire in virtù di ciò che è successo prima. I tuoi 17.153 contro 17.182 lo dimostrano empiricamente su un campione molto lungo..
Chi continua a sostenere la superiorità dei ritardatari sui frequenti o viceversa come hai scritto tu stesso o non conosce questi dati o li ignora deliberatamente.
In entrambi i casi non sta aiutando chi legge.
Mattia73
 
Eccellente @mattia73 è stato veramente un piacere condividere queste informazione. A me coi miei quasi 64 anni mi tiene più energico. A rileggerci con qualche nuova idea.
 

Ultima estrazione Lotto

  • Estrazione del lotto
    sabato 07 marzo 2026
    Bari
    72
    21
    49
    31
    07
    Cagliari
    28
    11
    57
    03
    85
    Firenze
    41
    76
    27
    01
    79
    Genova
    76
    19
    37
    40
    69
    Milano
    18
    23
    56
    21
    57
    Napoli
    10
    89
    63
    31
    48
    Palermo
    39
    15
    85
    77
    14
    Roma
    90
    51
    56
    89
    16
    Torino
    10
    04
    73
    06
    61
    Venezia
    89
    70
    46
    61
    56
    Nazionale
    31
    37
    89
    64
    68
    Estrazione Simbolotto
    Firenze
    29
    43
    32
    08
    25
Indietro
Alto