Novità

BIT: 0 - 1

Halmun

Advanced Member >PLATINUM<
l'importanza di bilanciare i dataset a 7 BIT

io:

certo capisco, ma se 2 colonne BIT hanno una forte frequenza di BIT 0 quest'ultima influirebbe sostanzialmente sul risultato della probabilità verso 0.

Copilot:
Esatto! Quando analizzi dati in cui due colonne di BIT hanno una forte frequenza di BIT 0, questo può influire notevolmente sulla probabilità complessiva. In un contesto frequentista, se la maggior parte dei bit sono 0, la frequenza relativa dei bit 0 sarà alta, il che comporta una probabilità elevata di osservare un bit 0 nel dataset.

Per esempio, supponiamo che tu abbia due colonne di dati bit e osservi che 90% dei bit sono 0. In questo caso, la probabilità stimata di trovare un bit 0 in un campione casuale dal dataset sarà approssimativamente 0.9 (o 90%). Questo alto valore di probabilità può influenzare significativamente qualsiasi modello o algoritmo che stai utilizzando per analizzare i dati.

In sintesi:
- **Elevata frequenza di bit 0**: Se la maggioranza dei dati in due colonne è composta da bit 0, la probabilità stimata sarà verso 0.9 o 90%, riflettendo la frequenza osservata.

Quindi, sì, una frequenza elevata di bit 0 influenzerà sostanzialmente il risultato della probabilità, rendendo probabile osservare bit 0 nei tuoi dati. Se hai ulteriori dettagli o domande specifiche sul tuo dataset o analisi, sentiti libero di condividerli!

Io:
come ad esempio in questo caso, dove la presenza 0 nelle colonne A e B riportano presenze pari a : A=63, B=58.
Pres. 0 : 63 58 47 47 46 45 45
Pres. 1: 27 32 43 43 44 45 45

Copilot:
Osservando il tuo dataset, noto che le colonne A e B hanno una frequenza elevata di bit 0. Questo effettivamente influirà sulle probabilità calcolate per questi bit.

Ad esempio:
- **Colonna A**: Ha 63 presenze di 0 su 90, il che significa che la probabilità di osservare un bit 0 in questa colonna è \( \frac{63}{90} \approx 0.7 \) o 70%.
- **Colonna B**: Ha 58 presenze di 0 su 90, quindi la probabilità di osservare un bit 0 è \( \frac{58}{90} \approx 0.64 \) o 64%.

Questa alta frequenza di bit 0 in entrambe le colonne significa che le osservazioni di bit 0 avranno una forte influenza sui risultati delle probabilità complessive. Se dovessi utilizzare queste probabilità nel contesto di un modello di classificazione o di previsione, è probabile che il modello predirebbe bit 0 con una probabilità più alta rispetto ai bit 1, data la distribuzione dei dati.

Io:
quindi in caso di previsioni con attivazioni Sigmoid o Softmax sarebbe consigliabile individuare o utilizzare un blocco-dataset dove la distribuzione 0-1 sia abbastanza equilibrata. giusto?

Copilot:
Esattamente
. Per ottenere previsioni più bilanciate e precise, è preferibile lavorare con dataset in cui la distribuzione dei valori 0 e 1 sia relativamente equilibrata. Quando i dati sono sbilanciati, come nel tuo esempio con molte più presenze di 0, i modelli di machine learning, inclusi quelli con funzioni di attivazione Sigmoid o Softmax, possono diventare meno efficaci e tendere a favorire la classe più frequente (in questo caso, i 0).

Ecco alcuni suggerimenti:
1. **Raccolta di più dati**: Se possibile, raccogli più dati per bilanciare le classi.
2. **Under-sampling**: Riduci il numero di esempi nella classe maggioritaria (0), selezionando casualmente un sottoinsieme.
3. **Over-sampling**: Aumenta il numero di esempi nella classe minoritaria (1) duplicando i dati esistenti o generando nuovi esempi sintetici (ad es. usando tecniche come SMOTE).
4. **Pesi delle classi**: Modifica i pesi delle classi durante l'addestramento del modello, dando più importanza alla classe minoritaria.

Bilanciando il dataset, le attivazioni Sigmoid e Softmax saranno in grado di fornire stime di probabilità più accurate e affidabili.
 
Ultima modifica:
ed infatti queste le percentuali sulla colonna del 1° Estratto di Bari a 7 BIT a partire dalla 1°a estraz. del 2022 ( Tot. 565 Estraz. consecutive ).
la presenza 0 nelle prime 2 colonne parla da sola, e le cose non cambiano su tutte le ruote e su tutte le colonne dei singoli estratti.
 

Allegati

  • 1° estratto Bari.jpg
    1° estratto Bari.jpg
    43 KB · Visite: 5
Ultima modifica:
Promemoria File Python bin_abc5.py
dataset in formato Binario.

Bari Test F.D. 25/01/2025

osserviamo gli indicatori dev. standard e asimmetria delle 5 colonne analizzate.
gli esiti 62 al 2° C. + 64 al 3° C. tendono ad evidenziare maggiormente lo Step 92 ( 2 colpi ).
Naturalmente il margine di tolleranza temporale è sempre d'obbligo x la scelta.


Quante righe vuoi analizzare partendo dall'ultima? 90

1/1 [==============================] - 0s 198ms/step
1/1 [==============================] - 0s 88ms/step
1/1 [==============================] - 0s 69ms/step
1/1 [==============================] - 0s 69ms/step
1/1 [==============================] - 0s 57ms/step
-----------------------------------------------------
1/1 [==============================] - 0s 126ms/step
1/1 [==============================] - 0s 59ms/step
1/1 [==============================] - 0s 60ms/step
1/1 [==============================] - 0s 60ms/step
1/1 [==============================] - 0s 60ms/step
-----------------------------------------------------
1/1 [==============================] - 0s 115ms/step
1/1 [==============================] - 0s 58ms/step
1/1 [==============================] - 0s 59ms/step
1/1 [==============================] - 0s 59ms/step
1/1 [==============================] - 0s 58ms/step
-----------------------------------------------------
1/1 [==============================] - 0s 115ms/step
1/1 [==============================] - 0s 59ms/step
1/1 [==============================] - 0s 60ms/step
1/1 [==============================] - 0s 60ms/step
1/1 [==============================] - 0s 59ms/step
-----------------------------------------------------
1/1 [==============================] - 0s 120ms/step
1/1 [==============================] - 0s 59ms/step
1/1 [==============================] - 0s 59ms/step
1/1 [==============================] - 0s 91ms/step
1/1 [==============================] - 0s 58ms/step
-----------------------------------------------------
Previsioni:
Step 91:
A: 0111101 (61) | Deviazione standard: 1.02 | Asimmetria: 0.27
B: 0111111 (63) | Deviazione standard: 1.02 | Asimmetria: -0.27
C: 0111101 (61) | Deviazione standard: 0.89 | Asimmetria: 0.00
D: 0000000 (00) | Deviazione standard: 0.00 | Asimmetria: nan
E: 0111111 (63) | Deviazione standard: 1.02 | Asimmetria: -0.27

Step 92:
A: 0111110 (62) | Deviazione standard: 1.02 | Asimmetria: 0.27
B: 1000000 (64) | Deviazione standard: 1.02 | Asimmetria: -0.27
C: 0111101 (61) | Deviazione standard: 0.89 | Asimmetria: 0.00
D: 0000000 (00) | Deviazione standard: 0.00 | Asimmetria: nan
E: 1000000 (64) | Deviazione standard: 1.02 | Asimmetria: -0.27

Step 93:
A: 0111110 (62) | Deviazione standard: 1.02 | Asimmetria: 0.27
B: 1000001 (65) | Deviazione standard: 1.02 | Asimmetria: -0.27
C: 0111110 (62) | Deviazione standard: 0.89 | Asimmetria: 0.00
D: 0000000 (00) | Deviazione standard: 0.00 | Asimmetria: nan
E: 1000001 (65) | Deviazione standard: 1.02 | Asimmetria: -0.27

Step 94:
A: 0111111 (63) | Deviazione standard: 1.02 | Asimmetria: 0.27
B: 1000001 (65) | Deviazione standard: 1.02 | Asimmetria: -0.27
C: 0111111 (63) | Deviazione standard: 0.89 | Asimmetria: 0.00
D: 0000000 (00) | Deviazione standard: 0.00 | Asimmetria: nan
E: 1000001 (65) | Deviazione standard: 1.02 | Asimmetria: -0.27

Step 95:
A: 1000000 (64) | Deviazione standard: 1.02 | Asimmetria: 0.27
B: 1000010 (66) | Deviazione standard: 1.02 | Asimmetria: -0.27
C: 0111111 (63) | Deviazione standard: 0.89 | Asimmetria: 0.00
D: 0000000 (00) | Deviazione standard: 0.00 | Asimmetria: nan
E: 1000010 (66) | Deviazione standard: 1.02 | Asimmetria: -0.27

Tempo di esecuzione: 16.50 secondi
 

Ultima estrazione Lotto

  • Estrazione del lotto
    sabato 01 febbraio 2025
    Bari
    83
    17
    12
    67
    85
    Cagliari
    50
    41
    18
    04
    46
    Firenze
    73
    63
    57
    74
    86
    Genova
    81
    22
    42
    37
    53
    Milano
    07
    60
    76
    11
    56
    Napoli
    87
    25
    66
    05
    33
    Palermo
    39
    58
    06
    89
    40
    Roma
    63
    23
    04
    14
    61
    Torino
    56
    59
    26
    81
    10
    Venezia
    39
    68
    37
    50
    07
    Nazionale
    19
    89
    28
    18
    33
    Estrazione Simbolotto
    Cagliari
    16
    18
    44
    24
    12

Ultimi Messaggi

Indietro
Alto