Novità

BIT: 0 - 1

Halmun

Advanced Member >PLATINUM<
l'importanza di bilanciare i dataset a 7 BIT

io:

certo capisco, ma se 2 colonne BIT hanno una forte frequenza di BIT 0 quest'ultima influirebbe sostanzialmente sul risultato della probabilità verso 0.

Copilot:
Esatto! Quando analizzi dati in cui due colonne di BIT hanno una forte frequenza di BIT 0, questo può influire notevolmente sulla probabilità complessiva. In un contesto frequentista, se la maggior parte dei bit sono 0, la frequenza relativa dei bit 0 sarà alta, il che comporta una probabilità elevata di osservare un bit 0 nel dataset.

Per esempio, supponiamo che tu abbia due colonne di dati bit e osservi che 90% dei bit sono 0. In questo caso, la probabilità stimata di trovare un bit 0 in un campione casuale dal dataset sarà approssimativamente 0.9 (o 90%). Questo alto valore di probabilità può influenzare significativamente qualsiasi modello o algoritmo che stai utilizzando per analizzare i dati.

In sintesi:
- **Elevata frequenza di bit 0**: Se la maggioranza dei dati in due colonne è composta da bit 0, la probabilità stimata sarà verso 0.9 o 90%, riflettendo la frequenza osservata.

Quindi, sì, una frequenza elevata di bit 0 influenzerà sostanzialmente il risultato della probabilità, rendendo probabile osservare bit 0 nei tuoi dati. Se hai ulteriori dettagli o domande specifiche sul tuo dataset o analisi, sentiti libero di condividerli!

Io:
come ad esempio in questo caso, dove la presenza 0 nelle colonne A e B riportano presenze pari a : A=63, B=58.
Pres. 0 : 63 58 47 47 46 45 45
Pres. 1: 27 32 43 43 44 45 45

Copilot:
Osservando il tuo dataset, noto che le colonne A e B hanno una frequenza elevata di bit 0. Questo effettivamente influirà sulle probabilità calcolate per questi bit.

Ad esempio:
- **Colonna A**: Ha 63 presenze di 0 su 90, il che significa che la probabilità di osservare un bit 0 in questa colonna è \( \frac{63}{90} \approx 0.7 \) o 70%.
- **Colonna B**: Ha 58 presenze di 0 su 90, quindi la probabilità di osservare un bit 0 è \( \frac{58}{90} \approx 0.64 \) o 64%.

Questa alta frequenza di bit 0 in entrambe le colonne significa che le osservazioni di bit 0 avranno una forte influenza sui risultati delle probabilità complessive. Se dovessi utilizzare queste probabilità nel contesto di un modello di classificazione o di previsione, è probabile che il modello predirebbe bit 0 con una probabilità più alta rispetto ai bit 1, data la distribuzione dei dati.

Io:
quindi in caso di previsioni con attivazioni Sigmoid o Softmax sarebbe consigliabile individuare o utilizzare un blocco-dataset dove la distribuzione 0-1 sia abbastanza equilibrata. giusto?

Copilot:
Esattamente
. Per ottenere previsioni più bilanciate e precise, è preferibile lavorare con dataset in cui la distribuzione dei valori 0 e 1 sia relativamente equilibrata. Quando i dati sono sbilanciati, come nel tuo esempio con molte più presenze di 0, i modelli di machine learning, inclusi quelli con funzioni di attivazione Sigmoid o Softmax, possono diventare meno efficaci e tendere a favorire la classe più frequente (in questo caso, i 0).

Ecco alcuni suggerimenti:
1. **Raccolta di più dati**: Se possibile, raccogli più dati per bilanciare le classi.
2. **Under-sampling**: Riduci il numero di esempi nella classe maggioritaria (0), selezionando casualmente un sottoinsieme.
3. **Over-sampling**: Aumenta il numero di esempi nella classe minoritaria (1) duplicando i dati esistenti o generando nuovi esempi sintetici (ad es. usando tecniche come SMOTE).
4. **Pesi delle classi**: Modifica i pesi delle classi durante l'addestramento del modello, dando più importanza alla classe minoritaria.

Bilanciando il dataset, le attivazioni Sigmoid e Softmax saranno in grado di fornire stime di probabilità più accurate e affidabili.
 
Ultima modifica:
ed infatti queste le percentuali sulla colonna del 1° Estratto di Bari a 7 BIT a partire dalla 1°a estraz. del 2022 ( Tot. 565 Estraz. consecutive ).
la presenza 0 nelle prime 2 colonne parla da sola, e le cose non cambiano su tutte le ruote e su tutte le colonne dei singoli estratti.
 

Allegati

  • 1° estratto Bari.jpg
    1° estratto Bari.jpg
    43 KB · Visite: 2
Ultima modifica:

Ultima estrazione Lotto

  • Estrazione del lotto
    venerdì 31 gennaio 2025
    Bari
    49
    28
    64
    42
    46
    Cagliari
    53
    76
    89
    26
    13
    Firenze
    38
    51
    15
    50
    56
    Genova
    87
    09
    35
    30
    04
    Milano
    53
    25
    23
    09
    37
    Napoli
    01
    65
    38
    06
    15
    Palermo
    05
    07
    10
    26
    58
    Roma
    32
    31
    09
    46
    80
    Torino
    68
    20
    44
    51
    11
    Venezia
    90
    24
    62
    54
    61
    Nazionale
    20
    79
    07
    45
    60
    Estrazione Simbolotto
    Bari
    45
    37
    01
    41
    17
Indietro
Alto