Novità

Python - Addestramento rete neurale

mi scuso per l'errore di invio:

467 10/08/2024 1 1 2 3 5
468 13/08/2024 8 10 16 23 46
469 16/08/2024 1 2 2 3 6
470 17/08/2024 9 11 17 26 51
471 20/08/2024 9 11 18 26 52
472 22/08/2024 2 2 4 5 10
473 23/08/2024 3 3 5 7 13
474 24/08/2024 11 13 21 31 61
475 27/08/2024 10 12 20 30 60
476 29/08/2024 2 3 4 6 12
477 30/08/2024 2 2 3 5 9
478 31/08/2024 15 18 30 44 88
479 03/09/2024 3 4 6 9 18
480 05/09/2024 6 8 12 18 36
481 06/09/2024 14 16 27 40 79
482 07/09/2024 15 17 29 43 85
483 10/09/2024 8 10 16 24 47
484 12/09/2024 3 3 5 7 13
485 13/09/2024 4 5 8 12 24
486 14/09/2024 4 4 7 10 19
487 17/09/2024 13 15 25 37 74
488 19/09/2024 3 3 5 7 14
489 20/09/2024 8 10 16 23 46
490 21/09/2024 7 8 14 20 40
491 24/09/2024 3 3 5 7 13
492 26/09/2024 3 4 6 9 17
493 27/09/2024 6 7 11 16 31
494 28/09/2024 8 10 16 24 47
495 01/10/2024 7 8 13 19 37
496 03/10/2024 15 18 30 45 89
497 04/10/2024 1 1 2 3 5
498 05/10/2024 12 14 23 34 68
499 08/10/2024 8 9 15 23 45
500 10/10/2024 8 10 16 24 48
501 11/10/2024 13 16 26 38 76
502 12/10/2024 7 9 14 21 41
503 15/10/2024 6 8 12 18 36
504 17/10/2024 7 8 13 20 39
505 18/10/2024 13 15 25 37 74
506 19/10/2024 11 14 22 33 66
507 22/10/2024 6 8 12 18 36
508 24/10/2024 2 2 3 4 7
509 25/10/2024 2 2 4 5 10
510 26/10/2024 7 8 14 20 40
511 29/10/2024 12 14 23 34 67
512 31/10/2024 3 4 6 8 16
513 02/11/2024 6 8 12 18 36
514 04/11/2024 3 4 6 8 16
515 05/11/2024 10 11 19 28 55
516 07/11/2024 5 6 10 15 29
517 08/11/2024 12 14 23 34 68
518 09/11/2024 8 9 15 22 43
519 12/11/2024 11 14 22 33 66
520 14/11/2024 10 12 19 29 57
521 15/11/2024 1 1 2 3 5
522 16/11/2024 3 4 6 9 17
523 19/11/2024 9 11 17 26 51
524 21/11/2024 1 2 2 3 6
525 22/11/2024 5 6 9 14 27
526 23/11/2024 6 7 11 17 33
527 26/11/2024 6 7 12 18 35
528 28/11/2024 9 11 18 26 52
529 29/11/2024 5 6 10 15 29
530 30/11/2024 5 5 9 13 25
531 03/12/2024 7 8 13 19 38
532 05/12/2024 6 7 11 16 32
533 06/12/2024 2 2 3 5 9
534 07/12/2024 7 8 13 19 37
535 10/12/2024 14 16 27 40 79
536 12/12/2024 2 2 3 4 7
537 13/12/2024 11 14 22 33 66
538 14/12/2024 15 18 30 45 89
539 17/12/2024 15 18 30 44 88
540 19/12/2024 9 11 18 27 53
541 20/12/2024 4 4 7 10 19
542 21/12/2024 4 4 7 10 19
543 24/12/2024 5 6 9 13 26
544 27/12/2024 9 11 18 27 54
545 28/12/2024 13 15 25 37 74
546 30/12/2024 7 8 13 19 37
547 31/12/2024 12 15 24 36 71
548 02/01/2025 7 8 13 20 39
549 03/01/2025 10 12 20 30 60
550 04/01/2025 8 10 16 24 48
551 07/01/2025 5 6 10 15 29
552 09/01/2025 8 10 16 24 47
553 10/01/2025 7 8 14 20 40
554 11/01/2025 13 15 25 37 73
555 14/01/2025 7 9 14 21 41
556 16/01/2025 8 10 16 24 47
557 17/01/2025 2 2 4 5 10
 
con early stopping = 2 ... come potrete notare le convergenze con l'early stopping = 1 sono 09 15 quindi 2 Primarie che sfaldano puntuale il 09
 

Allegati

  • 09 15.jpg
    09 15.jpg
    235,9 KB · Visite: 8
sperando di fare cosa gradita ho fatto una serie di aggiornamenti ad una mia beta 15 ho incluso quanto determinato da Halmun sperando di aver fatto in maniera corretta ,con una gestione grafica ed alcune impostazioni extra che andro' a spiegare successivamente ,ma è molto intuitivo , chiedo a te Halmun se ti è possibile aggiornare il pulsante statistiche te ne sarei grato.

NB sono indicativi gli esiti e non certi in alcun modo ,le tendenze sembrano essere positive ma vi invito a verificarne gli esiti e a trovare convergenze ,il code è gratuito non è in vendita in alcun modo da nessuna parte e in nessun forum ,è pubblicato solo qui su lottoced . iNOLTRE Se non avete dimestichezza con python io meno di voi , non usatelo e mantenete ben salde le vostr convinzioni ,è solo un test

Invito tutti alla partecipazione

Codice:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import Dense, Dropout, LSTM, Input
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint, ReduceLROnPlateau, CSVLogger
import tensorflow as tf
import tkinter as tk
from tkinter import messagebox, scrolledtext, simpledialog
from tkinter import ttk
from matplotlib.figure import Figure
from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg
import matplotlib.pyplot as plt

# Definizione dei file delle ruote
file_ruote = {
    'BA': 'Bari.txt',
    'CA': 'Cagliari.txt',
    'FI': 'Firenze.txt',
    'GE': 'Genova.txt',
    'MI': 'Milano.txt',
    'NA': 'Napoli.txt',
    'PA': 'Palermo.txt',
    'RM': 'Roma.txt',
    'TO': 'Torino.txt',
    'VE': 'Venezia.txt',
    'NZ': 'Nazionale.txt'
}

# Variabili globali
model = None
X_test = None
y_test = None
scaler = None
ruota_data = None
numeri_previsti = None
previsioni_multiple_resultati = None  # Aggiunta per salvare le previsioni multiple

# Funzione per caricare i dati della ruota selezionata
def carica_dati(ruota, start_date, end_date, num_estrazioni):
    global ruota_data
    file_name = file_ruote[ruota]
    try:
        data = pd.read_csv(file_name, header=None, sep=r'\s+')
        mostra_risultati(f"File caricato: {file_name}\n")

        if data.empty or data.isin([None, '']).any().any():
            mostra_risultati("File vuoto o con valori non validi.\n")
            return None, None, None, None

        data.columns = ['data'] + [f'num_{i}' for i in range(1, data.shape[1])]
        data['data'] = pd.to_datetime(data['data'], format='%Y/%m/%d')

        mask = (data['data'] >= start_date) & (data['data'] <= end_date)
        data = data.loc[mask]

        if data.empty:
            mostra_risultati("Nessun dato trovato nel range di date specificato.\n")
            return None, None, None, None

        mostra_risultati(f"Verifica da {data['data'].iloc[0].date()} a {data['data'].iloc[-1].date()}\n")
        numeri = data.iloc[:, 1:].apply(pd.to_numeric, errors='coerce').dropna(axis=1).values

        if numeri.size == 0:
            mostra_risultati("Non ci sono numeri validi nel file.\n")
            return None, None, None, None

        scaler = MinMaxScaler(feature_range=(0, 1))
        numeri_normalizzati = scaler.fit_transform(numeri.astype(float))

        X, y = [], []
        for i in range(len(numeri_normalizzati) - num_estrazioni):
            X.append(numeri_normalizzati[i:i + num_estrazioni])
            y.append(numeri_normalizzati[i + num_estrazioni])

        X = np.array(X)
        y = np.array(y)

        mostra_risultati(f"Dimensione X: {X.shape}, Dimensione y: {y.shape}\n")

        if X.shape[0] < 1:
            mostra_risultati("Non ci sono dati sufficienti per l'addestramento.\n")
            return None, None, None, None

        ruota_data = data
        return X, y, scaler, data
    except Exception as e:
        mostra_risultati(f"Errore durante il caricamento dei dati: {e}\n")
        return None, None, None, None

# Funzione per creare il modello LSTM
def crea_modello(X_train):
    model = Sequential()
    model.add(Input(shape=(X_train.shape[1], X_train.shape[2])))
    model.add(LSTM(128, return_sequences=True, kernel_regularizer=tf.keras.regularizers.l2(0.01)))
    model.add(Dropout(0.3))
    model.add(LSTM(64, kernel_regularizer=tf.keras.regularizers.l2(0.05)))
    model.add(Dropout(0.2))
    model.add(Dense(X_train.shape[2]))  # Matching output size to feature number
    model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.005), loss='mean_squared_error')
    return model

# Funzione per gestire la selezione della ruota
def on_seleziona_ruota(ruota):
    global model, X_test, y_test, scaler, numeri_previsti

    try:
        start_date = pd.to_datetime(entry_start_date.get(), format='%Y/%m/%d')
        end_date = pd.to_datetime(entry_end_date.get(), format='%Y/%m/%d')
        num_estrazioni = int(entry_num_estrazioni.get())
    except ValueError:
        mostra_risultati("Inserisci un intervallo di date valido nel formato YYYY/MM/DD e un numero valido per le estrazioni.\n")
        return

    if start_date > end_date:
        mostra_risultati("La data di inizio deve essere precedente alla data di fine.\n")
        return

    X, y, scaler, ruota_data = carica_dati(ruota, start_date, end_date, num_estrazioni)

    if X is not None and y is not None:
        if len(X) < 1:
            mostra_risultati("Non ci sono dati sufficienti per l'addestramento del modello.\n")
            return
       
        if len(X) < 2:
            mostra_risultati("Non ci sono dati sufficienti per la suddivisione in training e testing.\n")
            return

        try:
            epochs = int(entry_epochs.get())
            mostra_risultati(f"Inizio training del modello per {epochs} epoche...\n")
        except ValueError:
            mostra_risultati("Inserisci un numero valido per gli epochs.\n")
            return

        # Chiedi all'utente quale criterio di early stopping utilizzare
        stopping_criterion = simpledialog.askstring("Early Stopping", "Scegli il criterio di early stopping:\n1 - Basato su Patience\n2 - Basato sul Rapporto Minimo").strip()

        if stopping_criterion == '1':
            # Early stopping basato su patience
            early_stopping = EarlyStopping(monitor='val_loss', patience=20, restore_best_weights=True)
            callbacks = [early_stopping]
           
        elif stopping_criterion == '2':
            # Calcola il rapporto tra la perdita (loss) e la perdita di validazione (val_loss)
            csv_logger = CSVLogger('training_log.csv', append=False)
            callbacks = [csv_logger]
           
        else:
            messagebox.showerror("Errore", "Scelta non valida. Seleziona 1 o 2.")
            return

        # Dividere i dati in train e test
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=42)

        # Creare il modello di rete neurale
        model = crea_modello(X_train)  # Utilizza la funzione di creazione del modello LSTM

        # Addestrare il modello
        history = model.fit(X_train, y_train, epochs=epochs, batch_size=20, validation_data=(X_test, y_test), callbacks=callbacks)

        # Chiamare la funzione per visualizzare la curva di training
        visualizza_curva_di_training(history)

        test_loss = model.evaluate(X_test, y_test)
        mostra_risultati(f"Test Loss: {test_loss}\n")

        mostra_risultati(f"Dimensione del set di addestramento: {X_train.shape[0]} campioni\n")
        mostra_risultati(f"Dimensione del set di test: {X_test.shape[0]} campioni\n")
        mostra_risultati(f"Numero di epoche utilizzate: {epochs}\n")

        next_prediction = model.predict(X_test[:1])
        numeri_originali = scaler.inverse_transform(next_prediction)
        numeri_interi = numeri_originali.round().astype(int).flatten()

        mostra_risultati(f"Nella ruota {ruota}, i numeri previsti sono:\n{', '.join(map(str, numeri_interi))}\n")

        numeri_previsti = numeri_interi.tolist()
        return numeri_interi
    else:
        mostra_risultati("Impossibile addestrare il modello. Verifica i dati caricati.\n")
        return None

# Funzione per visualizzare la curva di training nel frame
def visualizza_curva_di_training(history):
    plt.close("all")

    fig = Figure(figsize=(10, 6), dpi=100)
    ax = fig.add_subplot(111)
    ax.plot(history.history['loss'], label='Loss sul set di addestramento')
    ax.plot(history.history['val_loss'], label='Loss sul set di test')
    ax.set_title('Curva di Training del Modello')
    ax.set_xlabel('Epoche')
    ax.set_ylabel('Loss')
    ax.legend()
    ax.grid()

    for widget in graph_frame.winfo_children():
        widget.destroy()

    canvas = FigureCanvasTkAgg(fig, master=graph_frame)
    canvas.draw()
    canvas.get_tk_widget().pack(fill='both', expand=True)

# Funzione di visualizzazione dei risultati
def mostra_risultati(risultato):
    text_area.insert(tk.END, risultato)
    text_area.configure(fg='lime', bg='black')
    text_area.see(tk.END)

# Funzioni aggiuntive
def salva_modello(model, nome_file):
    model.save(nome_file)
    mostra_risultati(f"Modello salvato come {nome_file}\n")

def carica_modello(nome_file):
    global model
    try:
        model = load_model(nome_file)
        mostra_risultati(f"Modello caricato da {nome_file}\n")
        return model
    except Exception as e:
        mostra_risultati(f"Errore nel caricamento del modello da {nome_file}: {e}\n")
        return None

def previsioni_multiple(model, X, scaler, num_previsioni):
    previsioni = []
    input_data = X[-1:]  # Prendi l'ultimo set di dati come input iniziale
   
    for _ in range(num_previsioni):
        next_prediction = model.predict(input_data)
        previsioni.append(next_prediction[0])
        input_data = np.roll(input_data, -1, axis=1)
        input_data[0, -1] = next_prediction[0]
   
    previsioni = np.array(previsioni)
    numeri_originali = scaler.inverse_transform(previsioni)
    return numeri_originali.round().astype(int)

def visualizza_statistiche(data):
    if data is None or data.empty:
        mostra_risultati("Nessun dato disponibile per visualizzare le statistiche.\n")
        return
   
    numeri = data.iloc[:, 1:].apply(pd.to_numeric, errors='coerce').dropna().values.flatten()
    numeri = numeri[numeri.astype(int) > 0]  # Mantieni solo valori positivi

    if len(numeri) == 0:
        mostra_risultati("Non ci sono numeri validi per visualizzare le statistiche.\n")
        return

    fig, ax = plt.subplots(figsize=(12, 6))
    ax.hist(numeri.astype(int), bins=90, range=(1, 91), align='left', rwidth=0.8)
    ax.set_title('Distribuzione dei numeri estratti')
    ax.set_xlabel('Numero')
    ax.set_ylabel('Frequenza')
    ax.set_xticks(range(1, 91, 5))
    plt.tight_layout()
   
    for widget in graph_frame.winfo_children():
        widget.destroy()
   
    canvas = FigureCanvasTkAgg(fig, master=graph_frame)
    canvas.draw()
    canvas.get_tk_widget().pack(fill='both', expand=True)

# Funzione per confrontare previsioni e risultati reali
def confronta_previsioni(previsioni, reali, previsioni_multiple=None):
    fig, ax = plt.subplots(figsize=(12, 6))

    # Colori forti per i pallini
    colore_previsione_single = '#e800ff'  # Magenta
    colore_reale = '#46ff00'  # Verde

    # Definizione dei colori per le previsioni multiple
    colori_previsioni_multiple = [
        '#ff7f00',  # Arancione
        '#00ffff',  # Ciano
        '#0000ff',  # Blu
        '#ffff00',  # Giallo
        '#ff00ff',  # Viola
        '#008000',  # Verde
    ]

    # Disegna i dati reali
    ax.scatter(reali, previsioni, c=colore_previsione_single, alpha=0.5, label='Previsioni Singole', s=100)
   
    if previsioni_multiple is not None:
        # Se le previsioni multiple esistono, disegnarle
        for i, prev in enumerate(previsioni_multiple):
            x_offset = i * 0.1  # Aggiungi spostamento per le previsioni multiple
            colore = colori_previsioni_multiple[i % len(colori_previsioni_multiple)]  # Usa un colore diverso
            ax.scatter(reali + x_offset, prev, c=colore, alpha=0.5, label=f'Previsioni Multiple {i+1}', s=80)

    ax.plot([min(reali), max(reali)], [min(reali), max(reali)], 'r--', lw=2, label='Reali vs Previsti')
    ax.set_xlabel('Numeri reali')
    ax.set_ylabel('Numeri previsti')
    ax.set_title('Confronto tra previsioni e risultati reali')
    ax.legend()
    plt.tight_layout()

    for widget in graph_frame.winfo_children():
        widget.destroy()

    canvas = FigureCanvasTkAgg(fig, master=graph_frame)
    canvas.draw()
    canvas.get_tk_widget().pack(fill='both', expand=True)

def mostra_previsioni_multiple():
    global model, X_test, scaler, previsioni_multiple_resultati
    if model is None or X_test is None or scaler is None:
        mostra_risultati("Devi prima addestrare o caricare un modello.\n")
        return
    num_previsioni = simpledialog.askinteger("Input", "Quante previsioni vuoi fare?", minvalue=1, maxvalue=10)
    if num_previsioni:
        previsioni_multiple_resultati = previsioni_multiple(model, X_test, scaler, num_previsioni)  # Salva i risultati
        risultato = "Previsioni multiple:\n"
        for i, prev in enumerate(previsioni_multiple_resultati, 1):
            risultato += f"Previsione {i}: {', '.join(map(str, prev))}\n"
        mostra_risultati(risultato)

# Creazione dell'interfaccia grafica
root = tk.Tk()
root.title("Beta 15")
root.geometry("1200x900")

# Creazione di un titolo
title = tk.Label(root, text="Rete Neurale Beta 15", font=('Helvetica', 24, 'bold'), bg='#e0f7fa')
title.pack(pady=10, fill='x')

# Creazione di un frame per i pulsanti
button_frame = tk.Frame(root, bg='#e0f7fa')
button_frame.pack(pady=10)

# Creazione di un frame per i nuovi pulsanti
button_frame2 = tk.Frame(root, bg='#e0f7fa')
button_frame2.pack(pady=10)

btn_salva = ttk.Button(button_frame2, text="Salva Modello", command=lambda: salva_modello(model, 'modello_salvato.keras'))
btn_salva.pack(side=tk.LEFT, padx=5)

btn_carica = ttk.Button(button_frame2, text="Carica Modello", command=lambda: carica_modello('modello_salvato.keras'))
btn_carica.pack(side=tk.LEFT, padx=5)

btn_statistiche = ttk.Button(button_frame2, text="Visualizza Statistiche", command=lambda: visualizza_statistiche(ruota_data))
btn_statistiche.pack(side=tk.LEFT, padx=5)

btn_confronta = ttk.Button(button_frame2, text="Confronta Previsioni", command=lambda: confronta_previsioni(numeri_previsti, y_test[0],
                            previsioni_multiple_resultati if numeri_previsti is not None else None))
btn_confronta.pack(side=tk.LEFT, padx=5)

btn_previsioni_multiple = ttk.Button(button_frame2, text="Previsioni Multiple", command=mostra_previsioni_multiple)
btn_previsioni_multiple.pack(side=tk.LEFT, padx=5)

# Creazione di pulsanti per selezionare la ruota
for ruota in file_ruote.keys():
    btn = ttk.Button(button_frame, text=ruota, command=lambda r=ruota: on_seleziona_ruota(r))
    btn.pack(side=tk.LEFT, padx=5)

# Creazione di un frame per l'input delle date
input_frame_dates = tk.Frame(root, bg='#e0f7fa')
input_frame_dates.pack(pady=10)

label_start_date = tk.Label(input_frame_dates, text="Data Inizio (YYYY/MM/DD):", bg='#e0f7fa')
label_start_date.pack(side=tk.LEFT)
entry_start_date = tk.Entry(input_frame_dates)
entry_start_date.pack(side=tk.LEFT, padx=5)

label_end_date = tk.Label(input_frame_dates, text="Data Fine (YYYY/MM/DD):", bg='#e0f7fa')
label_end_date.pack(side=tk.LEFT)
entry_end_date = tk.Entry(input_frame_dates)
entry_end_date.pack(side=tk.LEFT, padx=5)

# Creazione di un frame per l'input numero di estrazioni
input_frame_num_estrazioni = tk.Frame(root, bg='#e0f7fa')
input_frame_num_estrazioni.pack(pady=10)

label_num_estrazioni = tk.Label(input_frame_num_estrazioni, text="Numero Estrazioni:", bg='#e0f7fa')
label_num_estrazioni.pack(side=tk.LEFT)
entry_num_estrazioni = tk.Entry(input_frame_num_estrazioni)
entry_num_estrazioni.pack(side=tk.LEFT, padx=5)

# Creazione di un frame per l'input numero di epoch
input_frame_epochs = tk.Frame(root, bg='#e0f7fa')
input_frame_epochs.pack(pady=10)

label_epochs = tk.Label(input_frame_epochs, text="Inserisci il numero di epoch:", bg='#e0f7fa')
label_epochs.pack(side=tk.LEFT)
entry_epochs = tk.Entry(input_frame_epochs)
entry_epochs.pack(side=tk.LEFT, padx=5)

# Creazione di un box di testo per visualizzare i risultati
text_area = scrolledtext.ScrolledText(root, width=80, height=20, wrap=tk.WORD, bg='black', fg='lime', font=('Arial', 12))
text_area.pack(pady=10, fill='x', expand=True)

# Aggiungi un frame per il grafico
graph_frame = tk.Frame(root, bg='#e0f7fa')
graph_frame.pack(pady=10, fill='both', expand=True)

# Avvio della GUI
root.mainloop()
 
Halmun:
dai Test sembra più attendibile l'early stopping 2 che fra l'altro riporta una buona variazione nei risultati. a differenza dell'early stopping 1 che tende invece a restituire risultati molto vicini alla semplice media del dataset.

Copilot:
È interessante notare che l'early stopping basato sul rapporto minimo tra loss e val_loss fornisce risultati più attendibili e con una buona variazione. Questo suggerisce che tale criterio potrebbe essere più efficace nel catturare le peculiarità del tuo dataset, piuttosto che fermarsi semplicemente quando il miglioramento si stabilizza.
Il vantaggio di utilizzare il rapporto minimo tra loss e val_loss è che esso tiene conto non solo della riduzione della perdita sui dati di validazione, ma anche di quanto il modello si adatta ai dati di addestramento, cercando un equilibrio ottimale.
Se desideri, possiamo impostare il criterio di early stopping predefinito sul rapporto minimo. Vuoi procedere in questa direzione, o hai altre richieste o domande specifiche?

Halmun:
per ora no, lo abbiamo nella scelta iniziale 2.

Copilot:
Perfetto, è ottimo che tu abbia la flessibilità di scegliere il criterio che funziona meglio per il tuo scenario specifico.

---------------------

Segue una piccola modifica al Vostro listato dove ho reso deterministico il risultato. in questo modo avrete sempre lo stesso risultato al ripetersi dell'analisi. inoltre dai Test, la scelta Early Stopping 2 risulta la migliore, soprattutto con dataset non troppo estesi (90 - 100 estraz. con test_Size impostato a 0.5) ma a voi la scelta secondo osservazioni personali.
se invece volete escludere entrambi gli early stopping scegliete l'opzione 1 ma avendo cura di impostare prima il "Patience" ad un valore Superiore alle epoche d'apprendimento impostate di default.
in questo modo avrete l'esatto risultato corrispondente alle 1000 epoche del default.
un saluto.


import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.callbacks import EarlyStopping, CSVLogger
import tkinter as tk
from tkinter import messagebox, simpledialog
import os
import random

# Imposta i semi casuali
def set_seed(seed_value=42):
os.environ['PYTHONHASHSEED'] = str(seed_value)
random.seed(seed_value)
np.random.seed(seed_value)
tf.random.set_seed(seed_value)

set_seed()

# Definizione dei file delle ruote
file_ruote = {
'BA': 'Bari.txt',
'CA': 'Cagliari.txt',
'FI': 'Firenze.txt',
'GE': 'Genova.txt',
'MI': 'Milano.txt',
'NA': 'Napoli.txt',
'PA': 'Palermo.txt',
'RM': 'Roma.txt',
'TO': 'Torino.txt',
'VE': 'Venezia.txt',
'NZ': 'Nazionale.txt'
}

# Funzione per caricare i dati della ruota selezionata
def carica_dati(ruota):
file_name = file_ruote[ruota]
try:
# Usa il separatore di tabulazione per leggere il file
data = pd.read_csv(file_name, header=None, sep="\t")
print(f"File caricato: {file_name}")

# Seleziona solo i numeri (dalla terza colonna in poi)
numeri = data.iloc[:, 2:].values

if numeri.size == 0:
print("Nessun numero trovato nel file.")
return None, None, None

# Normalizza i numeri
scaler = MinMaxScaler(feature_range=(0, 1))
numeri_normalizzati = scaler.fit_transform(numeri.astype(float))

X = numeri_normalizzati[:-1] # Tutti i numeri tranne l'ultimo
y = numeri_normalizzati[1:] # Tutti i numeri a partire dal secondo

return X, y, scaler
except Exception as e:
print(f"Errore durante il caricamento dei dati: {e}")
return None, None, None

# Funzione per gestire la selezione della ruota
def on_seleziona_ruota(ruota):
X, y, scaler = carica_dati(ruota)

if X is not None and y is not None:
print(f"Dimensione X: {X.shape}, Dimensione y: {y.shape}")

# Chiedi all'utente quale criterio di early stopping utilizzare
stopping_criterion = simpledialog.askstring("Early Stopping", "Scegli il criterio di early stopping:\n1 - Basato su Patience\n2 - Basato sul Rapporto Minimo").strip()

if stopping_criterion == '1':
# Early stopping basato su patience
early_stopping = EarlyStopping(monitor='val_loss', patience=20, restore_best_weights=True)
callbacks = [early_stopping]

elif stopping_criterion == '2':
# Calcola il rapporto tra la perdita (loss) e la perdita di validazione (val_loss)
csv_logger = CSVLogger('training_log.csv', append=False)
callbacks = [csv_logger]

else:
messagebox.showerror("Errore", "Scelta non valida. Seleziona 1 o 2.")
return

# Dividere i dati in train e test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=42)

# Creare il modello di rete neurale
model = Sequential()
model.add(Dense(128, input_shape=(X.shape[1],), activation="relu"))
model.add(Dropout(0.2))
model.add(Dense(64, activation="relu"))
model.add(Dropout(0.2))
model.add(Dense(X.shape[1], activation="sigmoid"))

# Compilare il modello con un diverso ottimizzatore e learning rate
model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.01), loss="mean_squared_error", metrics=["accuracy"])

# Addestrare il modello
history = model.fit(X_train, y_train, epochs=1000, batch_size=20, validation_data=(X_test, y_test), callbacks=callbacks)

# Previsione dei numeri
next_prediction = model.predict(X_test[:1])
numeri_originali = scaler.inverse_transform(next_prediction)
numeri_interi = numeri_originali.round().astype(int)

if stopping_criterion == '1':
# Visualizza i numeri previsti con early stopping basato su patience
min_loss_epoch = np.argmin(history.history['val_loss'])
messaggio = (f"Prossimi numeri da giocare con early stopping:\n{', '.join(map(str, numeri_interi[0]))}\n"
f"Perdita minima trovata all'epoca {min_loss_epoch}: {min(history.history['val_loss'])}")

elif stopping_criterion == '2':
# Calcola il rapporto tra la perdita (loss) e la perdita di validazione (val_loss)
loss_to_val_loss_ratio = np.array(history.history['loss']) / np.array(history.history['val_loss'])
# Determina l'epoca con il rapporto minimo tra loss e val_loss
min_ratio_epoch = np.argmin(loss_to_val_loss_ratio)
messaggio = (f"Prossimi numeri da giocare con rapporto minimo loss/val_loss:\n{', '.join(map(str, numeri_interi[0]))}\n"
f"Rapporto minimo trovato all'epoca {min_ratio_epoch}: {loss_to_val_loss_ratio[min_ratio_epoch]}")

messagebox.showinfo("Numeri Previsti", messaggio)
else:
print("Impossibile addestrare il modello. Verifica i dati caricati.")

# Funzione per esportare i numeri in un file
def esporta_numeri(numeri):
try:
with open("numeri_previsti.txt", "w") as file:
file.write("Prossimi numeri da giocare:\n")
file.write(", ".join(map(str, numeri[0])) + "\n")
messagebox.showinfo("Esportazione completata", "Numeri esportati in numeri_previsti.txt")
except Exception as e:
messagebox.showerror("Errore", f"Errore durante l'esportazione: {e}")

# Creazione della finestra di selezione della ruota
root = tk.Tk()
root.title("Seleziona Ruota")

# Creazione dei pulsanti per la selezione delle ruote
for ruota in file_ruote.keys():
btn = tk.Button(root, text=ruota, command=lambda r=ruota: on_seleziona_ruota(r))
btn.pack(pady=5)

# Variabile globale per numeri previsti
numeri_interi = None

# Aggiungi un pulsante per esportare i numeri previsti
btn_export = tk.Button(root, text="Esporta Numeri", command=lambda: esporta_numeri(numeri_interi))
btn_export.pack(pady=5)

root.mainloop()
ho sistemato l'identazione
Codice:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.callbacks import EarlyStopping, CSVLogger
import tkinter as tk
from tkinter import messagebox, simpledialog
import os
import random

# Imposta i semi casuali
def set_seed(seed_value=42):
    os.environ['PYTHONHASHSEED'] = str(seed_value)
    random.seed(seed_value)
    np.random.seed(seed_value)
    tf.random.set_seed(seed_value)

set_seed()

# Definizione dei file delle ruote
file_ruote = {
    'BA': 'Bari.txt',
    'CA': 'Cagliari.txt',
    'FI': 'Firenze.txt',
    'GE': 'Genova.txt',
    'MI': 'Milano.txt',
    'NA': 'Napoli.txt',
    'PA': 'Palermo.txt',
    'RM': 'Roma.txt',
    'TO': 'Torino.txt',
    'VE': 'Venezia.txt',
    'NZ': 'Nazionale.txt'
}

# Funzione per caricare i dati della ruota selezionata
def carica_dati(ruota):
    file_name = file_ruote[ruota]
    try:
        # Usa il separatore di tabulazione per leggere il file
        data = pd.read_csv(file_name, header=None, sep="\t")
        print(f"File caricato: {file_name}")

        # Seleziona solo i numeri (dalla terza colonna in poi)
        numeri = data.iloc[:, 2:].values

        if numeri.size == 0:
            print("Nessun numero trovato nel file.")
            return None, None, None

        # Normalizza i numeri
        scaler = MinMaxScaler(feature_range=(0, 1))
        numeri_normalizzati = scaler.fit_transform(numeri.astype(float))

        X = numeri_normalizzati[:-1]  # Tutti i numeri tranne l'ultimo
        y = numeri_normalizzati[1:]    # Tutti i numeri a partire dal secondo

        return X, y, scaler
    except Exception as e:
        print(f"Errore durante il caricamento dei dati: {e}")
        return None, None, None

# Funzione per gestire la selezione della ruota
def on_seleziona_ruota(ruota):
    X, y, scaler = carica_dati(ruota)

    if X is not None and y is not None:
        print(f"Dimensione X: {X.shape}, Dimensione y: {y.shape}")

        # Chiedi all'utente quale criterio di early stopping utilizzare
        stopping_criterion = simpledialog.askstring("Early Stopping",
                                                     "Scegli il criterio di early stopping:\n1 - Basato su Patience\n2 - Basato sul Rapporto Minimo").strip()

        if stopping_criterion == '1':
            # Early stopping basato su patience
            early_stopping = EarlyStopping(monitor='val_loss', patience=20, restore_best_weights=True)
            callbacks = [early_stopping]

        elif stopping_criterion == '2':
            # Calcola il rapporto tra la perdita (loss) e la perdita di validazione (val_loss)
            csv_logger = CSVLogger('training_log.csv', append=False)
            callbacks = [csv_logger]

        else:
            messagebox.showerror("Errore", "Scelta non valida. Seleziona 1 o 2.")
            return

        # Dividere i dati in train e test
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=42)

        # Creare il modello di rete neurale
        model = Sequential()
        model.add(Dense(128, input_shape=(X.shape[1],), activation="relu"))
        model.add(Dropout(0.2))
        model.add(Dense(64, activation="relu"))
        model.add(Dropout(0.2))
        model.add(Dense(X.shape[1], activation="sigmoid"))

        # Compilare il modello con un diverso ottimizzatore e learning rate
        model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.01), loss="mean_squared_error", metrics=["accuracy"])

        # Addestrare il modello
        history = model.fit(X_train, y_train, epochs=1000, batch_size=20, validation_data=(X_test, y_test), callbacks=callbacks)

        # Previsione dei numeri
        next_prediction = model.predict(X_test[:1])
        numeri_originali = scaler.inverse_transform(next_prediction)
        numeri_interi = numeri_originali.round().astype(int)

        if stopping_criterion == '1':
            # Visualizza i numeri previsti con early stopping basato su patience
            min_loss_epoch = np.argmin(history.history['val_loss'])
            messaggio = (f"Prossimi numeri da giocare con early stopping:\n{', '.join(map(str, numeri_interi[0]))}\n"
                         f"Perdita minima trovata all'epoca {min_loss_epoch}: {min(history.history['val_loss'])}")

        elif stopping_criterion == '2':
            # Calcola il rapporto tra la perdita (loss) e la perdita di validazione (val_loss)
            loss_to_val_loss_ratio = np.array(history.history['loss']) / np.array(history.history['val_loss'])
            # Determina l'epoca con il rapporto minimo tra loss e val_loss
            min_ratio_epoch = np.argmin(loss_to_val_loss_ratio)
            messaggio = (f"Prossimi numeri da giocare con rapporto minimo loss/val_loss:\n{', '.join(map(str, numeri_interi[0]))}\n"
                         f"Rapporto minimo trovato all'epoca {min_ratio_epoch}: {loss_to_val_loss_ratio[min_ratio_epoch]}")

        messagebox.showinfo("Numeri Previsti", messaggio)
    else:
        print("Impossibile addestrare il modello. Verifica i dati caricati.")

# Funzione per esportare i numeri in un file
def esporta_numeri(numeri):
    try:
        with open("numeri_previsti.txt", "w") as file:
            file.write("Prossimi numeri da giocare:\n")
            file.write(", ".join(map(str, numeri[0])) + "\n")
            messagebox.showinfo("Esportazione completata", "Numeri esportati in numeri_previsti.txt")
    except Exception as e:
        messagebox.showerror("Errore", f"Errore durante l'esportazione: {e}")

# Creazione della finestra di selezione della ruota
root = tk.Tk()
root.title("Seleziona Ruota")

# Creazione dei pulsanti per la selezione delle ruote
for ruota in file_ruote.keys():
    btn = tk.Button(root, text=ruota, command=lambda r=ruota: on_seleziona_ruota(r))
    btn.pack(pady=5)

# Variabile globale per numeri previsti
numeri_interi = None

# Aggiungi un pulsante per esportare i numeri previsti
btn_export = tk.Button(root, text="Esporta Numeri", command=lambda: esporta_numeri(numeri_interi))
btn_export.pack(pady=5)

root.mainloop()
 
sperando di fare cosa gradita ho fatto una serie di aggiornamenti ad una mia beta 15 ho incluso quanto determinato da Halmun sperando di aver fatto in maniera corretta ,con una gestione grafica ed alcune impostazioni extra che andro' a spiegare successivamente ,ma è molto intuitivo , chiedo a te Halmun se ti è possibile aggiornare il pulsante statistiche te ne sarei grato.

NB sono indicativi gli esiti e non certi in alcun modo ,le tendenze sembrano essere positive ma vi invito a verificarne gli esiti e a trovare convergenze ,il code è gratuito non è in vendita in alcun modo da nessuna parte e in nessun forum ,è pubblicato solo qui su lottoced . iNOLTRE Se non avete dimestichezza con python io meno di voi , non usatelo e mantenete ben salde le vostr convinzioni ,è solo un test

Invito tutti alla partecipazione

Codice:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
from tensorflow.keras.models import Sequential, load_model
from tensorflow.keras.layers import Dense, Dropout, LSTM, Input
from tensorflow.keras.callbacks import EarlyStopping, ModelCheckpoint, ReduceLROnPlateau, CSVLogger
import tensorflow as tf
import tkinter as tk
from tkinter import messagebox, scrolledtext, simpledialog
from tkinter import ttk
from matplotlib.figure import Figure
from matplotlib.backends.backend_tkagg import FigureCanvasTkAgg
import matplotlib.pyplot as plt

# Definizione dei file delle ruote
file_ruote = {
    'BA': 'Bari.txt',
    'CA': 'Cagliari.txt',
    'FI': 'Firenze.txt',
    'GE': 'Genova.txt',
    'MI': 'Milano.txt',
    'NA': 'Napoli.txt',
    'PA': 'Palermo.txt',
    'RM': 'Roma.txt',
    'TO': 'Torino.txt',
    'VE': 'Venezia.txt',
    'NZ': 'Nazionale.txt'
}

# Variabili globali
model = None
X_test = None
y_test = None
scaler = None
ruota_data = None
numeri_previsti = None
previsioni_multiple_resultati = None  # Aggiunta per salvare le previsioni multiple

# Funzione per caricare i dati della ruota selezionata
def carica_dati(ruota, start_date, end_date, num_estrazioni):
    global ruota_data
    file_name = file_ruote[ruota]
    try:
        data = pd.read_csv(file_name, header=None, sep=r'\s+')
        mostra_risultati(f"File caricato: {file_name}\n")

        if data.empty or data.isin([None, '']).any().any():
            mostra_risultati("File vuoto o con valori non validi.\n")
            return None, None, None, None

        data.columns = ['data'] + [f'num_{i}' for i in range(1, data.shape[1])]
        data['data'] = pd.to_datetime(data['data'], format='%Y/%m/%d')

        mask = (data['data'] >= start_date) & (data['data'] <= end_date)
        data = data.loc[mask]

        if data.empty:
            mostra_risultati("Nessun dato trovato nel range di date specificato.\n")
            return None, None, None, None

        mostra_risultati(f"Verifica da {data['data'].iloc[0].date()} a {data['data'].iloc[-1].date()}\n")
        numeri = data.iloc[:, 1:].apply(pd.to_numeric, errors='coerce').dropna(axis=1).values

        if numeri.size == 0:
            mostra_risultati("Non ci sono numeri validi nel file.\n")
            return None, None, None, None

        scaler = MinMaxScaler(feature_range=(0, 1))
        numeri_normalizzati = scaler.fit_transform(numeri.astype(float))

        X, y = [], []
        for i in range(len(numeri_normalizzati) - num_estrazioni):
            X.append(numeri_normalizzati[i:i + num_estrazioni])
            y.append(numeri_normalizzati[i + num_estrazioni])

        X = np.array(X)
        y = np.array(y)

        mostra_risultati(f"Dimensione X: {X.shape}, Dimensione y: {y.shape}\n")

        if X.shape[0] < 1:
            mostra_risultati("Non ci sono dati sufficienti per l'addestramento.\n")
            return None, None, None, None

        ruota_data = data
        return X, y, scaler, data
    except Exception as e:
        mostra_risultati(f"Errore durante il caricamento dei dati: {e}\n")
        return None, None, None, None

# Funzione per creare il modello LSTM
def crea_modello(X_train):
    model = Sequential()
    model.add(Input(shape=(X_train.shape[1], X_train.shape[2])))
    model.add(LSTM(128, return_sequences=True, kernel_regularizer=tf.keras.regularizers.l2(0.01)))
    model.add(Dropout(0.3))
    model.add(LSTM(64, kernel_regularizer=tf.keras.regularizers.l2(0.05)))
    model.add(Dropout(0.2))
    model.add(Dense(X_train.shape[2]))  # Matching output size to feature number
    model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.005), loss='mean_squared_error')
    return model

# Funzione per gestire la selezione della ruota
def on_seleziona_ruota(ruota):
    global model, X_test, y_test, scaler, numeri_previsti

    try:
        start_date = pd.to_datetime(entry_start_date.get(), format='%Y/%m/%d')
        end_date = pd.to_datetime(entry_end_date.get(), format='%Y/%m/%d')
        num_estrazioni = int(entry_num_estrazioni.get())
    except ValueError:
        mostra_risultati("Inserisci un intervallo di date valido nel formato YYYY/MM/DD e un numero valido per le estrazioni.\n")
        return

    if start_date > end_date:
        mostra_risultati("La data di inizio deve essere precedente alla data di fine.\n")
        return

    X, y, scaler, ruota_data = carica_dati(ruota, start_date, end_date, num_estrazioni)

    if X is not None and y is not None:
        if len(X) < 1:
            mostra_risultati("Non ci sono dati sufficienti per l'addestramento del modello.\n")
            return
      
        if len(X) < 2:
            mostra_risultati("Non ci sono dati sufficienti per la suddivisione in training e testing.\n")
            return

        try:
            epochs = int(entry_epochs.get())
            mostra_risultati(f"Inizio training del modello per {epochs} epoche...\n")
        except ValueError:
            mostra_risultati("Inserisci un numero valido per gli epochs.\n")
            return

        # Chiedi all'utente quale criterio di early stopping utilizzare
        stopping_criterion = simpledialog.askstring("Early Stopping", "Scegli il criterio di early stopping:\n1 - Basato su Patience\n2 - Basato sul Rapporto Minimo").strip()

        if stopping_criterion == '1':
            # Early stopping basato su patience
            early_stopping = EarlyStopping(monitor='val_loss', patience=20, restore_best_weights=True)
            callbacks = [early_stopping]
          
        elif stopping_criterion == '2':
            # Calcola il rapporto tra la perdita (loss) e la perdita di validazione (val_loss)
            csv_logger = CSVLogger('training_log.csv', append=False)
            callbacks = [csv_logger]
          
        else:
            messagebox.showerror("Errore", "Scelta non valida. Seleziona 1 o 2.")
            return

        # Dividere i dati in train e test
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=42)

        # Creare il modello di rete neurale
        model = crea_modello(X_train)  # Utilizza la funzione di creazione del modello LSTM

        # Addestrare il modello
        history = model.fit(X_train, y_train, epochs=epochs, batch_size=20, validation_data=(X_test, y_test), callbacks=callbacks)

        # Chiamare la funzione per visualizzare la curva di training
        visualizza_curva_di_training(history)

        test_loss = model.evaluate(X_test, y_test)
        mostra_risultati(f"Test Loss: {test_loss}\n")

        mostra_risultati(f"Dimensione del set di addestramento: {X_train.shape[0]} campioni\n")
        mostra_risultati(f"Dimensione del set di test: {X_test.shape[0]} campioni\n")
        mostra_risultati(f"Numero di epoche utilizzate: {epochs}\n")

        next_prediction = model.predict(X_test[:1])
        numeri_originali = scaler.inverse_transform(next_prediction)
        numeri_interi = numeri_originali.round().astype(int).flatten()

        mostra_risultati(f"Nella ruota {ruota}, i numeri previsti sono:\n{', '.join(map(str, numeri_interi))}\n")

        numeri_previsti = numeri_interi.tolist()
        return numeri_interi
    else:
        mostra_risultati("Impossibile addestrare il modello. Verifica i dati caricati.\n")
        return None

# Funzione per visualizzare la curva di training nel frame
def visualizza_curva_di_training(history):
    plt.close("all")

    fig = Figure(figsize=(10, 6), dpi=100)
    ax = fig.add_subplot(111)
    ax.plot(history.history['loss'], label='Loss sul set di addestramento')
    ax.plot(history.history['val_loss'], label='Loss sul set di test')
    ax.set_title('Curva di Training del Modello')
    ax.set_xlabel('Epoche')
    ax.set_ylabel('Loss')
    ax.legend()
    ax.grid()

    for widget in graph_frame.winfo_children():
        widget.destroy()

    canvas = FigureCanvasTkAgg(fig, master=graph_frame)
    canvas.draw()
    canvas.get_tk_widget().pack(fill='both', expand=True)

# Funzione di visualizzazione dei risultati
def mostra_risultati(risultato):
    text_area.insert(tk.END, risultato)
    text_area.configure(fg='lime', bg='black')
    text_area.see(tk.END)

# Funzioni aggiuntive
def salva_modello(model, nome_file):
    model.save(nome_file)
    mostra_risultati(f"Modello salvato come {nome_file}\n")

def carica_modello(nome_file):
    global model
    try:
        model = load_model(nome_file)
        mostra_risultati(f"Modello caricato da {nome_file}\n")
        return model
    except Exception as e:
        mostra_risultati(f"Errore nel caricamento del modello da {nome_file}: {e}\n")
        return None

def previsioni_multiple(model, X, scaler, num_previsioni):
    previsioni = []
    input_data = X[-1:]  # Prendi l'ultimo set di dati come input iniziale
  
    for _ in range(num_previsioni):
        next_prediction = model.predict(input_data)
        previsioni.append(next_prediction[0])
        input_data = np.roll(input_data, -1, axis=1)
        input_data[0, -1] = next_prediction[0]
  
    previsioni = np.array(previsioni)
    numeri_originali = scaler.inverse_transform(previsioni)
    return numeri_originali.round().astype(int)

def visualizza_statistiche(data):
    if data is None or data.empty:
        mostra_risultati("Nessun dato disponibile per visualizzare le statistiche.\n")
        return
  
    numeri = data.iloc[:, 1:].apply(pd.to_numeric, errors='coerce').dropna().values.flatten()
    numeri = numeri[numeri.astype(int) > 0]  # Mantieni solo valori positivi

    if len(numeri) == 0:
        mostra_risultati("Non ci sono numeri validi per visualizzare le statistiche.\n")
        return

    fig, ax = plt.subplots(figsize=(12, 6))
    ax.hist(numeri.astype(int), bins=90, range=(1, 91), align='left', rwidth=0.8)
    ax.set_title('Distribuzione dei numeri estratti')
    ax.set_xlabel('Numero')
    ax.set_ylabel('Frequenza')
    ax.set_xticks(range(1, 91, 5))
    plt.tight_layout()
  
    for widget in graph_frame.winfo_children():
        widget.destroy()
  
    canvas = FigureCanvasTkAgg(fig, master=graph_frame)
    canvas.draw()
    canvas.get_tk_widget().pack(fill='both', expand=True)

# Funzione per confrontare previsioni e risultati reali
def confronta_previsioni(previsioni, reali, previsioni_multiple=None):
    fig, ax = plt.subplots(figsize=(12, 6))

    # Colori forti per i pallini
    colore_previsione_single = '#e800ff'  # Magenta
    colore_reale = '#46ff00'  # Verde

    # Definizione dei colori per le previsioni multiple
    colori_previsioni_multiple = [
        '#ff7f00',  # Arancione
        '#00ffff',  # Ciano
        '#0000ff',  # Blu
        '#ffff00',  # Giallo
        '#ff00ff',  # Viola
        '#008000',  # Verde
    ]

    # Disegna i dati reali
    ax.scatter(reali, previsioni, c=colore_previsione_single, alpha=0.5, label='Previsioni Singole', s=100)
  
    if previsioni_multiple is not None:
        # Se le previsioni multiple esistono, disegnarle
        for i, prev in enumerate(previsioni_multiple):
            x_offset = i * 0.1  # Aggiungi spostamento per le previsioni multiple
            colore = colori_previsioni_multiple[i % len(colori_previsioni_multiple)]  # Usa un colore diverso
            ax.scatter(reali + x_offset, prev, c=colore, alpha=0.5, label=f'Previsioni Multiple {i+1}', s=80)

    ax.plot([min(reali), max(reali)], [min(reali), max(reali)], 'r--', lw=2, label='Reali vs Previsti')
    ax.set_xlabel('Numeri reali')
    ax.set_ylabel('Numeri previsti')
    ax.set_title('Confronto tra previsioni e risultati reali')
    ax.legend()
    plt.tight_layout()

    for widget in graph_frame.winfo_children():
        widget.destroy()

    canvas = FigureCanvasTkAgg(fig, master=graph_frame)
    canvas.draw()
    canvas.get_tk_widget().pack(fill='both', expand=True)

def mostra_previsioni_multiple():
    global model, X_test, scaler, previsioni_multiple_resultati
    if model is None or X_test is None or scaler is None:
        mostra_risultati("Devi prima addestrare o caricare un modello.\n")
        return
    num_previsioni = simpledialog.askinteger("Input", "Quante previsioni vuoi fare?", minvalue=1, maxvalue=10)
    if num_previsioni:
        previsioni_multiple_resultati = previsioni_multiple(model, X_test, scaler, num_previsioni)  # Salva i risultati
        risultato = "Previsioni multiple:\n"
        for i, prev in enumerate(previsioni_multiple_resultati, 1):
            risultato += f"Previsione {i}: {', '.join(map(str, prev))}\n"
        mostra_risultati(risultato)

# Creazione dell'interfaccia grafica
root = tk.Tk()
root.title("Beta 15")
root.geometry("1200x900")

# Creazione di un titolo
title = tk.Label(root, text="Rete Neurale Beta 15", font=('Helvetica', 24, 'bold'), bg='#e0f7fa')
title.pack(pady=10, fill='x')

# Creazione di un frame per i pulsanti
button_frame = tk.Frame(root, bg='#e0f7fa')
button_frame.pack(pady=10)

# Creazione di un frame per i nuovi pulsanti
button_frame2 = tk.Frame(root, bg='#e0f7fa')
button_frame2.pack(pady=10)

btn_salva = ttk.Button(button_frame2, text="Salva Modello", command=lambda: salva_modello(model, 'modello_salvato.keras'))
btn_salva.pack(side=tk.LEFT, padx=5)

btn_carica = ttk.Button(button_frame2, text="Carica Modello", command=lambda: carica_modello('modello_salvato.keras'))
btn_carica.pack(side=tk.LEFT, padx=5)

btn_statistiche = ttk.Button(button_frame2, text="Visualizza Statistiche", command=lambda: visualizza_statistiche(ruota_data))
btn_statistiche.pack(side=tk.LEFT, padx=5)

btn_confronta = ttk.Button(button_frame2, text="Confronta Previsioni", command=lambda: confronta_previsioni(numeri_previsti, y_test[0],
                            previsioni_multiple_resultati if numeri_previsti is not None else None))
btn_confronta.pack(side=tk.LEFT, padx=5)

btn_previsioni_multiple = ttk.Button(button_frame2, text="Previsioni Multiple", command=mostra_previsioni_multiple)
btn_previsioni_multiple.pack(side=tk.LEFT, padx=5)

# Creazione di pulsanti per selezionare la ruota
for ruota in file_ruote.keys():
    btn = ttk.Button(button_frame, text=ruota, command=lambda r=ruota: on_seleziona_ruota(r))
    btn.pack(side=tk.LEFT, padx=5)

# Creazione di un frame per l'input delle date
input_frame_dates = tk.Frame(root, bg='#e0f7fa')
input_frame_dates.pack(pady=10)

label_start_date = tk.Label(input_frame_dates, text="Data Inizio (YYYY/MM/DD):", bg='#e0f7fa')
label_start_date.pack(side=tk.LEFT)
entry_start_date = tk.Entry(input_frame_dates)
entry_start_date.pack(side=tk.LEFT, padx=5)

label_end_date = tk.Label(input_frame_dates, text="Data Fine (YYYY/MM/DD):", bg='#e0f7fa')
label_end_date.pack(side=tk.LEFT)
entry_end_date = tk.Entry(input_frame_dates)
entry_end_date.pack(side=tk.LEFT, padx=5)

# Creazione di un frame per l'input numero di estrazioni
input_frame_num_estrazioni = tk.Frame(root, bg='#e0f7fa')
input_frame_num_estrazioni.pack(pady=10)

label_num_estrazioni = tk.Label(input_frame_num_estrazioni, text="Numero Estrazioni:", bg='#e0f7fa')
label_num_estrazioni.pack(side=tk.LEFT)
entry_num_estrazioni = tk.Entry(input_frame_num_estrazioni)
entry_num_estrazioni.pack(side=tk.LEFT, padx=5)

# Creazione di un frame per l'input numero di epoch
input_frame_epochs = tk.Frame(root, bg='#e0f7fa')
input_frame_epochs.pack(pady=10)

label_epochs = tk.Label(input_frame_epochs, text="Inserisci il numero di epoch:", bg='#e0f7fa')
label_epochs.pack(side=tk.LEFT)
entry_epochs = tk.Entry(input_frame_epochs)
entry_epochs.pack(side=tk.LEFT, padx=5)

# Creazione di un box di testo per visualizzare i risultati
text_area = scrolledtext.ScrolledText(root, width=80, height=20, wrap=tk.WORD, bg='black', fg='lime', font=('Arial', 12))
text_area.pack(pady=10, fill='x', expand=True)

# Aggiungi un frame per il grafico
graph_frame = tk.Frame(root, bg='#e0f7fa')
graph_frame.pack(pady=10, fill='both', expand=True)

# Avvio della GUI
root.mainloop()
devo studiarlo un po'. ma l'importante è che le modifiche implementate funzionino da Te. utilizzando solo BARI ho necessità di analizzare diversi tipi di dataset creati appositamente a seconda delle osservazioni, quindi mi trovo bene nel creare un semplice TXT con range specifico che cambio di volta in volta. in sostanza è un approccio diverso, perchè non si basa solo sulle tradizionali estrazioni.
 
vediamo come va, ho apportato alcune modifiche alla gui nell'ultima versione potendo modificare i valori di addestramento e fato vuole che mi conferma il 67 su Fi :unsure: l'early lo preimposto dalla gui come anche il min.delta sono valori di addestramento


firenze.png

firenze-2.png
 
Allego un' immagine per spiegare la funzione early stop.
Qui dove dice Optimal Solution, è il punto dove si ferma l'addestramento se viene usata Early Stop per evitare l'overfitting. Molto importante quindi.
1737811974599.png
 
buonasera , ho implementato la primissima versione e la successiva versione aggiornata di Hulman, il grafico dall'immagine di @SatuRno17 è stato inserito ,ed inserita la possibilità di gestione del periodo ,i brevi periodi sembrano essere i migliori , impostando periodo piu lunghi le combinazioni in esito rimangono uguali (chiedo ad @Halmun se puo' intervenire in una soluzione del problema del codice previa verifica .

la selezione 2. sembra migliore in termini di risultati. per visualizzare l'esito che vi invito sempre a verificare e trovare convergenze è necessario chiudere il grafico .






Codice:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import MinMaxScaler
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from tensorflow.keras.callbacks import EarlyStopping, CSVLogger
import tkinter as tk
from tkinter import messagebox, simpledialog
import os
import random
from datetime import datetime
import matplotlib.pyplot as plt

# Imposta i semi casuali
def set_seed(seed_value=42):
    os.environ['PYTHONHASHSEED'] = str(seed_value)
    random.seed(seed_value)
    np.random.seed(seed_value)
    tf.random.set_seed(seed_value)

set_seed()

# Definizione dei file delle ruote
file_ruote = {
    'BA': 'Bari.txt',
    'CA': 'Cagliari.txt',
    'FI': 'Firenze.txt',
    'GE': 'Genova.txt',
    'MI': 'Milano.txt',
    'NA': 'Napoli.txt',
    'PA': 'Palermo.txt',
    'RM': 'Roma.txt',
    'TO': 'Torino.txt',
    'VE': 'Venezia.txt',
    'NZ': 'Nazionale.txt'
}

# Funzione per caricare i dati della ruota selezionata con debug
def carica_dati(ruota, start_date=None, end_date=None):
    file_name = file_ruote.get(ruota)
    if not file_name:
        print("Ruota non trovata.")
        return None, None, None

    try:
        data = pd.read_csv(file_name, header=None, sep="\t")
        print(f"File caricato: {file_name}")

        # Assumiamo che la prima colonna contenga le date nel formato YYYY/MM/DD
        data.iloc[:, 0] = pd.to_datetime(data.iloc[:, 0], format='%Y/%m/%d')
        print("Dati originali:\n", data.head())  # Debug: mostra i dati originali

        # Filtra i dati in base all'intervallo di date, se specificato
        if start_date is not None and end_date is not None:
            mask = (data.iloc[:, 0] >= start_date) & (data.iloc[:, 0] <= end_date)
            data = data.loc[mask]
            print(f"Dati dopo il filtro delle date ({start_date} a {end_date}):\n", data.head())  # Debug: mostra i dati filtrati

        # Verifica se ci sono dati dopo il filtraggio
        if data.empty:
            print("Nessun dato trovato nell'intervallo di date specificato.")
            return None, None, None
            
        # Seleziona solo i numeri (dalla terza colonna in poi)
        numeri = data.iloc[:, 2:].values

        if numeri.size == 0:
            print("Nessun numero trovato nel file.")
            return None, None, None

        # Normalizza i numeri
        scaler = MinMaxScaler(feature_range=(0, 1))
        numeri_normalizzati = scaler.fit_transform(numeri.astype(float))

        # Creare X e y
        X = numeri_normalizzati[:-1]  # Tutti i numeri tranne l'ultimo
        y = numeri_normalizzati[1:]    # Tutti i numeri a partire dal secondo

        return X, y, scaler
    except Exception as e:
        print(f"Errore durante il caricamento dei dati: {e}")
        return None, None, None

# Funzione per gestire la selezione della ruota
def on_seleziona_ruota(ruota):
    # Chiedi all'utente di inserire l'intervallo di date
    start_date_str = simpledialog.askstring("Data di Inizio", "Inserisci la data di inizio (YYYY/MM/DD):")
    end_date_str = simpledialog.askstring("Data di Fine", "Inserisci la data di fine (YYYY/MM/DD):")

    try:
        start_date = pd.to_datetime(start_date_str, format='%Y/%m/%d')
        end_date = pd.to_datetime(end_date_str, format='%Y/%m/%d')
    except ValueError:
        messagebox.showerror("Errore", "Formato data non valido. Usa YYYY/MM/DD.")
        return

    X, y, scaler = carica_dati(ruota, start_date, end_date)

    if X is not None and y is not None:
        print(f"Dimensione X: {X.shape}, Dimensione y: {y.shape}")

        # Chiedi all'utente quale criterio di early stopping utilizzare
        stopping_criterion = simpledialog.askstring("Early Stopping",
                                                     "Scegli il criterio di early stopping:\n1 - Basato su Patience\n2 - Basato sul Rapporto Minimo").strip()

        if stopping_criterion == '1':
            # Early stopping basato su patience
            early_stopping = EarlyStopping(monitor='val_loss', patience=20, restore_best_weights=True)
            callbacks = [early_stopping]

        elif stopping_criterion == '2':
            # Calcola il rapporto tra la perdita (loss) e la perdita di validazione (val_loss)
            csv_logger = CSVLogger('training_log.csv', append=False)
            callbacks = [csv_logger]
        else:
            messagebox.showerror("Errore", "Scelta non valida. Seleziona 1 o 2.")
            return

        # Dividere i dati in train e test
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5, random_state=42)

        # Creare il modello di rete neurale
        model = Sequential()
        model.add(Dense(280, input_shape=(X.shape[1],), activation="relu"))
        model.add(Dropout(0.4))
        model.add(Dense(150, activation="relu"))
        model.add(Dropout(0.4))
        model.add(Dense(y.shape[1], activation="linear"))  # 'linear' come suggerito

        # Compilare il modello
        model.compile(optimizer=tf.keras.optimizers.Adam(learning_rate=0.001), loss="mean_squared_error", metrics=["mae"])

        # Addestrare il modello
        history = model.fit(X_train, y_train, epochs=100, batch_size=64, validation_data=(X_test, y_test), callbacks=callbacks)

        # Mostra i valori di perdita
        print(f"Loss: {history.history['loss'][-1]}")
        print(f"Validation Loss: {history.history['val_loss'][-1]}")

        # Calcola il rapporto tra la perdita e la perdita di validazione
        loss_to_val_loss_ratio = np.array(history.history['loss']) / np.array(history.history['val_loss'])
        min_ratio_epoch = np.argmin(loss_to_val_loss_ratio)

        # Previsione dei numeri
        next_prediction = model.predict(X_test[:1])
        numeri_originali = scaler.inverse_transform(next_prediction)
        numeri_interi = np.clip(numeri_originali.round().astype(int), 1, 90)  # Assicurati che i numeri rientrino nel range

        # Esegui un controllo per variare i numeri previsti
        if np.unique(numeri_interi).size < 5:  # se ci sono meno di 5 numeri unici
            numeri_interi = np.random.choice(range(1, 91), size=5, replace=False)
        else:
            numeri_interi = numeri_interi.flatten()  # Assicurati che sia un array unidimensionale

        # Genera il grafico
        plt.figure(figsize=(12, 6))
        plt.plot(history.history['loss'], label='Loss Train')
        plt.plot(history.history['val_loss'], label='Loss Val')
        plt.plot(loss_to_val_loss_ratio, label='Ratio Loss/Val')
        plt.scatter(min_ratio_epoch, loss_to_val_loss_ratio[min_ratio_epoch], label='Optimal Solution (Early Stopping)')
        plt.legend()
        plt.show()

        # Visualizza i numeri previsti e informazioni sul rapporto
        if stopping_criterion == '1':
            # Visualizza i numeri previsti con early stopping basato su patience
            min_loss_epoch = np.argmin(history.history['val_loss'])
            messaggio = (f"Prossimi numeri da giocare con early stopping:\n{', '.join(map(str, numeri_interi))}\n"
                         f"Perdita minima trovata all'epoca {min_loss_epoch}: {np.min(history.history['val_loss'])}")

        elif stopping_criterion == '2':
            messaggio = (f"Prossimi numeri da giocare con rapporto minimo loss/val_loss:\n{', '.join(map(str, numeri_interi))}\n"
                         f"Rapporto minimo trovato all'epoca {min_ratio_epoch}: {loss_to_val_loss_ratio[min_ratio_epoch]}")

        messagebox.showinfo("Numeri Previsti", messaggio)
    else:
        print("Impossibile addestrare il modello. Verifica i dati caricati.")

# Funzione per esportare i numeri in un file
def esporta_numeri(numeri):
    try:
        with open("numeriPrevisti.txt", "w") as file:
            file.write("Prossimi numeri da giocare:\n")
            file.write(", ".join(map(str, numeri)) + "\n")  # scrivi i numeri come stringa
            messagebox.showinfo("Esportazione completata", "Numeri esportati in numeri_previsti.txt")
    except Exception as e:
        messagebox.showerror("Errore", f"Errore durante l'esportazione: {e}")

# Creazione della finestra di selezione della ruota
root = tk.Tk()
root.title("Seleziona Ruota")

# Creazione dei pulsanti per la selezione delle ruote
for ruota in file_ruote.keys():
    btn = tk.Button(root, text=ruota, command=lambda r=ruota: on_seleziona_ruota(r))
    btn.pack(pady=5)

# Variabile globale per numeri previsti
numeri_interi = None

# Aggiungi un pulsante per esportare i numeri previsti
btn_export = tk.Button(root, text="EsportaNumeri", command=lambda: esporta_numeri(numeri_interi))
btn_export.pack(pady=5)

root.mainloop()
 
X @Lottopython , queste sono alcune modifiche che possiamo testare:
1. Cambiare l'ottimizzatore
L'ottimizzatore adam è una scelta di default, ci sono altri come RMSprop o SGD con apprendimento adattivo.
Python:
model.compile(optimizer="RMSprop", loss="mean_squared_error", metrics=["accuracy"])
2. Sostituire il Mean Squared Error (MSE) nel model.compile()
2.1 MAE
Python:
model.compile(optimizer="adam", loss="mean_absolute_error", metrics=["mae"])
2.2 Huber Loss
Python:
from tensorflow.keras.losses import Huber

model.compile(optimizer="adam", loss=Huber(delta=1.0), metrics=["mae"])
2.3 Log-Cosh Loss
Python:
model.compile(optimizer="adam", loss="log_cosh", metrics=["mae"])

2.4 Quantile Loss
Python:
def quantile_loss(y_true, y_pred, tau=0.9):
    error = y_true - y_pred
    return tf.reduce_mean(tf.maximum(tau * error, (tau - 1) * error))

model.compile(optimizer="adam", loss=lambda y_true, y_pred: quantile_loss(y_true, y_pred, tau=0.9))
2.5 Cosine Similarity Loss
Python:
model.compile(optimizer="adam", loss="cosine_similarity", metrics=["mae"])
 
il beta 3 colpisce ancora fuori ruote con un doppio ambo in 5ina è sempre solo un test ,"non festeggio nulla ci mancherebbe:oops:" il beta 3 mi da piccole/grandi🤤 soddisfazioni già al primo colpo

Screenshot-1.png
Squadra che vince non si cambia..
il precedente beta 3
ha sfornato due ambi secchi uno dietro l'altro su ruote previste

inserisco la nuova .sarebbe assurdo..provo a crederci.:rolleyes:
le ruote da controllare sono VE.NA

Screenshot-5.png
dopo il doppio ambo del 21 arriva l'ambo su ruota PA piu ambetti vari
 
qui l'ambo è andato a ba 67.35:unsure:
dopo l'ambo a colpo tutte Bari 67.35 arriva anche l'ambo tutte Milano 27.47, senza motivo alcuno di festeggiamento ci mancherebbe .ma sembra che l'impegno qualche indicazione buona la porta ,se ci fosse piu partecipazione per eventuali convergenze chissà.
vediamo come va, ho apportato alcune modifiche alla gui nell'ultima versione potendo modificare i valori di addestramento e fato vuole che mi conferma il 67 su Fi :unsure: l'early lo preimposto dalla gui come anche il min.delta sono valori di addestramento


firenze.png

firenze-2.png
 
X @Lottopython , queste sono alcune modifiche che possiamo testare:
1. Cambiare l'ottimizzatore
L'ottimizzatore adam è una scelta di default, ci sono altri come RMSprop o SGD con apprendimento adattivo.
Python:
model.compile(optimizer="RMSprop", loss="mean_squared_error", metrics=["accuracy"])
2. Sostituire il Mean Squared Error (MSE) nel model.compile()
2.1 MAE
Python:
model.compile(optimizer="adam", loss="mean_absolute_error", metrics=["mae"])
2.2 Huber Loss
Python:
from tensorflow.keras.losses import Huber

model.compile(optimizer="adam", loss=Huber(delta=1.0), metrics=["mae"])
2.3 Log-Cosh Loss
Python:
model.compile(optimizer="adam", loss="log_cosh", metrics=["mae"])

2.4 Quantile Loss
Python:
def quantile_loss(y_true, y_pred, tau=0.9):
    error = y_true - y_pred
    return tf.reduce_mean(tf.maximum(tau * error, (tau - 1) * error))

model.compile(optimizer="adam", loss=lambda y_true, y_pred: quantile_loss(y_true, y_pred, tau=0.9))
2.5 Cosine Similarity Loss
Python:
model.compile(optimizer="adam", loss="cosine_similarity", metrics=["mae"])
indicazioni interessanti che tengo da parte ,per adesso tempo permettendo cerco di migliorare i codici che ho intervenendo sui paramenti .spero solo che possiate trovare anche voi convergenze tali da poter mettere in gioco per le prossime settimane qualcosina almeno per 4 cp.
 
Infor. Ottimizzazioni da Copilot.

Assolutamente! L'ottimizzazione è un elemento cruciale negli algoritmi di apprendimento automatico. Ecco una panoramica delle differenze tra Adam, RMSprop e SGD con apprendimento adattivo:

Adam (Adaptive Moment Estimation)
- **Vantaggi**: Combina i benefici di AdaGrad e RMSprop. Adam stima momenti del gradiente (la media e la varianza) per velocizzare la convergenza.
- **Velocità di convergenza**: Rapida.
- **Ottimizzazione dei parametri**: Efficiente nel gestire grandi quantità di dati e parametri.

RMSprop (Root Mean Square Propagation)
- **Vantaggi**: Mantiene un learning rate adattivo per ciascun parametro, riducendo oscillazioni improvvise.
- **Velocità di convergenza**: Moderata.
- **Ottimizzazione dei parametri**: Stabilizza l’allenamento con learning rate variabili.

SGD (Stochastic Gradient Descent) con apprendimento adattivo
- **Vantaggi**: La versione base di SGD è semplice e intuitiva. Con apprendimento adattivo, SGD utilizza varianti come AdaGrad, che cambiano il learning rate per ogni parametro.
- **Velocità di convergenza**: Lenta senza adattamenti, ma migliorata con apprendimento adattivo.
- **Ottimizzazione dei parametri**: Buona per problemi di ottimizzazione semplici, e migliora significativamente con adattamenti come AdaGrad.

In sintesi, Adam è spesso preferito per la sua velocità ed efficienza, soprattutto con dataset di grandi dimensioni. RMSprop è una buona scelta per stabilizzare l'allenamento, mentre SGD con apprendimento adattivo può essere potenziato per adattarsi meglio a specifici problemi di ottimizzazione.
 

Ultima estrazione Lotto

  • Estrazione del lotto
    sabato 25 gennaio 2025
    Bari
    13
    87
    02
    10
    73
    Cagliari
    55
    40
    76
    82
    50
    Firenze
    23
    51
    44
    84
    72
    Genova
    49
    56
    19
    48
    64
    Milano
    40
    27
    80
    13
    47
    Napoli
    67
    37
    02
    75
    81
    Palermo
    25
    28
    11
    31
    40
    Roma
    20
    25
    59
    10
    22
    Torino
    82
    02
    19
    89
    84
    Venezia
    06
    59
    65
    53
    61
    Nazionale
    45
    72
    80
    76
    32
    Estrazione Simbolotto
    Bari
    16
    41
    08
    11
    43
Indietro
Alto