Nella risoluzione dei problemi di machine learning è prassi comune dover risolvere un problema composto da più di due classi (classificazione binaria). Pensa solo di dover classificare dei cani (pastore tedesco, labrador, beagle o bassotto tedesco): già in questa situazione non ci troviamo più in un problema di classificazione binario, ma multi classe. In quest’articolo […]
Funzione di perdita: come calcolare l’errore di un modello
La misurazione delle prestazioni del modello è il punto cruciale di qualsiasi algoritmo di apprendimento automatico e ciò viene fatto mediante l’uso di funzioni di perdita o funzioni di costo. La scelta di queste funzioni può aiutare il modello ad apprendere meglio; al contrario, la scelta di quella sbagliata potrebbe portare il modello a non […]
Introduzione alla funzione di massima verosimiglianza
Un modello di machine learning apprende dai dati puntando a minimizzare una funzione di costo. Tramite essa si cerca di misurare quanto sia sbagliato il modello in termini di capacità di stimare la relazione tra le variabili indipendenti X e la variabile target y. In questo articolo vediamo una metodologia per stimare i parametri di […]
Come creare un modello di machine learning in 5 step
Molte esercitazioni di apprendimento automatico si concentrano su elementi specifici del flusso di lavoro come la pulizia dei dati, la formazione dei modelli o l’ottimizzazione dell’algoritmo. Tuttavia, quando si è all’inizio degli studi dell’apprendimento automatico, può essere difficile cogliere appieno questi meccanismi senza una semplice spiegazione o procedura dettagliata. Nel seguente post, fornirò un tutorial […]
Quattro semplici operazioni di base in Pandas
Prima di creare e addestrare un modello di machine learning è fondamentale trattare e gestire correttamente i dati. Un modo comune per farlo è avvalersi della libreria Pandas, uno strumento di analisi e manipolazione dei dati open source, veloce, potente, flessibile e facile da usare, basato sul linguaggio di programmazione Python. In questo articolo vediamo […]
Variabili Dummy: cosa sono e perché sono utilizzate
I modelli di machine learning vengono addestrati su dati di input e output numerici. Quando ci si trova a che fare con variabili categoriali, quindi stringhe o testi, bisogna adottare delle tecniche di preprocessamento dei dati che ne permettano la gestione in modo appropriato. In altre parole, risulta necessario avvalersi di metodi di codifica categoriali, […]