Il 2020 verrà certamente ricordato come l’anno della pandemia Covid-19. Nessuno è riuscito a prevedere cosa sarebbe potuto accadere: un disastro dal punto di vista sanitario ed economico, per non parlare di quello sociale. In quest’articolo, voglio mostrare un’analisi interessante presa da Rikunert, in merito a questa epidemia. L’autore prende in analisi i risultati della […]
Algoritmo SMOTE: cos’è e come funziona?
Nei problemi di machine learning è difficile trovare la stessa distribuzione dei dati bilanciata: generalmente si verifica che le osservazioni in una delle classi sono molto più alte o più basse delle altre classi. Per definizione, un set di dati è sbilanciato se le classi non sono rappresentate in modo approssimativamente uguale. Ipotizziamo di avere […]
Tre tecniche di selezione del modello: AIC, BIC e HQIC
Quando si inizia a studiare il machine learning e l’intelligenza artificiale ci si prefigge di costruire il miglior modello adatto alle proprie esigenze. Ben presto ci si rende conto che però, per un motivo o per un altro, il modello inizia ad avere qualche inefficienza, e non funziona come ci si aspetta. La realtà è […]
Modello ARIMA: come prevedere le serie temporali
Quando si cerca di prevedere un andamento futuro si fanno delle stime o pianificazioni. Ad esempio decidere se costruire un altro impianto di generazione di energia nei prossimi cinque anni richiede previsioni sulla domanda futura; programmare il personale in un call center la prossima settimana richiede previsioni sui volumi di chiamate; o ancora, immagazzinare […]
Come costruire e manipolare un array Numpy
Nella creazione di modelli di machine learning spesso ci si trova a che fare con array numpy. Capire cosa sono e come funzionano permette di comprendere cosa sono le strutture dati su cui si avvale la libreria, come impostare correttamente la fase di preprocessamento dei dati e l’implementazione successiva degli algoritmi di machine learning. In […]
Muovere i primi passi in Jupyter Notebook
Jupyter Notebook è un’applicazione web open source che puoi utilizzare per creare e condividere documenti che contengono codice live, equazioni, grafici e testo. Facente parte del progetto Jupyter, è in grado di eseguire la presentazione interattiva di progetti di data science, lasciando ai programmatori la possibilità di scegliere tra più di 40 linguaggi di programmazione. […]