Uno strumento che sta avendo sempre più interesse in ambito Big Data Analitycs è certamente Apache Spark. Dai suoi umili inizi nell’AMPLab di Berkeley nel 2009, Apache Spark è diventato uno dei principali framework di elaborazione distribuita di big data al mondo. Giganti Tech come Netflix, Yahoo ed Alibaba sono solo alcuni che hanno implementato […]
Hadoop: il sistema più utilizzato per gestire i Big Data
Vista l’immensa quantità di dati generati solo giornalmente non è più pensabile dover gestire i dati tramite i database relazionali. Il motivo principale è che questi ultimi non sono bravi a gestire in maniera economica elevati quantitativi di dati di tipo non strutturato, dove non risulta possibile associare una relazione come uno schema o una […]