DATABIZ e KNIME abbattono i tempi di elaborazione dei Big Data

DATABIZ_logoL’evento che DATABIZ ha organizzato a Milano il 5 luglio in collaborazione con KNIME (Konstanz Information Miner) – KNIME Italy Meetup goes Big Data on Apache Spark – ha coinvolto più di sessanta persone tra sviluppatori, data scientist e responsabili CRM di varie aziende, che si sono ritrovati per aggiornarsi sulla nuova release KNIME – piattaforma open source di analisi dati e reporting che integra vari componenti per il machine learning e il data mining – presentata in anteprima mondiale.

Le novità riguardano in particolare un apposito modulo che permette un machine learning avanzato, che può essere gestito ancheKNIME_logo senza le competenze di uno sviluppatore specializzato; un ruolo di primo piano nello sviluppo della piattaforma è stato svolto da DATABIZ, co-developer di alcuni dei nuovi nodi della recente release. È stato proprio Andrea Bessi di DATABIZ a spiegare in che modo è possibile far comunicare KNIME con Apache Spark, engine che permette di distribuire il carico di lavoro su più macchine e dà la possibilità di costruire in poco tempo modelli predittivi: le nuove funzionalità sviluppate da DATABIZ permettono di conciliare le particolarità del linguaggio di programmazione di Spark con l’interfaccia user-friendly di KNIME, permettendo alle aziende utenti di concentrarsi sull’analisi dei dati.

Abbiamo scelto KNIME perché ha un’interfaccia user-friendly, è parzialmente open source, aveva già un’integrazione attiva con Hadoop e Spark, offre un ottimo rapporto costi-benefici e dà la possibilità di co-development con il team di KNIME” ha spiegato Andrea Bessi.

I vantaggi di questa nuova soluzione sono stati testimoniati da una grande azienda che ha adottato la release per adattare la piattaforma KNIME alle proprie tecnologie CRM e poter utilizzare così la mole di informazioni raccolte.

La caratteristica principale di KNIME è la sua struttura modulare, basata su nodi che effettuano azioni singole sul dato e vengono poi collegati tra loro per costruire la pipeline desiderata; attualmente KNIME ha più di 1.000 diversi nodi per scrittura e lettura dei dati, pre-processing, cleaning, data mining, text analytics, modellizzazione, statistiche, machine learning, viste interattive, grafici e report. L’integrazione di Spark con KNIME si basa sull’RDD, ovvero una striscia virtuale che attraversa i nodi (macchine) di Spark, permettendo allo sviluppatore di interagire con la base dati come se fosse una collection. Spark e KNIME dialogano attraverso lo Spark Job Server, un tool di terze parti che etichetta l’RDD in modo che KNIME sappia qual è e possa recuperarlo al momento necessario. In questo modo le trasformazioni vengono eseguite solo quando si vuole vedere il dato, permettendo di non appesantire il PC e ridurre il carico su tutto il cluster.

Leo Pillon, Amministratore delegato di DATABIZ, ha dichiarato: “DATABIZ è in prima linea nella ricerca e sviluppo di altre funzionalità per costruire nuovi e sempre più sofisticati metodi di analisi. Siamo lieti di aver contribuito al successo dell’evento, che è stato un’occasione di scambio e approfondimento, un’opportunità per incontrare altri esperti, salutare i partner di KNIME e confrontarsi sui futuri sviluppi dell’universo Big Data”.

COMMENTI