La fabbrica dei dati di Talend al servizio della trasformazione digitale

La fabbrica dei dati di Talend al servizio della trasformazione digitale

Disponibile la versione Winter ’17, che introduce la data preparation e il supporto nativo di Spark 2.0. In forte espansione la filiale italiana della società.

di: Roberto Bonino del 25/01/2017 14:15

Big Data & Analytics
 
C’era una volta il data warehouse, ovvero una sorta di grande archivio pensato per raccogliere grandi quantità di informazioni e agevolarne la ricerca e l’utilizzo sfruttando i database relazionali. Se ne è parlato per diverso tempo nel primo decennio di questo secolo, ma in pochi anni lo scenario è radicalmente cambiato, complice l’esplosione di dati generati dalle fonti più disparate, ma anche la crescita di esigenze di governance e collaborazione che le tecnologie tradizionali faticano a soddisfare.
Nell’era dei big data, inizia a farsi largo il concetto di data lake, idealmente non troppo diverso da quello di data warehouse, ma più aggiornato alle attuali tendenze (cloud, soprattutto, ma anche talend-italia-massimo-tripodi--002-.jpgApache Hadoop come framework per l’accesso e il calcolo distribuito) e adatto alla costruzione di un repository centralizzato dove immagazzinare grandi quantità di dati a costi relativamente contenuti: “Per affrontare al meglio il tema della trasformazione digitale, è inevitabile che un’azienda evolva in direzione data-driven – conferma Massimo Tripodi, country manager di Talend Italia -. Con un modello data lake, è possibile partire da semplici casi d’uso, poi passare all’infrastruttura e, infine, aggiungere temi come la condivisione e la governance dei dati, ma anche il machine learning, la gestione dei metadati o l’accesso self-service. Per evitare che un progetto fallisca, tuttavia, occorre quali informazioni acquisire e cosa farne, controllarne la qualità e rendere possibile un accesso più universale”.

Una base open source e votata all'aggiornamento continuo

Nata e cresciuta con un’offerta di estrazione, trasformazione e integrazione dei dati in ambiente open source, l’azienda di origine francese (ma oggi con headquarter negli Usa) ha aggiornato per tempo la propria proposta, oggi fondata sul concetto di data fabric, grazie al quale diventa possibile elaborare, organizzare e manutenere set di dati delle più disparate provenienze su piattaforme big data come Hadoop o Spark (sempre di Apache) in modo coeso, integrato, controllato e accessibile self-service.
In questi giorni, è stata introdotta sul mercato la versione Winter ’17 della Talend Data Fabric, che introduce novità che vanno proprio nelle direzioni indicate. La data preparation, infatti, consente agli utenti di accedere a qualsiasi fonte di dati (ambienti tradizionali, Hadoop o cloud) e utilizzare un data dictionary pre-configurato per il riconoscimento automatico del valore dei dati grezzi messi a disposizione dal data lake. A questo si aggiunge la cosiddetta “data stewardship”, che rende omogenei tutti i dati, anche quelli che l’algoritmo di machine learning non sa gestire in termini di eccezioni. Inoltre, il supporto è stato esteso alla recente versione 2.0 di Spark, ma anche ad Amazon Web Services. SalesForce e distribuzioni Hadoop come Cloudera, MapR e Hortonworks: “L’obiettivo di questo aggiornamento – spiega Tripodi – è di rendere disponibili dati di qualità, validati e utili per il business, in modo che si possa usare una logica self-service per agevolare il lavoro di tutti gli interessati in azienda”.
Per tradizione, Talend rilascia due volte all’anno un aggiornamento della propria Data Fabric, per assicurare la costante evoluzione della soluzione in un contesto soggetto a cambiamenti piuttosto frequenti. Questa scelta, abbinata a quella totalmente open source (con il vantaggio di poter sfruttare quanto prodotto dalla community degli sviluppatori) e a un modello commerciale basato sul canone annuale (il tasso di rinnovo è al 98%, secondo il vendor), è alla base di una crescita che da sei anni mantiene il ritmo del 40% all’anno.
La storia della presenza italiana diretta è piuttosto recente (dopo una prima esperienza qualche anno fa), ma ha già prodotto alcuni risultati significativi: “Abbiamo chiuso il primo anno di attività con un surplus del 175% rispetto al budget assegnato – sottolinea Tripodi – e abbiamo acquisito 22 clienti, con alcune eccellenze soprattutto nel settore finanziario. Nel 2017, porteremo l’organico a dieci persone e costruiremo una rete di partner che dovrà supportarci per la componente di implementazione, consentendo di concentrarci sul rafforzamento del brand e la parte di supporto. Già oggi, comunque, quasi tutto il business locale viene prodotto con il canale”.
Tag notizia:

Cosa ne pensi di questa notizia?

Attualità

...continua

Opinioni e Commenti

...continua