Cloud Bigdata: NO (Not Only) Sql

 

Nel 2011, l’essere umano ha creato 1,800,000,000,000,000,000,000 bytes di informazioni, in altre parole 1.8 ZB. Bisogna proprio utilizzare gli zettabytes per identificare quanto stiamo producendo di informazioni. Nel 2015 si prevede che si vada a circa 8 ZB e il tipo di informazione sta evolvendo da una informazione strutturata a completamente non strutturata.

In poche parole queste informazioni tendono a non essere analizzate con strumenti tradizionali di business intelligence a prescindere da quanto siano sofisticati. Per loro natura i database hanno la necessità di strutturarsi per diventare loro stessi pervasivi e per costruire un piattaforma che ospita i dati sul cloud.

La necessità di memorizzare informazioni sul cloud è testimoniata dal proliferare di tutti i Database NOSQL che sono nati negli ultimi anni. Ci sono una serie di database NoSql che riducono all’essenziale la gestione del dato e si preoccupano di essere funzionanti in relazioni alla tipologia del dato stesso.

Nelle ultime settimane abbiamo utilizzato OrientDB, un database Not Only SQL che sa supportare sia SQL che NOSQL e che ha la caratteristica di lavorare a grafo. Il suo modello di replica è davvero innovativo e orientato all’erogazione di servizi sul cloud. La master to master replica unita al concetto di avere un database Graph Oriented permette di poter impostare il proprio database sul cloud con delle repliche master to master su zone diverse per rami diversi e quindi di poter portare dei particolari nodi di informazioni in regioni diverse.

La politica di come devono essere portate queste informazioni vicino al cliente è una politica che deve essere descritta da un utente che non è tecnologico e che è vicino al business. Tali policy tengono in considerazione oltre che  alla dimensione del dato anche la tipologia di clienti che appartengono a quella area e al costo infrastrutturale di avere il nodo replicato anche su quella particolare area geografica.

OrientDB è definitivamente un player nel mercato del Big Data; è una piattaforma opensource dove circa 30 contributori stanno attivamente contribuendo al progetto. Lo stile che abbiamo percepito lavorando con OrientDB è quello del Professional Opensource che aveva Jboss ai tempi di Marc Fleury.

Il mercato è vasto e il mondo dei database NO SQL sta esplodendo. I principali competitors di OrientDB sono

  1. DEX che è un prodotto spagnolo che sembra non sia adottato molto;
  2. InfiniGraph che ricordiamo essere stato un database a oggetti e non nativamente nato a grafo;
  3. Neo4J che è un database NOSQL a grafo ed è production ready.

A nostro parere OrientDB è un database maturo ed è Production Ready. Leggendo sui forum attivi di Orient DB abbiamo potuto verificare che ci sono delle situazioni di produzione anche importanti.

Bayoda è una grande installazione con circa 200 server paralleli e diversi tera di informazioni che sono memorizzate.

OrientDB è un database che è nato con l’idea del cloud e della agilità. Lo skill per poterlo utilizzare è quello normale di un db NOSQL oppure quello standard di un database SQL. Infatti è possibile utilizzarlo come un normale database in cui si usa lo standard SQL per fare gli inquiry. Si riusa così lo skill in azienda e si accelerano i tempi di adozione nel caso in cui si vogliano pensare applicazioni che integrino già database esistenti e abbiano la necessità di portare dati e informazioni sul cloud.

 


Comments