Google Cloud lancia BigLake e unifica le sue piattaforme di dati.

Al suo Cloud Data Summit, Google Cloud ha annunciato l’anteprima di BigLake, un nuovo motore di data lake basato sull’esperienza acquisita con il suo data warehouse su cloud BigQuery.

Apparentemente, Google Cloud si è guadagnato una buona reputazione negli ultimi anni come Data Cloud con il suo data warehouse BigQuery, le sue tecnologie Cloud Run serverless e i suoi strumenti di analisi ML “Vertex AI”.

Cavalcando lo stesso desiderio di unificare laghi e data warehouse che ha portato Microsoft a lanciare Azure Synapse poco più di un anno fa, Google Cloud annuncia ” Grande Lago abbattere i silos che separano laghi e magazzini. Silos sinonimo di limitare le analisi, aumentare i rischi ma anche aumentare i costi perché spesso è necessario duplicare i dati per effettuare analisi incrociate.

BigLake consente alle aziende di unificare i propri data lake e warehouse per analizzare i dati senza preoccuparsi del formato o del sistema di storage sottostante, eliminando la necessità di duplicare o spostare i dati e riducendo i costi e la perdita di dati. spiega l’editore.

La soluzione è davvero progettata in uno spirito di unificazione dei diversi data lake sulla base di tutta l’esperienza acquisita da Google Cloud ma anche dai suoi clienti con BigQuery. BigLake consente quindi non solo di fare affidamento sul data warehouse BigQuery e sui dati ivi archiviati, ma anche sui laghi archiviati su AWS S3 e su Azure Data Lake. Il tutto con la massima sicurezza ma anche efficienza per eseguire analisi avanzate ed esplorare tutto il potenziale di ML e AI.

Con BigLake, i clienti ottengono controlli di accesso granulari, con un’interfaccia API che copre Google Cloud e formati aperti come Parquet, oltre a motori di elaborazione open source come Apache Spark. Queste funzionalità estendono le innovazioni di BigQuery negli ultimi dieci anni ai data lake su Google Cloud Storage per creare un’architettura aperta, flessibile ed economica. aggiunge l’editore.

Oltre a questo annuncio di punta, Google Cloud ha anche annunciato due nuove funzionalità che sicuramente risuoneranno con i suoi utenti di servizi dati.

Una nuova funzionalità” Cambia flusso consente di eseguire l’acquisizione delle modifiche in tempo reale (CDC – Change Data Capture) su Spanner, il database SQL distribuito di Google Cloud. Questa funzionalità consente di tracciare in tempo reale eventuali modifiche (inserimenti, aggiornamenti, eliminazioni) apportate ai dati e di attivare eventi Pub/Sub, analisi di aggiornamento, ecc.

Altra novità, Google Cloud annuncia la disponibilità in versione finale di ” Workshop sull’IA dei vertici », un nuovo strumento intuitivo e interattivo per gestire l’intero ciclo di vita dei progetti di Data Science. ” Vertex AI Workbench riunisce dati e sistemi ML in un’unica interfaccia in modo che i team abbiano un set comune di strumenti per l’analisi dei dati, la scienza dei dati e l’apprendimento automatico. I team possono creare, addestrare e distribuire un modello ML cinque volte più velocemente di prima spiega l’editore.


Leggi anche:

> Google Cloud Next’21: Tra iniziative sovrane e multicloud

> Google Cloud lancia tre nuovi servizi dati

> Dashboard per misurare le emissioni di CO2 di Azure e Google Cloud.

> Azure Synapse unifica data warehouse e data lake

> Con Azure Purview, Microsoft sta investendo nel mercato della governance dei dati

> La startup francese Saagie estende il suo orchestrator DataOps a livello internazionale.

Leave a Comment