Home Enterprise Cloudera Perkenalkan Pembaruan Platform untuk AI dan Analitik — Fokus pada Iceberg...

Cloudera Perkenalkan Pembaruan Platform untuk AI dan Analitik — Fokus pada Iceberg REST Catalog dan Lakehouse Optimizer

solusi AI Cloudera, Mercy Corps

Cloudera mengumumkan pembaruan signifikan pada platform data dan AI-nya dengan menghadirkan Cloudera Iceberg REST Catalog dan Cloudera Lakehouse Optimizer. Dua fitur baru ini dirancang untuk memperkuat open data lakehouse yang didukung Apache Iceberg, memungkinkan perusahaan berbagi data tanpa duplikasi, meningkatkan performa query, dan menurunkan biaya penyimpanan — semuanya tetap berada di bawah tata kelola dan keamanan terpadu.

Pengumuman tersebut dipaparkan pada ajang industri EVOLVE25 di New York City, dan menjadi bagian dari strategi Cloudera untuk menyederhanakan arsitektur data perusahaan serta mempercepat adopsi AI dengan menghilangkan hambatan teknis yang sering muncul saat memindahkan atau menyalin data antar platform.

Berbagi data tanpa salinan: Iceberg REST Catalog untuk interoperabilitas nyata

Salah satu tantangan terbesar dalam proyek AI dan analitik skala enterprise adalah kebutuhan memindahkan data antar sistem untuk konsumsi oleh mesin analitik atau model AI—praktik yang menambah biaya, memperlambat proses, dan membuka celah risiko keamanan. Cloudera menghadirkan Iceberg REST Catalog sebagai solusi yang memungkinkan mesin pihak ketiga mengakses data yang dikelola platform Cloudera secara langsung melalui REST, tanpa perlu menyalin dataset.

Dengan pendekatan ini, Cloudera mengklaim pengguna bisa mempertahankan kebijakan akses, lineage, dan kontrol metadata secara konsisten di seluruh lingkungan — baik cloud publik, pusat data on-premise, maupun edge. Akses metadata terbuka juga memudahkan penemuan aset data tanpa ketergantungan pada katalog proprietary, sehingga mempercepat proses pengembangan AI dan analitik.

Lakehouse Optimizer: pengelolaan tabel otomatis untuk performa dan efisiensi biaya

Cloudera Lakehouse Optimizer adalah layanan baru yang melakukan pengoptimalan otomatis dan pemeliharaan tabel untuk format Apache Iceberg di dalam lakehouse. Fungsinya melampaui maintenance dasar: termasuk penulisan ulang manifes (manifest rewriting) dan penghapusan file yang tidak diperlukan, sehingga mengurangi beban manajemen manual dan biaya operasional.

Hasil benchmark internal yang dipaparkan Cloudera menunjukkan peningkatan performa query hingga 13 kali lipat dan pengurangan biaya penyimpanan rata-rata 36% berkat optimasi cerdas ini. Lakehouse Optimizer juga menyediakan observability dan kontrol kebijakan yang detil — kebijakan dapat diterapkan pada tabel tertentu atau keseluruhan katalog — serta dapat digunakan oleh mesin yang kompatibel dengan Iceberg di berbagai cloud publik.

Manfaat tata kelola terpadu dan total biaya kepemilikan lebih rendah

Integrasi Iceberg REST Catalog dengan mekanisme tata kelola Cloudera memastikan kebijakan keamanan, kontrol akses granular, lineage, dan audit trail tetap terjaga ketika data dikonsumsi oleh platform pihak ketiga seperti engine analitik atau layanan cloud. Menurut penjelasan dari Cloudera, pelanggan yang mengadopsi pendekatan ini melaporkan penurunan biaya penyimpanan yang signifikan — dalam beberapa kasus mencapai pengurangan yang besar — sambil meningkatkan visibilitas data di seluruh lini bisnis.

Dengan demikian, organisasi bisa menurunkan total biaya kepemilikan (TCO) sekaligus mempercepat time-to-value bagi proyek AI dan analitik, tanpa harus melakukan duplikasi data atau terjebak dalam vendor lock-in.

Dampak ekosistem: keterbukaan dan kompatibilitas multi-engine

Cloudera menekankan bahwa solusi ini dirancang untuk lingkungan multi-engine: data yang dikelola di Cloudera dapat diakses secara aman oleh sejumlah engine populer tanpa proses ETL berulang. Ini mendorong interoperabilitas dengan layanan dan produk analitik yang banyak digunakan di industri, sehingga tim data bisa memilih tool terbaik untuk setiap tahap pipeline — tanpa mengorbankan tata kelola dan keamanan.

Pernyataan eksekutif dan strategi produk

“Cloudera terus berinvestasi untuk menjadikan format table terbuka Apache Iceberg siap digunakan di level enterprise,” ujar Leo Brunnick, Chief Product Officer Cloudera. Menurutnya, kombinasi interoperabilitas, tata kelola terpadu, dan optimasi otomatis akan membantu organisasi memperoleh fleksibilitas, skalabilitas, dan insight tanpa kompromi — kapan pun dan di mana pun data berada.

Kapan tersedia dan langkah adopsi

Cloudera menyatakan bahwa fitur Cloudera Data Sharing yang didukung Iceberg REST Catalog dan Lakehouse Optimizer kini telah tersedia dalam status General Availability. Perusahaan yang ingin mengadopsi dianjurkan melakukan assessment arsitektur data saat ini untuk mengidentifikasi area yang paling diuntungkan oleh interoperabilitas tanpa salinan dan optimasi tabel otomatis — misalnya pipeline yang saat ini bergantung pada replikasi data antar lingkungan atau workload query yang sering mengalami degradasi performa.

Implikasi bagi tim data dan TI perusahaan

Bagi organisasi yang mengelola proyek AI dan analitik skala besar, pembaruan ini menawarkan beberapa implikasi praktis:

  • Mempercepat eksperimen dan deployment model AI karena data bisa diakses langsung tanpa penyalinan antar platform.
  • Menurunkan biaya penyimpanan dan operasi melalui optimasi tabel dan housekeeping otomatis.
  • Meningkatkan kepatuhan dan auditabilitas karena kebijakan dan lineage tetap konsisten di seluruh akses pihak ketiga.
  • Mengurangi risiko vendor lock-in, memberi fleksibilitas untuk menggunakan engine analitik terbaik sesuai kebutuhan.