Oleh JC Hsu, Corporate Vice President and General Manager of MediaTek’s Wireless Communications Business Unit
Revolusi teknolgi AI memungkinkan pengguna menciptakan dan memanfaatkan konten yang lebih canggih. AI generatif memimpin revolusi ini dengan memberikan perspektif dan hal baru, serta mengenalkan tingkat kreativitas baru di dalam kehidupan kita sehari-hari yang lebih mudah diakses dibanding sebelumnya. Pengalaman pengguna sedang diubah; dari pertunjukan musik yang dihasilkan oleh AI, karya seni, dan dokumen berbasis teks hingga pemrograman dan pembuatan kode (coding) yang dibantu AI.
Tren pengembangan AI generatif terdapat dalam model pemrosesan bahasa alami (natural language processing/NLP), seperti ChatGPT, yang menggunakan model bahasa besar untuk dipakai khusus dalam chatbot, dan model pembuatan teks ke gambar, seperti Midjourney dan DALL-E. Melalui inovasi ini, hal-hal yang sebelumnya terlihat tidak mungkin, kini menjadi mungkin dan bisa kita raih. Kita sekarang dapat membuat visual memukau berdasarkan deskripsi teks dan membuat percakapan realistis melalui antarmuka chatbot sederhana. Bahkan, hal-hal lain juga mungkin bisa; dengan memanfaatkan sumber kreativitas baru, baik mesin maupun manusia, potensi AI generatif baru saja dieksplorasi.
AI Generatif berbasis ‘Transformer’
Transformer, model AI terobosan dalam pemrosesan bahasa alami, diperkenalkan pada tahun 2017 dan sejak itu menjadi model dasar AI generatif. Pada tahun 2020, Transformer diperluas ke kemampuan prediktif (vision) dan suara, di mana menunjukkan kinerja yang lebih baik ketimbang teknologi yang ada sebelumnya, seperti jaringan saraf convolutional (convulational neural networks/CNN) dan jaringan saraf berulang (recurrent neural networks RNN), terutama dalam hal akurasi dan kualitas.
Sejak tahun 2021, AI Processing Unit (APU) MediaTek dioptimalkan untuk menangani model Transformer dan telah digunakan oleh merek ponsel cerdas untuk menghadirkan aplikasi kemampuan prediktif dan suara ke pasar. Melalui kolaborasinya dengan perusahaan seluler terkemuka, MediaTek secara proaktif meningkatkan cara berinteraksi dengan ponsel cerdas dengan aplikasi AI yang menggunakan model Transformer.
MediaTek APU & NeuroPilot siap untuk Transformer
NeuroPilot, Platform AI MediaTek, adalah solusi komprehensif penerapan aplikasi AI berbasis Transformer. Platform ini dirancang untuk mengatasi komputasi atau penghitungan yang kompleks; terlebih, juga memanfaatkan desain APU MediaTek yang mengurangi bandwidth DRAM untuk memastikan kinerja SoC yang optimal dan hemat daya. NeuroPilot juga menyertakan rangkaian alat canggih terintegrasi yang membantu menyederhanakan pengembangan dan penerapan model AI, dengan eksekusi end-to-end model AI Transformer pada APU. Dengan NeuroPilot, pengembang juga memiliki semua yang mereka butuhkan untuk membuat aplikasi berbasis Transformer yang canggih dengan cepat dan mudah.
MediaTek NeuroPilot memudahkan produsen memanfaatkan kemampuan Vision Transformer (ViT) dan Voice Transformer yang telah terbukti dari APU.
Implementasi dan manfaat dunia nyata
Vivo X90 Pro, ponsel cerdas baru luar biasa yang menggunakan MediaTek Dimensity 9200—cip ponsel cerdas 5G unggulan terbaru kami yang mencakup MediaTek APU 690 baru—menetapkan standar baru untuk fotografi perangkat seluler dan pengenalan suara melalui penggunaan Vision (ViT) dan Voice Transformer yang inovatif.
Dengan memanfaatkan teknologi ViT, vivo X90 Pro memiliki akurasi yang belum pernah ada dari sebelumnya terhadap sebuah objek, sehingga bisa menyesuaikan dan mengoreksi fotografi dan videografi, bahkan secara drastis meningkatkan fotografi di cahaya rendah atau redup. Teknologi ViT juga mampu secara akurat mengekstraksi seseorang dari latar belakang (pengambilan mode portrait), bahkan sampai ke rambut mereka, lalu menerapkan filter latar belakang yang berbeda secara waktu nyata (real-time) untuk menciptakan efek memukau yang benar-benar membuat X90 Pro paling berbeda dalam persaingan pengambilan video dan live-streaming.
Platform Dimensity 9200 juga mengunggulkan Voice AI berbasis Transformer, yang menyediakan fitur pengenalan ucapan otomatis pada perangkat, meningkatkan kecepatan respons, serta tetap menjaga privasi pengguna dengan memastikan bahwa data tidak dikirim ke cloud untuk diproses. Teknologi mutakhir ini menandai pertama kalinya model Transformer Voice AI dioptimalkan untuk digunakan pada mobile APU, memberikan peningkatan konsumsi daya sebesar 30% dan peningkatan kinerja sebesar 50% dibandingkan dengan CPU generasi sebelumnya.