Pengamat Perkirakan Penerapan Teknologi AI di Apple Menyasar SIRI
Apple berpotensi buat LLM dengan penyimpanan lebih kecil.
Jakarta, FORTUNE – Pengamat menyebut kemungkinan besar Apple mengembangkan Teknologi AI (Artificial Intelligence) untuk menyempurnakan fitur SIRI agar menjadi lebih baik dan bermanfaat.
Editor Vergecast yang juga pengamat teknologi konsumen, David Pierce, mengungkapkan kemungkinan terbesar Apple menjadikan pengembangan model bahasa besar (Large Language Model/LLM) menjadi asisten virtual lebih baik dan lebih pintar. “Artinya membuat model tersebut secepat mungkin, dan memastikan model tersebut ada di mana-mana,” ujarnya seperti dikutip dari The Verge, Senin (6/5).
Kemungkinan ini semakin terdorong oleh pengembangan LLM yang makin kecil ukurannya–biasa disimpan di RAM, namun kini bisa di SSD saja. Bahkan, para peneliti mengungkapkan, LLM berukuran kecil ini bisa mencapai percepatan kecepatan inferensi sebesar 4-5x dibandingkan dengan metode pemuatan tradisional di CPU (Central Processing Unit), dan 20-25x dalam GPU (Graphic Processing Unit).
Pierce memperkirakan, dalam pertemuan akbar para pengembang aplikasi yang diselenggarakan Apple Juni nanti, WWDC (Worldwide Developers Conference), CEO Apple, Tim Cook akan mengumumkan informasi besar.
“Ada dua hal yang sangat jelas: Apple sangat terlibat dalam perlombaan AI, dan ini mungkin merupakan perombakan total pada iPhone. Anda bahkan mungkin mulai dengan sukarela menggunakan Siri!” ujarnya.
Pengembangan LLM
Dengan ukuran ini, Pierce menyebutkan LLM akan lebih murah dan bisa masuk untuk perangkat Anda. Dengan demikian, model ini dapat berjalan lebih cepat dan efisien. Peneliti Apple juga menciptakan sistem yang disebut EELBERT yang pada dasarnya dapat memampatkan LLM menjadi ukuran yang jauh lebih kecil tanpa membuatnya menjadi lebih buruk.
“Secara umum, Apple berusaha untuk mengatasi ketegangan inti dalam dunia model: semakin besar suatu model, semakin baik dan berguna model tersebut, namun juga semakin berat, boros daya, dan lambatnya model tersebut,” kata Pierce.
Pierce mengatakan, Siri yang lebih bagus dapat memberikan banyak manfaat bagi para pengguna Apple. Salah satu yang paling tampak mungkin adalah kemampuan fitur tersebut untuk mengetahui secara pasti bahwa Anda sedang berbicara pada asisten tersebut. “Masalah ini jauh lebih menantang daripada deteksi pemicu suara,” kata Pierce mengutip kata-kata para peniliti Apple.
Selain itu, Pierce juga mengungkapkan sistem lain yang sedang dikembangkan oleh para peneliti, yang disebut STEER (Semantic Turn Extension-Expansion Recognition). Aplikasi ini akan meningkatkan komunikasi bolak-balik Anda dengan asisten, dengan mencoba mencari tahu kapan Anda sedang menanyakan pertanyaan lanjutan dan saat Anda menanyakan pertanyaan baru.
SSIRI menggunakan LLM untuk lebih memahami ‘pertanyaan ambigu’ untuk mengetahui apa yang Anda maksud, tidak peduli bagaimana Anda mengatakannya.
“Agen percakapan yang cerdas mungkin perlu mengambil inisiatif untuk mengurangi ketidakpastian mereka dengan mengajukan pertanyaan yang baik secara proaktif, sehingga memecahkan masalah dengan lebih efektif,” tulis para peneliti dalam makalah berjudul LLM in a flash: Efficient Large Language Model Inference with Limited Memory.
Pengembangan lain
Hal lain yang mungkin tercakup dalam pengembangan SIRI berteknologi AI fokus pada masalah kesehatan. Apple telah meneliti cara mengumpulkan dan menyusun semua data gerakan Anda, cara menggunakan pengenalan gaya berjalan dan headphone untuk mengidentifikasi Anda, serta cara melacak dan memahami data detak jantung Anda.
Ada juga, pengembangan AI dalam SIRI yang akan memungkinkan para pengguna membangun dan menyempurnakan desain yang dihasilkan secara berulang. Alih-alih mengetikkan perintah dan mendapatkan gambar, lalu mengetikkan perintah lain untuk mendapatkan gambar lain, Anda dapat memulai dengan perintah tetapi kemudian mendapatkan perangkat untuk mengubah dan menyempurnakan bagian gambar sesuai keinginan Anda.
Para peneliti Apple, menurut Pierce, akan menjelaskan alat bernama MGIE yang memungkinkan Anda mengedit gambar hanya dengan menjelaskan pengeditan yang ingin Anda lakukan. “Daripada panduan yang singkat namun ambigu, MGIE memperoleh maksud sadar visual yang eksplisit dan mengarah pada pengeditan gambar yang wajar,” ujarnya.
Hal ini belum termasuk kemampuan teknologi AI di Apple Music, untuk memisahkan suara dari instrumen dalam lagu – yang bisa berguna jika Apple ingin memberikan alat kepada orang-orang, misalnya remix lagu yang Anda pilih, untuk konten di TikTok atau Instagram.
Yang terbesar
Dari sekian banyak kemungkinan ini, potensi yang terbesar adalah Ferret. Potensi pengembangan ini adalah LLM multi-modal yang dapat menerima instruksi, fokus pada sesuatu spesifik yang telah Anda lingkari atau pilih, dan memahami dunia di sekitarnya.
Hal tersebut dirancang untuk penggunaan AI normal saat ini, yaitu menanyakan perangkat tentang dunia di sekitar Anda, tetapi mungkin juga dapat memahami apa yang ada di layar Anda.
“Para peneliti menunjukkan bahwa ini dapat membantu Anda menavigasi aplikasi, menjawab pertanyaan tentang peringkat App Store, menjelaskan apa yang Anda lihat, dan banyak lagi. Hal ini memiliki implikasi yang sangat menarik terhadap aksesibilitas, tetapi juga dapat sepenuhnya mengubah cara Anda menggunakan ponsel—dan Vision Pro suatu saat nanti,” kata Pierce.