Akurasi Artificial Intelligence Meningkat dengan Pelabelan Data

Untuk membuat AI lebih akurat, adil, dan tidak bias.

Akurasi Artificial Intelligence Meningkat dengan Pelabelan Data
Ilustrasi artificial intelligence. (Pixabay/KELLEPICS)
Follow Fortune Indonesia untuk mendapatkan informasi terkini. Klik untuk follow WhatsApp Channel & Google News

Jakarta, FORTUNE – Kecerdasan buatan atau AI bukan hal alami atau muncul begitu saja. Prosesnya membutuhkan data dan menggunakan algoritme untuk membuat prediksi berdasarkan data itu, termasuk peran manusia di dalamnya. Oleh karena itu, untuk membuat AI lebih akurat, adil, tidak bias, pelabelan data pun dibutuhkan.

Menurut mit.edu, pelabelan data (data labelling) merupakan proses pemberian makna pada mesin pembelajar tentang poin-poin data individual yang tergambar melalui teks. Pelabelan data seperti satu fase terpenting yang akan menentukan tingkat kecerdasan sebuah sistem AI. Semakin banyak data yang dimiliki, maka sistem AI tersebut akan semakin akurat dalam menghasilkan prediksi.

Frederik Bussler, seorang konsultan dan analis digital, menulis di VentureBeat (7/12), tentang kumpulan data yang berlabel yang diperlukan AI agar bisa berfungsi dengan baik. Ia mencontohkan langkah perusahaan OpenAI dalam menawarkan penggunaan data berlabel untuk ‘meningkatkan perilaku model bahasa’.

Menurut Bussler, pelabelan data seperti yang dilakukan oleh OpenAI akan membawa sebuah revolusi dalam penggunaan AI. “Ini adalah contoh penting, karena model OpenAI telah lama ditegur karena dianggap ‘toxic’ dan rasis,” katanya. “Dan ini adalah contoh sempurna dalam menggunakan data berlabel untuk mengontrol bias.”

Pentingnya pelabelan data

Bussler mengungkapkan bahwa AI sejatinya tidak secerdas yang dibayangkan tanpa adanya pelabelan data. Banyak kasus terjadi yang menunjukkan kesalahan pembacaan data akibat sistem AI yang masih menggunakan data tak berlabel. “Saat diterapkan dalam keseharian, penggunaan data tanpa label akan berdampak serius dalam banyak kasus,” ujarnya.

Kesalahan-kesalahan ini banyak terjadi ketika datang ke domain yang menantang seperti perawatan kesehatan, moderasi konten, atau kendaraan otonom. Dalam banyak kasus, penilaian manusia masih diperlukan untuk memastikan modelnya akurat.

“Perhatikan contoh sarkasme dalam moderasi konten media sosial. Sebuah posting Facebook mungkin berbunyi, ‘Astaga, kamu sangat pintar!’. Namun, itu bisa menjadi sarkastik dengan cara yang bisa dilewatkan oleh robot. Lebih buruk lagi, model bahasa yang dilatih pada bias data dapat menjadi seksis, rasis, atau hal toxic lainnya,” menurut Bussler.

Memadukan AI dengan penilaian manusia

Bussler mengatakan pelabelan data secara manual untuk AI adalah proses padat karya. Diperlukan waktu berminggu-minggu atau berbulan-bulan untuk memberi label beberapa ratus sampel menggunakan pendekatan ini. Hal ini pun juga belum bisa terjamin tingkat akurasinya, terutama ketika menghadapi tugas pelabelan khusus berskala besar.

Bussler menyatakan bahwa cara terbaik untuk menskalakan pelabelan data dalam jumlah besar dan mampu bersaing dengan penyedia lain adalah dengan memadukan pembelajaran mesin dan keahlian manusia. “Perusahaan seperti Toloka, Appen, dan lainnya menggunakan AI untuk mencocokkan orang yang tepat dengan tugas yang tepat, sehingga para ahli melakukan pekerjaan yang hanya bisa mereka lakukan,” katanya.

Cara ini akan meningkatkan upaya pelabelan untuk data yang lebih akurat, kata Bussler. Selanjutnya, AI dapat menimbang jawaban dari responden yang berbeda sesuai dengan kualitas tanggapan. Ini memastikan bahwa setiap label memiliki peluang akurasi yang lebih tinggi.

Bussler menyampaikan bahwa data berlabel memicu revolusi AI baru. “Dengan menggabungkan AI dengan penilaian manusia, perusahaan dapat membuat model data yang akurat. Model-model ini kemudian dapat digunakan untuk membuat keputusan yang lebih baik yang memiliki dampak terukur pada bisnis,” katanya.

Aplikasi yang menggunakan pelabelan data

Bussler berpendapat, pelabelan data sangat penting untuk aplikasi pencarian, visi komputer, asisten suara, moderasi konten, dan banyak lagi. Pencarian adalah salah satu kasus penggunaan AI besar pertama yang mengandalkan penilaian manusia untuk menentukan relevansi. Dengan data berlabel, pencarian bisa sangat akurat.

Pada sektor perawatan kesehatan, AI dapat membantu mendiagnosis kondisi kulit dan retinopati diabetik, meningkatkan tingkat ingatan untuk tinjauan kepatuhan pengobatan, dan menganalisis laporan ahli radiologi untuk mendeteksi kondisi mata seperti glaukoma.

“Moderasi konten juga mengalami kemajuan signifikan berkat AI yang diterapkan pada sejumlah besar data berlabel. Hal ini terutama berlaku untuk topik sensitif, seperti kekerasan atau ancaman kekerasan. Misalnya, AI dengan data berlabel akan mampu membedakan postingan Youtube tentang ancaman bunuh diri dengan video informasi mengenai bunuh diri,” kata Bussler.

Penggunaan AI penting lainnya, ucap Bussler, adalah untuk pelabelan data dalam memahami suara dengan aksen atau nada apa pun, seperti asisten suara Alexa atau Siri. Ini membutuhkan pelatihan algoritme untuk mengenali pola bicara pria dan wanita berdasarkan volume besar audio berlabel.

Magazine

SEE MORE>
Fortune Indonesia 40 Under 40
Edisi Februari 2024
Investor's Guide 2024
Edisi Januari 2024
Change the World 2023
Edisi Desember 2023
Back for More
Edisi November 2023
Businessperson of the Year 2023
Edisi Oktober 2023
Rethinking Wellness
Edisi September 2023
Fortune Indonesia 100
Edisi Agustus 2023
Driving Impactful Change
Edisi Juli 2023

Most Popular

Paylater Layaknya Pedang Bermata Dua, Kenali Risiko dan Manfaatnya
Bidik Pasar ASEAN, Microsoft Investasi US$2,2 Miliar di Malaysia
LPS Bayarkan Klaim Rp237 Miliar ke Nasabah BPR Kolaps dalam 4 Bulan
BI Optimistis Rupiah Menguat ke Rp15.800 per US$, Ini Faktor-faktornya
Saham Anjlok, Problem Starbucks Tak Hanya Aksi Boikot
Rambah Bisnis Es Krim, TGUK Gandeng Aice Siapkan Investasi Rp700 M