Cara Edit Foto di Gemini 2.0

21 Mar 2025, 11:08 WIB

ilustrasi gemini 2.0 (Dok. deepmind.google)

Intinya Sih

Gemini 2.0 Flash memperkenalkan pendekatan baru dalam pembuatan gambar melalui teknologi native image generation.
Langkah-langkah untuk menggunakan Gemini 2.0 Flash dalam pembuatan gambar:
Gemini 2.0 Flash memiliki fitur pengeditan gambar berbasis perintah teks, seperti mengubah warna, menghapus atau menambahkan objek, mengganti latar belakang, dan mengubah pose atau ekspresi.

This section summary was AI-assisted and reviewed by our editorial team.

Jakarta, FORTUNE - Google baru saja merilis fitur pembuatan gambar secara native melalui model Gemini 2.0 Flash. Fitur ini memungkinkan Gemini menghasilkan dan mengedit gambar secara langsung tanpa memerlukan model AI tambahan.

Dengan peningkatan ini, Gemini kini mampu memanipulasi gambar dengan cara yang lebih canggih, menyerupai perangkat lunak pengeditan seperti Photoshop. Google menjadi perusahaan pertama di Amerika Serikat yang memperkenalkan fitur ini kepada publik.

Bagi para pengguna, fitur Gemini 2.0 Flash ini tersedia secara gratis melalui platform Google AI Studio. Dengan langkah ini, Google berhasil melampaui pesaing utamanya, OpenAI, yang hingga saat ini belum meluncurkan fitur serupa dalam GPT-4o sejak pertama kali diumumkan pada Mei 2024.

Mari kita telaah lebih lanjut mengenai keunggulan teknologi ini serta cara memanfaatkannya untuk membuat dan mengedit gambar.

Keunggulan Teknologi Native Image Generation pada Gemini 2.0 Flash

Gemini 2.0 Flash memperkenalkan pendekatan baru dalam pembuatan gambar melalui teknologi native image generation. Dalam sistem ini, Google mengintegrasikan teknologi pembuatan gambar langsung ke dalam model AI mereka, berbeda dari pendekatan sebelumnya yang membutuhkan dua model terpisah untuk teks dan gambar.

Sebagai perbandingan, OpenAI masih menggunakan kombinasi GPT-4o dengan DALL-E 3 untuk menghasilkan gambar. Integrasi langsung ini memberikan beberapa keuntungan utama, antara lain:

1. Akurasi Pemahaman Perintah

Model ini lebih baik dalam memahami perintah teks yang kompleks, menghasilkan visual yang sesuai dengan deskripsi pengguna.

2. Konsistensi Elemen Visual

Gemini 2.0 Flash dapat menjaga konsistensi karakter dan latar dalam ilustrasi cerita.

3. Kualitas Gambar Tinggi

Model ini mampu menghasilkan gambar yang lebih realistis dan masuk akal sesuai dengan pengetahuan umum.

4. Kemampuan Text Rendering

Gemini unggul dalam merender teks di dalam gambar dibandingkan model AI lainnya.

Gemini 2.0 Flash juga memiliki keunggulan dalam memahami konteks dunia nyata. Dengan demikian, gambar yang dihasilkan lebih masuk akal dan tidak sekadar rekayasa visual belaka.

Model ini tersedia secara gratis di Google AI Studio dalam versi eksperimental bernama "gemini-2.0-flash-exp." Pengguna dapat mengaksesnya melalui antarmuka web maupun API.

Cara Membuat Gambar dengan Gemini 2.0 Flash

Berikut adalah langkah-langkah untuk menggunakan Gemini 2.0 Flash dalam pembuatan gambar:

Kunjungi platform Google AI Studio di aistudio.google.com.
Pilih model Gemini 2.0 Flash (Image Generation) Experimental.
Atur pengaturan output menjadi Images and Text.

Kunci utama dalam menghasilkan gambar yang sesuai dengan keinginan adalah kualitas prompt. Prompt harus dibuat dengan spesifik dan mendetail agar hasil gambar optimal. Berikut adalah beberapa elemen yang perlu dimasukkan dalam prompt:

Subjek utama (misalnya, seseorang, benda, atau pemandangan tertentu)
Latar belakang (misalnya, ruang kelas, taman, atau kota)
Gaya visual (realistis, kartun, lukisan, dsb.)
Sudut pandang (tampak depan, samping, dari atas, dsb.)
Detail penting lainnya (warna pakaian, ekspresi wajah, objek tambahan, dsb.)

Sebagai contoh, jika ingin membuat ilustrasi seorang ilmuwan yang sedang bekerja di laboratorium, berikut adalah contoh prompt yang dapat digunakan:

"Buat gambar seorang ilmuwan wanita mengenakan jas laboratorium putih, sedang mengamati mikroskop di meja kerja. Latar belakang berupa laboratorium dengan peralatan ilmiah modern. Gaya gambar realistis dengan pencahayaan alami. Ambil sudut pandang dari samping."

Cara Mengedit Gambar dengan Gemini 2.0 Flash

Selain membuat gambar baru, Gemini 2.0 Flash juga memiliki fitur pengeditan gambar berbasis perintah teks. Pengguna cukup mengunggah gambar ke Google AI Studio dan memberikan instruksi dalam bahasa natural untuk melakukan perubahan yang diinginkan.

Beberapa jenis pengeditan yang dapat dilakukan dengan Gemini 2.0 Flash meliputi:

Mengubah Warna dan Filter

Misalnya, mengubah gambar hitam putih menjadi berwarna.

Menghapus atau Menambahkan Objek

Bisa digunakan untuk menghapus objek yang mengganggu atau menambahkan elemen baru ke dalam gambar.

Mengganti Latar Belakang

Misalnya, mengganti latar belakang foto dari dalam ruangan menjadi pemandangan luar.

Mengubah Pose atau Ekspresi

Dapat digunakan untuk menyesuaikan ekspresi wajah atau posisi tubuh dalam gambar.

Sebagai contoh, jika pengguna memiliki foto hitam putih seorang tokoh sejarah dan ingin mengubahnya menjadi berwarna, mereka dapat memberikan instruksi seperti:

"Tambahkan warna realistis ke foto ini sesuai dengan karakteristik zaman dan suasana aslinya."

Uji coba yang dilakukan menunjukkan hasil pewarnaan yang tampak alami dan mendekati kenyataan, meskipun terdapat beberapa detail kecil yang masih perlu penyempurnaan.

Kelebihan dan Keterbatasan Gemini 2.0 Flash

Sebagai teknologi yang masih dalam tahap uji coba, Gemini 2.0 Flash memiliki beberapa keunggulan sekaligus keterbatasan. Keunggulan utama dari model ini meliputi:

Kemudahan dalam pembuatan dan pengeditan gambar dengan hanya menggunakan perintah teks.
Integrasi AI yang lebih baik sehingga mampu memahami dan menghasilkan gambar dengan akurasi tinggi.
Kemampuan text rendering yang lebih unggul dibandingkan model AI lainnya.

Sedangkan beberapa keterbatasan yang perlu diperhatikan, seperti:

Resolusi gambar yang masih terbatas, sehingga detail kecil terkadang kurang tajam.
Keterbatasan dalam pengaturan rasio aspek, yang membuat beberapa pengguna kesulitan dalam menyesuaikan proporsi gambar.

Google terus mengembangkan dan menyempurnakan teknologi ini berdasarkan masukan dari para pengguna. Dengan demikian, di masa depan, diharapkan fitur pembuatan dan pengeditan gambar di Gemini 2.0 Flash dapat semakin optimal.

Gemini 2.0 Flash membawa terobosan baru dalam pembuatan dan pengeditan gambar berbasis AI. Dengan fitur native image generation yang terintegrasi langsung ke dalam model AI, pengguna dapat dengan mudah membuat dan memodifikasi gambar sesuai keinginan mereka. Teknologi ini menawarkan berbagai keunggulan, meskipun masih memiliki beberapa batasan yang perlu diperbaiki di masa mendatang.