Apple Rilis Pico Banana 400K, Berisi 400 Ribu Gambar Terkurasi
Para peneliti Apple merilis Pico Banana 400K yang menjadi sebuah dataset komprehensif berisi 400 ribu gambar terkurasi.
Apple merilis Pico Banana 400K yang berisi 400 ribu gambar terkurasi. Foto: ist/net
trustjabar.com – Para peneliti Apple merilis Pico Banana 400K yang menjadi sebuah dataset komprehensif berisi 400 ribu gambar terkurasi. Besutan ini untuk meningkatkan cara sistem kecerdasan buatan (artificial intelligent, AI) mengedit foto berdasarkan perintah teks.
Baca Juga : Google Berencana Ekspansi Nano Banana Melalui Aplikasi Ini!
Dikutip laman resminya pada Kamis (30/10/2025), dataset Pico Banana 400K ini bertujuan mengatasi kesenjangan kritis dalam pengeditan gambar berbasis AI. Meskipun sistem GPT-4o dapat melakukan pengeditan mengesankan, namun masih ada kendala. Para peneliti mengatakan, kekurangan data pelatihan berskala besar dan berkualitas tinggi, telah membatasi kemajuan di bidang ini.
Yang membedakan Pico Banana 400K dari dataset sebelumnya adalah pendekatan sistematis Apple terhadap kontrol kualitas dan cakupan yang komprehensif. Gambar-gambar tersebut, diorganisir de dalam 35 jenis edit berbeda di delapan kategori. Mulai dari penyesuaian dasar seperti perubahan warna hingga transformasi kompleks seperti mengubah orang menjadi bergaya karakter Pixar atau fitur LEGO.
Dalam Pico Banana 400K ini, Apple membangun dataset menggunakan model Gemini 2,5 Flash Image milik Google. Sementara Gemini 2,5 Pro, berfungsi sebagai sistem kontrol kualitas otomatis mengevaluasi hasil berdasarkan kepatuhan instruksi dan kualitas teknis. Setiap gambar dalam set tersebut menjalani proses penyaringan bertenaga AI yang ketat.
Subset Khusus Pico Banana 400K
Data set ini mencakup tiga subset khusus, di antaranya 258 ribu contoh edit tunggal untuk pelatihan dasar dan 56 ribu pasangan preferensi. Pasangan preferensi ini untuk membandingkan edit yang berhasil dan gagal. Selain itu, ada 72 ribu urutan multi-giliran yang menunjukkan bagaimana gambar berevolusi melalui beberapa edit berturut-turut.
Baca Juga : Sejumlah Talenta AI Apple Hengkang, Memilih Eksodus ke Meta
Penelitian Apple mengungkapkan, keterbatasan signifikan dalam model pengeditan gambar saat ini. Meskipun perubahan gaya global berhasil 93 persen dari waktu yang ada, tugas-tugas presisi seperti memindahkan objek atau mengedit teks masih di bawah 60 persen. Temuan ini memberikan wawasan berharga mengenai pengeditan gambar berbasis AI masih belum memenuhi ekspektasi pengguna.
Dataset lengkap Pico Banana 400K tersedia secara gratis untuk penggunaan penelitian non-komersial di Github. Memungkinkan pengembang dan peneliti menggunakannya dalam melatih sistem AI pengeditan gambar yang lebih mumpuni. Menurut para peneliti, dataset ini menetapkan fondasi yang kuat melatih dan membandingkan generasi berikutnya dari model pengeditan gambar berbasis teks. (ecp/trustjabar/R1)
Komentar
0 komentar untuk Apple Rilis Pico Banana 400K, Berisi 400 Ribu Gambar Terkurasi
Masuk dulu untuk ikut diskusi
Akun komentar viewer terpisah dari author dan admin.