Ketika AI Menambahkan Tangan Ekstra dan Bersikeras Semuanya Baik-Baik Saja

Pernah mengalami momen saat kamu menatap gambar buatan AI lalu berpikir:

“Sebenarnya gadis anime ini punya berapa tangan?”

Saya pernah — dan jujur saja, rasanya seperti saya yang mulai gila. Di gambar itu jelas ada tiga tangan… tapi modelnya terus bersikeras bahwa jumlahnya cuma dua.

Saya memintanya menghapus tangan ekstra itu lima kali.
Tidak berubah sama sekali.
Dan bagian paling lucunya? Ia bahkan tidak bilang “oops”. Ia malah makin yakin dengan jawabannya sendiri.

Ini contoh yang sangat pas tentang bagaimana halusinasi AI muncul dalam pembuatan gambar — dan kenapa “coba minta lagi saja” tidak selalu berhasil.

Seperti apa “halusinasi” pada gambar

Dalam teks, halusinasi berarti fakta palsu.
Dalam gambar, halusinasi berarti anatomi yang salah dan detail yang diada-adakan yang sekilas terlihat meyakinkan.

Contoh yang sering muncul:

jari ekstra / anggota tubuh ekstra
sendi yang mustahil
objek yang terduplikasi
aksesori yang tidak konsisten (anting berubah, logo ikut berubah bentuk)
bayangan aneh yang tidak cocok dengan arah cahaya

Model ini tidak tahu bahwa ia salah — ia hanya memprediksi piksel yang cocok dengan pola yang pernah dipelajarinya. Jika “anime girl + pose + framing” sering berkorelasi dengan bentuk tertentu, model bisa “melengkapi” gambar dengan cara yang terlihat masuk akal, tetapi sebenarnya tidak konsisten secara fisik.

Kenapa model tidak memperbaikinya, bahkan saat kamu menunjukkannya

Bagian ini sering mengejutkan: meskipun kamu sudah menjelaskan letak salahnya dengan tepat, model tetap bisa gagal memperbaikinya.

Ada beberapa alasan:

Model tidak bisa “menghitung” atau memverifikasi detail secara andal seperti manusia.
Ia tidak melakukan audit yang benar-benar teliti; ia hanya membuat tebakan baru setiap kali.
Permintaanmu berbenturan dengan komposisi gambar.
Menghapus satu tangan bisa merusak pose, siluet, atau keseimbangan yang “disukai” model, jadi ia terus membangun ulang struktur yang sama.
Ia memang dirancang untuk terdengar sangat yakin.
Banyak model menjawab dengan tingkat keyakinan tinggi. Jadi alih-alih berkata, “Kamu benar, ada tangan ketiga,” kamu malah mendapat jawaban, “Tangannya ada dua,” bahkan ketika mata kamu jelas melihat sebaliknya.
Edit tidak selalu berarti edit sungguhan.
Bergantung pada alat yang dipakai, “edit” bisa lebih mirip “buat ulang gambar yang mirip”, sehingga kesalahan yang sama terus muncul lagi.

Pelajaran praktis untuk para builder

Kalau kamu sedang membangun produk yang memakai pembuatan gambar, kamu tidak bisa mengasumsikan bahwa:

satu prompt = satu hasil yang benar
model akan mengikuti permintaan koreksi
model bahkan akan mengakui kesalahannya

Dengan kata lain: perlakukan output gambar sebagai sesuatu yang probabilistik, bukan deterministik.

Kalau kamu ingin tingkat keberhasilan yang lebih tinggi, biasanya kamu butuh taktik di level produk:

constraint yang kuat (referensi pose, character sheet yang konsisten)
workflow inpainting / masking yang benar-benar nyata
beberapa generasi + seleksi
pemeriksaan otomatis (bahkan heuristik sederhana untuk tangan dan jari sudah membantu)

Tetap saja… saya suka momen seperti ini

Semenyebalkannya hal ini, tetap saja ada sisi lucunya.
AI bisa membuat karya yang indah — lalu dengan santai menambahkan tangan ketiga dan bersikeras bahwa kamulah yang salah lihat.

Dan itulah persis jenis kekacauan “AI di dunia nyata” yang saya suka bagikan sambil membangun.

Kalau kamu penasaran, saya sedang mendokumentasikan lebih banyak keanehan seperti ini di proyek AI Anime Chatbot saya — bagian yang menyenangkan dan bagian yang bikin frustrasi.