Adu Canggih GPT-5 dan Gemini 2.5 Flash “Menggambar Jakarta”: Mana yang Paling Realistis?

Dipublikasikan 9 September 2025 oleh admin
Teknologi Dan Gadget

Yogyakarta, zekriansyah.com – Teknologi kecerdasan buatan (AI) kini bukan lagi sekadar alat penjawab pertanyaan berbasis teks. Semakin ke sini, kemampuannya melesat jauh, bahkan bisa menghasilkan gambar dengan kualitas yang luar biasa realistis. Bayangkan saja, hanya dengan satu kalimat perintah singkat, chatbot bisa “melukis” visual sesuai keinginan kita dalam hitungan detik!

Dua raksasa teknologi, OpenAI dengan ChatGPT-5 dan Google dengan Gemini 2.5 Flash, baru-baru ini meluncurkan pembaruan besar yang digadang-gadang makin canggih dalam urusan visual. ChatGPT-5 disebut-sebut lebih akurat, sementara Gemini 2.5 Flash (yang juga dikenal sebagai Nano Banana) menawarkan kualitas gambar lebih baik, kontrol kreatif lebih presisi, dan kecepatan pemrosesan yang tetap rendah.

Lalu, bagaimana jika kedua AI gambar super canggih ini diadu untuk “menggambar Jakarta”? Siapa yang mampu menciptakan visual yang paling mendekati kenyataan? KompasTekno sudah melakukan eksperimen menarik ini, dan hasilnya akan kita kupas tuntas di sini. Siap-siap terkejut dengan kemampuan mereka!

Duel Kreativitas AI: Uji Coba “Menggambar Jakarta”

Untuk menguji kemampuan ChatGPT-5 dan Gemini 2.5 Flash, KompasTekno memberikan lima prompt yang sama. Fokus utamanya adalah menilai seberapa realistis gambar yang dihasilkan, mencakup aspek detail dan kesesuaian dengan deskripsi prompt yang diberikan. Lima topik prompt tersebut antara lain:

  • Kota Jakarta saat jam sibuk di pagi hari
  • Suasana malam hari di sekitar kawasan Bundaran HI
  • Kota Tua Jakarta dan ragam aktivitasnya
  • Stadion GBK Jakarta di masa depan

Mari kita lihat hasil pertarungan mereka di dua prompt pertama yang paling detail.

1. Suasana Pagi Hari di Monas, Jakarta

Prompt yang diberikan cukup panjang dan detail, meminta gambar Monas di pagi hari yang sibuk, lengkap dengan pekerja, anak sekolah, pedagang kaki lima, ojek online, bus TransJakarta, hingga bajaj, dengan pencahayaan pagi alami dan efek soft glow.

  • ChatGPT-5:

    • Menghasilkan visual yang sangat sinematik dengan tone warna kuning keemasan, memberikan kesan hangat dan dramatis.
    • Elemen-elemen seperti jalanan padat, ojek online, bus TransJakarta biru, Tugu Monas, dan pejalan kaki terlihat ada.
    • Namun, efek pencahayaan terlalu terang membuatnya lebih mirip suasana sore hari. Komposisi Monas juga kurang akurat, terlalu dekat dengan jalan raya, dan detail wajah orang-orang masih kurang presisi.
  • Gemini 2.5 Flash:

    • Menampilkan visual dengan tone warna yang lebih natural dan cerah, dengan langit biru pucat khas pagi hari dan pepohonan hijau.
    • Variasi aktivitas di jalan dibuat lebih kreatif, menambah kedalaman suasana yang hidup.
    • Secara keseluruhan, dari sisi detail dan storytelling visual, Gemini 2.5 Flash dianggap lebih mampu menggambarkan “Jakarta” yang sesungguhnya dibandingkan GPT-5.

2. Gemerlap Malam di Bundaran HI

Untuk prompt kedua, AI diminta menggambarkan suasana malam di Bundaran HI yang ultra-realistis, lengkap dengan air mancur warna-warni, lalu lintas padat, serta gedung-gedung ikonik di sekitarnya seperti Mandarin Oriental, Grand Indonesia, dan Grand Hyatt.

  • ChatGPT-5:

    • Menghasilkan gambar dengan tone warna yang lebih gelap, sesuai suasana malam.
    • Air mancur divisualisasikan secara proporsional, dan yang terpenting, Tugu Selamat Datang tampil jelas di tengah bundaran.
    • Pencahayaan jalan, pantulan lampu kota, dan komposisi gedung di sekitar area terasa lebih akurat.
    • Kekurangannya, letak kendaraan yang berjejer memberi kesan “kaku”, kurang menangkap padatnya lalu lintas khas Jakarta pada malam hari.
  • Gemini 2.5 Flash:

    • Menampilkan Bundaran HI dengan kesan yang lebih cerah, dinamis, dan penuh warna, dengan saturasi dan pencahayaan yang membuat gambar terlihat lebih “hidup”.
    • Sayangnya, ada detail penting yang hilang: Tugu atau Patung Selamat Datang di tengah bundaran tidak divisualisasikan secara akurat, justru diganti dengan air mancur yang didominasi gradasi warna pelangi.
    • Ini mengurangi kesan realistis karena tata letak tidak sesuai kenyataan.

Melampaui “Menggambar Jakarta”: Keunggulan Gemini 2.5 Flash

Meskipun dalam beberapa aspek ChatGPT-5 unggul, terutama dalam mempertahankan ikon penting seperti Tugu Selamat Datang, Gemini 2.5 Flash menunjukkan fitur-fitur yang menjanjikan di luar sekadar menggambar Jakarta. Model AI gambar ini dirancang untuk mengatasi kelemahan AI generasi sebelumnya dan menawarkan kemampuan visual yang lebih canggih.

Beberapa fitur unggulan dari Gemini 2.5 Flash meliputi:

  • Conversational Editing: Pengguna cukup menggunakan bahasa natural untuk mengedit gambar, tanpa perlu membuat ulang dari awal.
  • Multi-Image Composition: Kemampuan untuk menggabungkan hingga 3 gambar menjadi satu karya baru yang kohesif.
  • Character Consistency: Ini adalah terobosan besar, karena AI mampu menjaga karakter atau objek tetap konsisten di berbagai adegan tanpa mengubah penampilannya.
  • High-Fidelity Text Rendering: Teks yang ditambahkan dalam gambar menjadi tajam, jelas, dan mudah dibaca.
  • Real-World Reasoning: Hasil edit dan kreasi gambar lebih sesuai dengan logika dunia nyata, meningkatkan realisme.

Google juga menekankan bahwa Gemini 2.5 Flash unggul dalam menjaga detail wajah dan objek yang biasanya sering terdistorsi di model lain. Kecepatan dan efisiensi juga menjadi poin penting, di mana istilah “Flash” sendiri menunjukkan kemampuan pemrosesan gambar yang sangat singkat dan hemat biaya komputasi.

Selain itu, untuk mengatasi risiko penyalahgunaan, semua gambar yang dihasilkan Gemini 2.5 Flash otomatis dibubuhi tanda air digital tak terlihat (watermark SynthID) dan metadata khusus agar bisa diidentifikasi sebagai buatan AI. Ini adalah langkah penting dalam menjaga integritas konten digital.

Bahkan, Gemini 2.5 Flash juga membuka tren baru seperti membuat action figure AI hiper-realistis hanya dari prompt, menunjukkan fleksibilitasnya untuk berbagai kebutuhan kreatif digital.

Jadi, Siapa Juara “Menggambar Jakarta” & AI Visual Masa Depan?

Dari “adu canggih” ini, terlihat bahwa baik ChatGPT-5 maupun Gemini 2.5 Flash memiliki keunggulan masing-masing dalam menggambar Jakarta. ChatGPT-5 cenderung lebih sinematik dan akurat dalam menempatkan ikon tertentu, namun kadang meleset dalam tone atau komposisi. Sementara itu, Gemini 2.5 Flash menawarkan visual yang lebih natural, kreatif, dan detail dalam storytelling, meskipun bisa “lupa” menempatkan ikon penting.

Kedua AI gambar ini menunjukkan lompatan besar dalam teknologi visual. Mereka bukan hanya sekadar alat, tetapi juga mitra kreatif yang bisa mewujudkan imajinasi menjadi gambar nyata. Pilihan terbaik mungkin tergantung pada kebutuhan Anda: apakah Anda mencari gaya sinematik yang dramatis atau visual yang lebih natural dan detail.

Satu hal yang pasti, perkembangan AI di bidang gambar akan terus berlanjut. Kita bisa menantikan kemampuan yang semakin realistis, presisi, dan mudah digunakan untuk berbagai aplikasi, mulai dari seni, desain, hingga kebutuhan bisnis dan edukasi. Era baru visual yang dihasilkan AI baru saja dimulai, dan pastinya akan semakin memukau!

FAQ

Tanya: Apa perbedaan utama antara ChatGPT-5 dan Gemini 2.5 Flash dalam menghasilkan gambar?
Jawab: ChatGPT-5 diklaim lebih akurat, sementara Gemini 2.5 Flash menawarkan kualitas gambar lebih baik, kontrol kreatif lebih presisi, dan kecepatan pemrosesan rendah.

Tanya: Bagaimana cara kerja AI seperti ChatGPT-5 dan Gemini 2.5 Flash dalam “menggambar” sebuah kota?
Jawab: AI ini menggunakan model pembelajaran mesin yang dilatih dengan jutaan gambar dan teks untuk memahami deskripsi visual dan menghasilkan gambar baru berdasarkan perintah teks yang diberikan.

Tanya: Apakah hasil gambar dari AI ini benar-benar realistis seperti foto asli?
Jawab: Tingkat realisme gambar yang dihasilkan AI semakin meningkat, namun masih ada perbedaan detail dan nuansa dibandingkan foto asli, tergantung pada kecanggihan model dan prompt yang diberikan.