Ketika Gemini Google Mengambil Ujian Pakar dan Raih Nilai Di Atas Manusia

Table of Contents


Coba kamu bayangkan sedang ujian di sekolah. Soalnya sangat susah, mencakup semua mata pelajaran—mulai dari matematika super rumit, fisika tingkat tinggi, sejarah dunia, hukum, bahkan etika dan kedokteran. Hanya profesor atau ahli di bidangnya yang bisa menjawabnya dengan benar. Nah, ada sebuah program komputer, alias kecerdasan buatan (AI) buatan Google, yang ikut ujian ini. Namanya Gemini.

Yang bikin geger dunia adalah hasil ujiannya. Gemini tidak cuma lulus, tapi nilainya lebih tinggi dari skor rata-rata para ahli atau expert manusia di ujian itu! Ujian ini punya nama MMLU (Massive Multitask Language Understanding). Ini bukan sekadar menang di permainan catur atau Go, lho. Ini artinya, dalam hal pengetahuan dan penalaran, AI sudah melangkahi kemampuan manusia di banyak bidang sekaligus.

Ini bukan film fiksi ilmiah, tapi kenyataan yang diumumkan Google. Kenapa ini penting? Karena MMLU adalah tolak ukur paling berat untuk menguji seberapa pintarnya sebuah AI. Mari kita bongkar kenapa Gemini bisa sampai di level ini dan apa artinya buat masa depan kita.

MMLU: Ujian Paling Berat untuk Otak AI

Apa sebenarnya MMLU itu? Anggap saja MMLU adalah Ujian Nasional (UN) atau Ujian Masuk Universitas yang paling susah di dunia, dikalikan 57 mata pelajaran.

MMLU terdiri dari hampir 16.000 pertanyaan pilihan ganda yang mencakup 57 disiplin ilmu yang berbeda. Ini termasuk:

1. STEM (Sains, Teknologi, Teknik, Matematika): Fisika kuantum, teknik elektro, kalkulus, dan ilmu komputer.

2. Humaniora: Sejarah AS, sastra, filsafat, dan bahasa.

3. Ilmu Sosial: Ekonomi, psikologi, dan politik.

4. Disiplin Profesional: Hukum, akuntansi, dan kedokteran.

Tujuan dari MMLU bukan cuma menguji seberapa banyak data yang dihafal AI, tapi lebih ke kemampuan penalaran dan pemecahan masalah di berbagai konteks. AI harus bisa menghubungkan informasi, menggunakan logika, dan "berpikir" untuk menjawab.

Skor Manusia vs. Skor Gemini

Saat pertama kali MMLU dibuat, skor rata-rata manusia biasa (non-spesialis) yang mencoba ujian ini hanya sekitar 34%. Itu hampir sama dengan menebak. Ini menunjukkan betapa susahnya ujian ini.

Untuk para ahli (profesor atau orang yang punya gelar tinggi di bidangnya), skor rata-rata mereka berada di kisaran 89.8%. Angka ini menjadi batas expert level manusia.

Saat Google meluncurkan model terbesarnya, Gemini Ultra, skor yang diraihnya pada MMLU adalah 90.04%.

Ini adalah momen bersejarah. Gemini Ultra adalah model AI pertama yang secara resmi berhasil melampaui ambang batas kinerja ahli manusia pada tolok ukur MMLU. Ini bukan cuma menang 1-0, tapi sebuah pernyataan bahwa AI sudah punya pemahaman yang luas dan mendalam di banyak bidang ilmu.

Kenapa Gemini Bisa Sehebat Itu? Multimodalitas Jawabannya

Model AI terdahulu (seperti GPT-3 atau PaLM) biasanya "berpikir" hanya menggunakan teks. Mereka dilatih dengan triliunan kata dan kalimat. Tapi Gemini beda.

Gemini adalah model multimodal secara native atau bawaan. Artinya, dia tidak hanya dilatih menggunakan teks, tetapi juga gambar, video, audio, dan kode secara bersamaan sejak awal.

Bayangkan anak kecil yang belajar. Dia tidak cuma membaca buku (teks), tapi juga melihat gambar (visual), mendengar suara gurunya (audio), dan mencoba memegang benda (fisik). Gemini belajar dengan cara yang jauh lebih mirip dengan manusia.

Contoh kehebatannya:

AI lama: Kamu berikan soal matematika yang ditulis tangan di kertas. AI lama akan kesulitan karena harus mengubah tulisan tangan itu menjadi teks digital dulu, baru bisa dihitung.

Gemini: Ia bisa langsung melihat tulisan tangan itu, memahami bahwa itu adalah soal, menganalisis langkah-langkah penyelesaiannya, dan bahkan menemukan di mana letak kesalahan penalaran si murid, semuanya dalam waktu singkat! Kemampuan untuk menggabungkan visual dan logika inilah yang membuat skor MMLU-nya melambung. Ia melihat dunia layaknya kita, tidak hanya sebagai deretan huruf.

Revolusi di Dunia Coding: AlphaCode 2

Kinerja Gemini tidak hanya terlihat di ujian pengetahuan umum. Google juga mengintegrasikan kekuatan Gemini dalam sistem pembuatan kode canggih, yang mereka sebut AlphaCode 2.

Dalam kompetisi coding yang menantang, AlphaCode 2 yang ditenagai Gemini berhasil mengalahkan 85% peserta manusia! Ini bukan hanya tentang menulis sintaks (bahasa program), tetapi tentang penalaran tingkat tinggi, pemikiran strategis, dan memecahkan masalah matematika yang kompleks di bawah tekanan.

Ini menunjukkan bahwa Gemini memiliki kemampuan untuk berpikir layaknya seorang programmer ahli, bukan cuma alat bantu koding biasa. Ini jelas akan merevolusi dunia teknologi dalam beberapa tahun ke depan, entah itu jadi kabar baik atau kabar buruk buat para programmer senior, kita tunggu saja.

Google meluncurkan Gemini dalam tiga versi, disesuaikan dengan kebutuhan dan efisiensi:

1. Gemini Nano: Model paling ringan, dirancang untuk berjalan langsung di perangkat seluler (seperti ponsel pintar), bahkan saat offline. Ini memungkinkan fitur-fitur AI cerdas langsung ada di genggaman tangan kita.

2. Gemini Pro: Model kelas menengah yang cepat dan efisien. Ini adalah model yang dipakai untuk sebagian besar produk Google seperti Bard atau layanan cloud. Bisa dibilang ini "kuda pekerja" utamanya Google.

3. Gemini Ultra: Model terbesar dan terkuat, yang mencetak rekor 90.04% di MMLU. Ini ditujukan untuk tugas-tugas yang paling kompleks dan membutuhkan penalaran yang sangat mendalam.

Apa Dampaknya Buat Kita?

Ketika AI melampaui skor ahli manusia di ujian seperti MMLU, ini bukan berarti besok kita tidak butuh lagi dokter, pengacara, atau guru. Tentu saja tidak. Manusia punya empati, moral, dan kreativitas yang tidak dimiliki AI.

Namun, ini artinya AI seperti Gemini akan menjadi asisten super yang sangat kuat.

Bagi Dokter: Gemini bisa membantu menganalisis hasil sinar-X atau mamogram (multimodal) dan memberikan diagnosis awal yang sangat akurat dalam hitungan detik.

Bagi Ilmuwan, Gemini bisa meninjau ribuan makalah ilmiah dan menemukan pola tersembunyi yang mungkin terlewat oleh peneliti manusia.

Bagi Pelajar, Gemini bisa menjadi tutor pribadi yang sangat sabar, menjelaskan fisika kuantum sambil menunjukkan gambar-gambar visualnya.

Intinya, Gemini dan skor MMLU-nya mengukuhkan bahwa kita sudah masuk ke zaman di mana AI bisa diajak berpikir, bukan hanya disuruh bekerja. Ini adalah tonggak sejarah yang akan mengubah banyak hal. Jadi, siap-siap saja ya, dunia ini bakal makin aneh dan canggih! Kita harus terus belajar supaya bisa memanfaatkan alat super pintar ini dengan bijak.

Posting Komentar