Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Review Asus ExpertBook P1403CVA. Laptop Bisnis Terjangkau untuk Jangka Panjang

Dalam beberapa bulan terakhir, industri laptop menghadapi tantangan besar akibat kenaikan harga komponen, terutama RAM dan SSD. Permintaan global terhadap memori dan penyimpanan meningkat seiring transformasi digital, cloud computing, serta tren kerja hybrid.  Situasi tersebut diperparah oleh ketidakstabilan rantai pasok, sehingga harga komponen menjadi fluktuatif. Dampaknya, banyak produsen laptop harus melakukan penyesuaian konfigurasi, bahkan di segmen premium sekalipun. Menariknya, kondisi tersebut justru mempercepat pertumbuhan pasar laptop bisnis. Banyak perusahaan dan profesional mulai beralih dari laptop consumer ke perangkat profesional yang dirancang lebih tahan lama.  Fokus tidak lagi pada spesifikasi tinggi di awal, melainkan efisiensi investasi dalam jangka panjang. Laptop bisnis menawarkan daya tahan, keamanan, serta fleksibilitas upgrade yang menjadi semakin penting. Kenaikan harga RAM dan SSD juga membuat konsep modular menjadi nilai utama. Laptop bisnis sepert...

Hp Oppo Murah Ini Cuma 1 Jutaan

Oppo belum lama ini menggelar smartphone terbarunya ke pasaran Indonesia. Spesifikasinya mengagumkan, apalagi fitur kameranya. Ya, Oppo Reno 10x Zoom menawarkan kemampuan fotografi yang mumpuni, sekaligus performa perangkat yang hebat. Meski demikian, ada harga ada rupa. Smartphone tersebut dipasarkan dengan harga yang tidak murah, yakni Rp12,999 juta untuk versi dengan RAM 8GB dan storage 256GB. Mahal? Tentu saja tidak, jika melihat spesifikasi yang disediakan di dalamnya. Sayangnya, tidak semua pengguna mampu membeli smartphone Oppo dengan harga yang tergolong fantastis tersebut. Cukup banyak di antara kita yang ingin membeli hp Oppo murah yang harganya kalau bisa di bawah Rp1 juta. Kalau tidak ada pun, kalau bisa harganya masih Rp1 jutaan. Alias di bawah Rp2 juta. Nah, kalau sudah begitu, apa pilihan yang bisa kita dapatkan? Berikut ini pilihannya: Harga HP Oppo Murah di 2019: Untuk smartphone alias hp Oppo murah di harga 1 jutaan, dipastikan Anda sudah mendapatkan pe...

AMD Ryzen 9 9950X3D2, Prosesor 16 Core 32 Thread 200 Watt

AMD kembali memanaskan pasar prosesor enthusiast dengan merilis Ryzen 9 9950X3D2 Dual Edition, sebuah chip yang membawa pendekatan ekstrem lewat implementasi dual 3D V-Cache. Ini bukan sekadar iterasi, melainkan eksperimen agresif untuk mendorong batas performa CPU desktop, khususnya di workload gaming dan cache-sensitive. Prosesor ini hadir dengan konfigurasi 16-core/32-thread dan total 192MB L3 cache, berkat 3D V-Cache yang kini ditempatkan di kedua CCD. Secara teori, pendekatan ini menghilangkan bottleneck antar-core yang sebelumnya muncul pada desain single-CCD cache stacking.  Namun, konsekuensinya langsung terlihat. Base clock 4.3GHz dan boost hingga 5.6GHz, sedikit lebih rendah dibanding Ryzen 9 9950X3D. Penurunan ini bukan kebetulan, melainkan kompromi terhadap kebutuhan daya dan thermal yang meningkat. Dengan TDP mencapai 200W, jelas bahwa efisiensi bukan lagi prioritas utama. AMD mencoba mengompensasi lewat penggunaan 2nd Gen 3D V-Cache yang diklaim lebih dingin dan lebih...

GPU Intel Arc Tidak Didukung oleh Game Baru Ini

Peluncuran Crimson Desert justru menyisakan masalah serius bagi sebagian gamer PC. Developer Pearl Abyss secara resmi mengonfirmasi bahwa game ini tidak mendukung GPU Intel Arc, bahkan tidak bisa dijalankan sama sekali di platform tersebut. Masalahnya bukan sekadar performa atau optimasi yang buruk. Sejumlah pengguna melaporkan game gagal launch dengan pesan error “graphics device is currently not supported.” Artinya, ini adalah isu kompatibilitas total, bukan sekadar bug minor yang bisa ditambal lewat patch awal. Dalam FAQ resminya, Pearl Abyss menyatakan bahwa Crimson Desert “saat ini tidak mendukung Intel Arc” dan yang lebih mengkhawatirkan, tidak ada komitmen untuk memperbaikinya. Tidak ada roadmap, tidak ada janji update. Praktis menutup harapan pengguna Intel Arc dalam waktu dekat. Dampaknya cukup luas. Tidak hanya pengguna GPU diskrit, tetapi juga sistem dengan iGPU berbasis Arc, termasuk platform terbaru Intel ikut terdampak. Ini berpotensi mematikan kompatibilitas game dengan ...

2027, Aktivitas Bot Lampaui Manusia

Lalu lintas internet sedang menuju titik balik besar. Cloudflare memprediksi bahwa pada 2027, trafik bot berbasis AI akan melampaui aktivitas manusia di internet. Prediksi ini jauh lebih cepat dari yang banyak pihak perkirakan. Matthew Prince, CEO Cloudflare menilai, lonjakan ini didorong oleh perilaku agen AI yang jauh lebih “rakus” dibanding pengguna manusia. Jika seseorang hanya membuka beberapa situs untuk mencari produk, agen AI bisa mengunjungi ribuan halaman dalam waktu singkat untuk membandingkan data. Skala inilah yang mengubah pola trafik secara fundamental. Sebagai gambaran, sebelum era generative AI, bot sudah menyumbang sekitar 20 persen trafik internet, didominasi crawler seperti milik Google. Kini, dengan hadirnya agen AI yang terus aktif mengumpulkan dan memproses data, angka tersebut diperkirakan akan melonjak drastis hingga melampaui trafik manusia dalam dua tahun ke depan Dampaknya tidak sepele. Infrastruktur internet yang selama ini dirancang untuk aktivitas manusia...