Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Hp Oppo Murah Ini Cuma 1 Jutaan

Oppo belum lama ini menggelar smartphone terbarunya ke pasaran Indonesia. Spesifikasinya mengagumkan, apalagi fitur kameranya. Ya, Oppo Reno 10x Zoom menawarkan kemampuan fotografi yang mumpuni, sekaligus performa perangkat yang hebat. Meski demikian, ada harga ada rupa. Smartphone tersebut dipasarkan dengan harga yang tidak murah, yakni Rp12,999 juta untuk versi dengan RAM 8GB dan storage 256GB. Mahal? Tentu saja tidak, jika melihat spesifikasi yang disediakan di dalamnya. Sayangnya, tidak semua pengguna mampu membeli smartphone Oppo dengan harga yang tergolong fantastis tersebut. Cukup banyak di antara kita yang ingin membeli hp Oppo murah yang harganya kalau bisa di bawah Rp1 juta. Kalau tidak ada pun, kalau bisa harganya masih Rp1 jutaan. Alias di bawah Rp2 juta. Nah, kalau sudah begitu, apa pilihan yang bisa kita dapatkan? Berikut ini pilihannya: Harga HP Oppo Murah di 2019: Untuk smartphone alias hp Oppo murah di harga 1 jutaan, dipastikan Anda sudah mendapatkan pe...

Bot Kini Kuasai Internet. Manusia Resmi Tersalip

Internet tampaknya telah memasuki fase baru. Untuk pertama kalinya dalam sejarah, lalu lintas yang dihasilkan bot disebut telah melampaui aktivitas manusia. Klaim tersebut datang dari CEO Cloudflare, Matthew Prince, yang mengungkapkan bahwa gelombang agen AI berkembang jauh lebih cepat dibandingkan prediksi industri sebelumnya. Menurut Cloudflare, perubahan ini bukan disebabkan oleh bot tradisional seperti crawler mesin pencari, spam bot, atau skrip otomatis yang selama ini memenuhi internet. Lonjakan justru berasal dari generasi baru agen AI yang dirancang untuk bertindak atas nama pengguna manusia. Agen-agen tersebut kini mampu menjalankan berbagai tugas secara mandiri, mulai dari membandingkan harga produk, mencari tiket perjalanan, memesan makanan, hingga berinteraksi dengan layanan pelanggan. Dalam banyak kasus, pengguna bahkan tidak lagi perlu mengunjungi situs web secara langsung karena proses pencarian informasi dilakukan sepenuhnya oleh AI. Data Cloudflare menunjukkan bahwa se...

Review Asus ExpertBook B3 B3404CVA. Laptop Kerja Fleksibel untuk Pendukung Bisnis

Industri laptop bisnis sedang mengalami pergeseran yang cukup signifikan. Jika dulu perusahaan hanya mencari perangkat yang “cukup bisa dipakai”, kini standar berubah menjadi efisiensi, keamanan, dan daya tahan jangka panjang. Tekanan untuk bekerja hybrid, meningkatnya ancaman siber, serta kebutuhan multitasking membuat laptop bisnis harus lebih dari sekadar alat kerja. Ia harus menjadi fondasi produktivitas. Di sisi lain, tidak semua perusahaan siap mengalokasikan budget untuk perangkat flagship. Di sinilah segmen laptop bisnis menengah menjadi menarik. Pasalnya, laptop bisnis kelas menengah menawarkan keseimbangan antara harga, fitur, dan performa. Namun, kompromi tentunya selalu ada dibanding seri flagship, dan di sinilah evaluasi kritis menjadi penting. Sebagai contoh, Asus mencoba mengisi celah segmen laptop bisnis menengah lewat Asus ExpertBook B3 B3404CVA . Laptop bisnis ini ditujukan untuk perusahaan yang membutuhkan perangkat kerja solid dengan fitur enterprise, tetapi tetap r...

Intel Kian Serius Tantang AMD di Pasar Gaming

Intel akhirnya resmi memperkenalkan prosesor Arc G-Series, keluarga chip baru yang dirancang khusus untuk perangkat gaming handheld. Langkah ini menjadi upaya paling serius Intel untuk menembus pasar yang selama beberapa tahun terakhir didominasi AMD melalui berbagai perangkat populer seperti ROG Ally dan Legion Go. Berbeda dari pendekatan sebelumnya yang mengadaptasi prosesor laptop ke perangkat portabel, Arc G-Series dikembangkan secara khusus untuk kebutuhan handheld gaming. Intel menghadirkan dua varian utama, Arc G3 dan Arc G3 Extreme, yang dibangun di atas arsitektur Panther Lake dan diproduksi menggunakan proses manufaktur 18A, teknologi fabrikasi terbaru perusahaan. Kedua chip mengusung konfigurasi 14 inti yang terdiri dari dua Performance Core, delapan Efficient Core, dan empat Low-Power Efficient Core. Namun daya tarik utamanya terletak pada sektor grafis. Varian Arc G3 Extreme dipadukan dengan GPU Intel Arc B390 berbasis arsitektur Xe3 yang telah mendukung ray tracing hardwa...

Microsoft Kembangkan Perangkat Berbasis Android, Windows Ditinggalkan?

Microsoft diam-diam sedang menyiapkan babak baru dalam strategi perangkat keras berbasis AI. Menariknya, proyek yang dikenal sebagai Project Solara ini justru tidak dibangun di atas Windows, melainkan Android.  Keputusan tersebut memunculkan pertanyaan menarik. Apakah Microsoft melihat Windows dianggap kurang ideal untuk generasi perangkat AI berikutnya? Project Solara dirancang sebagai platform yang berfokus pada agen AI, bukan aplikasi konvensional. Microsoft bahkan telah memiliki dua purwarupa perangkat yang berfungsi penuh. Perangkat pertama berupa hub desktop yang dapat menerima perintah suara, mengenali pengguna melalui pemindaian wajah, hingga menampilkan informasi penting harian. Ketika dihubungkan ke monitor, perangkat tersebut dapat mengakses lingkungan Windows berbasis cloud. Perangkat kedua tampil lebih unik. Berbentuk lencana atau badge pintar, perangkat ini mengintegrasikan sensor sidik jari, kamera, serta kemampuan merekam dan mentranskripsi percakapan. Dalam demonst...