Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Skor Benchmark Intel Core 5 330 Mulai Muncul. Prosesor Terbaik Intel?

Kemunculan prosesor Intel Core 5 330 di basis data benchmark kembali menegaskan arah strategi Intel dalam memperkuat segmen entry-level. Berdasarkan hasil uji di platform PassMark, chip ini mencatat skor 4.215 poin untuk single-thread dan 14.947 poin untuk multi-thread, angka yang secara praktis menempatkannya sejajar dengan varian saudaranya, Core 5 320. Secara arsitektural, Core 5 330 mengusung konfigurasi 6 core dan 6 thread dengan skema hybrid 2 Performance-core dan 4 LP-Efficient core. Pendekatan ini mencerminkan filosofi desain Wildcat Lake yang menitikberatkan efisiensi daya tanpa mengorbankan performa dasar.  Clock speed yang diusung berada di kisaran 1,5 GHz hingga 4,6 GHz untuk P-core dan 1,4 GHz hingga 3,4 GHz untuk LP-E core, menjadikannya cukup fleksibel untuk berbagai skenario penggunaan, mulai dari produktivitas ringan hingga multitasking moderat. Menariknya, meski membawa label “lebih tinggi”, Core 5 330 nyaris identik dengan Core 5 320 dari sisi spesifikasi teknis....

Review Asus ExpertBook P1403CVA. Laptop Bisnis Terjangkau untuk Jangka Panjang

Dalam beberapa bulan terakhir, industri laptop menghadapi tantangan besar akibat kenaikan harga komponen, terutama RAM dan SSD. Permintaan global terhadap memori dan penyimpanan meningkat seiring transformasi digital, cloud computing, serta tren kerja hybrid.  Situasi tersebut diperparah oleh ketidakstabilan rantai pasok, sehingga harga komponen menjadi fluktuatif. Dampaknya, banyak produsen laptop harus melakukan penyesuaian konfigurasi, bahkan di segmen premium sekalipun. Menariknya, kondisi tersebut justru mempercepat pertumbuhan pasar laptop bisnis. Banyak perusahaan dan profesional mulai beralih dari laptop consumer ke perangkat profesional yang dirancang lebih tahan lama.  Fokus tidak lagi pada spesifikasi tinggi di awal, melainkan efisiensi investasi dalam jangka panjang. Laptop bisnis menawarkan daya tahan, keamanan, serta fleksibilitas upgrade yang menjadi semakin penting. Kenaikan harga RAM dan SSD juga membuat konsep modular menjadi nilai utama. Laptop bisnis sepert...

Hp Oppo Murah Ini Cuma 1 Jutaan

Oppo belum lama ini menggelar smartphone terbarunya ke pasaran Indonesia. Spesifikasinya mengagumkan, apalagi fitur kameranya. Ya, Oppo Reno 10x Zoom menawarkan kemampuan fotografi yang mumpuni, sekaligus performa perangkat yang hebat. Meski demikian, ada harga ada rupa. Smartphone tersebut dipasarkan dengan harga yang tidak murah, yakni Rp12,999 juta untuk versi dengan RAM 8GB dan storage 256GB. Mahal? Tentu saja tidak, jika melihat spesifikasi yang disediakan di dalamnya. Sayangnya, tidak semua pengguna mampu membeli smartphone Oppo dengan harga yang tergolong fantastis tersebut. Cukup banyak di antara kita yang ingin membeli hp Oppo murah yang harganya kalau bisa di bawah Rp1 juta. Kalau tidak ada pun, kalau bisa harganya masih Rp1 jutaan. Alias di bawah Rp2 juta. Nah, kalau sudah begitu, apa pilihan yang bisa kita dapatkan? Berikut ini pilihannya: Harga HP Oppo Murah di 2019: Untuk smartphone alias hp Oppo murah di harga 1 jutaan, dipastikan Anda sudah mendapatkan pe...

Xbox Mode, Upaya Microsoft Gabungkan PC dan Konsol

Microsoft resmi memulai rollout fitur baru “Xbox Mode” untuk Windows 11, sebuah langkah yang secara strategis mengarah pada penyatuan pengalaman gaming antara PC dan konsol. Fitur ini dirancang untuk menghadirkan antarmuka yang lebih ringan, responsif, dan berorientasi pada kontroler, mendekati pengalaman khas Xbox. Secara fungsional, Xbox Mode mengubah Windows 11 menjadi lingkungan gaming yang lebih fokus. Antarmuka dipangkas dari elemen-elemen desktop tradisional yang sering menjadi distraksi, lalu digantikan dengan tampilan yang menonjolkan library game, judul terakhir dimainkan, serta akses cepat ke katalog Xbox Game Pass. Ini bukan sekadar kosmetik, tetapi upaya nyata untuk mengurangi friction saat berpindah dari kerja ke bermain. Namun, langkah ini juga mengungkap masalah lama Windows sebagai platform gaming. Selama ini, Windows dikenal fleksibel tetapi tidak pernah benar-benar optimal untuk pengalaman plug-and-play seperti konsol. Xbox Mode bisa dilihat sebagai pengakuan implisi...

Samsung Berhenti Produksi RAM LPDDR4 dan LPDDR4X

Samsung resmi menghentikan produksi memori generasi lama seperti LPDDR4 dan LPDDR4X. Keputusan ini bukan sekadar pembaruan lini produk, melainkan sinyal kuat bahwa industri memori sedang bergeser total ke arah kebutuhan kecerdasan buatan, khususnya segmen Agentic AI yang menyedot kapasitas produksi dalam skala besar. Sebagai gantinya, Samsung kini memusatkan sumber daya ke teknologi memori yang lebih relevan seperti LPDDR5, LPDDR5X, dan HBM. Ketiga jenis memori ini menjadi tulang punggung infrastruktur AI modern, terutama di pusat data yang membutuhkan bandwidth tinggi dan latensi rendah. Permintaan yang melonjak tajam dari sektor ini membuat memori bukan lagi komoditas biasa, tetapi komponen strategis yang menentukan performa sistem AI secara keseluruhan. Namun, peningkatan kapasitas produksi ternyata belum cukup. Dalam laporan kinerja terbarunya, Samsung mengakui bahwa permintaan memori untuk tahun 2027 diperkirakan akan jauh melampaui pasokan. Bahkan, kesenjangan supply dan demand d...