Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Asus ExpertBook Ultra. The Flagship of the Industry. Period! Mengapa Begitu?

Asus resmi membawa Asus ExpertBook Ultra ke Indonesia sebagai bagian dari strategi memperkuat lini laptop bisnis premium berbasis AI. Perangkat ini langsung menargetkan profesional dengan mobilitas tinggi melalui desain ultra-ringan dengan bobot mulai dari 0,99 kg, tanpa mengorbankan performa maupun fitur enterprise yang semakin krusial di era kerja hybrid. Asus mengklaim, laptop ini merupakan the Flagship of the Industry. Period. Mengapa? Kinerja Tertinggi di Laptop Tertipis Di sektor performa, Asus mengandalkan prosesor Intel Core Ultra Series 3, termasuk varian Intel Core Ultra X7 358H. Chip ini mengusung arsitektur hybrid dengan kombinasi Performance core, Efficient core, dan Low Power Efficient core, memungkinkan distribusi beban kerja yang lebih adaptif.  Clock boost hingga 4,8GHz memastikan performa single-thread tetap tinggi, sementara integrasi CPU, GPU, dan NPU dalam satu paket menghadirkan pendekatan komputasi modern yang lebih efisien. Meskipun sangat tipis dan ringan,...

Samsung Berhenti Produksi RAM LPDDR4 dan LPDDR4X

Samsung resmi menghentikan produksi memori generasi lama seperti LPDDR4 dan LPDDR4X. Keputusan ini bukan sekadar pembaruan lini produk, melainkan sinyal kuat bahwa industri memori sedang bergeser total ke arah kebutuhan kecerdasan buatan, khususnya segmen Agentic AI yang menyedot kapasitas produksi dalam skala besar. Sebagai gantinya, Samsung kini memusatkan sumber daya ke teknologi memori yang lebih relevan seperti LPDDR5, LPDDR5X, dan HBM. Ketiga jenis memori ini menjadi tulang punggung infrastruktur AI modern, terutama di pusat data yang membutuhkan bandwidth tinggi dan latensi rendah. Permintaan yang melonjak tajam dari sektor ini membuat memori bukan lagi komoditas biasa, tetapi komponen strategis yang menentukan performa sistem AI secara keseluruhan. Namun, peningkatan kapasitas produksi ternyata belum cukup. Dalam laporan kinerja terbarunya, Samsung mengakui bahwa permintaan memori untuk tahun 2027 diperkirakan akan jauh melampaui pasokan. Bahkan, kesenjangan supply dan demand d...

Review Asus ExpertBook P1403CVA. Laptop Bisnis Terjangkau untuk Jangka Panjang

Dalam beberapa bulan terakhir, industri laptop menghadapi tantangan besar akibat kenaikan harga komponen, terutama RAM dan SSD. Permintaan global terhadap memori dan penyimpanan meningkat seiring transformasi digital, cloud computing, serta tren kerja hybrid.  Situasi tersebut diperparah oleh ketidakstabilan rantai pasok, sehingga harga komponen menjadi fluktuatif. Dampaknya, banyak produsen laptop harus melakukan penyesuaian konfigurasi, bahkan di segmen premium sekalipun. Menariknya, kondisi tersebut justru mempercepat pertumbuhan pasar laptop bisnis. Banyak perusahaan dan profesional mulai beralih dari laptop consumer ke perangkat profesional yang dirancang lebih tahan lama.  Fokus tidak lagi pada spesifikasi tinggi di awal, melainkan efisiensi investasi dalam jangka panjang. Laptop bisnis menawarkan daya tahan, keamanan, serta fleksibilitas upgrade yang menjadi semakin penting. Kenaikan harga RAM dan SSD juga membuat konsep modular menjadi nilai utama. Laptop bisnis sepert...

Amazon Coba Delivery Pakai Drone, Barang Banyak yang Rusak

Eksperimen pengiriman drone oleh Amazon kembali menuai sorotan, bukan karena kecepatannya, tetapi karena potensi kerusakan barang. Dalam beberapa bulan terakhir, layanan Prime Air diperluas ke berbagai kota di Amerika Serikat, menjanjikan pengiriman kurang dari dua jam dengan biaya sekitar USD 4,99. Namun, realitas di lapangan menunjukkan bahwa efisiensi ini datang dengan kompromi yang tidak kecil. Salah satu kasus yang viral datang dari seorang kreator konten yang menguji pengiriman barang rapuh. Ia memesan sebotol sirup untuk melihat bagaimana sistem menangani paket sensitif.  Hasilnya cukup problematis. Drone menjatuhkan paket dari ketinggian sekitar tiga meter langsung ke permukaan beton. Botol plastik tersebut pecah, menimbulkan pertanyaan serius tentang bagaimana sistem ini akan menangani barang yang lebih rentan seperti kaca atau elektronik. Fenomena ini bukan kasus tunggal. Video lain dari lokasi uji coba di Nashville menunjukkan pola serupa. Drone berhenti di udara dan men...

Skor Benchmark Intel Core 5 330 Mulai Muncul. Prosesor Terbaik Intel?

Kemunculan prosesor Intel Core 5 330 di basis data benchmark kembali menegaskan arah strategi Intel dalam memperkuat segmen entry-level. Berdasarkan hasil uji di platform PassMark, chip ini mencatat skor 4.215 poin untuk single-thread dan 14.947 poin untuk multi-thread, angka yang secara praktis menempatkannya sejajar dengan varian saudaranya, Core 5 320. Secara arsitektural, Core 5 330 mengusung konfigurasi 6 core dan 6 thread dengan skema hybrid 2 Performance-core dan 4 LP-Efficient core. Pendekatan ini mencerminkan filosofi desain Wildcat Lake yang menitikberatkan efisiensi daya tanpa mengorbankan performa dasar.  Clock speed yang diusung berada di kisaran 1,5 GHz hingga 4,6 GHz untuk P-core dan 1,4 GHz hingga 3,4 GHz untuk LP-E core, menjadikannya cukup fleksibel untuk berbagai skenario penggunaan, mulai dari produktivitas ringan hingga multitasking moderat. Menariknya, meski membawa label “lebih tinggi”, Core 5 330 nyaris identik dengan Core 5 320 dari sisi spesifikasi teknis....