Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Qualcomm Hadirkan Chipset Baru untuk Entry - Mid Level

Qualcomm resmi memperkenalkan dua chipset baru untuk pasar smartphone kelas menengah dan entry-level, yakni Snapdragon 6 Gen 5 dan Snapdragon 4 Gen 5. Kedua platform ini dirancang untuk menghadirkan peningkatan performa gaming, efisiensi daya, dan responsivitas sistem di tengah persaingan pasar mobile yang semakin agresif. Snapdragon 6 Gen 5 menjadi lini yang difokuskan untuk smartphone mid-range dengan fitur yang mulai mendekati kelas flagship. Qualcomm membawa peningkatan performa GPU hingga 21 persen, sekaligus menghadirkan Adaptive Performance Engine 4.0 untuk menjaga stabilitas performa saat menjalankan game berat dalam waktu lama. Chipset ini juga mulai mengadopsi fitur premium seperti dukungan Wi-Fi 7 dan teknologi AI untuk pemrosesan kamera. Qualcomm menyebut Snapdragon Smooth Motion UI sebagai salah satu fitur utama yang mampu mengurangi stutter pada animasi antarmuka dan meningkatkan kelancaran navigasi sistem. Pendekatan tersebut menunjukkan bahwa pengalaman pengguna kini me...

Awas, Google Chrome Tanam AI Lokal Tanpa Izin!

Google kembali bikin geger setelah Google Chrome ketahuan diam-diam mengunduh model AI lokal Gemini Nano berukuran sekitar 4 GB ke PC pengguna tanpa izin jelas. File raksasa itu muncul di folder “OptGuideOnDeviceModel” dengan nama “weights.bin”, dan diduga dipakai untuk fitur AI seperti scam detection hingga AI writing assistance. Temuan ini diungkap peneliti privasi Alexander Hanff dari blog That Privacy Guy. Yang bikin panas, proses unduhan berlangsung otomatis di latar belakang tanpa notifikasi maupun persetujuan eksplisit pengguna.  Chrome hanya mendeteksi apakah hardware cukup kuat menjalankan AI lokal, lalu langsung menginstal model tersebut. Masalahnya bukan cuma soal privasi. Di tengah harga SSD yang makin tidak masuk akal akibat ledakan AI datacenter, Google justru seenaknya “memakan” 4GB storage pengguna untuk fitur yang bahkan belum tentu dipakai. Pada laptop dengan SSD 256GB, angka itu jelas bukan kecil. Lebih parah lagi, beberapa pengguna melaporkan file tersebut muncu...

Review Asus ExpertBook B3 B3405CVA. Laptop Kerja Fleksibel untuk Pendukung Bisnis

Industri laptop bisnis sedang mengalami pergeseran yang cukup signifikan. Jika dulu perusahaan hanya mencari perangkat yang “cukup bisa dipakai”, kini standar berubah menjadi efisiensi, keamanan, dan daya tahan jangka panjang. Tekanan untuk bekerja hybrid, meningkatnya ancaman siber, serta kebutuhan multitasking membuat laptop bisnis harus lebih dari sekadar alat kerja. Ia harus menjadi fondasi produktivitas. Di sisi lain, tidak semua perusahaan siap mengalokasikan budget untuk perangkat flagship. Di sinilah segmen laptop bisnis menengah menjadi menarik. Pasalnya, laptop bisnis kelas menengah menawarkan keseimbangan antara harga, fitur, dan performa. Namun, kompromi tentunya selalu ada dibanding seri flagship, dan di sinilah evaluasi kritis menjadi penting. Sebagai contoh, Asus mencoba mengisi celah segmen laptop bisnis menengah lewat Asus ExpertBook B3 B3405CVA . Laptop bisnis ini ditujukan untuk perusahaan yang membutuhkan perangkat kerja solid dengan fitur enterprise, tetapi tetap r...

Samsung Galaxy S27 Di Persimpangan. Mau Harga Tinggi atau Performa Turun?

Samsung Electronics kembali berada di persimpangan sulit. Di tengah krisis harga DRAM global akibat ledakan infrastruktur AI, raksasa Korea Selatan itu dikabarkan mulai mempertimbangkan pemangkasan fitur teknis pada chipset Exynos 2700 demi menekan biaya produksi seri Samsung Galaxy S27 yang diproyeksikan meluncur awal 2027. Laporan terbaru menyebut Samsung kemungkinan menghapus teknologi FOWLP (Fan-Out Wafer-Level Packaging) dari Exynos 2700, meski chip tersebut sudah memakai proses manufaktur 2nm GAA generasi kedua. Langkah ini cukup ironis karena FOWLP justru menjadi salah satu teknologi penting yang sebelumnya dipakai Samsung untuk memperbaiki efisiensi termal dan performa sustain pada lini Exynos. Secara teknis, FOWLP memungkinkan jalur interkoneksi diperluas di luar area die utama chipset. Hasilnya, chip dapat dibuat lebih tipis, memiliki distribusi panas lebih baik, dan mempertahankan performa tinggi lebih lama tanpa throttling berlebihan. Dalam konteks Exynos yang selama bertah...

Samsung dan SK Hynix Bersaing di Standar RAM Masa Depan

Samsung dan SK Hynix kini tidak lagi sekadar bersaing soal kapasitas produksi memori. Di tengah ledakan industri AI global, keduanya mulai bertarung menentukan fondasi teknologi DRAM generasi berikutnya.  Persaingan ini menjadi semakin krusial karena AI data center modern tidak hanya haus GPU, tetapi juga sangat bergantung pada pasokan HBM dan DRAM berkecepatan tinggi yang kini mulai memasuki fase kritis. Lonjakan kebutuhan AI membuat rantai pasok memori semakin tertekan. HBM, DRAM, hingga NAND kini berebut material produksi yang sama, mulai dari wafer silikon sampai bahan kimia litografi. Situasi ini membuat produsen memori harus mencari cara baru untuk meningkatkan densitas chip tanpa menghancurkan efisiensi produksi. Samsung dilaporkan mengambil pendekatan yang cukup agresif dengan mempertimbangkan penggunaan teknologi Gate-All-Around FET atau GAAFET untuk DRAM generasi baru. Teknologi ini sebelumnya populer di prosesor modern karena mampu meningkatkan efisiensi dan kontrol aru...