Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Hp Oppo Murah Ini Cuma 1 Jutaan

Oppo belum lama ini menggelar smartphone terbarunya ke pasaran Indonesia. Spesifikasinya mengagumkan, apalagi fitur kameranya. Ya, Oppo Reno 10x Zoom menawarkan kemampuan fotografi yang mumpuni, sekaligus performa perangkat yang hebat. Meski demikian, ada harga ada rupa. Smartphone tersebut dipasarkan dengan harga yang tidak murah, yakni Rp12,999 juta untuk versi dengan RAM 8GB dan storage 256GB. Mahal? Tentu saja tidak, jika melihat spesifikasi yang disediakan di dalamnya. Sayangnya, tidak semua pengguna mampu membeli smartphone Oppo dengan harga yang tergolong fantastis tersebut. Cukup banyak di antara kita yang ingin membeli hp Oppo murah yang harganya kalau bisa di bawah Rp1 juta. Kalau tidak ada pun, kalau bisa harganya masih Rp1 jutaan. Alias di bawah Rp2 juta. Nah, kalau sudah begitu, apa pilihan yang bisa kita dapatkan? Berikut ini pilihannya: Harga HP Oppo Murah di 2019: Untuk smartphone alias hp Oppo murah di harga 1 jutaan, dipastikan Anda sudah mendapatkan pe...

Asus Tawarkan AI Hybrid untuk Tekan Biaya AI Enterprise hingga 70 Persen

Asus memperluas strategi AI enterprise dengan menghadirkan arsitektur AI hybrid ke seluruh lini perangkat komersialnya, mulai dari laptop ExpertBook, desktop ExpertCenter, hingga mini PC NUC. Langkah tersebut menjadi respons terhadap meningkatnya biaya operasional AI generatif dan bisa menjadi solusi untuk menekan biaya AI perusahaan. Sebagai konteks, anggaran operasional AI generatif semakin membebani perusahaan seiring adopsi large language model (LLM) dan agen AI yang terus berkembang. Bahkan jauh melebihi budget saat perusahaan memanfaatkan otak manusia untuk mengerjakan tugas-tugas yang saat ini dikerjakan AI. Seperti diketahui, selama ini, banyak implementasi AI mengandalkan cloud sebagai pusat pemrosesan. Model tersebut memang fleksibel, tetapi biaya inferensi berbasis token dapat meningkat drastis ketika penggunaan AI dilakukan dalam skala besar.  Bagi perusahaan, kondisi ini mulai menjadi salah satu hambatan utama dalam memperluas penerapan AI. Melalui pendekatan AI hybrid...

Acer Perluas Lini Aspire AI. Laptop Hingga All-in-One

Di tengah tren industri yang berlomba-lomba menempelkan label “AI PC” pada hampir setiap produk baru, Acer kembali memperluas portofolio Copilot+ PC lewat peluncuran Aspire X 16 AI, Aspire 18 AI, serta desktop all-in-one Aspire C AI Series di ajang Computex 2026.  Langkah ini menunjukkan bahwa Acer ingin memastikan lini Aspire tidak tertinggal dalam perlombaan perangkat berbasis kecerdasan buatan. Namun di balik sederet klaim AI, pertanyaan yang lebih penting adalah apakah teknologi tersebut benar-benar memberikan manfaat nyata bagi pengguna. Sorotan utama datang dari Aspire X 16 AI yang mengusung prosesor Intel Core Ultra generasi terbaru dengan performa hingga 180 TOPS. Angka tersebut menempatkannya sebagai salah satu laptop AI paling bertenaga di kelasnya.  Acer juga membekalinya dengan layar OLED 3K 120Hz, desain metal premium setebal 15,9 mm, serta baterai yang diklaim mampu bertahan hingga 24 jam. Kombinasi ini menjadikannya lebih dari sekadar laptop produktivitas biasa,...

Review Asus ExpertBook B3 B3404CVA. Laptop Kerja Fleksibel untuk Pendukung Bisnis

Industri laptop bisnis sedang mengalami pergeseran yang cukup signifikan. Jika dulu perusahaan hanya mencari perangkat yang “cukup bisa dipakai”, kini standar berubah menjadi efisiensi, keamanan, dan daya tahan jangka panjang. Tekanan untuk bekerja hybrid, meningkatnya ancaman siber, serta kebutuhan multitasking membuat laptop bisnis harus lebih dari sekadar alat kerja. Ia harus menjadi fondasi produktivitas. Di sisi lain, tidak semua perusahaan siap mengalokasikan budget untuk perangkat flagship. Di sinilah segmen laptop bisnis menengah menjadi menarik. Pasalnya, laptop bisnis kelas menengah menawarkan keseimbangan antara harga, fitur, dan performa. Namun, kompromi tentunya selalu ada dibanding seri flagship, dan di sinilah evaluasi kritis menjadi penting. Sebagai contoh, Asus mencoba mengisi celah segmen laptop bisnis menengah lewat Asus ExpertBook B3 B3404CVA . Laptop bisnis ini ditujukan untuk perusahaan yang membutuhkan perangkat kerja solid dengan fitur enterprise, tetapi tetap r...

AMD Rilis Ryzen AI Max 400 Series

AMD kembali memperluas lini prosesor AI mobile melalui peluncuran Ryzen AI Max 400 Series, sebuah penyegaran dari platform Strix Halo yang kini diarahkan lebih agresif ke workstation AI portabel dan pengembangan large language model (LLM) secara lokal.  Berbeda dari generasi laptop konvensional yang masih mengandalkan cloud untuk inferensi AI, platform terbaru ini justru mencoba membawa beban kerja AI skala besar langsung ke perangkat mobile. Ryzen AI Max 400 Series tetap mengusung konfigurasi hingga 16-core/32-thread berbasis arsitektur Zen 5, dipadukan dengan GPU terintegrasi RDNA 3.5 hingga 40 Compute Unit. Namun perubahan paling signifikan ada pada dukungan memori LPDDR5X yang kini meningkat drastis dari maksimum 128GB menjadi 192GB.  AMD bahkan memungkinkan alokasi unified memory hingga 160GB langsung ke iGPU, sebuah pendekatan yang sangat tidak biasa di segmen laptop. Secara teknis, strategi unified memory tersebut membuat platform ini mampu menjalankan model AI berukura...