Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Review Lenovo ThinkPad E14 Gen 7. Laptop Bisnis di Era Efisiensi dan Mobilitas

Industri laptop bisnis tengah mengalami pergeseran signifikan. Jika sebelumnya performa dan skalabilitas menjadi tolok ukur utama, kini efisiensi daya, mobilitas, keamanan, dan keberlanjutan justru menjadi faktor penentu. Perusahaan semakin menuntut perangkat yang ringkas, tahan lama, mudah dikelola, namun tetap cukup bertenaga untuk produktivitas. Tren kerja hybrid juga turut mengubah prioritas desain laptop bisnis. Bobot ringan, daya tahan baterai memadai, konektivitas lengkap, serta fitur keamanan berlapis kini menjadi standar baru. Produsen pun berlomba menghadirkan perangkat yang tidak sekadar kuat di atas kertas, tetapi relevan dengan kebutuhan kerja modern. Lenovo melalui lini ThinkPad E-Series mencoba menjawab tantangan tersebut. Buktinya, ThinkPad E14 Gen 7   hadir sebagai opsi entry-level hingga menengah untuk profesional dan pelaku bisnis yang membutuhkan laptop tangguh, fleksibel, dan ekonomis tanpa meninggalkan DNA ThinkPad yang legendaris. Desain Lenovo ThinkPad E14 G...

Lewat Arrow Lake Refresh, Intel Coba Kembali Dominasi Industri PC

Intel tampaknya menyiapkan langkah lanjutan untuk menghidupkan kembali daya saingnya di pasar prosesor, meski jalurnya tidak sepenuhnya agresif. Core Ultra 200K Plus dan 200HX Plus, yang dikenal dengan nama kode Arrow Lake Refresh, dikabarkan akan meluncur pada Maret atau April 2026. Informasi ini berasal dari pembocor perangkat keras asal Tiongkok, Golden Pig Upgrade Pack, dan mengindikasikan bahwa Intel memilih bermain aman sambil menunggu momentum yang lebih besar. Menurut laporan Tom’s Hardware, Intel sebelumnya memang sudah mengonfirmasi bahwa lini Core Ultra 200S Arrow Lake akan mendapatkan penyegaran. Namun, perusahaan hanya menyebut “2026” tanpa kepastian waktu, memicu spekulasi bahwa pengumuman akan dilakukan di CES 2026. Kenyataannya, Intel justru lebih memusatkan perhatian pada Panther Lake, yang kini diposisikan sebagai bintang utama. Panther Lake dijadwalkan hadir di pasar pada 27 Januari 2026, dengan embargo ulasan untuk varian andalan Core Ultra X9 388H dikabarkan akan b...

Kabar Buruk. Pengguna Beralih ke Harddisk, Harga Jadi Ikut Naik

Permintaan terhadap hard disk drive (HDD) kembali melonjak tajam dan berdampak langsung pada harga pasar. Berdasarkan pelacakan harga ComputerBase, rata-rata harga HDD telah naik sekitar 46 persen sejak pertengahan September, meskipun tidak ada gangguan besar pada rantai pasok global.  Kenaikan ini terjadi secara bertahap selama empat bulan terakhir, dengan rentang peningkatan harga antara 23 persen hingga 66 persen, tergantung model dan kapasitas. Model dengan kenaikan terendah tercatat pada Seagate IronWolf Pro NAS HDD + Rescue 16 TB, yang naik sekitar 23 persen. Sebaliknya, lonjakan harga tertinggi terjadi pada Toshiba Cloud Scale Capacity MG10F AFA 22 TB yang melonjak hingga 66 persen. ComputerBase memantau 12 model HDD paling populer berdasarkan daftar harga euro dan menemukan bahwa secara rata-rata, HDD kini hampir 50 persen lebih mahal dibandingkan empat bulan lalu. Laporan DigiTimes pada Desember 2025 turut memperkuat tren ini. Disebutkan bahwa negosiasi kontrak kuartal kee...

Dukung Industri E-sports, ShopeePay Gandeng RRQ

Rex Regum Qeon (RRQ) mengumumkan kemitraan strategis dengan ShopeePay sebagai sponsor untuk tahun 2026. Kolaborasi ini menegaskan semakin eratnya hubungan antara industri esports dan layanan keuangan digital, sekaligus menunjukkan bagaimana dompet elektronik kini menjadi bagian penting dari gaya hidup generasi muda yang lekat dengan gaming, hiburan, dan transaksi digital. Bagi ShopeePay, menggandeng RRQ bukan sekadar langkah branding. RRQ memiliki basis penggemar besar dan loyal, dikenal sebagai RRQ Kingdom, yang mayoritas berasal dari kalangan anak muda dan digital native.  Segmen ini dinilai sejalan dengan visi ShopeePay untuk memperluas adopsi layanan keuangan digital melalui pengalaman yang relevan, praktis, dan bernilai tambah. ShopeePay menegaskan kolaborasi ini akan menghadirkan kemudahan transaksi sekaligus berbagai keuntungan eksklusif bagi komunitas RRQ. Di sisi RRQ, kehadiran ShopeePay dipandang sebagai mitra yang memahami kultur komunitas esports. RRQ menekank...

Hp Oppo Murah Ini Cuma 1 Jutaan

Oppo belum lama ini menggelar smartphone terbarunya ke pasaran Indonesia. Spesifikasinya mengagumkan, apalagi fitur kameranya. Ya, Oppo Reno 10x Zoom menawarkan kemampuan fotografi yang mumpuni, sekaligus performa perangkat yang hebat. Meski demikian, ada harga ada rupa. Smartphone tersebut dipasarkan dengan harga yang tidak murah, yakni Rp12,999 juta untuk versi dengan RAM 8GB dan storage 256GB. Mahal? Tentu saja tidak, jika melihat spesifikasi yang disediakan di dalamnya. Sayangnya, tidak semua pengguna mampu membeli smartphone Oppo dengan harga yang tergolong fantastis tersebut. Cukup banyak di antara kita yang ingin membeli hp Oppo murah yang harganya kalau bisa di bawah Rp1 juta. Kalau tidak ada pun, kalau bisa harganya masih Rp1 jutaan. Alias di bawah Rp2 juta. Nah, kalau sudah begitu, apa pilihan yang bisa kita dapatkan? Berikut ini pilihannya: Harga HP Oppo Murah di 2019: Untuk smartphone alias hp Oppo murah di harga 1 jutaan, dipastikan Anda sudah mendapatkan pe...