Langsung ke konten utama

ChatGPT Kualitasnya Menurun?

Model bahasa besar (Large Language Model) besutan OpenAI telah mendapatkan pengakuan luas dan pujian dari berbagai kalangan. Kevin Roose, penulis "Futureproof: 9 Rules for Humans in the Age of Automation," dan CEO Nvidia Jensen Huang, memuji model ini sebagai "chatbot kecerdasan buatan terbaik" yang pernah dirilis ke masyarakat umum dan sebagai prestasi besar dalam komputasi.

Model ini juga telah menghadapi ujian Turing dan berhasil mendapatkan skor tinggi dalam berbagai bidang ujian prestasi. Mulai dari ujian seperti matematika, hukum, dan GRE verbal.

Selain itu, ChatGPT juga telah memberikan respons yang sangat baik dalam konteks perawatan Kesehatan. Sebuah laporan dari sekolah kedokteran NYU muncul dan menyatakan bahwa saran yang diberikan oleh ChatGPT hampir tidak dapat dibedakan dari saran yang diberikan oleh staf medis manusia.

Meskipun demikian, peneliti dari Stanford University dan University of California, Berkeley, telah menunjukkan kekhawatiran terkait konsistensi kinerja ChatGPT.

Para peneliti tersebut menemukan variasi yang signifikan dalam kinerja model ini, termasuk penurunan dalam beberapa tugas dari Maret hingga Juni.

Contohnya adalah penurunan tingkat akurasi dalam pemecahan masalah matematika dan pembuatan kode komputer. Kritik juga muncul terkait penyebab perubahan tersebut. Tingkat akurasi model ini mengalami penurunan yang mencolok dalam beberapa kasus.

Baca juga:


Para peneliti mencatat bahwa sulit untuk menentukan penyebab perubahan dalam kinerja ChatGPT. Beberapa teori konspirasi muncul, tetapi OpenAI menolak klaim tersebut dan mengatakan bahwa setiap versi baru seharusnya lebih pintar.

Selain itu, permintaan telah muncul agar OpenAI mengungkapkan sumber materi pelatihan, kode, dan elemen struktural lainnya di balik ChatGPT 4.0 untuk memungkinkan verifikasi oleh komunitas ilmiah.

Apapun itu, perdebatan dan tantangan seputar penggunaan model bahasa besar seperti ChatGPT dalam berbagai konteks terus berlangsung. Para peneliti menyatakan pentingnya OpenAI melakukan transparansi dalam proses pembuatan LLM dan penggunaannya.

Postingan Populer

Review Lenovo ThinkPad E14 Gen 7. Laptop Bisnis di Era Efisiensi dan Mobilitas

Industri laptop bisnis tengah mengalami pergeseran signifikan. Jika sebelumnya performa dan skalabilitas menjadi tolok ukur utama, kini efisiensi daya, mobilitas, keamanan, dan keberlanjutan justru menjadi faktor penentu. Perusahaan semakin menuntut perangkat yang ringkas, tahan lama, mudah dikelola, namun tetap cukup bertenaga untuk produktivitas. Tren kerja hybrid juga turut mengubah prioritas desain laptop bisnis. Bobot ringan, daya tahan baterai memadai, konektivitas lengkap, serta fitur keamanan berlapis kini menjadi standar baru. Produsen pun berlomba menghadirkan perangkat yang tidak sekadar kuat di atas kertas, tetapi relevan dengan kebutuhan kerja modern. Lenovo melalui lini ThinkPad E-Series mencoba menjawab tantangan tersebut. Buktinya, ThinkPad E14 Gen 7   hadir sebagai opsi entry-level hingga menengah untuk profesional dan pelaku bisnis yang membutuhkan laptop tangguh, fleksibel, dan ekonomis tanpa meninggalkan DNA ThinkPad yang legendaris. Desain Lenovo ThinkPad E14 G...

Download Windows 10 ISO versi Lite Alias Ringan

Anda kesal karena laptop atau PC desktop Anda lemot padahal punya spek yang tidak jelek? Jangan dulu membuang laptop atau upgrade komponen PC desktop tersebut. Siapa tau yang membuatnya berat adalah sistem operasi Windows 10-nya yang kegemukan. Selain format dan install ulang, ada cara lain yang lebih efektif dalam membuat komputer kita bekerja seperti layaknya baru beli. Caranya adalah download Windows 10 ISO versi ringan. Lho, apa bedanya? Kalau kita memilih untuk download Windows 10 ISO versi ringan dan instalasikan di PC kita, maka fitur-fitur, fungsi atau aplikasi yang jarang digunakan, sudah ditiadakan. Selain lebih hemat ruang di harddisk, dibuangnya fitur-fitur yang tidak berguna tersebut akan membuat PC atau laptop spek rendah pun bisa menjalankan Windows 10 dengan lancar. Download Windows 10 Terbaru October 2020 Update Lalu, apa saja yang ada di Windows 10 versi Lite alias versi Ringan tersebut? Nah ini dia: Windows 10 SuperLite Compact (Gaming Edition) x64 – ...

Microsoft Mulai Lupakan NPU?

Fokus besar-besaran terhadap Copilot+ PC di CES 2026 kini justru menimbulkan pertanyaan mendasar. Apakah saat ini industri PC sedang mengejar strategi AI yang sudah mulai ditinggalkan oleh Microsoft sendiri? Seperti diketahui, beberapa bulan lalu, Microsoft menegaskan bahwa semua PC Windows 11 adalah “AI PC”, termasuk perangkat non-Copilot+. Namun di lantai pameran CES, narasi yang dominan justru seolah kembali ke era awal Copilot+, dengan fokus besar pada NPU dan angka TOPS. Masalahnya, Microsoft kini tampak kurang antusias terhadap NPU. Dengan hadirnya Windows AI Foundry yang memungkinkan inferensi AI berjalan di CPU, GPU, maupun NPU, peran NPU tidak lagi eksklusif seperti saat Copilot Runtime pertama kali diperkenalkan. Di sisi pengguna, manfaat nyata NPU juga masih minim. Fitur Copilot+ PC yang tersedia saat ini seperti Windows Studio Effects, Recall, atau Click To Do, belum cukup kuat untuk mendorong adopsi massal atau membuat konsumen benar-benar peduli pada spesifikasi NPU. Iron...

Ikut Australia, Perancis Larang Ponsel di Sekolah

Mengikuti langkah Australia, Prancis bergerak tegas membatasi akses anak terhadap teknologi digital. Majelis Nasional Prancis resmi menyetujui rancangan undang-undang yang melarang anak di bawah usia 15 tahun mengakses media sosial, sekaligus memberlakukan larangan total penggunaan ponsel di sekolah menengah atas.  RUU tersebut kini menunggu pembahasan di Senat sebelum ditandatangani menjadi undang-undang oleh Presiden Emmanuel Macron. Rancangan ini disahkan lewat pemungutan suara 130 banding 21, sebuah konsensus langka di tengah parlemen Prancis yang biasanya terpolarisasi. Mayoritas anggota parlemen lintas partai sepakat bahwa pembatasan ini diperlukan untuk melindungi anak dari perundungan siber, kecanduan digital, serta paparan konten yang tidak sesuai usia. Presiden Macron, yang secara aktif mendorong regulasi ini, menyebut keputusan tersebut sebagai “langkah besar” demi kesehatan mental dan keselamatan anak-anak Prancis. Dalam pernyataannya di televisi nasional, Macron menega...

Tantang AMD dan Intel, Nvidia Siapkan Prosesor untuk Data Center

Nvidia kembali mengguncang industri data center. CEO Nvidia Jensen Huang mengumumkan bahwa Vera CPU akan diluncurkan sebagai produk infrastruktur mandiri, bukan sekadar pendamping GPU. Ini menandai langkah strategis penting.  Untuk pertama kalinya, Nvidia menjual prosesor yang mampu menjalankan full computing stack secara independen. Dengan kata lain, Nvidia secara terbuka masuk ke wilayah yang selama puluhan tahun didominasi AMD dan Intel. Huang menyebut Vera sebagai prosesor “revolusioner”, dengan mitra awal seperti CoreWeave disebut sudah bersiap melakukan implementasi, bahkan sebelum pengumuman design win resmi. Pernyataan ini menegaskan bahwa Vera bukan eksperimen jangka pendek, melainkan bagian dari rencana besar Nvidia untuk menjadi penyedia silikon menyeluruh bagi AI dan komputasi performa tinggi. Secara teknis, Vera dirancang agresif. CPU ini mengusung 88 core Armv9.2 Olympus kustom dengan Spatial Multithreading, menghasilkan total 176 thread. Pilihan arsitektur Arm member...