Langsung ke konten utama

Chat with RTX adalah “ChatGPT Versi Offline” dari Nvidia

Ada kabar menarik nih guys. Nvidia, produsen chip grafis terkemuka dunia baru saja merilis aplikasi chatbot berbasis kecerdasan buatan alias rtificial intelligence (AI) untuk komputer (PC) yang diberi nama "Chat with RTX".

Yang menarik, berbeda dengan ChatGPT, aplikasi ini sejatinya merupakan asisten pribadi digital yang bekerja secara lokal di komputer/PC, bukan di-cloud.

Chat with RTX sendiri menawarkan berbagai layanan, antara lain pengguna bisa mengunggah dokumen di PC dengan format file .txt, .pdf, .doc/.docx, dan .xml, kemudian meminta Chat with RTX untuk merangkumnya. 



Sebagai contoh, pengguna dapat meng-upload file meeting kemudian menanyakan pertanyaan spesifik, seperti: "Apa nama tempat yang direkomendasikan rekan kerja saya?". Nantinya, chatbot akan mencari jawaban pertanyaan itu langsung dari dokumen yang diberikan, sehingga pengguna tidak usah mencari jawaban tersebut secara manual.

Selain merangkum file, Chat with RTX juga bisa merangkum video YouTube yang diberikan dalam bentuk tautan (link). Misalnya, pengguna bisa menanyakan "Apa saja GPU yang diumumkan Nvidia di Consumer Electronics Show (CES) 2024?", sehingga tidak usah menonton video pengumuman resminya yang berdurasi hingga 30 menit.

Chat with RTX juga bisa menganalisis dokumen pengguna dan merangkum video YouTube. Pengguna dapat juga meminta rekomendasi tempat wisata "hidden gem" yang wajib dikunjungi dari berbagai kreator konten di YouTube, atau meminta tutorial cara membuat kue.
 
Dengan begitu, pengguna mendapatkan informasi yang dibutuhkan secara lebih efisien. Melihat kegunaannya, bisa dibilang bahwa Chat with RTX memiliki kemiripan dengan chatbot Gemini milik Google atau ChatGPT bikinan OpenAI.

Harus Menggunakan Nvidia RTX 3000 atau 4000 series
Adapun Chat with RTX menggunakan retrieval augmented generation (RAG) dan software Nvidia TensorRT-LLM, yang didukung oleh unit pengolah grafis (GPU) Nvidia RTX 3000 atau 4000 series dan diakselerasi oleh inti Tensor built-in.

Chat with RTX mengandalkan GPU dengan VRAM 8GB, RAM 16GB, sistem operasi (OS) Windows 10 atau 11, serta driver GPU Nvidia teranyar (versi 535.11 atau lebih baru). Pengguna juga memerlukan media penyimpanan seluas 35GB.

File lokal di komputer pengguna nantinya dihubungkan (upload) ke model bahasa besar (large language model/LLM) open-source seperti Mistral atau Llama 2, yang disebut bisa memberikan jawaban yang cepat dan relevan secara kontekstual. 

Baca juga:


Nah, tugas retrieval augmented generation adalah meningkatkan akurasi dan reliabilitas model AI generatif, sedangkan Nvidia TensorRT-LLM mengoptimalkan kinerja inferensi model bahasa besar terbaru dalam platform Nvidia AI.

Chat with RTX dijalankan langsung di PC dan workstation Nvidia RTX, sehingga data pengguna hanya akan disimpan di perangkat saja. Chat with RTX tidak mengandalkan LLM berbasis cloud, sehingga pengguna bisa memproses data sensitif di PC tanpa harus membagikannya ke pihak ketiga.

Pengguna juga tidak perlu koneksi internet saat menggunakan Chat with RTX. Bisa diunduh gratis Tampilan Chat with RTX Lihat Foto Tampilan Chat with RTX(Nvidia) Pengguna yang sudah memenuhi minimum spesifikasi Chat with RTX bisa mengunduhnya secara gratis.

Sebagai informasi, aplikasi ini masih bersifat demo, sehingga masih terasa kurang apabila dibandingkan chatbot kenamaan lainnya. Proses instalasinya membutuhkan kesabaran, dan aplikasinya disebut boros daya. Selain itu, Chat with RTX tidak mengingat konteks pembicaraan, sehingga pengguna tidak bisa menanyakan pertanyaan lanjutan dari pertanyaan yang sudah diajukan.

Postingan Populer

RRQ Kembali Masuk Program Esports World Cup 2026, Validasi Global atau Sekadar Branding?

Team RRQ kembali masuk dalam Esports World Cup Foundation Club Partner Program 2026, memperpanjang statusnya sebagai salah satu organisasi esports yang dianggap relevan secara global. Ini adalah tahun kedua berturut-turut RRQ terpilih dalam program bernilai total US$20 juta tersebut, yang dirancang untuk mendorong pertumbuhan bisnis dan eksposur internasional klub esports. Secara angka, program ini terlihat impresif. Hanya 40 organisasi terpilih dari seluruh dunia, dengan total jangkauan lebih dari 300 juta penggemar. RRQ menjadi salah satu dari sedikit perwakilan Asia Tenggara, indikasi bahwa pasar regional mulai diperhitungkan dalam peta esports global.  Namun di balik angka besar itu, pertanyaan yang lebih penting adalah, seberapa strategis dampak program ini bagi keberlanjutan industri? Pendanaan hingga US$1 juta per klub memang memberi dorongan signifikan, terutama untuk penguatan brand dan operasional. Tetapi perlu dicatat, ini bukan tiket langsung ke panggung Esports World C...

Review Asus ExpertBook B3 B3405CVA. Laptop Kerja Fleksibel untuk Pendukung Bisnis

Industri laptop bisnis sedang mengalami pergeseran yang cukup signifikan. Jika dulu perusahaan hanya mencari perangkat yang “cukup bisa dipakai”, kini standar berubah menjadi efisiensi, keamanan, dan daya tahan jangka panjang. Tekanan untuk bekerja hybrid, meningkatnya ancaman siber, serta kebutuhan multitasking membuat laptop bisnis harus lebih dari sekadar alat kerja. Ia harus menjadi fondasi produktivitas. Di sisi lain, tidak semua perusahaan siap mengalokasikan budget untuk perangkat flagship. Di sinilah segmen laptop bisnis menengah menjadi menarik. Pasalnya, laptop bisnis kelas menengah menawarkan keseimbangan antara harga, fitur, dan performa. Namun, kompromi tentunya selalu ada dibanding seri flagship, dan di sinilah evaluasi kritis menjadi penting. Sebagai contoh, Asus mencoba mengisi celah segmen laptop bisnis menengah lewat Asus ExpertBook B3 B3405CVA . Laptop bisnis ini ditujukan untuk perusahaan yang membutuhkan perangkat kerja solid dengan fitur enterprise, tetapi tetap r...

Qualcomm Snapdragon Terbaru Loncat ke 2nm TSMC

Qualcomm kembali jadi sorotan setelah bocoran terbaru mengungkap dua kode model yakni SM8975 dan SM8950. Kedua chip baru tersebut diyakini sebagai Snapdragon 8 Elite Gen 6 Pro dan Snapdragon 8 Elite Gen 6. Jika rumor ini akurat, chip tersebut bukan hanya akan menjadi sekadar refresh tahunan, melainkan lompatan teknologi yang cukup agresif. Mengapa? Rumor paling menarik adalah penggunaan proses fabrikasi 2nm dari TSMC. Ini akan menjadi pertama kalinya Qualcomm masuk ke node tersebut, melampaui generasi sebelumnya seperti Snapdragon 8 Elite Gen 5 yang masih bertumpu pada 3nm. Secara teori, 2nm menawarkan efisiensi daya lebih baik, suhu lebih terkendali, dan potensi peningkatan performa, kombinasi ideal untuk smartphone modern yang semakin berat beban kerjanya, dari gaming hingga AI on-device. Namun, seperti biasa, angka node sering kali lebih terdengar impresif di atas kertas dibanding di dunia nyata. Kompetitor seperti Apple dengan chip A18 dan A18 Pro juga masih berada di 3nm, sehingga...

AMD Tak Peduli dengan Pengguna Radeon Jadul. Tak Dapat Upgrade

AMD akhirnya membuat keputusan yang terasa terlalu tegas. Pemilik GPU Radeon RX 6000 Series dan Radeon RX 7000 Series secara efektif ditinggalkan dari FSR 4 dan FSR 4.1. Padahal, FSR bukan sekadar fitur kosmetik, ia adalah lompatan penting dalam kualitas upscaling berbasis AI. FSR 4 membawa peningkatan nyata yakni rekonstruksi gambar lebih stabil, edge lebih bersih, dan scaling performa yang akhirnya kompetitif. Namun semua itu “dikunci” untuk GPU Radeon RX 9000 Series berbasis RDNA 4, dengan dalih kebutuhan arsitektur baru dan dukungan FP8. Secara teknis masuk akal, tapi terasa terlalu nyaman sebagai alasan. Masalahnya, RDNA 2 dan RDNA 3 bukan perangkat usang. Dukungan INT8 yang mereka miliki masih relevan untuk banyak workload AI ringan. Ini membuat keputusan AMD terlihat bukan murni batasan teknis, melainkan strategi segmentasi produk yang agresif, atau lebih tepat, dorongan upgrade yang dipaksakan. Bandingkan dengan Nvidia. Mereka memang membatasi fitur seperti frame generation di ...

GPU Intel Arc Pro B70 dan Arc Pro B65 Bidik Segmen Profesional

Intel resmi memperluas portofolio GPU workstation melalui peluncuran Arc Pro B70 dan Arc Pro B65. Keduanya dibangun di atas arsitektur Xe2 “Battlemage”, menargetkan segmen profesional yang kini semakin didorong oleh kebutuhan AI compute, visualisasi kompleks, dan pengembangan software berbasis akselerasi GPU. Arc Pro B70 menjadi varian paling ambisius. Dengan 32 Xe core, 256 XMX engine, dan 32 ray tracing unit, GPU ini diposisikan sebagai mesin kerja serius untuk workload berat. Kapasitas memori 32GB GDDR6 pada bus 256-bit dengan bandwidth 608 GB/s memberikan fondasi kuat untuk dataset besar dan model AI.  Intel bahkan mengklaim performa hingga 367 TOPS (INT8), angka yang secara langsung menyasar kebutuhan inference modern. Dukungan API lengkap, mulai dari DirectX 12 Ultimate hingga Vulkan 1.3, membuatnya fleksibel untuk berbagai pipeline profesional. Di bawahnya, Arc Pro B65 hadir dengan konfigurasi lebih ramping: 24 Xe core dan 160 XMX engine. Meski begitu, menariknya tetap memba...