Tiga dekade setelah diperkenalkan oleh Adobe, Portable Document Format (PDF) tetap menjadi standar pertukaran dokumen digital. Format ini dirancang untuk memastikan tampilan halaman konsisten di berbagai perangkat. Namun, di era kecerdasan buatan (AI), karakteristik tersebut justru menjadi tantangan.
PDF dibangun berbasis koordinat grafis, bukan struktur teks linear seperti halaman web. Setiap huruf ditempatkan secara presisi di halaman, sehingga model bahasa besar (LLM) kerap kesulitan memahami urutan teks, hierarki, atau konteks.
Dokumen dengan banyak kolom, tabel, dan catatan kaki berisiko diproses keliru, memicu ringkasan tidak akurat atau “halusinasi” konten. Tantangan serupa juga dihadapi perangkat lunak aksesibilitas dan alat ekstraksi data.
Di sisi keamanan, Check Point melaporkan sekitar 20 persen serangan berbasis email memanfaatkan PDF berbahaya, memanfaatkan kemampuannya menyematkan skrip dan tautan. Popularitas format ini menjadikannya medium pertukaran universal sekaligus target empuk malware.
Sebagian pelaku industri melihat peluang untuk membangun format dokumen baru yang lebih ramah AI. Startup Israel Factify, dipimpin Matan Gavish, mengembangkan sistem dokumen yang dirancang khusus untuk interaksi dengan model AI. Namun PDF Association melalui Duff Johnson berpendapat masalahnya ada pada AI yang belum optimal memahami spesifikasi PDF.
Adobe telah menambahkan asisten AI di Acrobat untuk membantu merangkum dan mengekstrak informasi. Google juga menghadirkan dukungan konversi PDF dalam Gemini.
Dengan sekitar 2,5 triliun PDF beredar sejak standarisasi 2008, format ini masih dominan. Tantangannya kini bukan sekadar kompatibilitas perangkat, melainkan bagaimana PDF dan AI dapat berevolusi bersama di era otomasi digital.


