Tiga dekade setelah diperkenalkan oleh Adobe, Portable Document Format (PDF) tetap menjadi standar pertukaran dokumen digital. Format ini dirancang untuk memastikan tampilan halaman konsisten di berbagai perangkat. Namun, di era kecerdasan buatan (AI), karakteristik tersebut justru menjadi tantangan. PDF dibangun berbasis koordinat grafis, bukan struktur teks linear seperti halaman web. Setiap huruf ditempatkan secara presisi di halaman, sehingga model bahasa besar (LLM) kerap kesulitan memahami urutan teks, hierarki, atau konteks. Dokumen dengan banyak kolom, tabel, dan catatan kaki berisiko diproses keliru, memicu ringkasan tidak akurat atau “halusinasi” konten. Tantangan serupa juga dihadapi perangkat lunak aksesibilitas dan alat ekstraksi data. Di sisi keamanan, Check Point melaporkan sekitar 20 persen serangan berbasis email memanfaatkan PDF berbahaya, memanfaatkan kemampuannya menyematkan skrip dan tautan. Popularitas format ini menjadikannya medium pertukaran universal seka...

