Extragere completă a metadatelor
Vizualizați toate câmpurile de metadate standard și personalizate: autor, data creării, data modificării, producător PDF, versiunea software și chei personalizate (de exemplu, ID document, drepturi de autor, clasificare). Identificați când și cum a fost creat PDF-ul.
- Autor, titlu, subiect, cuvinte cheie
- Timestamp-uri de creare și modificare (inclusiv fusul orar)
- Metadate XMP personalizate și proprietăți ascunse
Analiza textului și conținutului
Extrageți tot textul din PDF cu informații de poziție. Analizați numărul de cuvinte, numărul de caractere, utilizarea fonturilor și dificultatea de citire. Detectați straturile de text (căutabil vs scanat). Identificați textul ascuns sau invizibil.
- Extragere text complet cu defalcare pagină cu pagină
- Detectați calitatea OCR și prezența stratului de text
- Evidențiați textul invizibil sau textul ascuns alb-pe-alb
Imagini extrase
Listați fiecare imagine din PDF: format (JPEG, PNG, CCITT), rezoluție, spațiu de culoare, nivel de compresie și dimensiune. Detectați videoclipuri încorporate, obiecte 3D, JavaScript sau atașamente – esențial pentru auditurile de securitate.
- Numărul de imagini, dimensiuni, DPI, tip de compresie
- Identificați fișierele sau scripturile încorporate suspecte
- Extrageți și previzualizați imaginile inline
Analiza aprofundată a fonturilor și tipografiei
Descoperiți toate fonturile utilizate în document – inclusiv fonturile încorporate, subseturile și fonturile de sistem. Verificați fonturile lipsă, tipul de font (TrueType, Type1, OpenType) și maparea reală text-la-font.
- Lista numelor fonturilor, tipurilor și stării de încorporare
- Detectați riscurile de substituire a fonturilor (pentru fiabilitatea imprimării)
- Verificați dacă fonturile sunt complet încorporate (bune pentru arhivare)
Structura documentului și navigarea
Analizați marcajele (arborele de contur), etichetele paginilor, ordinea logică a paginilor, firele articolelor și legăturile interne/externe. Înțelegeți cum este organizat documentul – esențial pentru validarea cărților electronice.
- Ierarhia marcajelor și numerele paginilor țintă
- Detectarea legăturilor interne întrerupte
- Efecte de tranziție a paginii și setări de prezentare
Detectarea securității și a riscurilor ascunse
Verificați criptarea, protecția prin parolă și indicatorii de permisiune (imprimare, copiere, editare). Detectați elemente potențial malițioase: JavaScript, acțiuni de lansare, fișiere încorporate sau formulare care trimit date externe – esențial pentru fluxurile de lucru cu documente zero-trust.
- Nivel de criptare (AES-128/256) și prezența parolei
- Semnalați acțiuni suspecte (URI, JavaScript, SubmitForm)
- Identificați conformitatea PDF/A și semnăturile digitale
Analiza câmpurilor de formular și adnotărilor
Extrageți toate câmpurile de formular interactive: intrări de text, casete de selectare, butoane radio, liste derulante și câmpuri de semnătură. Vedeți numele câmpurilor, valorile implicite, scripturile de validare și ordinea de calcul.
- Numărați și listați toate câmpurile de formular pe pagină
- Detectați câmpuri ascunse sau date pre-completate
- Analizați tipurile de adnotări (note lipicioase, evidențieri, ștampile)
Dimensiunile paginii și metrici de calitate
Obțineți statistici detaliate pe pagină: dimensiunea paginii (de exemplu, A4, Letter), orientare, rotație, complexitatea conținutului, numărul de obiecte, eficiența compresiei și dimensiunea estimată a fișierului pe pagină.
- Dimensiunile paginii în puncte, mm, inci
- Identificați paginile neobișnuit de mari (probleme de performanță)
- Detectați dimensiuni mixte de pagină într-un singur document
Compararea documentelor (Diferența de versiune)
Încărcați două versiuni ale unui PDF și vizualizați instantaneu diferențele: text adăugat/șters, imagini mutate, metadate modificate sau adnotări modificate. Ideal pentru revizuirea contractelor și urmărirea reviziilor.
- Evidențierea diferențelor la nivel de text (adăugare/eliminare/modificare)
- Compararea metadatelor și structurii
- Exportați raportul de comparație ca JSON sau HTML
Cele mai bune practici pentru analiza PDF
Analizați întotdeauna PDF-urile din surse nesigure înainte de a le deschide. Utilizați metadatele pentru a verifica autenticitatea documentului. Pentru cărțile electronice, verificați calitatea stratului de text și încorporarea fonturilor. Pentru documentele legale, efectuați audituri de securitate pentru a detecta modificările ascunse.
- Scanați PDF-urile suspecte pentru JavaScript și acțiuni de lansare
- Validați conformitatea PDF/A pentru arhivarea pe termen lung
- Comparați versiunile semnate vs nesemnate pentru a detecta manipularea
- Utilizați analiza înainte de redactare pentru a localiza toate datele sensibile