PDF 분석기 무료 온라인 – 문서 구조 및 속성 상세 | DonePDF

PDF 분석

PDF 파일 업로드

PDF 파일을 여기에 드래그 앤 드롭하거나 클릭하여 찾아보기

선택된 파일 없음

페이지

0 KB

페이지

0

전체 페이지 수

단어 수

0

총 단어 수

문자 수

0

총 문자 수

파일 크기

0 KB

PDF 파일 크기

읽는 시간

0 min

예상 읽기 시간

감정 분석

중립

부정적

긍정적

문서 내용

완전한 메타데이터 추출

속성	값

문서 검색

대소문자 구분 전체 단어만

텍스트 통계

추출된 이미지

핵심 구문 및 주제

PDF 분석: 메타데이터, 텍스트, 구조 및 보안 인사이트 추출

모든 PDF 파일 내부에 숨겨진 모든 것을 발견하세요. 당사의 PDF 분석 도구는 문서 메타데이터, 임베디드 글꼴, 이미지, 주석, 양식 필드 및 보안 설정을 추출합니다. 전자책 검증, 법률 문서 검토, 악성 코드 탐지 및 규정 준수 감사에 완벽합니다 – 모두 서버에 업로드하지 않고 수행됩니다.

완전한 메타데이터 추출

모든 표준 및 사용자 정의 메타데이터 필드(작성자, 생성 날짜, 수정 날짜, PDF 제작자, 소프트웨어 버전 및 사용자 정의 키(예: 문서 ID, 저작권, 분류))를 봅니다. PDF가 생성된 시기와 방법을 식별합니다.

작성자, 제목, 주제, 키워드
생성 및 수정 타임스탬프(시간대 포함)
사용자 정의 XMP 메타데이터 및 숨겨진 속성

텍스트 및 콘텐츠 분석

위치 정보와 함께 PDF에서 모든 텍스트를 추출합니다. 단어 수, 문자 수, 글꼴 사용량 및 읽기 난이도를 분석합니다. 텍스트 레이어(검색 가능 vs 스캔됨)를 감지합니다. 숨겨진 텍스트나 보이지 않는 텍스트를 식별합니다.

페이지별 분석과 함께 전체 텍스트 추출
OCR 품질 및 텍스트 레이어 존재 감지
보이지 않는 텍스트 또는 흰색 위 흰색 숨겨진 텍스트 강조 표시

추출된 이미지

PDF 내의 모든 이미지를 나열합니다: 형식(JPEG, PNG, CCITT), 해상도, 색상 공간, 압축 수준 및 크기. 임베디드 비디오, 3D 객체, JavaScript 또는 첨부 파일 감지 – 보안 감사에 중요합니다.

이미지 수, 차원, DPI, 압축 유형
의심스러운 임베디드 파일 또는 스크립트 식별
이미지 인라인 추출 및 미리보기

글꼴 및 타이포그래피 심층 분석

문서에 사용된 모든 글꼴(임베디드, 하위 집합 및 시스템 글꼴 포함)을 찾아보세요. 누락된 글꼴, 글꼴 유형(TrueType, Type1, OpenType) 및 실제 텍스트-글꼴 매핑을 확인하세요.

글꼴 이름, 유형 및 임베딩 상태 목록
글꼴 대체 위험 감지(인쇄 신뢰성용)
글꼴이 완전히 임베디드되었는지 확인(보관에 좋음)

문서 구조 및 탐색

북마크(개요 트리), 페이지 레이블, 논리적 페이지 순서, 문서 스레드 및 내부/외부 링크를 분석합니다. 문서가 구성된 방식을 이해 – 전자책 검증에 필수적입니다.

북마크 계층 구조 및 대상 페이지 번호
깨진 내부 링크 감지
페이지 전환 효과 및 프레젠테이션 설정

보안 및 숨겨진 위험 감지

암호화, 암호 보호 및 권한 플래그(인쇄, 복사, 편집)를 확인하세요. 잠재적으로 악의적인 요소(JavaScript, 실행 작업, 임베디드 파일, 외부 데이터를 제출하는 양식)를 감지합니다 – 제로 트러스트 문서 워크플로에 중요합니다.

암호화 수준(AES-128/256) 및 암호 존재 여부
의심스러운 작업 플래그 지정(URI, JavaScript, SubmitForm)
PDF/A 준수 및 디지털 서명 식별

양식 필드 및 주석 분석

모든 대화형 양식 필드(텍스트 입력, 확인란, 라디오 버튼, 드롭다운, 서명 필드)를 추출합니다. 필드 이름, 기본값, 유효성 검사 스크립트 및 계산 순서를 확인합니다.

페이지별 모든 양식 필드 계산 및 나열
숨겨진 필드 또는 미리 채워진 데이터 감지
주석 유형 분석(스티커 메모, 하이라이트, 스탬프)

페이지 치수 및 품질 측정항목

페이지별 상세 통계(페이지 크기(예: A4, Letter), 방향, 회전, 콘텐츠 복잡성, 개체 수, 압축 효율성, 페이지별 예상 파일 크기)를 확인하세요.

포인트, mm, 인치 단위의 페이지 치수
비정상적으로 큰 페이지 식별(성능 문제)
하나의 문서에서 혼합 페이지 크기 감지

문서 비교(버전 차이)

PDF의 두 버전을 업로드하고 추가/삭제된 텍스트, 이동된 이미지, 변경된 메타데이터 또는 변경된 주석과 같은 차이점을 즉시 시각화합니다. 계약 검토 및 개정 추적에 이상적입니다.

텍스트 수준 차이 강조 표시(추가/제거/수정)
메타데이터 및 구조 비교
비교 보고서를 JSON 또는 HTML로 내보내기

PDF 분석 모범 사례

신뢰할 수 없는 출처의 PDF는 항상 열기 전에 분석하세요. 메타데이터를 사용하여 문서 진위성을 확인하세요. 전자책의 경우 텍스트 레이어 품질과 글꼴 임베딩을 확인하세요. 법률 문서의 경우 보안 감사를 실행하여 숨겨진 편집 내용을 감지하세요.

의심스러운 PDF에서 JavaScript 및 실행 작업 검사
장기 보관을 위한 PDF/A 준수 검증
변조 탐지를 위해 서명된 버전과 서명되지 않은 버전 비교
모든 민감한 데이터를 찾기 위해 삭제 전 분석 사용

PDF 분석 › 문서 보안 및 전자책 검증을 위한 실용적인 사용 사례

PDF 분석은 단순히 속성을 보는 것이 아닙니다 – 보안, 규정 준수 및 품질 보증 도구입니다. 전자책에 숨겨진 악성 코드 탐지부터 법률 문서 확인까지, 전문가들이 당사 분석기를 사용하여 작업 흐름을 보호하는 방법을 알아보세요.

전자책 품질 및 접근성 검증

전자책을 게시하기 전에 텍스트 레이어를 분석하여 모든 콘텐츠를 검색할 수 있는지 확인하세요. 글꼴이 제대로 임베디드되었는지(리더에서 대체 방지), 책갈피가 장 제목과 일치하는지, 이미지 해상도가 인쇄 가능한지 확인하세요.

OCR 변환에서 숨겨진 텍스트 아티팩트를 식별하고, 읽기 복잡성을 측정하고, 누락된 메타데이터(제목, 저자, ISBN)를 감지합니다. 깔끔한 분석 보고서는 디지털 제품이 전문 표준을 충족한다는 확신을 줍니다.

전자책이 텍스트 검색 가능하고 스크린 리더 친화적인지 확인
배포 전 누락되거나 손상된 글꼴 감지
모든 이미지가 DPI 요구 사항을 충족하는지 확인
추출된 메타데이터로 상점 목록 개선

법률 문서 확인 및 규정 준수 감사

법률 회사 및 규정 준수 담당자는 수신된 PDF의 무결성을 확인해야 합니다. 메타데이터를 분석하여 생성 날짜를 확인하고, 숨겨진 주석이나 편집 실패를 찾고, 변조를 나타낼 수 있는 임베디드 JavaScript 또는 외부 작업을 식별합니다.

비교 도구를 사용하여 계약 버전 간의 변경 사항을 확인합니다. 디지털 서명 유효성 및 인증서 세부 정보를 확인합니다. 문서의 의미를 변경할 수 있는 숨겨진 레이어나 보이지 않는 텍스트가 없는지 확인합니다.

예상 값과 작성자 및 생성 타임스탬프 확인
편집 실패 감지(텍스트는 여전히 존재하지만 숨겨짐)
정확한 변경 사항을 보기 위해 두 초안 비교
Adobe에서 열기 전에 의심스러운 작업 플래그 지정

악성 PDF 및 피싱 공격으로부터 보호

PDF는 악성 코드, 피싱 링크 및 랜섬웨어의 일반적인 벡터입니다. 당사 분석기는 알려진 악성 패턴(JavaScript 익스플로잇, 외부 프로그램을 실행하는 실행 작업, 임베디드 실행 파일, 사기 사이트에 대한 숨겨진 하이퍼링크)을 검색합니다.

제로 트러스트 보안 정책은 알려진 발신자로부터의 PDF라도 모든 수신 PDF를 분석할 것을 권장합니다. 분석은 완전히 클라이언트 측에서 실행되므로(업로드 없음) 중요한 문서가 컴퓨터를 떠나지 않습니다. 열기 전에 위험 점수를 받으세요.

JavaScript, OpenAction 및 실행 작업 감지
임베디드 EXE, ZIP 또는 스크립트 첨부 파일 식별
주석 또는 양식에서 의심스러운 URL 플래그 지정
알려진 익스플로잇 패턴 기반 위험 점수

장기 보관 및 PDF/A 규정 준수 확인

박물관, 도서관 및 기업 아카이브는 장기 보존을 위해 PDF/A(ISO 19005)를 요구합니다. 당사 도구는 PDF가 PDF/A를 준수하는지(A-1, A-2, A-3 버전) 식별하고 준수를 위반하는 모든 기능(JavaScript, 오디오/멀티미디어, 누락된 글꼴 등)을 나열합니다.

또한 색상 공간 정보를 추출하고, 투명도 평탄화 문제를 확인하고, 모든 글꼴이 임베디드되었는지 확인할 수 있습니다 – 이는 100년 후에도 문서가 동일하게 표시되도록 보장합니다.

PDF/A 준수 수준 감지(해당하는 경우)
비준수 기능 나열(예: 양식, 주석)
임베디드 글꼴 및 장치 독립적 색상 확인
디지털화 프로젝트 및 법률 아카이브에 이상적

🔍 PDF 분석 – 기술 기능 및 확인 사항

당사 PDF 분석기는 보안 위험, 구조적 문제, 메타데이터 및 접근성 규정 준수에 대해 문서를 스캔합니다. 모든 PDF에서 검사하는 내용은 다음과 같습니다。

📑 메타데이터 추출

모든 문서 메타데이터를 추출합니다: 제목, 작성자, 주제, 키워드, 생성 날짜, 수정 날짜, PDF 제작자, PDF 버전, 페이지 수, 파일 크기 및 사용자 지정 속성. 이렇게 하면 문서의 출처, 이력 및 기본 특성을 한눈에 파악할 수 있습니다。

🛡️ 보안 및 악성코드 탐지

알려진 악성 패턴을 스캔합니다: JavaScript 코드, AutoLaunch 작업, 포함된 실행 파일, 의심스러운 URL, 난독화 코드 및 외부 파일 참조. 문서를 열기 전에 잠재적인 보안 위험을 식별합니다. 감지된 위협에 기반한 위험 점수를 제공합니다。

📄 구조 및 무결성 확인

PDF 구조를 검증합니다: 헤더 및 트레일러 무결성, 상호 참조 테이블 일관성, 객체 스트림 검증 및 문서 카탈로그를 확인합니다. 열리지 않거나 잘못 표시될 수 있는 손상되거나 훼손된 PDF를 감지합니다. 권장 수정 사항과 함께 구조적 문제를 식별합니다。

🔤 폰트 및 텍스트 레이어 분석

문서의 모든 폰트를 분석합니다: 폰트 이름, 유형(TrueType, Type1, OpenType), 임베딩 상태(완전 임베딩, 하위 집합 또는 임베딩되지 않음) 및 라이선스 권한. 누락된 폰트, 폰트 대체 위험 및 다양한 기기에서 렌더링에 영향을 미칠 수 있는 문제를 감지합니다。

🎨 색상 공간 및 이미지 해상도

사용된 색상 공간(RGB, CMYK, 그레이스케일), ICC 프로파일 일관성 및 이미지 해상도(DPI)를 검사합니다. 150 DPI 미만(웹 품질) 및 300 DPI 미만(인쇄 품질)의 이미지를 식별합니다. 인쇄 시 픽셀화되어 보일 수 있는 이미지를 감지합니다. 이미지 최적화를 위한 권장 사항을 제공합니다。

📋 문서 구조 및 태깅

문서 구조를 분석합니다: 논리적 태그의 존재, 제목 계층 구조(H1-H6), 목록, 표, 이미지 대체 텍스트 및 읽기 순서. PDF/UA(유니버설 접근성) 준수를 확인합니다. WCAG 2.1 및 Section 508 준수를 위한 접근성 문제를 보고합니다。

📎 링크, 북마크 및 주석

모든 하이퍼링크(내부 및 외부), 북마크(문서 개요), 주석, 댓글 및 양식 필드를 검사합니다. 링크 대상을 확인하고, 끊어진 링크를 확인하며, 대화형 요소에 대해 보고합니다. 피싱 사이트로 연결될 수 있는 의심스러운 URL을 식별합니다。

📊 파일 크기 및 최적화 분석

파일 크기 분석을 분석합니다: 텍스트 콘텐츠, 이미지, 폰트, 메타데이터 및 기타 객체. 최적화 기회를 식별합니다: 과도한 크기의 이미지(높은 DPI), 불필요한 중복 콘텐츠, 중복 메타데이터 및 압축 가능성. 예상 파일 크기 감소 권장 사항을 제공합니다。

PDF를 분석한 후 미리 보고 읽거나, 임베디드 이미지를 추출하거나, 콘텐츠를 텍스트로 변환하여 추가 처리할 수 있습니다. 공유하기 전에 파일 크기를 줄이거나 문서를 보호할 수도 있습니다.

PDF 분석 및 처리를 위한 관련 도구

추출, 최적화 및 변환을 위한 이러한 강력한 도구로 PDF 분석 후 작업 흐름을 향상하세요.

Frequently Asked Questions about PDF Analysis

PDF 분석은 실제로 무엇을 밝혀내나요?

PDF 분석은 보이는 정보와 숨겨진 정보를 모두 추출합니다: 메타데이터(작성자, 생성 날짜, 소프트웨어), 임베디드 글꼴 및 이미지, 텍스트 레이어(보이지 않는 텍스트 포함), 주석, 양식 필드, 책갈피, 링크, 보안 설정(암호화, 권한), JavaScript, 임베디드 파일 및 페이지 형상. 사용자가 보는 것뿐만 아니라 내부에 정확히 무엇이 있는지 알려줍니다.

내 PDF가 서버에 업로드되나요? 개인정보는 어떻게 되나요?

아니요. 당사의 PDF 분석기는 WebAssembly 및 로컬 JavaScript를 사용하여 브라우저 내에서 완전히 작동합니다. 귀하의 파일은 컴퓨터를 떠나지 않습니다 – 업로드 없음, 서버 처리 없음. 이는 기밀 문서나 변호사-의뢰인 특권 문서조차도 완전히 비공개이고 안전하게 만듭니다.

비밀번호로 보호된 PDF를 분석할 수 있나요?

예, 비밀번호가 있는 경우. 분석 중에 PDF 비밀번호를 입력할 수 있으며 도구는 메타데이터, 텍스트 및 구조를 추출하기 위해 콘텐츠를 로컬에서 해독합니다. 비밀번호가 없는 암호화된 파일의 경우 암호화 유형과 권한 플래그를 계속 확인할 수 있습니다(콘텐츠를 읽을 수 없음).

악성 코드 탐지 정확도는 얼마나 되나요?

당사 분석기는 PDF 사양에 기반한 알려진 악성 패턴(JavaScript, AutoLaunch, 임베디드 실행 파일, URL 리디렉션, 난독화 코드 등)을 식별합니다. 완전한 안티바이러스는 아니지만 1차 위험 평가 역할을 합니다. 제로데이 익스플로잇의 경우 전용 PDF 샌드박스와 결합하세요. 그러나 일반적인 공격 벡터의 95% 이상을 잡아냅니다.

스캔된(이미지 전용) PDF에서 텍스트를 추출할 수 있나요?

당사 분석 도구는 페이지에 텍스트 레이어(검색 가능)가 있는지 아니면 순수하게 이미지인지 나타냅니다. 이미지 전용 PDF의 경우 OCR 없이는 텍스트를 추출할 수 없습니다. 그러나 페이지 치수, 압축 유형 및 텍스트 추출을 사용할 수 없음을 알려드립니다. 변환을 위해 별도의 "OCR PDF" 도구를 사용하세요.

표준 메타데이터와 XMP의 차이점은 무엇인가요?

서명 후 PDF가 편집되었는지 감지할 수 있나요?

예. PDF에 디지털 서명이 있는 경우 당사 분석기는 서명 유효성, 인증서 세부 정보 및 서명 후 수정 사항이 있는지 표시합니다. 서명되지 않은 PDF의 경우 당사의 나란히 비교 기능을 사용하여 이전 버전과 비교할 수 있습니다. 또한 비정상적인 메타데이터 변경(예: 생성 날짜보다 이전 수정 날짜)에 플래그를 지정합니다.

PDF 분석이 파일에 어떤 방식으로든 영향을 미치나요?

아니요. 분석은 읽기 전용입니다. 콘텐츠를 수정, 평탄화, 제거 또는 변경하지 않습니다. 중요한 원본을 손상 위험 없이 안전하게 분석할 수 있습니다. 출력은 보고서이지 변경된 PDF가 아닙니다.

"보이지 않는 텍스트"란 무엇이며 어떻게 찾나요?

보이지 않는 텍스트는 PDF의 콘텐츠 스트림에 존재하지만 완전한 투명도(alpha=0), 흰색 배경의 흰색 또는 매우 작은 글꼴 크기로 렌더링되는 텍스트입니다. 악의적인 행위자는 검색 엔진이나 스크린 리더를 트리거하면서 시각적 검사에서 키워드를 숨기기 위해 이를 사용합니다. 당사 분석기는 불투명도가 0이거나 보이지 않게 만드는 렌더링 모드가 있는 모든 텍스트를 강조 표시합니다.

누락되었거나 포함되지 않은 글꼴을 볼 수 있나요?

물론입니다. 글꼴 분석 탭에는 모든 글꼴 참조가 나열됩니다. 각 글꼴에 대해 이름(예: "ArialMT"), 유형(TrueType/Type1), 전체 또는 하위 집합으로 임베디드되었는지 여부, 모든 PDF 리더가 가지고 있는 표준 기본 글꼴(Courier 등)을 사용하는지 여부를 볼 수 있습니다. 누락된 글꼴은 표시됩니다 – 대체되어 레이아웃이 깨질 수 있습니다.

분석을 위한 파일 크기 제한이 있나요?

모든 처리가 로컬이므로 제한은 장치 메모리에 따라 다릅니다. 대부분의 최신 컴퓨터에서는 최대 500MB, 5,000페이지의 PDF를 분석할 수 있습니다. 매우 큰 파일은 몇 초 정도 걸릴 수 있습니다. 진행률 표시줄을 제공합니다. 파일이 업로드되지 않으므로 서버 측 제한이 없습니다.

어떤 브라우저가 클라이언트 측 PDF 분석을 지원하나요?

Chrome, Firefox, Edge, Safari 및 Opera – WebAssembly를 지원하는 모든 최신 브라우저. Internet Explorer는 지원되지 않습니다. 큰 PDF에서 최상의 성능을 얻으려면 Chrome 또는 Edge를 사용하세요. 모바일 브라우저(iOS Safari, Android Chrome)도 작동하지만 메모리 제약으로 인해 매우 큰 파일에서는 어려움을 겪을 수 있습니다.

여러 PDF를 한 번에 분석할 수 있나요?

예. PDF 폴더를 드래그 앤 드롭하면 일괄 분석 모드에서 각 파일에 대한 요약 보고서를 생성합니다. 이를 사용하여 JavaScript, 누락된 글꼴 또는 특정 메타데이터가 포함된 PDF를 빠르게 찾을 수 있습니다. 일괄 결과는 감사 추적을 위해 CSV로 다운로드할 수 있습니다.

분석에서 "평탄화된 투명도"란 무엇을 의미하나요?

PDF가 투명 개체(그림자, 페이드 이미지)를 사용하는 경우 일부 소프트웨어는 이를 불투명한 모양으로 평탄화합니다. 이로 인해 시각적 아티팩트가 발생할 수 있습니다. 당사 분석기는 PDF에 활성 투명도 그룹이 포함되어 있는지 또는 평탄화되었는지 감지하여 전문 인쇄를 위해 투명도를 유지할지 여부를 결정하는 데 도움을 줍니다.

분석 보고서를 어떻게 내보내나요?

분석 후 JSON, HTML 또는 CSV 형식으로 상세 보고서를 내보낼 수 있습니다. 보고서에는 추출된 모든 데이터, 보안 경고 및 파일 메트릭이 포함됩니다. 이는 원본 PDF 콘텐츠를 노출하지 않고 문서화, 법적 증거 개시 또는 IT 보안 팀과의 공유에 유용합니다.

PDF 유틸리티에서 전체 도구 컬렉션을 살펴보세요.

PDF 保護

PDF 압축

PDF 분석기 온라인 – 기술 문서 검사 도구 Analyze PDF File

페이지

단어 수

문자 수

파일 크기

읽는 시간

감정 분석

문서 내용

완전한 메타데이터 추출

문서 검색

텍스트 통계

추출된 이미지

핵심 구문 및 주제

PDF 계속 탐색하기

PDF 분석: 메타데이터, 텍스트, 구조 및 보안 인사이트 추출

완전한 메타데이터 추출

텍스트 및 콘텐츠 분석

추출된 이미지

글꼴 및 타이포그래피 심층 분석

문서 구조 및 탐색

보안 및 숨겨진 위험 감지

양식 필드 및 주석 분석

페이지 치수 및 품질 측정항목

문서 비교(버전 차이)

PDF 분석 모범 사례

PDF 분석 › 문서 보안 및 전자책 검증을 위한 실용적인 사용 사례

전자책 품질 및 접근성 검증

법률 문서 확인 및 규정 준수 감사

악성 PDF 및 피싱 공격으로부터 보호

장기 보관 및 PDF/A 규정 준수 확인

🔍 PDF 분석 – 기술 기능 및 확인 사항

📑 메타데이터 추출

🛡️ 보안 및 악성코드 탐지

📄 구조 및 무결성 확인

🔤 폰트 및 텍스트 레이어 분석

🎨 색상 공간 및 이미지 해상도

📋 문서 구조 및 태깅

📎 링크, 북마크 및 주석

📊 파일 크기 및 최적화 분석

PDF 분석 및 처리를 위한 관련 도구

Frequently Asked Questions about PDF Analysis

PDF 분석은 실제로 무엇을 밝혀내나요?

내 PDF가 서버에 업로드되나요? 개인정보는 어떻게 되나요?

비밀번호로 보호된 PDF를 분석할 수 있나요?

악성 코드 탐지 정확도는 얼마나 되나요?

스캔된(이미지 전용) PDF에서 텍스트를 추출할 수 있나요?

표준 메타데이터와 XMP의 차이점은 무엇인가요?

서명 후 PDF가 편집되었는지 감지할 수 있나요?

PDF 분석이 파일에 어떤 방식으로든 영향을 미치나요?

"보이지 않는 텍스트"란 무엇이며 어떻게 찾나요?

누락되었거나 포함되지 않은 글꼴을 볼 수 있나요?

분석을 위한 파일 크기 제한이 있나요?

어떤 브라우저가 클라이언트 측 PDF 분석을 지원하나요?

여러 PDF를 한 번에 분석할 수 있나요?

분석에서 "평탄화된 투명도"란 무엇을 의미하나요?

분석 보고서를 어떻게 내보내나요?

이 주제의 더 많은 도구