저는 오랜 기간에 걸쳐 연구 자료를 정리하고 보고서를 한글로 옮기는 일을 해 왔습니다. 처음에는 PDF를 그대로 한글로 옮기려다 글자가 깨지는 현상을 자주 겪었고, 이로 인해 작업이 크게 늦어지곤 했습니다. 그때의 경험은 문제의 원인이 단순한 인코딩 문제뿐만 아니라 글꼴 포함 여부나 PDF가 텍스트가 아닌 이미지로 이루어져 있는지에 따라 달라진다는 것을 깨닫게 해주었습니다. 이 글은 그런 경험을 바탕으로, 비슷한 상황에 놓인 분들이 차근차근 해결할 수 있도록 실제로 시도해 본 방법들을 정리한 것입니다. PDF 한글 변환 깨짐 해결방법 입니다.
문제 원인 파악 (사전 확인)
가장 먼저 파일의 상태를 확인하는 것이 중요합니다. 아래의 두 가지로 나눠 생각해 보세요.
- 텍스트 선택이 가능하다면 텍스트 기반 PDF입니다. 이 경우 인코딩이나 폰트 문제일 가능성이 큽니다.
- 텍스트 선택이 불가능하다면 이미지 기반 PDF입니다. 이럴 때는 OCR이 반드시 필요합니다.
해결 방법
텍스트 기반 PDF일 경우 (텍스트 선택 가능)
대부분은 인코딩 문제나 폰트 호환 문제로 발생합니다. 아래 방법들을 순서대로 시도해 보세요.
- 다양한 변환 도구를 시도합니다. 가장 중요한 단계이므로, 여러 도구를 비교해 보는 것이 좋습니다.
-
- 한컴오피스 자체 기능 활용: 한글로 변환하는 것이 목표라면 한글과컴퓨터의 기능을 우선 사용합니다.
한컴오피스 공식 페이지에서 PDF 열기와 변환 기능을 확인해 보세요. - 방법 2: PDF를 한글 문서로 변환하기 기능 활용
- 한컴오피스 자체 기능 활용: 한글로 변환하는 것이 목표라면 한글과컴퓨터의 기능을 우선 사용합니다.
한컴오피스 기능 안내를 참고하면 도움이 됩니다.
-
- Adobe Acrobat Pro DC를 활용하는 방법도 있습니다. 이 유료 프로그램은 PDF를 Word로 변환한 뒤 한글에서 열어 저장하는 경로가 안정적일 때가 많습니다.
Adobe Acrobat Pro DC의 변환 도구를 활용해 보세요. - 온라인 PDF 변환 사이트를 이용하는 방법도 있습니다. 여러 엔진을 시도하면 한 곳에서 실패해도 다른 곳에서 성공할 수 있습니다.
Smallpdf, Ilovepdf, Sejda 등의 서비스를 참고해 보세요. - 네이버 오피스의 온라인 뷰어를 이용해 PDF를 HWP로 변환하는 방법도 있습니다. 특히 네이버 오피스의 기능이 간단한 경우가 여기에 해당합니다.
네이버 오피스를 확인해 보세요. - Google 문서도구를 활용하는 방법도 있습니다. Google 드라이브에 PDF를 업로드한 뒤, 해당 파일을 Google 문서로 열면 OCR 기능이 작동하여 텍스트를 추출하고, 일정 부분 한글로 복사/붙여넣기 또는 Word로 변환하는 방식이 가능합니다.
Google 문서도구를 이용해 보세요. - 중간 단계 변환도 유용합니다. PDF를 먼저 Word로 변환한 뒤 한글에서 열어 HWP로 저장하는 방식이 안정적인 경우가 많습니다.
Adobe 계열 도구를 활용하면 변환 품질이 better해질 수 있습니다. - 또 다른 방법으로는 PDF를 텍스트 파일로 저장한 뒤(HWP 변환 전 텍스트만 필요할 때), 텍스트를 메모장에 붙여넣고 다시 한글로 옮겨오는 방법도 있습니다. 이 경우 서식은 대부분 손실되므로 주의가 필요합니다.
이미지 기반 PDF일 경우 (OCR 필요)
이미지 기반의 경우에는 OCR 기능이 반드시 필요합니다. 아래의 방법으로 시도해 보세요.
- OCR 전문 프로그램을 사용하는 방법
- Adobe Acrobat Pro DC의 텍스트 인식 기능을 활용합니다. 한글 인식률이 비교적 좋은 편입니다.
Adobe Acrobat Pro DC의 도구를 이용해 보세요. - ABBYY FineReader와 같은 전문 OCR 소프트웨어도 우수한 인식률을 제공합니다.
ABBYY FineReader를 고려해 보세요. - N Nitro Pro 등의 도구도 OCR 기능이 포함되어 있습니다. 필요 시 확인해 보시길 권합니다.
Nitro Pro를 참고해 보세요.
- Adobe Acrobat Pro DC의 텍스트 인식 기능을 활용합니다. 한글 인식률이 비교적 좋은 편입니다.
- 온라인 OCR 서비스 이용: 이미지 기반의 PDF도 업로드 후 OCR 처리를 시도할 수 있습니다.
OnlineOCR, Free Online OCR 등을 활용해 보세요. - 모바일 OCR 앱도 유용합니다. 네이버 스마트렌즈나 구글 렌즈를 통해 촬영한 문서를 텍스트로 추출하고 PC로 옮겨 편집하는 방식이 있습니다.
Google Lens를 활용해 보세요.
깨짐 방지를 위한 팁 (PDF를 직접 생성하는 경우)
참고로, 나중에 변환할 것을 염두에 두고 PDF를 만들 때 아래 사항을 신경 쓰면 글자 깨짐을 크게 줄일 수 있습니다.
- 글꼴 포함(Embed Fonts): 작성 시 사용한 글꼴이 PDF 파일 안에 포함되도록 설정합니다. 인쇄 시나 저장 시 고급 설정에서 확인이 가능합니다.
PDF 글꼴 포함에 관한 가이드를 참고해 보세요. - 표준 글꼴 사용: 나눔고딕, 맑은 고딕, 돋움체 등 한국어 환경에서 널리 지원되는 글꼴을 우선 사용합니다.
- PDF/A 표준으로 저장: 장기 보존을 염두에 두고 PDF/A 표준으로 저장하면 글꼴 및 이미지 정보가 안정적으로 포함됩니다.
PDF/A 표준를 참고해 보세요.
가장 권장하는 방법
- PDF가 텍스트 기반인지 먼저 확인합니다. 선택 가능 여부로 판단합니다.
- 가능하다면 한컴오피스의 내장 변환 기능을 먼저 시도합니다.
한컴오피스의 PDF 열기/변환 기능을 활용해 보세요. - 안 되면, Adobe Acrobat Pro DC나 Google 문서도구를 이용해 Word로 변환한 뒤 한글에서 열어 HWP로 저장하는 경로를 시도합니다.
Adobe Acrobat Pro DC 또는 Google 문서도구를 활용해 보세요. - 이미지 기반이라면 전문 OCR 프로그램을 우선 사용합니다.
ABBYY FineReader와 같은 도구가 효과적일 수 있습니다.