배경
외부 입력(PDF/이미지/MD/DOCX) → HWPX 시험문제 변환 파이프라인의 사전 검증 단계.
Vision/OCR은 Claude Code Skill이 담당하고, rhwp 본체는 IR 빌드 + HWPX 출력에 집중하는 아키텍처.
전체 계획서: ~/.claude/plans/pdf-md-docx-optimized-neumann.md (작업지시자 승인 완료, 2026-05-07)
목표
2개 spike 모두 통과해야 본 작업 4개 이슈(JSON 스키마 / layout 빌더 / Skill / e2e)로 진입한다.
Vision/OCR 정확도는 Claude Code Skill이 담당하므로 PaddleOCR/Anthropic API spike은 수행하지 않는다. Skill 품질은 본 작업 이슈 5(e2e)에서 시험지 4종 변환 결과로 회귀 검증.
인도물
mydocs/plans/task_m100_{이슈번호}.md — 수행계획서
mydocs/plans/task_m100_{이슈번호}_impl.md — 구현계획서
mydocs/working/task_m100_{이슈번호}_stage{N}.md — 단계별 보고서
mydocs/tech/m100_neumann_spike.md — 2개 spike 결과 + GO/NO-GO 권고
mydocs/report/task_m100_{이슈번호}_report.md — 최종 보고서
- 검증 시료:
output/spike_picture_only.hwpx (Spike A), output/spike_numbering.hwpx (Spike B)
통과 기준
관련
배경
외부 입력(PDF/이미지/MD/DOCX) → HWPX 시험문제 변환 파이프라인의 사전 검증 단계.
Vision/OCR은 Claude Code Skill이 담당하고, rhwp 본체는 IR 빌드 + HWPX 출력에 집중하는 아키텍처.
전체 계획서:
~/.claude/plans/pdf-md-docx-optimized-neumann.md(작업지시자 승인 완료, 2026-05-07)목표
2개 spike 모두 통과해야 본 작업 4개 이슈(JSON 스키마 / layout 빌더 / Skill / e2e)로 진입한다.
serialize_hwpx로 출력 → 한컴오피스 2024에서 정상 표시되는지 확인.<hh:fontface type="EMBED">폰트 임베딩 처리 여부 1시간 spikenumbering_id자동 vs 텍스트에①직접 포함 두 방식 한컴오피스 호환성 확인인도물
mydocs/plans/task_m100_{이슈번호}.md— 수행계획서mydocs/plans/task_m100_{이슈번호}_impl.md— 구현계획서mydocs/working/task_m100_{이슈번호}_stage{N}.md— 단계별 보고서mydocs/tech/m100_neumann_spike.md— 2개 spike 결과 + GO/NO-GO 권고mydocs/report/task_m100_{이슈번호}_report.md— 최종 보고서output/spike_picture_only.hwpx(Spike A),output/spike_numbering.hwpx(Spike B)통과 기준
관련