Skip to content

외부 입력(PDF/이미지/MD/DOCX) → HWPX 시험문제 변환 파이프라인 사전 검증 spike #654

@metahan88-droid

Description

@metahan88-droid

배경

외부 입력(PDF/이미지/MD/DOCX) → HWPX 시험문제 변환 파이프라인의 사전 검증 단계.
Vision/OCR은 Claude Code Skill이 담당하고, rhwp 본체는 IR 빌드 + HWPX 출력에 집중하는 아키텍처.

전체 계획서: ~/.claude/plans/pdf-md-docx-optimized-neumann.md (작업지시자 승인 완료, 2026-05-07)

목표

2개 spike 모두 통과해야 본 작업 4개 이슈(JSON 스키마 / layout 빌더 / Skill / e2e)로 진입한다.

  • Spike A: HWPX writer [최우선] HWPX Serializer 완성 — 표/이미지/스타일/글꼴 직렬화 #182 회귀 확인 — 빈 문서 + Picture 1장(테스트 PNG) + 한 문단을 IR로 구성하여 serialize_hwpx로 출력 → 한컴오피스 2024에서 정상 표시되는지 확인. <hh:fontface type="EMBED"> 폰트 임베딩 처리 여부 1시간 spike
  • Spike B: 선택지 ①②③④⑤ 표시 정책 — ParaShape numbering_id 자동 vs 텍스트에 직접 포함 두 방식 한컴오피스 호환성 확인

Vision/OCR 정확도는 Claude Code Skill이 담당하므로 PaddleOCR/Anthropic API spike은 수행하지 않는다. Skill 품질은 본 작업 이슈 5(e2e)에서 시험지 4종 변환 결과로 회귀 검증.

인도물

  • mydocs/plans/task_m100_{이슈번호}.md — 수행계획서
  • mydocs/plans/task_m100_{이슈번호}_impl.md — 구현계획서
  • mydocs/working/task_m100_{이슈번호}_stage{N}.md — 단계별 보고서
  • mydocs/tech/m100_neumann_spike.md — 2개 spike 결과 + GO/NO-GO 권고
  • mydocs/report/task_m100_{이슈번호}_report.md — 최종 보고서
  • 검증 시료: output/spike_picture_only.hwpx (Spike A), output/spike_numbering.hwpx (Spike B)

통과 기준

관련

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions