Skip to content

Task #664: ingest 스키마 진화 — passage_groups, boxed, page footer #667

@metahan88-droid

Description

@metahan88-droid

배경

#660 본 작업 1 + v2 + e2e 검증에서 명백히 노출된 schema 한계를 후속 이슈로 정리한다.

범위

C-1. 공유 지문 그룹 (passage_groups)

수능/모의고사는 `[1~3] 다음 글을 읽고 물음에 답하시오.` 형식으로 여러 문제가 한 지문을 공유한다. 현재 schema는 question별 stem만 가정 — 본문이 첫 문제에 종속되어 의미적으로 어색함.

권고:
```jsonc
{
"passages": [
{"id": "p1-3", "blocks": [...]}
],
"questions": [
{"number": 1, "passage_ref": "p1-3", "stem": "...", ...},
{"number": 2, "passage_ref": "p1-3", "stem": "...", ...},
{"number": 3, "passage_ref": "p1-3", "stem": "...", ...}
]
}
```

C-2. <보기> 박스 (boxed 블록 타입)

문제 3번 등은 본문 외 `<보기>` 라는 별도 박스(테두리 + 배경) 안에 보조 자료를 둔다. 현재 `stem_blocks`의 `text` / `image` 두 종류로 표현 불가.

권고: schema에 `boxed` 블록 타입 추가, 본격 처리는 Table/Frame IR 빌드와 함께 후속 마일스톤.

C-3. 페이지 footer

시험지는 `1/20`, `홀수형`, `국어 영역` 등 반복 표시. `header_text` / `footer_text` / `form_label` 필드로 정형화.

Codex 권고 (마무리 협의)

#665(placement IR + ParaShape + Picture/BinData) 완료 후 진행 권고. IR 경계가 확정된 뒤 schema 추가가 깔끔.

의존성

참조

  • e2e 보고서: `mydocs/working/task_m100_660_e2e.md` (C 섹션)
  • 본 세션 발견 위치: 페이지 1 `[1~3] 다음 글…`, 페이지 2 문제 3번 `<보기>`, 모든 페이지 `1/20` footer

DoD

  • schema `v1`에 `passages` 배열 + `Question.passage_ref` 추가 (또는 `v2`로 버전 업)
  • `boxed` StemBlock 타입 추가
  • header/footer 메타 필드 추가
  • 빌더에서 IR 매핑 + 회귀 테스트
  • Skill SKILL.md 사용 가이드 갱신

Metadata

Metadata

Labels

No labels
No labels

Projects

No projects

Relationships

None yet

Development

No branches or pull requests

Issue actions