Skip to content

통합재정통계 2010.11/2011.10 — 본문 끝 빈 줄이 페이지 2로 밀려 PAGE_MISMATCH (1p → 2p) #676

@planet6897

Description

@planet6897

현황

samples/통합재정통계(2010.11월).hwp, samples/통합재정통계(2011.10월).hwp 두 문서가 한글2022 PDF 출력은 1페이지지만 rhwp는 2페이지로 분할.

문서 rhwp 한글2022 PDF
통합재정통계(2010.11월).hwp 2p 1p
통합재정통계(2011.10월).hwp 2p 1p
통합재정통계(2014.8월).hwp 1p 1p (참고: 일치)

1차 조사 (2010.11월)

`rhwp dump-pages` 결과:

페이지 1 (body_area h=933.5px, used=751.0px, hwp_used≈745.1px, 여유 ≈188px)

  • Table pi=0 (1×1, TopAndBottom wrap, tac=true)
  • FullParagraph pi=1~13 (본문 + 빈 줄 다수)
  • 마지막 항목 끝 vpos≈55883 HU

페이지 2 (단 1개 항목)

  • FullParagraph pi=14 — "(빈)" 빈 줄 1개, h=16.0px, vpos=56603 HU
  • pi=13 → pi=14 gap = 720 HU (9.6px)

페이지 1에 충분한 공간이 있음에도 빈 줄 1개가 페이지 2로 분리됨.

가설

  • 페이지 분할 로직이 본문 끝의 trailing empty paragraph를 다음 페이지로 강제 push.
  • 한글2022는 trailing whitespace를 페이지 끝에 흡수하거나 다음 페이지가 비어있을 경우 표시하지 않을 가능성.

검증 필요 항목

  • 한글 2010/2020 환경 검증 (PDF는 보조 ref. 메모리: PDF 비교 결과는 절대 기준이 아님).
  • 페이지 분할 로직 본질 정정 시 회귀 위험 큼 (메모리: respect_vpos_reset 등 layout 본질 정정 회귀 위험).
  • 광범위 샘플 회귀 검증 필수.

관련

  • 마일스톤: v1.0.0

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions