【技術實現步驟摘要】
【技術保護點】
一種基于層次式索引的版式可回流文件的建立和繪制方法,其特征在于,具體包括如下步驟:基于層次式索引的版式可回流文件建立:1)通過掃描、成像設備或者軟件工具得到版式數字書籍頁面數據;2)對每張數字書籍頁面進行幾何版面分析,得到文字段落區域和非文字區域,為每個區域分配一個索引號;對于非文字區域,計算其包圍框,包圍框形狀可為長方形、圓、曲線、橢圓、三角形或者多邊形形狀,并記錄對象包圍框坐標或其所包圍區域;3)對每個文本段落區域,確定其所包含的行或列,記錄行對準線和列對準線,并為每一行或每一列分配一個索引號,此處索引號碼的分配按照事先約定的規則來分配;4)對于其中每行,計算行內可回流對象的包圍框,對每列,計算列內可回流對象的包圍框,并為文字短路區域中的每個可回流對象計算出一個包圍框,并記錄可回流對象包圍框坐標,并為每個可回流對象包圍框分配一個索引號,確保行內或列內每個可回流幾何區域有一個索引號碼;5)利用版面相關的領域知識,對單張或多張數字書籍頁面進行版面識別和理解,得到章,節,標題,子標題,摘要,作者版面邏輯區域信息;6)為每個邏輯區域分配索引號;其中每個邏輯區域包含一個或多個區域,通過記錄其 ...
【技術特征摘要】