开始
段内文档(Document)
是否还有未处理
的文档?
取出一篇文档
当前文档是否比
上一篇文档小?
结束
生成映射newToOld
生成映射oldToNew
是
否
是
否