- 帖子
- 418
- 积分
- 811
- 技术
- 2
- 捐助
- 0
- 注册时间
- 2008-11-24
|
【取消】大藏经之三--xhtml修改和打包
本帖最后由 lxh623 于 2020-7-21 17:58 编辑
前面修改完了xhtml等等文件。还需要继续修改。
1——40元、以前求了一个xml提取。我把数据写入文本a(UTF-8),比如,[企-止+(口/土)],每一行搜索所有epub的子文件夹下的xhtml和html,只要有,就把构型串写入文本b,并搜索下一个构型串。(UTF-8)
上次得到3万多,担心有多余,所以,提前解包,再来检查。
2、我私下需要很多时间来制作替换规则。
3——30元、文本替换。就用简单替换。“难字.txt”(UTF-8)写入规则,难字构型串+制表符+替换后代码。
4——50元、图像替换。与epub平级的文件夹下有gaiji-CB文件夹。假设规则是[企-止+(口/土)]+制表符+CB03000。首先,要用“[企-止+(口/土)]”搜索xhtml文件,如果有,再从“gaiji-CB文件夹下”搜索CB03000,复制到该epub的Images文件夹。代码还没有想好,主要是要与同行文字一般大小和高度。替换也可以在复制图像之前。
5——30元、打包。
这个是最后的任务,我只是初步设想。效果也暂时不好验证。
谢谢! |
|