标题: [文本处理] [分享]批处理版CHM to TXT格式转换工具 [打印本页]
作者: dailisishen 时间: 2009-11-9 15:57 标题: [分享]批处理版CHM to TXT格式转换工具
上次的大牛说了,单纯的批是不能够解决htm to txt的,参阅了一下Google,有sed与HtoX32c.exe可形成htm2txt,当然,我也测试了asp,以及php文件,以上两种文件均不能完全的清理掉脚本本身的代码,只能适用于HTM与HTML文件。
昨晚架设完IIS7.5之后,浏览了一下以前的批处理,从垃圾堆了翻出这个加以修改了一下,发觉把以前做的班级主页静态页面改掉了,特下次决心重做了一个Prefect版本的,以下把代码贴出来,附随有HtoX32c.exe文件下载。。。
赶工写出来的,大家试着用用看吧。。。-
- @echo off
- mode con cols=50 lines=10
- color a
- title CHM to TXT BY:小死神 %date%
- echo 文件反编译中,请稍后。。。
- dir /b /a-d *.chm 2>nul
- if errorlevel 1 echo 请选择正确路径&pause&exit
- for /f "delims=." %%i in ('dir /b /a-d *.chm 2^>nul') do (
- hh.exe -decompile %%i文件 %%i.chm
- cd %%i文件
- copy ..\HtoX32c.exe HtoX32c.exe
-
- for /f "delims=. tokens=1,*" %%a in ('dir /b /s /a-d *.htm 2^>nul') do (
- if "%%b"=="htm" (
- HtoX32c.exe /ip "%%a.htm" > "%%a.txt"
- )
- if "%%b"=="html" (
- HtoX32c.exe /ip "%%a.html" > "%%a.txt"
- )
- del "%%a.%%b" /q /f >nul 2>nul
- )
- del *.hhc /q /f /s>nul 2>nul
- del *.hhk /q /f /s>nul 2>nul
- del HtoX32c.exe /f /q >nul 2>nul
- del *.gif /s /f /q >nul 2>nul
- cd ..
- )
- cls
- dir /b /a-d *.chm 2>nul
- echo 文件编译完成,感谢使用!
- pause>nul 2>nul
复制代码
在这里谢谢那位不知名的水牛,还有汉化HtoX32c.exe文件的大大
作者: dailisishen 时间: 2009-11-9 16:00
hhc,hhk,hhp文件我只删除了索引与目录文件,至于怎么提取目录里的信息重命名文件等以后再说吧,我这个真的是一点思路都没有的啊。。。
作者: dailisishen 时间: 2009-11-9 20:09
大家注意一下啊,对于htm2txt的文件,只有在当前目录下才能有效,否则提示找不到文件或者不属于批代码。。。
[ 本帖最后由 dailisishen 于 2009-11-11 11:52 编辑 ]
作者: icerice 时间: 2010-2-26 08:58
好东西啊············
作者: icerice 时间: 2010-2-26 09:01
这么好的东西,终于给我找到了。。。。
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |