标题: [文件操作] Word、Excel文件转文本文件:doctotext_0.12.0 [打印本页]
作者: Batcher 时间: 2011-1-28 15:38 标题: Word、Excel文件转文本文件:doctotext_0.12.0
MS Word format (DOC、DOCX), MS Excel format (XLS、XLSX), Rich Text Format (RTF), OpenDocument (ODF) and Office Open XML (OOXML, OpenXML or MSOOXML) documents to plain text converter. Can convert corrupted documents even if other recovery methods failed.复制代码
发布日期:2010-08-04
下载地址:http://sourceforge.net/projects/doctotext/
作者: yhcbird 时间: 2011-1-28 15:56
楼主这个转word的txt文本好象是unecode的。。。
作者: Batcher 时间: 2011-1-28 16:03 标题: 回复 2楼 的帖子
我测试的结果是UTF-8
Vista SP2 + Office 2007
作者: yhcbird 时间: 2011-1-29 13:14
可能有些版本不同。。上次我转了一个是GB2312的。。。
作者: QIAOXINGXING 时间: 2011-11-3 21:37
下载下来是一个压缩包,里面没有 .exe文件,运行doctotext.cpp出错了。应该怎么用?
作者: garyng 时间: 2011-11-4 18:13
也需要自行COMPILE~
作者: fanfande 时间: 2011-11-17 22:43
我也没成功我用的wps
作者: forfiles 时间: 2012-10-20 15:10
回复 7# fanfande
看顶楼的介绍没有提到支持WPS
作者: ozzw11411o 时间: 2012-11-7 18:52
回复 5# QIAOXINGXING
先编译,链接生成 .exe文件
作者: QIAOXINGXING 时间: 2012-11-7 22:22
回复 9# ozzw11411o
多谢了!!!!!
作者: tmplinshi 时间: 2012-11-8 08:49
中文文件名需要转换成 UTF-8 字符才能转换。
如果需要转换中文文件名(及批量转换),将附件中的文件(doctotext_.bat 和 win_iconv.exe)解压到 doctotext.exe 所在目录,之后的操作如下:复制代码
复制代码
结果将输出到 原文件名.txt 中。
doctotext_.bat:- @echo off
- setlocal
- set n=0
- set skip=
-
- dir /b %* | win_iconv -f gbk -t utf-8 >"%~f0.tmp"
-
- for /f "delims=" %%a in (' dir /b %* ') do (
- call :doctotext "%%a"
- )
- exit /b
-
- :doctotext
- if %n% neq 0 (
- set skip=skip=%n%
- )
-
- for /f "usebackq %skip% eol=< delims=" %%a in ("%~f0.tmp") do (
- echo convert %1...
- doctotext "%%a" >"%~1.txt"
- set /a n += 1
- goto :eof
- )
复制代码
作者: gdgzwqz 时间: 2014-7-30 19:16
中文文件名需要转换成 UTF-8 字符才能转换。
如果需要转换中文文件名(及批量转换),将附件中的文件(d ...
tmplinshi 发表于 2012-11-8 08:49
正在找转码的东东,看到了这个,谢谢!!!
作者: wyx567 时间: 2014-9-1 11:53
怎么样用DocToText批量转换多个文件夹内(包括子目录)的DOC为TXT呢,都是中文文档
作者: hnldwhm52 时间: 2014-9-13 21:34
xiexiexiexie!!
作者: cxq00 时间: 2024-1-5 15:10
这个怎么用
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |