Board logo

标题: [文件操作] Word、Excel文件转文本文件:doctotext_0.12.0 [打印本页]

作者: Batcher    时间: 2011-1-28 15:38     标题: Word、Excel文件转文本文件:doctotext_0.12.0

MS Word format (DOC、DOCX), MS Excel format (XLS、XLSX), Rich Text Format (RTF), OpenDocument (ODF) and Office Open XML (OOXML, OpenXML or MSOOXML) documents to plain text converter. Can convert corrupted documents even if other recovery methods failed.
  1. doctotext 1.doc >1.txt
复制代码
发布日期:2010-08-04 下载地址:http://sourceforge.net/projects/doctotext/
作者: yhcbird    时间: 2011-1-28 15:56

楼主这个转word的txt文本好象是unecode的。。。
作者: Batcher    时间: 2011-1-28 16:03     标题: 回复 2楼 的帖子

我测试的结果是UTF-8
Vista SP2 + Office 2007
作者: yhcbird    时间: 2011-1-29 13:14

可能有些版本不同。。上次我转了一个是GB2312的。。。
作者: QIAOXINGXING    时间: 2011-11-3 21:37

下载下来是一个压缩包,里面没有  .exe文件,运行doctotext.cpp出错了。应该怎么用?
作者: garyng    时间: 2011-11-4 18:13

也需要自行COMPILE~
作者: fanfande    时间: 2011-11-17 22:43

我也没成功我用的wps
作者: forfiles    时间: 2012-10-20 15:10

回复 7# fanfande


    看顶楼的介绍没有提到支持WPS
作者: ozzw11411o    时间: 2012-11-7 18:52

回复 5# QIAOXINGXING


    先编译,链接生成  .exe文件
作者: QIAOXINGXING    时间: 2012-11-7 22:22

回复 9# ozzw11411o


    多谢了!!!!!
作者: tmplinshi    时间: 2012-11-8 08:49

中文文件名需要转换成 UTF-8 字符才能转换。

如果需要转换中文文件名(及批量转换),将附件中的文件(doctotext_.bat 和 win_iconv.exe)解压到 doctotext.exe 所在目录,之后的操作如下:
  1. doctotext_ 测试.doc
复制代码
  1. doctotext_ *.doc
复制代码
结果将输出到 原文件名.txt 中。

doctotext_.bat:
  1. @echo off
  2. setlocal
  3. set n=0
  4. set skip=
  5. dir /b %* | win_iconv -f gbk -t utf-8 >"%~f0.tmp"
  6. for /f "delims=" %%a in (' dir /b %* ') do (
  7.     call :doctotext "%%a"
  8. )
  9. exit /b
  10. :doctotext
  11. if %n% neq 0 (
  12.     set skip=skip=%n%
  13. )
  14. for /f "usebackq %skip% eol=< delims=" %%a in ("%~f0.tmp") do (
  15.     echo convert %1...
  16.     doctotext "%%a" >"%~1.txt"
  17.     set /a n += 1
  18.     goto :eof
  19. )
复制代码

作者: gdgzwqz    时间: 2014-7-30 19:16

中文文件名需要转换成 UTF-8 字符才能转换。

如果需要转换中文文件名(及批量转换),将附件中的文件(d ...
tmplinshi 发表于 2012-11-8 08:49



    正在找转码的东东,看到了这个,谢谢!!!
作者: wyx567    时间: 2014-9-1 11:53

怎么样用DocToText批量转换多个文件夹内(包括子目录)的DOC为TXT呢,都是中文文档
作者: hnldwhm52    时间: 2014-9-13 21:34

xiexiexiexie!!
作者: cxq00    时间: 2024-1-5 15:10

这个怎么用




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2