Board logo

标题: [文本处理] [已解决]BAT如何批量删除多个TXT文件中的汉字? [打印本页]

作者: llsilver    时间: 2013-2-26 05:31     标题: [已解决]BAT如何批量删除多个TXT文件中的汉字?

update:十分感谢各位帮助,祝大家新年身体健康,IT人健康最重要:)

是这样的,有一批txt文件,中英文混合,大概有1万5千个。
如何批量去除txt中的汉字以及中文标点符号。
中文标点符号很简单,无非就是那么几个固定字符“。,!?”
我看过斑竹写的这个帖子:http://bathome.l3.wuyou.com/thread-16058-1-1.html
无奈基础太差,实在是搞不定如何“批量”处理所有的TXT文件
望老鸟们帮帮我,不甚感激。
作者: Batcher    时间: 2013-2-26 13:03

  1. @echo off
  2. for %%a in (*.txt) do (
  3.     (for /f "delims=" %%b in (%%a) do (
  4.         set "str=%%b"
  5.         setlocal enabledelayedexpansion
  6.         call :lp
  7.         endlocal
  8.     ))>%%a.log
  9. )
  10. goto :eof
  11. :lp
  12. if /i "!str:~,1!" leq "z" set "var=!var!!str:~,1!"
  13. set "str=!str:~1!"
  14. if defined str goto lp
  15. echo,!var!
  16. set "var="
复制代码

作者: tmplinshi    时间: 2013-2-26 14:37

  1. fr *.txt -r:"***:([\x80-\xFF][\x80-\xFF])" -t
复制代码
fr 下载地址: http://baiy.cn/utils/fr/index.htm
作者: lateol    时间: 2013-2-27 02:27

回复 3# tmplinshi 请问如果我要查找一段如“空格Y0. X0.”替换掉不要了 如果只是-r:" X0. Y0." 好像替换不了 就是因为那个小数点。该如何决绝呢?
作者: llsilver    时间: 2013-2-27 03:57

回复 3# tmplinshi
谢谢,执行效率比2楼管理员写的要高。




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2