标题: [文本处理] [已解决]BAT如何批量删除多个TXT文件中的汉字? [打印本页]
作者: llsilver 时间: 2013-2-26 05:31 标题: [已解决]BAT如何批量删除多个TXT文件中的汉字?
update:十分感谢各位帮助,祝大家新年身体健康,IT人健康最重要:)
是这样的,有一批txt文件,中英文混合,大概有1万5千个。
如何批量去除txt中的汉字以及中文标点符号。
中文标点符号很简单,无非就是那么几个固定字符“。,!?”
我看过斑竹写的这个帖子:http://bathome.l3.wuyou.com/thread-16058-1-1.html
无奈基础太差,实在是搞不定如何“批量”处理所有的TXT文件
望老鸟们帮帮我,不甚感激。
作者: Batcher 时间: 2013-2-26 13:03
- @echo off
- for %%a in (*.txt) do (
- (for /f "delims=" %%b in (%%a) do (
- set "str=%%b"
- setlocal enabledelayedexpansion
- call :lp
- endlocal
- ))>%%a.log
- )
- goto :eof
-
- :lp
- if /i "!str:~,1!" leq "z" set "var=!var!!str:~,1!"
- set "str=!str:~1!"
- if defined str goto lp
- echo,!var!
- set "var="
复制代码
作者: tmplinshi 时间: 2013-2-26 14:37
- fr *.txt -r:"***:([\x80-\xFF][\x80-\xFF])" -t
复制代码
fr 下载地址: http://baiy.cn/utils/fr/index.htm
作者: lateol 时间: 2013-2-27 02:27
回复 3# tmplinshi 请问如果我要查找一段如“空格Y0. X0.”替换掉不要了 如果只是-r:" X0. Y0." 好像替换不了 就是因为那个小数点。该如何决绝呢?
作者: llsilver 时间: 2013-2-27 03:57
回复 3# tmplinshi
谢谢,执行效率比2楼管理员写的要高。
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |