标题: [文本处理] [已解决] findstr命令对于UTF-8文本处理的不兼容 [打印本页]
作者: pZjVa0 时间: 2013-7-1 22:14 标题: [已解决] findstr命令对于UTF-8文本处理的不兼容
本帖最后由 pZjVa0 于 2013-7-2 10:02 编辑
最初处理时用了最简单的代码- FINDSTR /i " 簡介 简介 资源类型" x.txt>nu&&echo 找到||echo 没找到
- pause
复制代码
后面发现当文本是UTF-8时无论关键词是什么结果都是 false
我查了一下网上对于批处理对UTF-8的资料非常少
1.请教一下各位有办法可以对UTF-8的内容进行检测吗?
2.对于文本的编码仅用批处理能不能达到文本编码的效果?谢谢
作者: xxpinqz 时间: 2013-7-1 23:40
http://www.bathome.net/thread-10861-1-1.html
批处理utf-8编码文件要先转为ansi
善用下论坛提供的搜索功能
作者: Bearxy 时间: 2013-7-1 23:56
你试试用TYPE读文件看看。
作者: CrLf 时间: 2013-7-2 02:21
xp 以上(不含 xp)可以把 bat 存为 utf-8,在头部加个 &@cls&chcp>nul 65001,这样就能且只能 findstr utf-8 文件了
作者: pZjVa0 时间: 2013-7-2 11:57
回复 4# CrLf
加了这个代码后闪退怎么破
作者: CrLf 时间: 2013-7-2 15:38
回复 5# pZjVa0
&前加个空格
作者: PowerShell 时间: 2013-7-2 18:32
本帖最后由 PowerShell 于 2013-7-2 18:37 编辑
这个问题是世界难题,findstr,和 linux中的 grep 都没解决,(在不用重新生成文件的情况下,或者说不用先把文件转码的情况下)被powershell解决了。
你说powershell牛不?
select-string 中有个 -encodeing
作者: terse 时间: 2013-7-2 18:48
powershell牛
作者: Python 时间: 2013-7-3 08:30
回复 7# PowerShell
给个能够解决楼主问题的完整代码让大家学习下呗
作者: PowerShell 时间: 2013-7-3 18:50
双击powershell
select-string "簡介 简介 资源类型" x.txt -encoding xxx
即可。
---------------把 xxx 替换成下述内容 --------------------------
-Encoding <string>
指定 Select-String 在搜索文件时应采用的字符编码。默认值为 UTF8。
有效值包括“UTF7”、“UTF8”、“UTF32”、“ASCII”、“Unicode”、“BigEndianUnicode”、“Default”和“OEM”。“Default”是系统当前 ANSI 代码页的编码。“OEM”是操作系统的当前原始设备制造商代码页标识符。
作者: apang 时间: 2013-7-3 19:12
不明,觉厉
PowerShell斑竹是不是弄个基础教程,方便我等菜鸟学习?
作者: karmane 时间: 2022-3-25 22:48
回复 4# CrLf
这个牛啊。。。。
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |