标题: [技术讨论] VBS 正则匹配失败竟会导致脚本暂停 [打印本页]
作者: tmplinshi 时间: 2015-4-13 17:14 标题: VBS 正则匹配失败竟会导致脚本暂停
- data = ReadTextFile("match_stop.txt")
-
- set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=""LatinName"">(.*?)<")
- MsgBox ms.count
-
- ' 去掉末尾的【""LatinName"">(.*?)<】则正常
- ' set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=")
-
- Function RegExMatch(ByRef inputstr, Pattern)
- Set re = New RegExp
- re.Pattern = Pattern
- re.IgnoreCase = True
- re.Global = True
- MsgBox "呵呵呵,脚本要停止运行了..下面的 MsgBox 你看不见了."
-
- Set RegExMatch = re.Execute( inputstr )
- MsgBox "你看不见我,你看不见我"
- End Function
-
- Function ReadTextFile(fPath)
- Set filesys = CreateObject("Scripting.FileSystemObject")
- Set filetxt = filesys.OpenTextFile(fPath, 1)
- ReadTextFile = filetxt.ReadAll
- End Function
复制代码
作者: CrLf 时间: 2015-4-13 17:59
测试下面这段好像正常的哟- data = "fasdfasdf"&vbCrLf&"_ffsafdwsaf"
-
- set ms = RegExMatch(data, "asdfasdf@<")
- MsgBox ms.count
-
- Function RegExMatch(ByRef inputstr, Pattern)
- Set re = New RegExp
- re.Pattern = Pattern
- re.IgnoreCase = True
- re.Global = True
- MsgBox "呵呵呵,脚本要停止运行了..下面的 MsgBox 你看不见了."
-
- Set RegExMatch = re.Execute( inputstr )
- MsgBox "你看不见我,你看不见我"
- End Function
复制代码
作者: tmplinshi 时间: 2015-4-13 19:28
是的,并不是所有情况都会导致脚本暂停。可是我顶楼给出的例子就是会导致脚本暂停。
作者: yu2n 时间: 2015-4-15 18:10
这不是 VBS 的问题。
目测表达式太长、或其他未知的表达式错误。
作者: tmplinshi 时间: 2015-4-16 01:36
本帖最后由 tmplinshi 于 2015-4-16 01:41 编辑
回复 4# yu2n
并不是目标表达式太长,如果我把表达式换成下面这行则运行正常、匹配成功(以下表达式比原来的还长):
set ms = RegExMatch(data, "class=""smallphoto"" id=""(.*?)"".*?src=""(.*?)""[\s\S]*?author=""(.*?)""[\s\S]*?photoCName"">[\s\S]*?"">(.*?)<[\s\S]*?photoLName"">[\s\S]*?href=""(.*?)""[\s\S]*?class=""plantname"".*?>(.*?)<")
脚本暂停,仅仅是表达式的末尾部分“LatinName"">(.*?)<”在源文件中找不到。既然找不到,正常情况 VBS 应该处理为匹配失败,而不是把脚本暂停了。
代码语法也并没有错误。既然代码语法没有错误,那么正则匹配无非两种结果——成功或者失败,“表达式错误”那就应该处理为匹配失败。
所以这当然是 VBS 的问题。
作者: tmplinshi 时间: 2015-4-16 01:57
本帖最后由 tmplinshi 于 2015-4-16 02:50 编辑
知道原因了,是因为达到了匹配的最大(长度?)限制,导致 VBS 卡住了。我用那个表达式在 AutoHotkey 中进行匹配也返回了 -8 的 ErrorLevel 值("reached match limit" (-8))。
试了下添加“On error resume Next”并没有效果,有方法忽略这个错误吗?
=====================================
匹配过程估计是这样:
由于数据中有比较多的 [\s\S]*?class="",但是数据中并没有 [\s\S]*?class=""LatinName,所以电脑不停地往前搜索 [\s\S]*?class="",结果到达了匹配的最大长度限制。
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |