标题: [问题求助] VBS如何下载带UNICODE字符的网页数据? [打印本页]
作者: lqh123108 时间: 2013-7-28 10:14 标题: VBS如何下载带UNICODE字符的网页数据?
- With CreateObject("WinHttp.WinHttpRequest.5.1")
- .Open "GET", "http://dict.qq.com/dict?q=word", False
- .send
- tt = .responseText '发现网页上的使用UNICODE的字符被WINHTTP组件自动转为GB字符了...
- with
复制代码
我想下载这个网页的音标(wə:d)保存到文本文件中去的...注:这个音标是UNICODE字符..
作者: czjt1234 时间: 2013-7-28 19:51
本帖最后由 czjt1234 于 2013-7-28 19:52 编辑
源文件就是这样的、
["w& #601;:d"]
作者: lqh123108 时间: 2013-7-29 11:07
回复 2# czjt1234
呀,..
那怎么把源文件转成 正常识别的数据wə:d呢?
另外,我直接打开,发现源文件是wə:d呀..
作者: yu2n 时间: 2013-7-29 21:47
回复 3# lqh123108
按照英语音标需要的常用特殊字符,手动替换即可。
IPA符号
http://www.fmddlmyy.cn/text65.html
4.1 概述
这里的IPA指的是“International Phonetic Alphabet”。IPA也是International Phonetic Association的缩写。IPA符号就是这个协会整理的一套用来表示语音的标准符号。 根据Wikipedia,在2008年,IPA符号包括107个字母,52个音调符号(diacritics)和4个韵律标记(prosody marks)。 有一个关于"The International Phonetic Alphabet in Unicode"的网页上面有IPA符号对应的Unicode字符的列表。 还有个网页提供了IPA字符输入功能。 只要点击网页上的字符,字符就会出现在下方的编辑框中。
英语音标需要的特殊字符
因为英语音标系统需要一些ascii字符以外的符号,这些符号在Unicode出现前没有统一的编码和相应的字体,需要用特殊字体实现。所以在音标的输入和显示上造成了一定的混乱。 那么英语音标究竟需要哪些特殊字符呢?下表列出了英语音标需要的常用特殊字符。
音标符号 10进制Unicode编码 16进制Unicode编码
æ 230 00E6
e 240 00F0
ŋ 331 014B
ɑ 593 0251
ɒ 594 0252
ɔ 596 0254
ə 601 0259
ɛ 603 025B
ɜ 604 025C
ɡ 609 0261
ɪ 618 026A
ʃ 643 0283
ʊ 650 028A
ʌ 652 028C
ʒ 658 0292
ˈ 712 02C8
ˌ 716 02CC
ː 720 02D0
θ 952 03B8
网页代码转IPA代码如下(贴代码无法显示,请下载附档,另注意VBS应保存为Unicode编码):
作者: lqh123108 时间: 2013-9-13 13:44
多谢了
作者: moon3003003 时间: 2015-2-7 12:22
学习了,谢谢
欢迎光临 批处理之家 (http://bathome.net./) |
Powered by Discuz! 7.2 |