Board logo

标题: [问题求助] VBS如何下载带UNICODE字符的网页数据? [打印本页]

作者: lqh123108    时间: 2013-7-28 10:14     标题: VBS如何下载带UNICODE字符的网页数据?

  1. With CreateObject("WinHttp.WinHttpRequest.5.1")
  2.         .Open "GET", "http://dict.qq.com/dict?q=word", False
  3.         .send
  4.          tt = .responseText '发现网页上的使用UNICODE的字符被WINHTTP组件自动转为GB字符了...
  5.   with
复制代码
我想下载这个网页的音标(wə:d)保存到文本文件中去的...注:这个音标是UNICODE字符..
作者: czjt1234    时间: 2013-7-28 19:51

本帖最后由 czjt1234 于 2013-7-28 19:52 编辑

源文件就是这样的、

["w& #601;:d"]
作者: lqh123108    时间: 2013-7-29 11:07

回复 2# czjt1234


    呀,..

那怎么把源文件转成 正常识别的数据wə:d呢?
另外,我直接打开,发现源文件是wə:d呀..
作者: yu2n    时间: 2013-7-29 21:47

回复 3# lqh123108
    按照英语音标需要的常用特殊字符,手动替换即可。
IPA符号
http://www.fmddlmyy.cn/text65.html

4.1 概述
这里的IPA指的是“International Phonetic Alphabet”。IPA也是International Phonetic Association的缩写。IPA符号就是这个协会整理的一套用来表示语音的标准符号。 根据Wikipedia,在2008年,IPA符号包括107个字母,52个音调符号(diacritics)和4个韵律标记(prosody marks)。 有一个关于"The International Phonetic Alphabet in Unicode"的网页上面有IPA符号对应的Unicode字符的列表。 还有个网页提供了IPA字符输入功能。 只要点击网页上的字符,字符就会出现在下方的编辑框中。

英语音标需要的特殊字符
因为英语音标系统需要一些ascii字符以外的符号,这些符号在Unicode出现前没有统一的编码和相应的字体,需要用特殊字体实现。所以在音标的输入和显示上造成了一定的混乱。 那么英语音标究竟需要哪些特殊字符呢?下表列出了英语音标需要的常用特殊字符。

音标符号        10进制Unicode编码        16进制Unicode编码
æ        230        00E6
e        240        00F0
ŋ        331        014B
ɑ        593        0251
ɒ        594        0252
ɔ        596        0254
ə        601        0259
ɛ        603        025B
ɜ        604        025C
ɡ        609        0261
ɪ        618        026A
ʃ        643        0283
ʊ        650        028A
ʌ        652        028C
ʒ        658        0292
ˈ        712        02C8
ˌ        716        02CC
ː        720        02D0
θ        952        03B8

网页代码转IPA代码如下(贴代码无法显示,请下载附档,另注意VBS应保存为Unicode编码):
作者: lqh123108    时间: 2013-9-13 13:44

多谢了
作者: moon3003003    时间: 2015-2-7 12:22

学习了,谢谢




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2