Board logo

标题: [问题求助] Python如何提取网页上的md5数值 [打印本页]

作者: netdzb    时间: 2021-1-17 12:41     标题: Python如何提取网页上的md5数值

# -*- coding: UTF-8 -*-
import requests
r = requests.get('http://yimuhe.com/file-4830434.html')
r.encoding='utf-8'
print(r.text)


下面是r.txt的部分内容,如何把
<div class="md5">MD5:9a61e37cc886a327928045ebf6a14610</div>
<div class="sha1">SHA1:35c3acb56e4b7749370426e9679da4ac23b5e70b</div>
上的md5数据给提取出来,最好是用标准一点的方法,不要使用正则表达式。
提取的字符串赋值给一个新的字符串。


<div class="l w630">

        <h1>05. Kiss The Rain - Yiruma</h1>

    <div class="info">

        <span>上传用户:</span><span><a href="http://netdzb.yimuhe.com/">netdzb</a></span><span>文件大小:</span><span class="rightnone">15.77MB</span>

        <span>文件类型:</span><span>flac</span><span>下载次数:</span><span class="rightnone"><img src="/n_images/z1.gif" />&nbsp;</span>

        <span>上传日期:</span><span>2021-01-03 07:45:16</span><span>用户收入:</span><span class="rightnone">保密  <a href="/n_money.html" target="_blank"><font color="#FF0000">想赚钱吗?</font></a></span>

            <div class="md5">MD5:9a61e37cc886a327928045ebf6a14610</div><div class="sha1">SHA1:35c3acb56e4b7749370426e9679da4ac23b5e70b</div>

    </div>

        

    <div class="caocuo">

        <span class="soucang"><A href="javascript:window.external.AddFavorite('http://www.yimuhe.com/file-4830434.html','05. Kiss The Rain - Yiruma.flac');">收藏文件</A></span>

        <span class="jubao"><a onclick="jubao_file(4830434,'netdzb');" href="javascript:;">举报文件</a></span>

        <span><a href="down-4830434.html"><font color="#FF0000">下载文件</font></a></span>



    </div>

......
</div>




欢迎光临 批处理之家 (http://bathome.net./) Powered by Discuz! 7.2