博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
解析煎蛋图片
阅读量:6876 次
发布时间:2019-06-26

本文共 1525 字,大约阅读时间需要 5 分钟。

hot3.png

from html.parser import HTMLParserclass my_html_parser(HTMLParser):    def __init__(self):        HTMLParser.__init__(self)        self.bprint = False        self.imgs = []    def handle_starttag(self, tag, attrs):        # print('start:<%s>' % tag)        self.bprint = False        if tag is not 'a':            img = ''            for (var, value) in attrs:                if var == 'href':                    img = value                if var == 'class' and value == 'view_img_link':                    # print('%s="%s"' %(var, value))                    self.bprint = True            if str(img).__len__() > 0 and self.bprint is True:                self.imgs.append(img)    def handle_startendtag(self, tag, attrs):        pass        # print('start_end:<%s>' % tag)    def handle_endtag(self, tag):        pass        # print('end:<%s>' % tag)    # def handle_data(self, data):    #     if self.bprint is True:    #         print('data:<%s>' % data)            # def handle_comment(self, data):            #     print('comment:<%s>' % data)            #            # def handle_entityref(self, name):            #     print('entityref:<&%s>' % name)            #            # def handle_charref(self, name):            #     print('charref:<&#%s>' % name)    def print_img(self):        for img in self.imgs:            print(img)if __name__ == '__main__':    parser = my_html_parser()    parser.feed('''            

Some html HTML tutorial...

END

''')

转载于:https://my.oschina.net/IzumiHoshi/blog/1143143

你可能感兴趣的文章
RDS最佳实践(四)—如何处理Mysql的子查询
查看>>
最大流:Dinic模板
查看>>
安卓开发中个人能力的进阶进程
查看>>
人工智能10年将有颠覆性改变
查看>>
探秘AOP实现原理
查看>>
单点登录(SSO)简介
查看>>
2018最新大数据学习路线分享
查看>>
利用SVG制作不规矩背景的链接导航
查看>>
Linux - 一次运行多个命令
查看>>
10.C# -- 函数参数,参数数组,值传递函数,引用传递函数,输出函数,无参函数...
查看>>
BT5设置ip地址
查看>>
转载/验证码
查看>>
Surface、SurfaceView、SurfaceHolder和SurfaceHolder.Callback之间的联系
查看>>
什么是Data Store and Data Collector?
查看>>
我的友情链接
查看>>
php培训11.30
查看>>
Effective Java读后感
查看>>
windows下两个无线网卡 一个内网 一个外网
查看>>
tcp nat 负载均衡
查看>>
起点,游戏开发的梦想与技能点
查看>>