Python爬虫之xpath使用

京漂大叔 2019-09-16 PM 3312℃ 0条

xpath获取文本比较方便
但是获取带html标签的内容，比如，获取某个文章内容，里面有大量的html标签的时候，就需要选进行字符串转化，然后再对字符串解密获取内容。

content = selector.xpath('//*[@id="article_content"]')[0]
content2 = etree.tostring(content, encoding='utf-8',pretty_print=True)
res = content2.decode('utf-8')

content是获取内容，content2是对获取的内容进行utf-8编码转换成字符串，res进行解密，这样带html标签的内容就获取到了

标签: Python, xpath

非特殊说明，文章均为原创。

未经许可，禁止转载，如若授权转载，请注明出处和来源地址：https://yunyingshuo.com/bz/34.html

上一篇鬼谷子内捷篇之感悟一

下一篇安利一个简单好用的PHP生成excel文件类

评论啦~

1984年生的高以翔，年仅35岁，又帅又高，11月27日凌晨，在宁波录制节目《追我吧》，不幸去世！娱乐圈为何如此拼命！2019年11月29日 11:03:43
2019年9月10日，马云将不再担任集团董事局主席，由现任集团CEO张勇接任。2019年09月11日 08:45:20
阿里巴巴20亿美金收购网易考拉以后考拉的东西假货的概率会上升吗？2019年08月16日 10:11:20
支付宝调整花呗还款日2019年07月30日 21:43:30

Python mysql PHP Apache 小程序 Linux 爬虫 centos7 vue 流量网赚网站淘宝运营 scp svn 口罩抖音 uniapp 微信小程序前端域名 Zblog 关键词外链 Zblog插件自媒体 iptables 运维防火墙 UFW

宁采陈博客

村外人

蜘蛛窝

名家书画

C4D模型网

一起爱

冯阳光seo

魏星

滴滴友链

宁远高铁

win10系统

福州seo

Python爬虫之xpath使用

评论啦~

栏目分类

动态 ~

标签云

友情链接

Python爬虫之xpath使用

 评论啦~

 栏目分类

动态 ~

标签云

友情链接

评论啦~

栏目分类

动态 ~

标签云

友情链接