欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 焦点 > python bs4解析笔记

python bs4解析笔记

2024/12/22 0:22:03 来源:https://blog.csdn.net/weixin_45339670/article/details/144464364  浏览:    关键词:python bs4解析笔记

.tagnamef属性

soup.a 返回html中第一次出现的a标签

soup.div 返回html中第一次出现的div标签

find函数

soup.find(‘div’) 返回html中第一次出现的div标签,等价于soup.div

soup.find(‘div’, class_=‘song’) 属性定位,返回class为song的div标签(class下划线是跟class一起的,为了不和关键字重名。)什么叫class为song,请看下图。

在这里插入图片描述
soup.find(‘div’, id=‘???’) 同理

soup.find(‘div’, attr=‘???’) 同理

soup.find_all(‘div’) 返回html中所有的div标签,返回列表

select函数

soup.select(‘.tang > ul > li > a’) >表示一个层级

soup.select(‘.tang > ul a’) 空格表示跨层级

text属性

soup.a.text 获取文本

string属性

soup.a.string 获取文本

get_text方法

soup.a.get_text() 获取文本。与上面两个的区别是,可以获取某一个标签中所有文本内容,可以非直系

中括号

soup.a[‘href’] 获取a标签href属性的值

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com