你的位置:首页 > 营销推广 > SEO > Python BeautifulSoup4安装与简单应用

Python BeautifulSoup4安装与简单应用

星空跨境
跨境电商干货分享网站,最新的亚马逊、全球速卖通、eBay、Wish商户平台、敦煌网、Shopify、Lazada、Etsy等电商平台卖家开店运营课程,以及外贸电子商务B2B和B2C平台网络营销,Dropshipping,英文SEO,海外SNS营销,Facebook,YouTube,LinkedIn,Twitter,Instagram,Snapchat,Pinterest,Tumblr以及EDM精准邮件营销等推广营销实战培训。
2020-11-06 20:01:59
BeautifulSoup是最初学习Python抓取网页时都会用到的一个库,可以使HTML内容结构化,从而更方便的获取内部数据,可以说是pythoner居家必备的model之一。本文主要对BeautifulSoup的安装与应用作简单的介绍。 注:本文使用的BeautifulSou ...

Python BeautifulSoup4安装与简单应用

BeautifulSoup是最初学习Python抓取网页时都会用到的一个库,可以使HTML内容结构化,从而更方便的获取内部数据,可以说是pythoner居家必备的model之一。本文主要对BeautifulSoup的安装与应用作简单的介绍。

注:本文使用的BeautifulSoup版本为BeautifulSoup4

1. BeautifulSoup安装

linux安装

  • 可以通过系统软件包来安装:$ apt-get install Python-bs4
  • 也可以通过easy_installpip安装:$ easy_install beautifulsoup4$ pip install beautifulsoup4

windows安装

  • 可以在官方地址下载源码,然后通过python setup.py install安装;
  • 也可以通过easy_installpip安装,方法同上。

2. 简单浏览结构化数据

使用BeautifulSoup对HTML内容解析之后,HTML内容就变成了结构化数据,可以轻易对其中的DOM元素进行操作,比如获取数据,修改,删除等。
注:由于BeautifulSoup用于采集数据较多,本文只对查找数据做示例。

import requestsfrom bs4 import BeautifulSoup as bspurl = ' >r = requests.get(url)soup = bsp(r.content) # 得到结构化数据soupprint soup.title # 定位title标签# <title>#张亚楠 ' BLOG - 天意从来高难问# </title>print soup.title.name # title标签的名称#titleprint soup.title.string # title标签中文本内容#张亚楠 ' BLOG - 天意从来高难问print soup.h2 # 定位HTML中第一个h2标签# <h2 class="title"><a href="/post/python-beautifulsoup" ><i class="fa fa-leaf"></i>Python BeautifulSoup4安装与简单应用</a># </h2>print soup.h2['class'] # 第一个h2标签的class属性#[u'title']print soup.body.div.div.a # 获取到导航中第一个链接#<a href="/">Home</a>

原标题:Python BeautifulSoup4安装与简单应用

关键词:

*特别声明:以上内容来自于网络收集,著作权属原作者所有,如有侵权,请联系我们: admin#shaoqun.com (#换成@)。
星空跨境
跨境电商干货分享网站,最新的亚马逊、全球速卖通、eBay、Wish商户平台、敦煌网、Shopify、Lazada、Etsy等电商平台卖家开店运营课程,以及外贸电子商务B2B和B2C平台网络营销,Dropshipping,英文SEO,海外SNS营销,Facebook,YouTube,LinkedIn,Twitter,Instagram,Snapchat,Pinterest,Tumblr以及EDM精准邮件营销等推广营销实战培训。

该作者最新发布文章

相关推荐

我的浏览记录

用小程序打开用小程序打开更快