Python专题教程:BeautifulSoup详解

版本:v1.0

Crifan Li

摘要

本文主要介绍了Python中的第三方库,BeautifulSoup,主要用于处理HTML,此处简介什么BeautifulSoup,以及BeautifulSoup中常用的各种函数,比如find等等。

[提示] 本文提供多种格式供:
在线阅读 HTML HTMLs PDF CHM TXT RTF WEBHELP
下载(7zip压缩包) HTML HTMLs PDF CHM TXT RTF WEBHELP

HTML版本的在线地址为:

http://www.crifan.com/files/doc/docbook/python_topic_beautifulsoup/release/html/python_topic_beautifulsoup.html

有任何意见,建议,提交bug等,都欢迎去讨论组发帖讨论:

http://www.crifan.com/bbs/categories/python_topic_beautifulsoup/

2013-09-05

修订历史
修订 1.0 2013-09-05 crl
  1. 将之前在Python语言总结中的BeautifulSoup相关的内容都整理过来了
  2. 把之前写的各种BeautifulSoup相关的帖子的链接也整理过来了

目录

前言
1. 本文目的
2. 待完成
1. BeautifulSoup简介
1.1. BeautifulSoup模块简介
2. BeautifulSoup中的find函数详解
2.1. BeautifulSoup中使用find,findAll等函数时,除了字符串外,也可以用正则表达式作为参数
3. BeautifulSoup使用注意事项
3.1. BeautifulSoup的Tag的属性
3.2. BeautifulSoup有时候会遇到非法的,不支持的html源码而导致无法解析或无法正常解析html
参考书目