【教程】Python中第三方的用于解析HTML的库:BeautifulSoup
crifan 12年前 (2013-02-01) 10581浏览 3评论
背景 在Python去写爬虫,网页解析等过程中,比如: 如何用Python,C#等语言去实现抓取静态网页+抓取动态网页+模拟登陆网站 常常需要涉及到HTML等网页的解析。 当然,对于简单的HTML中内容的提取,Python内置的正则表达式Re模块,就...
crifan 12年前 (2013-02-01) 10581浏览 3评论
背景 在Python去写爬虫,网页解析等过程中,比如: 如何用Python,C#等语言去实现抓取静态网页+抓取动态网页+模拟登陆网站 常常需要涉及到HTML等网页的解析。 当然,对于简单的HTML中内容的提取,Python内置的正则表达式Re模块,就...
crifan 12年前 (2012-11-15) 7498浏览 2评论
1.Python内置模块和第三方模块 内置模块: Python中,安装好了Python后,本身就带有的库,就叫做Python的内置的库。 内置模块,也被称为Python的标准库。 Python 2.x的在线库函数查询,可以去这里: The Pyt...