版本:v1.0
摘要
本文是针对Python的中级开发人员,介绍如何用Python语言去实现抓取网站,模拟登陆,抓取动态网页。其中主要涉及到,网络处理方面的模块(urllib,urllib2等),以及HTML解析相关的模块(BeautifulSoup,json等)。
本文提供多种格式供: | |
---|---|
HTML版本的在线地址为: 有任何意见,建议,提交bug等,都欢迎去讨论组发帖讨论: http://www.crifan.com/bbs/categories/python_topic_web_scrape/ |
2013-02-06
修订历史 | ||
---|---|---|
修订 1.0 | 2013-02-06 | crl |
|
版权 © 2013 Crifan, http://crifan.com