最新消息:20210816 当前crifan.com域名已被污染,为防止失联,请关注(页面右下角的)公众号

ProgrammingLanguage

all programming language, C/C++/C#/VB/VBA/VB.NET/Python/Ruby/PHP/Go/Perl/……

【教程】Python中第三方的用于解析HTML的库:BeautifulSoup

【教程】Python中第三方的用于解析HTML的库:BeautifulSoup

crifan 12年前 (2013-02-01) 10591浏览 3评论

背景 在Python去写爬虫,网页解析等过程中,比如: 如何用Python,C#等语言去实现抓取静态网页+抓取动态网页+模拟登陆网站 常常需要涉及到HTML等网页的解析。 当然,对于简单的HTML中内容的提取,Python内置的正则表达式Re模块,就...

【整理】Python中的yield用法

【整理】Python中的yield用法

crifan 12年前 (2013-01-31) 3933浏览 1评论

1.看到这里提到了yield,然后就去找了找资料。 2.找到了个解释的比较清楚的: Python yield 使用浅析 3.Python 2.7中的解释,摘录如下 5.2.10. Yield expressions yield_atom ...

【整理】C#中的HTML解析

【整理】C#中的HTML解析

crifan 12年前 (2013-01-28) 3742浏览 0评论

【背景】 找个C#中可以用的,直接解析我自己C#代码获得的html的HTML解析器或者库。 【折腾过程】 然后去网上找了下,可参考的资料有: 1. HTML Agility Pack 提到的: http://htmlagilitypack.codep...

65 queries in 0.172 seconds, using 22.04MB memory