【整理】用Python从PDF中提取数据
crifan 11年前 (2013-09-09) 3771浏览 0评论
1.搜到的一些参考资料,有空可以去试试: http://www.endlesslycurious.com/2012/06/13/scraping-pdf-with-python/ https://github.com/dpapathanasi...
all python related
crifan 11年前 (2013-09-09) 3771浏览 0评论
1.搜到的一些参考资料,有空可以去试试: http://www.endlesslycurious.com/2012/06/13/scraping-pdf-with-python/ https://github.com/dpapathanasi...
crifan 11年前 (2013-08-30) 19353浏览 17评论
关于什么是Python的IDE,不了解的先去看: 【整理】【多图详解】如何在Windows下开发Python:在cmd下运行Python脚本+如何使用Python Shell(command line模式和GUI模式)+如何使用Python IDE ...
crifan 12年前 (2013-08-12) 12613浏览 6评论
【问题】 用Python脚本模拟登陆百度空间。 需要先获得最开始登陆的百度空间网页所返回的cookie。 【解决过程】 1.搜了一番,最后参考这个: 利用Python抓取需要登录网站的信息 实现了对应的代码: loginUrl = "htt...
crifan 12年前 (2013-08-01) 3693浏览 1评论
【背景】 之前用过Python的chardet: https://pypi.python.org/pypi/chardet (代码下载在:https://github.com/dcramer/chardet) 现在,在看Requests的编码方式时,...
crifan 12年前 (2013-07-25) 8249浏览 3评论
1.python中,处理excel的库是: xlrd和xlwt 对应网上有总结: http://www.python-excel.org/ 但是都是针对python 2.x的的。 官网下载分别是: https://pypi.python.org/py...
crifan 12年前 (2013-07-19) 10370浏览 6评论
【背景】 Python中的字符编码,其实的确有点复杂。 再加上,不同的开发环境和工具中,显示的逻辑和效果又不太相同,尤其是,中文的,初级用户,最常遇到的: (1)在Python自带的IDE:IDLE中折腾中文字符,结果看到的差不多都是乱码类的东西,比...
crifan 12年前 (2013-07-19) 15405浏览 4评论
【背景】 python中的字符串编码,搞晕很多人,包括之前的我。 随着对于python的编码的深入了解,后来才算搞懂,关于python的,用encoding去声明的文件编码,和,python文件实际的编码,之间的关系。 Python中用...
crifan 12年前 (2013-07-19) 25671浏览 8评论
#!/usr/bin/python 是用来说明脚本语言是python的 是要用/usr/bin下面的程序(工具)python,这个解释器,来解释python脚本,来运行python脚本的。 # -*- coding: utf-8 -*-...
crifan 12年前 (2013-07-18) 20797浏览 6评论
背景 之前已经写帖子,解释了关于Python的开发环境: 【整理】【多图详解】如何在Windows下开发Python:在cmd下运行Python脚本,如何使用Python Shell(command line模式和GUI模式),如何使用Python ...
crifan 12年前 (2013-07-17) 11238浏览 3评论
table.mystyle { border-width: 0 0 1px 1px; border-spacing: 0; border-collapse: collapse; border-style: soli...