【记录】用Python从pdf文件中提取文字数据信息
crifan 12年前 (2013-05-20) 6137浏览 0评论
【背景】 已有一个pdf文件,效果如下: 想要用python从中提取一些信息。 【折腾过程】 1.搜了下,找到个: pyPdf http://pybrary.net/pyPdf/ 其功能之一是: “extracting document infor...
all programming language, C/C++/C#/VB/VBA/VB.NET/Python/Ruby/PHP/Go/Perl/……
crifan 12年前 (2013-05-20) 6137浏览 0评论
【背景】 已有一个pdf文件,效果如下: 想要用python从中提取一些信息。 【折腾过程】 1.搜了下,找到个: pyPdf http://pybrary.net/pyPdf/ 其功能之一是: “extracting document infor...
crifan 12年前 (2013-05-16) 6938浏览 0评论
【问题】 C#中,已有一个List,想要动态的,绑定到ComboBox中。 【解决过程】 1.参考: c# winform comboBox动态绑定数据 去试试代码: cmbSubCategory.DataSource...
crifan 12年前 (2013-05-16) 8936浏览 1评论
【问题】 C#中,对于一行代码,加了断点,而且肯定会执行到的。 结果调试的时候,却无法调试到。 现象看起来是,该行代码,直接被忽略掉了。 比如,对于代码: HtmlAgilityPack.HtmlDocument htmlDoc = crl.html...
crifan 12年前 (2013-05-13) 6935浏览 0评论
【背景】 要在java代码中,输入一个路径,比如: D:\tmp\tmp_dev_root\eclipse\common_root\antlrEddlParser\src 而想要将此路径,当做正常的字符串,在Java中赋值给String的...
crifan 12年前 (2013-05-08) 4033浏览 0评论
待完成,最新更新:2013-05-08 把之前的: 【详解】Python中的文件操作,readline读取单行,readlines读取全部行,文件打开模式 中的部分内容整理过来,再加上更多的解释。 关于文件的基本知识 &...
crifan 12年前 (2013-05-03) 7816浏览 0评论
【问题】 已经通过Python中的BeautifulSoup获得了对应的soup: LINE 253 : INFO foundDescription=<td va...
crifan 12年前 (2013-05-02) 15273浏览 5评论
【问题】 写Python代码,利用urllib2去访问网络,结果期间会出现错误: urllib2.URLError: <urlopen error [Errno 10060] > 【解决过程】 1.后来发现,程序本身是好的,但...
crifan 12年前 (2013-04-29) 13651浏览 4评论
【问】 Hi Crifan, 我在http://bbs.csdn.net/topics/390361293 里看到抓取网易公开课的脚本,我看了下,感觉还比较简单,但是有一处不是很理解 它在 获取课程名称的时候用到以下代码, fileNa...
crifan 12年前 (2013-04-29) 3351浏览 0评论
【问题】 C语言中, 关于如何获得一个,当做参数传递到函数内的一个数组的大小。 之前以为是可以通过类似于: sizeof(b) / sizeof(b[0]) 的,去获得参数中的数组的大小而定。 【解决过程】 1后来经过实际测试,说明自...
crifan 12年前 (2013-04-27) 2919浏览 0评论
已经有了对应的java代码去访问网络了: /** Get response from url, headerDict, postDict */ public HttpResponse getUrlResponse(String url...