【记录】尝试用xpdf将不可复制的PDF转换为文本或HTML
crifan 11年前 (2014-01-27) 3263浏览 0评论
【背景】 折腾: 【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据 期间,去试试用xpdf,将一个不可拷贝的pdf文件,转换为文本或html。 【折腾过程】 1.参考: PDFTOHTML conversion p...
crifan 11年前 (2014-01-27) 3263浏览 0评论
【背景】 折腾: 【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据 期间,去试试用xpdf,将一个不可拷贝的pdf文件,转换为文本或html。 【折腾过程】 1.参考: PDFTOHTML conversion p...
crifan 11年前 (2014-01-27) 4938浏览 3评论
【背景】 折腾: 【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据 期间,去试试使用pyPdf去把一个不可复制的PDF文件,转换为文本或HTML。 【折腾过程】 1.参考: Convert PDF to text ...
crifan 11年前 (2014-01-27) 3330浏览 1评论
【背景】 折腾: 【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据 期间,打算去试试使用PDFMiner去把PDF,且是个加了密,不可拷贝的PDF,看看能否转换为文本或HTML。 【折腾过程】 1.找到主页: PD...
crifan 11年前 (2014-01-24) 8008浏览 0评论
【背景】 拿到一个DWG文件,就是AutoCAD的文件。 想要查看。 但是不方便安装软件。 所以希望找个在线的可以查看DWG,甚至编辑DWG的。 如果可以转换为对应的JPG图片或PDF,更好。 【折腾过程】 试了半天,结果如下: 1. http://...
crifan 11年前 (2014-01-23) 12911浏览 0评论
【背景】 弄了个CAJ,想要转为PDF。 这样发给别人,就不用麻烦别人再安装那个CAJ软件,就可以打开看了。 【折腾过程】 1.参考: caj转pdf的方法图文教程_百度经验 去打印,选择PDF类打印机即可。 2.打印完毕后,此处根据之前...
crifan 11年前 (2013-12-04) 2166浏览 0评论
制作出来的PDF效果比较好的方法 用专业制作PDF的工具去生成pdf 用adobe pdf creator之类的工具去制作 关于adobe pdf creator之,参见官网: PDF 创建程序 从...
crifan 11年前 (2013-10-05) 5915浏览 9评论
【背景】 之前看到: http://velocity.apache.org/docbook/DocBook-Framework-1.0.pdf 中的pdf有页眉和页脚: 所以,想要也去给自己的pdf,以及html,去添加页眉和页脚。 其中我目前的p...
crifan 11年前 (2013-09-30) 2283浏览 0评论
【背景】 之前折腾了: 【记录】docbook中借鉴别人的css配置以制作自己的css:docbook_crl.css 弄出了自己的docbook_crl.css,效果还不错。 不过,对于这些配置,都还是针对于html类型的(单个html,多个htm...
crifan 11年前 (2013-09-30) 2625浏览 0评论
【背景】 折腾: 【记录】把docbook中的html的css的配置效果应用到fo即PDF等输出文件类型中 期间, 已经尝试了: 【记录】docbook中尝试使用CSSToXSLFO将css转换为fo(pdf)的xsl配置参数 结果失败了。 所以只能...
crifan 11年前 (2013-09-09) 3768浏览 0评论
1.搜到的一些参考资料,有空可以去试试: http://www.endlesslycurious.com/2012/06/13/scraping-pdf-with-python/ https://github.com/dpapathanasi...