【记录】尝试用xpdf将不可复制的PDF转换为文本或HTML
crifan 11年前 (2014-01-27) 3264浏览 0评论
【背景】 折腾: 【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据 期间,去试试用xpdf,将一个不可拷贝的pdf文件,转换为文本或html。 【折腾过程】 1.参考: PDFTOHTML conversion p...
crifan 11年前 (2014-01-27) 3264浏览 0评论
【背景】 折腾: 【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据 期间,去试试用xpdf,将一个不可拷贝的pdf文件,转换为文本或html。 【折腾过程】 1.参考: PDFTOHTML conversion p...
crifan 11年前 (2014-01-27) 5331浏览 0评论
【问题】 折腾: 【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据 期间,想要用xpdf的pdftotext把一个禁止拷贝的pdf文件转换为html,但是出错了: D:\tmp\dev_tools\python\pdf\xpdf...