标签：pdftohtml

【记录】尝试使用pdftohtml将不可拷贝的PDF文件转换为HTML并保留表格的格式

crifan 11年前 (2014-01-27) 4524浏览 0评论

【背景】折腾：【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据期间，去试试用pdftohtml，将一个不可拷贝的pdf文件，转换为文本或html。【折腾过程】 1.继续参考： Howto Convert P...

crifan 11年前 (2014-01-27) 3262浏览 0评论

【背景】折腾：【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据期间，去试试用xpdf，将一个不可拷贝的pdf文件，转换为文本或html。【折腾过程】 1.参考： PDFTOHTML conversion p...

crifan 11年前 (2014-01-27) 3418浏览 0评论

【背景】折腾：【未解决】将不可拷贝复制的PDF中的表格数据导出并转换为xml格式数据期间，虽然可以用pdftohtml通过加-nodrm参数而使得将不可复制的pdf生成html。但是生成的html中，丢失了原先pdf中有个那些表格的数据，只剩...

57 queries in 0.137 seconds, using 21.81MB memory