Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
文將介紹通過Java編程來實現PDF文檔轉換的方法。包括:
PDF轉為Word
PDF轉為圖片
PDF轉為Html
PDF轉為SVG
4.1 將PDF每一頁轉為單個的SVG
4.2 將一個包含多頁的PDF文檔轉為一個SVG
PDF轉為XPS
PDF轉為PDF/A
使用工具:Free Spire.PDF for Java(免費版)
Jar文件獲取及導入:
方法1:通過官網下載下載jar包。下載后,解壓文件,并將lib文件夾下的Spire.Pdf.jar文件導入Java程序。
方法2:可通過maven倉庫安裝導入。參考導入方法
PdfDocument pdf=new PdfDocument("test.pdf");
pdf.saveToFile("ToWord.docx",FileFormat.DOCX);
支持的圖片格式包括Jpeg, Jpg, Png, Bmp, Tiff, Gif, EMF等。這里以保存為Png格式為例。
用jupyter notebook寫代碼文檔的時候,有時需要導出pdf版本,但jupyter會報錯。我在想,除了網上的debug方法,還沒有其他方案可以生成pdf。
度娘搜了下,很多博客推薦Python的第三方庫pdfkit,可以將網頁、html文件以及字符串生成pdf文件。
其實也有很多軟件提供pdf生成服務,但這樣太不python了,那下面就來試試pdfkit怎么用吧!
python版本 3.x,在命令行輸入:
pip install pdfkit
安裝過程基本不會有啥問題,出現上面的Successfully installed pdfkit-0.6.1提示,說明安裝成功了。
注:pdfkit是基于wkhtmltopdf的python封裝,所以需要安裝wkhtmltopdf.exe。wkhtmltopdf是輕量級軟件,非常很容易安裝。
下載地址:https://wkhtmltopdf.org/downloads.html
下載wkhtmltopdf
下載完成后,一路next,將wkhtmltopdf安裝好。
務必要記住安裝地址,找到wkhtmltopdf.exe文件所在的絕對路徑,后面要用到。
我這里是默認路徑""C:\Program Files\wkhtmltopdf\bin\wkhtmltopdf.exe""
安裝wkhtmltopdf
前面說過pdfkit可以將網頁、html文件、字符串生成pdf文件。
# 導入庫
import pdfkit
'''將網頁url生成pdf文件'''
def url_to_pdf(url, to_file):
# 將wkhtmltopdf.exe程序絕對路徑傳入config對象
path_wkthmltopdf=r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
config=pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
# 生成pdf文件,to_file為文件路徑
pdfkit.from_url(url, to_file, configuration=config)
print('完成')
# 這里傳入我知乎專欄文章url,轉換為pdf
url_to_pdf(r'https://zhuanlan.zhihu.com/p/69869004', 'out_1.pdf')
# 導入庫
import pdfkit
'''將html文件生成pdf文件'''
def html_to_pdf(html, to_file):
# 將wkhtmltopdf.exe程序絕對路徑傳入config對象
path_wkthmltopdf=r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
config=pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
# 生成pdf文件,to_file為文件路徑
pdfkit.from_file(html, to_file, configuration=config)
print('完成')
html_to_pdf('sample.html','out_2.pdf')
# 導入庫
import pdfkit
'''將字符串生成pdf文件'''
def str_to_pdf(string, to_file):
# 將wkhtmltopdf.exe程序絕對路徑傳入config對象
path_wkthmltopdf=r'C:\\Program Files\\wkhtmltopdf\\bin\\wkhtmltopdf.exe'
config=pdfkit.configuration(wkhtmltopdf=path_wkthmltopdf)
# 生成pdf文件,to_file為文件路徑
pdfkit.from_string(string, to_file, configuration=config)
print('完成')
str_to_pdf('This is test!','out_3.pdf')
本文講了如何在Python中使用pdfkit庫生成pdf文件,非常方便快捷,適合批量自動化操作。
我們看看生成的pdf效果如何:
pdf效果展示
整體頁面視覺不錯呦,趕快用起來吧!
我們日常學習和日常工作中,如果遇見將PDF文件轉換為HTML的問題該怎么辦呢?
其實很簡單,之前小編也寫過關于將PDF文件轉換為HTML的步驟方法,今天小編就來為大家盤點一下PDF轉換為HTML的軟件。都是小編自己試過的軟件哦!
第一款 PDF to HTML
PDF to HTML可以將PDF文件批量的轉換為HTML頁面,在輸出HTML文件的同時保留PDF文件的原始文本、格式以及布局。支持轉換有所限制的PDF文件,比如不允許拷貝的內容、保存為文本以及頁面提取的PDF文件。
第二款 風云PDF轉換器
風云PDF轉換器,這款軟件小編之前也提及過。可以快速的將多種文件轉換為PDF文件以及將PDF文件轉換為多種格式文檔比如PDF轉圖片,PDF轉HTML等等。除了轉換文件之外,還有PDF拆分,PDF合并,PDF頁面提取眾多功能,頁面簡潔,操作簡單易上手,支持批量轉換使用起來很方便。
第三款 Okdo Pdf to Html Converter
Okdo Pdf to Html Converter這款軟件與前兩款軟件相似都是獨立軟件,不需要額外下載插件。可以保留PDF文件的原始布局、圖像。文本、矢量圖形,軟件內置直觀操作界面,方便操作。
第四款 iPubsoft PDF to HTML Converter
iPubsoft PDF to HTML Converter這款軟件小編主要介紹一個特點,這款軟件將PDF格式轉換為網頁格式后,可以使PDF文件可以被搜索引擎搜索和索引。還可以部分轉換PDF文件頁面,保留原始圖像、文本、表格、圖像、超鏈接等等。
第五款 BlueFox Free PDF to HTML Converter
BlueFox Free PDF to HTML Converter這款軟件,小編覺得比較有特點的是可以將文章轉換多種語言的PDF文件,可以使全球PDF文件發行更有效,如果沒明白的話,小編舉個例子就是如果你的PDF文件具有英語內容也是可以輕松轉換。
以上就是小編為大家盤點的五款PDF轉換為HTML的軟件了,每個軟件都有自己很獨特的方向,小編的話比較喜歡全面的軟件,所以使用第二款軟件比較多,如果想要部分轉換可以選擇其他軟件。
如果還有想看的盤點,歡迎給小編留言。小編看到后會幫您安排盤點哦!
*請認真填寫需求信息,我們會在24小時內與您取得聯系。