Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
近臨近開(kāi)學(xué)了,大家都在忙著準(zhǔn)備各種學(xué)習(xí)的資料,準(zhǔn)備在新的學(xué)期好好學(xué)習(xí),充實(shí)自己。小編身邊的同學(xué)也是如此,最近,小編的同學(xué)小麗就遇到了一個(gè)很棘手的問(wèn)題。
她想將一個(gè)網(wǎng)頁(yè)的Python學(xué)習(xí)的教程打印下來(lái),方便自己來(lái)學(xué)習(xí),但是上千頁(yè)的教程,如果通過(guò)手動(dòng)的方式,一個(gè)一個(gè)的去轉(zhuǎn)成pdf并保存到本地,實(shí)在是麻煩的不。
這就是一個(gè)html轉(zhuǎn)pdf的問(wèn)題,其實(shí)網(wǎng)上有很多不錯(cuò)的html資源,但是苦于學(xué)習(xí)起來(lái),不方便!于是小編就跟小麗保證,這點(diǎn)小事包在我身上。今天,小編就跟分享一下如何用Python把html資料變成pdf。
如今網(wǎng)上的在線學(xué)習(xí)資料可謂是多如牛毛,為了方便講解,小編就利用python3.9.2的中文文檔作為演示的例子,來(lái)將其抓取并保存到本地,其網(wǎng)頁(yè)鏈接如下:
https://docs.python.org/zh-cn/3.9/tutorial/index.html
打開(kāi)上述鏈接后,大家會(huì)在網(wǎng)頁(yè)中找到不同內(nèi)容的鏈接地址,包括了基礎(chǔ)的python字符、python語(yǔ)法等內(nèi)容。
在上圖中,我們需要格外關(guān)注的是紅色方格標(biāo)注的鏈接,每個(gè)鏈接都會(huì)跳轉(zhuǎn)到對(duì)應(yīng)的子網(wǎng)頁(yè)中,而在子網(wǎng)頁(yè)中,就是我們想要保存的內(nèi)容。
可以看到,上圖中,在python速覽子頁(yè)面中,包含了我們需要提取的文字內(nèi)容。所以將html內(nèi)容保存為pdf的第一步便是獲取到子頁(yè)面的鏈接。由于教程大都是固定內(nèi)容,因此對(duì)于教程的網(wǎng)頁(yè),大都采用的是靜態(tài)頁(yè)面,在網(wǎng)頁(yè)源代碼中可以很輕松地找到子頁(yè)面的網(wǎng)頁(yè)鏈接。
對(duì)于子網(wǎng)頁(yè)的鏈接抓取,程序如下圖所示:
程序中,通過(guò)BeautifulSoup庫(kù)來(lái)解析網(wǎng)頁(yè)源代碼,然后提取所有的子頁(yè)面鏈接地址并返回,如果抓取失敗,則直接返回None。
03.html轉(zhuǎn)pdf
在得到子網(wǎng)頁(yè)的鏈接后,接下來(lái)就是將html的子網(wǎng)頁(yè)保存為pdf文件。小編使用的pdfkit庫(kù),pdfkit庫(kù)可以將網(wǎng)頁(yè)保存為pdf文檔。首先小編來(lái)介紹一下pdfkit庫(kù)的安裝。
按照上述的操作流程,就可以安裝pdfkit庫(kù)。對(duì)于pdfkit庫(kù)的使用,常見(jiàn)的用法有以下三種:
上面的程序主要完成以下幾步:
首先需要指定wkhtmltopdf.exe文件的路徑;
因此,pdfkit庫(kù)只能將子網(wǎng)頁(yè)保存為單獨(dú)的pdf文檔,無(wú)法直接通過(guò)pdfkit庫(kù)將所有的子網(wǎng)頁(yè)拼接成一個(gè)完整的pdf文檔,小編通過(guò)PyPDF2庫(kù)中的PdfFileMerger類來(lái)實(shí)現(xiàn)pdf文檔的拼接。程序如下圖所示。
程序中首先將所有的html網(wǎng)頁(yè)保存為單獨(dú)的pdf文檔,然后通過(guò)PdfFileMerger類對(duì)象來(lái)實(shí)現(xiàn)pdf文檔的拼接。最后就可以得到全部的pdf內(nèi)容。最后我們通過(guò)視頻的展示,來(lái)看一下程序的效果吧。
除此之外,程序不光可以抓取python3.9的中文文檔,針對(duì)其他的在線文檔,只需要對(duì)獲取網(wǎng)頁(yè)鏈接的程序進(jìn)行修改即可抓取,例如對(duì)于Flask中文文檔的抓取,程序只需要按照下圖進(jìn)行修改,即可將Flask的在線文檔保存為PDF文檔。
學(xué)習(xí)Python其實(shí)非常有趣,也很有用。因?yàn)镻ython有大量的現(xiàn)成的庫(kù),可以幫助我們把工作中的很多瑣碎的煩事輕松解決。小編將上述的程序稍加修改,很快就幫阿麗搞定了教程,保存為pdf發(fā)送給了她,小編與女神的關(guān)系更拉近了一步
TML編輯器從WORD復(fù)制粘貼圖片,HTML編輯器從WORD復(fù)制圖片,HTML編輯器從WORD粘貼圖片,javascript支持WORD上傳的富文本編輯器,JS支持word上傳的富文本編輯器,html支持word上傳的富文本編輯器,前端支持word上傳的富文本編輯器,vue支持word上傳的富文本編輯器,javascript粘貼word圖片,js粘貼word圖片,javascript導(dǎo)入word,js導(dǎo)入word,word文檔如何存到HTML編輯器上,word圖片如何保存到html編輯器上,word圖文如何保存到html編輯器上,word文檔如何轉(zhuǎn)存到html編輯器上,word文檔如何轉(zhuǎn)存到富文本編輯器上,word文檔如何轉(zhuǎn)存到web編輯器上,word文檔如何轉(zhuǎn)存到百度富文本編輯器上
HTML編輯器粘貼word圖片,web編輯器粘貼word圖片,web富文本編輯器粘貼word,
粘貼word內(nèi)容,粘貼word圖片,粘貼word圖文,
用戶發(fā)布新聞的時(shí)候是從word里面復(fù)制圖片和文字,也就是復(fù)制word文檔里面的內(nèi)容,這些內(nèi)容包含文字和圖片
然后將word圖文內(nèi)容粘貼到web富文本編輯器中,圖片自動(dòng)上傳到web服務(wù)器中,上傳通過(guò)指定的接口,接口能夠自定義,能夠在內(nèi)網(wǎng)使用,能夠在外網(wǎng)使用
粘貼后自動(dòng)返回文字和圖片HTML,圖片和文字HTML自動(dòng)添加到編輯器中,用戶能夠直接看到粘貼后的效果,能夠不裝插件最好。
1.下載示例:
http://www.ncmem.com/webapp/wordpaster/versions.aspx
2.復(fù)制WordPaster插件目錄
3.引入插件文件
注意:不要重復(fù)引入jquery,如果您的項(xiàng)目已經(jīng)引入了jq,則不用再引入jq-1.4
4.在工具欄中增加插件按鈕
6.初始化控件
注意:
1.如果接口字段名稱不是file,請(qǐng)配置FileFieldName。ueditor接口中使用的upfile字段
參考:http://www.ncmem.com/doc/view.aspx?id=c3ad06c2ae31454cb418ceb2b8da7c45
2.如果接口返回JSON,請(qǐng)配置ImageMatch
參考:http://www.ncmem.com/doc/view.aspx?id=07e3f323d22d4571ad213441ab8530d1
3.如果接口返回的圖片地址沒(méi)有域名,請(qǐng)配置ImageUrl
參考:http://www.ncmem.com/doc/view.aspx?id=704cd302ebd346b486adf39cf4553936
4.如果接口有權(quán)限驗(yàn)證(登陸驗(yàn)證,SESSION驗(yàn)證),請(qǐng)配置COOKIE?;蛉∠麢?quán)限驗(yàn)證。
參考:http://www.ncmem.com/doc/view.aspx?id=8602DDBF62374D189725BF17367125F3
效果
訂閱版報(bào)價(jià)單:https://drive.weixin.qq.com/s?k=ACoAYgezAAwE99pINf
年費(fèi)版報(bào)價(jià)單:https://drive.weixin.qq.com/s?k=ACoAYgezAAwFouDIB4#/
我們?yōu)g覽網(wǎng)頁(yè)時(shí)可能需要把網(wǎng)頁(yè)上的內(nèi)容保存下來(lái),這時(shí)候有幾種方式可以做到:1、把重要的內(nèi)容復(fù)制出來(lái);2、對(duì)網(wǎng)頁(yè)進(jìn)行截圖保存,我們推薦過(guò)的截圖插件如印象筆記·剪藏、Full Page Screen Capture等;3、把網(wǎng)頁(yè)保存成PDF,如Adobe Acrobat。4、直接把網(wǎng)頁(yè)保存成HTML。當(dāng)然所有瀏覽器都有另存頁(yè)面為HTML 文檔的功能,不過(guò)可能會(huì)遇到一些問(wèn)題,保存后不是各種資源如JS、CSS和圖片的文件很多,就是打開(kāi)后無(wú)法載入樣式表,圖片顯示不出來(lái),要把網(wǎng)頁(yè)備份起來(lái)或傳送給別人就很麻煩。本文要介紹的SingleFile是一款免費(fèi)瀏覽器擴(kuò)展,可以將完整的頁(yè)面保存到一個(gè)HTML文件中,包括所有CSS和圖片等等,讓用戶即使在一個(gè)HTML文檔中也能瀏覽完整內(nèi)容。除了單一頁(yè)面外,SingleFile還支持保存選中的部分、非固定標(biāo)簽頁(yè)或所有頁(yè)面,操作上也非常的簡(jiǎn)單易用。如果你有保存頁(yè)面的需求,可以試試這款插件。
簡(jiǎn)介
SingleFile
*請(qǐng)認(rèn)真填寫(xiě)需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。