Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
要:hi,親愛的們,為了提高大家對軟件的認知能力,我們與報銷吧聯合推出了100款特色軟件欄目。發(fā)現100款各有特色的軟件,本次是第③期,風格特點“網頁應用”,我們通過大腦進行數據掃描了16個網頁工具庫、500+的網頁,收集整理出了6款網頁版的應用,涵蓋:圖片壓縮、格式轉換、視頻下載、詞云圖制作、文本轉語音、平面設計的網頁版工具,以及差旅報銷神器—報銷吧的鼎力支持,更多軟件我們會在后續(xù)不斷掃描網絡,通過大數據精準為你推送你喜歡熱愛的軟件。
圖片壓縮利器:TinyPNG
如何把網頁中要用到的圖片壓縮到最小,這是前端攻城師們在寫網頁時都會考慮的一個問題,本著控制空間體積以及圖片加載速度的,所以需要用到稍微方便和不太失真的圖片壓縮工具。當然,如果你經常和圖片打交道,你也會用得到。TinyPNG提供在線免費壓縮圖片,而且可以批量壓縮后打包下載,只需要簡單的兩步就可以把你要壓縮的PNG/JPG格式圖片壓縮到小很多又基本上不會影響圖片的質量。它還提供API服務,可以將任何JPEG或PNG圖像上傳到Tinify API進行壓縮,將自動檢測圖像的類型,并相應地使用TinyPNG或TinyJPG引擎進行優(yōu)化。Tinify API允許你壓縮和優(yōu)化JPEG和PNG圖像。
音頻格式轉換的工具:Media io
大家平時在用設備聽音樂時,經常會遇到因為音源不支持流媒體的格式時往往會把您想對一件美好事物欣賞的樂趣打消掉,今天小編在這里介紹一款如何轉換音頻格式的工具。Media io 是一個支持在線音頻格式轉換的工具,支持的輸出格式有MP3、WAV、WMA、OGG等150種格式,可選擇的音頻質量有320kbit/s、192kbit/s、128kbit/s、96kbit/s,讓用戶無需安裝任何工具即可實現在線轉換。第一步打開網站后選擇想要上傳的文件,支持URL鏈接,第二步選擇要輸出的格式和質量,最好點擊轉換按鈕,根據文件的大小等待的時間也不同,當然如果下載軟件的話也支持Youtube URL轉換,完成下載到本地即可。
視頻嗅探下載工具:Video Get
在線看視頻業(yè)已融入了人們的生活當中。但是總還是有些情況下,我們沒時間,或者斷網的情況下,還是希望能夠看到喜歡的視頻,這個時候當然只能夠祭出視頻下載軟件把視頻下到本地來看了。每個視頻巨頭其實都已經推出了自家的客戶端,也都帶了視頻下載功能,但我們有些時候還是需要一款通殺的視頻下載軟件,能夠支持多家視頻網站,能夠少裝點軟件。Video Get是一個在線視頻下載地址解析器,支持1000+ 網站,集合涵蓋了所有的視頻網站,如Youtube、優(yōu)酷、Facebook、土豆網、Instagram、推特、Twitch等,用戶只需要輸入目標視頻URL地址即可獲取,同類產品還有VideoGrabber、KeepVid、SaveFrom等。
詞云圖制作生成工具:圖悅
詞云圖,也叫文字云,是對文本中出現頻率較高的“關鍵詞”予以視覺化的展現,詞云圖過濾掉大量的低頻低質的文本信息,使得瀏覽者只要一眼掃過文本就可領略文本的主旨。經常在各個媒體,微信圈,個人博客看到類似于這樣的圖片。第一感覺就是很漂亮,接著就在想這個東西是怎么做到的,覺得非常有意思。圖悅是一款在線詞云圖制作工具,同類產品還有(WordArt.com、Tagxedo)該系統(tǒng)能根據熱詞詞頻、熱詞權重輸出詞云圖,詞云圖輸出支持四種模式:標準模式、微信模式、地圖模式和導出EXCEL模式。
文本實時轉換語音:百度廣播開放平臺
有時候我們需要把文字轉換成語音,以方便在播放器中播放,但是大部分軟件都是收費的,生成的語音文件無法下載。特別是需要在電臺、微信公眾號運營的小伙伴能用得到。見多了語音并可轉化為文字的工具,但是我們也需要文字轉語音吶。這時我們可以考慮使用百度廣播開放平臺輕松的把文字轉換成語音。百度廣播開放平臺是一款在線的文本實時轉換語音工具。采用更為逼真的人聲與斷句模式,有效的將文本轉化為語音,并在云端直接生成語音文件,便于分享和轉發(fā)。我們也可以點擊“輸入URL”標簽 ,在新頁面中輸入網址,就可以把該網頁的文字生成語音了。
免墊資的差旅報銷工具:報銷吧
現在基本每一家公司都少不了各種發(fā)票報銷,公司的行政采購、營銷廣告花費、差旅出差等,還有公司經常有一些飯補、交通補貼、住房補貼,但是需要搞定各種發(fā)票進行報銷,粘貼發(fā)票比較麻煩,怎么辦?報銷吧這款神奇的報銷軟件就可以幫助你有效提高報銷效率,只要手機掃描一下,1秒就可自動識別和保存發(fā)票信息,不再擔心貼票了。當然,平時我們商務、銷售、市場、活動、老板人員出差要訂票、打車、住酒店,而報銷吧整合國內的眾多旅游服務商,比如:飛鶴航空、攜程與同程網的機票酒店、滴滴出行企業(yè)版、京東企業(yè)購等,一款軟件內可以實現商務出差全過程,從出差到報銷,無需再下載多個軟件應用,只需一個報銷吧,就可以實現應用內一站式預訂機票、酒店、火車及打車和出差比價的功能,要說提高效率,出差就能“免墊資、免發(fā)票、免報銷”。
傻瓜式的平面設計工具:創(chuàng)客貼
工作中需要制作各種海報、淘寶主圖、名片、PPT、簡歷、宣傳單、易拉寶、邀請函、信息圖表,但是自己不會做,麻煩別人也不行,這款在線工具可以幫你傻瓜式的做設計。選擇對應的平面設計素材,無需任何PS基礎通過簡單的托拉拽就可以設計出自己想要圖片。創(chuàng)客貼是一款簡單易用的線上圖形設計工具,平臺上提供了豐富的圖片、模板等素材,通過簡單的拖拉拽操作就可以輕松設計出精美的海報、PPT、邀請函、信息圖和名片等各類圖片,提供了圖片框架、條幅、線條、形狀、箭頭、對話氣泡、信息圖、手繪、裝飾等16種組件分類。
100款各有特色的軟件:這是一個新欄目,我們通過網絡(apple store、軟件站、fnd.io等渠道)幫助你挖掘100款各有特色的軟件,每天為你奉上6款不同“特色”的主題軟件推薦,涵蓋工作辦公、效率生產、生活常用、商務出行等等,不限于移動端、網頁版、電腦版系列軟件,以此提高你的效率與軟件見識,關注吐槽哥,隨時掌握一手軟件信息源頭。
之前的稍后讀專題中,愛范君介紹了一系列的稍后讀工具,它們具有的標注功能,能夠讓用戶初步整理網頁內容中的有效信息——不過,這些標注都是建立在提取后的正文內容之上,因而只適用于能夠提取到有效內容的網頁,具有較大的局限性。
對原始網頁直接進行標注則顯然不需要考慮對各種網頁復雜的適配問題。電腦端如 Chrome,Edge 等瀏覽器擁有各種類型的強大插件。Hypothesis 便是一款能直接在網頁上進行標注的強大插件,關于它的具體使用方法可以在我們之前的文章中查看。
▲ Hypothesis 插件
iPad 相較電腦更為輕巧便攜,且與 Apple Pencil 搭配使其具有了更好的書寫體驗以及對圖像文檔的標注能力。一系列如 Notability,PDF Expert,Procreate 等的優(yōu)秀軟件覆蓋了筆記,PDF 閱讀,繪畫這些常用的領域,從而讓 iPad 相較于其它同類產品獨特的優(yōu)勢。
然而我們卻很難在 iPad 上找到一款和 Hypothesis 類似功能的工具。較為出名的 LINER 和 Diigo 在 iPad 上可以使用,然而解鎖其完整版需要高昂的訂閱費。
直到最近,愛范君發(fā)現了一款具備網頁標注功能且完全免費的瀏覽器 Command Browser,且可以連接 Notion,OneNote 來同步高亮和批注的內容。
▲ Command Browser 官網
接下來,就跟我們一起了解下 Command Browser。
使用 Command Browser 瀏覽網頁的過程中,選中文本段落即會彈出功能菜單,選擇「Highlight」便可高亮選中的文本。
▲ 選中文本進行高亮
高亮默認的顏色為黃色,在軟件設置里還可以切換為藍色,綠色,紅色和淺黃色。相比在選中文本的彈出菜單里直接進行切換,目前的高亮顏色切換使用步驟較為繁瑣。且在設置里切換高亮顏色后所有網頁標注都會更改為新顏色,從而用戶不能同時使用多種顏色來標記不同內容。
▲ 切換高亮顏色
用戶可以對高亮的文本添加標簽和筆記,記錄的筆記可以選擇保存至自己創(chuàng)建的不同分類中,方便之后的查閱和整理。
▲ 選擇已高亮文本,可以進一步添加筆記和標簽
▲ 對高亮文本添加筆記并保存到建立的不同分類中
▲ 為高亮內容添加標簽
除了支持文本的批注,Command Browser 也支持向圖片和整個網頁添加筆記。添加的筆記同樣也可以到不同分類的筆記本中。
▲ 為圖片添加筆記
▲ 為整個網頁添加筆記
在 Command Browser 中點擊右上角的多功能按鈕并選擇「Highlights」,即可查看到所有高亮的內容,且下方也以標簽的形式進行了歸類。
▲ 查看高亮過的所有內容
在具體的標簽下即可看到所有同一標簽的高亮文本,點擊高亮文本后會直接跳轉至對應的原始網頁段落位置。
▲ 從高亮內容跳轉到原文位置
點擊左上角的書籍圖標或選擇右上角多功能按鈕下的「Journals」子選項都能進入筆記界面。在該界面可以看到之前所有針對文本,圖片和網頁的批注內容。相似的,用戶也能通過點擊日記本中保存的筆記內容跳轉到筆記在原文中所對應的位置。同時,用戶在筆記本中也可以添加獨立于網頁內容的筆記。
▲ 筆記界面,用戶可對自己建立的筆記本進行置頂,默認置頂筆記本為軟件操作演示
在包含高亮文本的網站下,選擇右上角多功能按鈕下的「Share」能夠將高亮過的段落以網頁鏈接的形式分享出去,同時也可以導出高亮段落為指定格式以及分享到其它如 Obsidian,Bear 等筆記應用中。
▲ 分享或導出當前網頁的高亮內容
▲ 以網頁形式分享的高亮文本
▲ 將高亮內容以純文本,Markdown 的形式導出或發(fā)送至其它應用中
在筆記界面,點擊筆記本標題下方的「Export」按鈕即可將該筆記本中高亮和批注內容導出到 Obsidian, Bear 等應用中。
▲ 導出某個筆記本中的內容
▲ 將筆記導入至 Obsidian 的效果
除了支持將高亮和筆記導出, Command Browser 還支持將高亮和標注實時同步至 Notion,OneNote 等應用中。高亮內容支持同步的應用有 Notion,Readwise 和 RemNote,綁定高亮內容和圖片的筆記則支持通過 Notion 和 OneNote 同步。
▲ 筆記內容可同步至 Notion 和 OneNote
值得注意的是,高亮內容的同步和筆記的同步是分離的。以和 Notion 同步為例,同步高亮到 Notion 中會生成一個名為「Command」的主文檔,其中的子文檔以網頁文章標題為文件名,文檔內容包括原始鏈接,高亮文本及與之綁定的標簽。
▲ 高亮內容同步至 Notion 中的效果
而同步筆記則會生成名為「Journals」的主文檔,其子文檔為用戶建立的筆記本名稱。筆記的同步存在許多問題,例如在同一個網頁中的筆記不能合并為一份,而是每一個筆記都被單獨的羅列出來,沒有按照網址進行歸類,且不能顯示筆記對應的標簽信息。
▲ Notion 中筆記本目錄下單個筆記是獨立展示的,沒有按照網頁進行分類
Command Browser 支持將網頁和筆記頁面劃分到不同的自定義工作空間,方便用戶根據使用場景快速找到某一類型的網頁。點擊最右上角的圖標可以查看當前工作空間的所有標簽頁,用戶也可以選擇將當前工作空間的網頁移動至其它工作空間。
▲ 移動當前網頁至其它工作空間
Command Browser 支持私密標簽頁,其中的網頁需要經過生物識別解鎖之后才可查看。在應用設置里還可以進一步設置私密標簽頁的鎖定時間。
▲ 生物識別解鎖私密標簽頁
Command Browser 也支持閱讀模式,在閱讀模式下也可進行標注。相比 Safari 的閱讀模式,Command Browser 閱讀模式下網頁圖片的寬度不會延伸至屏幕邊緣,排版體驗較好。
▲ 閱讀模式對比,左圖為 Safari 閱讀模式,右圖為 Command Browser 閱讀模式
作為 iPad 上一款完全免費且具有網頁標注功能的瀏覽器,Command Browser 基礎標注體驗已具有較高的可用性,且使用 Apple Pencil 的「隨手寫」可以方便的為高亮內容添加批注。Command Browser 還提供了豐富的標注導出選項。更進一步地,它還能夠通過 Notion 等應用來實時同步高亮內容和筆記。
然后它現階段并不完美,如高亮顏色的切換步驟較多,且無法實現多種高亮顏色共存;為高亮內容添加標簽時會偶爾出現整個應用卡住,需要重新啟動才能繼續(xù)使用;批注筆記在 Notion 中的呈現過于碎片化,沒有如同高亮一樣依據網頁鏈接進行歸類。默認的搜索引擎為谷歌,在國內無法正常使用,需要切換到 Bing 才可進行搜索。
如果你對在 iPad 上對網頁內容進行標注有需求或者感興趣,那么不妨嘗試一下這款應用。
*《Command Browser》在 App Store 得 4.4 分。支持 iPhone,iPad,大小為 48.1MB,免費下載,無內購。
這個信息爆炸的時代,我們每天都會接觸到大量的網絡數據。有時候我們需要獲取一些特定的數據來進行分析或者處理。作為一個程序員,我曾經親身體驗了使用JAVA編程語言來抓取網頁數據的過程。下面我將分享我在這個過程中遇到的挑戰(zhàn)和解決方案。
一、背景概述
首先,讓我們來了解一下什么是抓取網頁數據。簡單來說,抓取網頁數據就是通過編程的方式從互聯網上獲取網頁上的內容。這些內容可以是文本、圖片、鏈接等等。而JAVA是一種廣泛應用于開發(fā)各種類型應用程序的編程語言,也是我選擇用來實現網頁數據抓取的工具。
二、選擇合適的工具
在開始之前,我首先需要選擇一個合適的工具來輔助我完成任務。幸運的是,JAVA提供了許多強大的庫和框架,可以幫助我們輕松地實現網頁數據抓取功能。其中最常用和流行的工具就是Jsoup。Jsoup是一個開源的JAVA HTML解析器,可以方便地從HTML文檔中提取所需內容。
三、分析目標網頁結構
在開始編寫代碼之前,我需要先分析目標網頁的結構。這是因為不同的網頁結構可能需要使用不同的方法來獲取數據。通過查看目標網頁的源代碼,我可以了解到它的HTML結構和標簽使用情況。在分析過程中,我發(fā)現目標網頁中的數據都被包含在特定的HTML標簽中,這對我編寫代碼來提取數據非常有幫助。
四、編寫JAVA代碼
接下來,我開始編寫JAVA代碼來實現網頁數據抓取功能。首先,我需要導入Jsoup庫,并建立與目標網頁的連接。然后,通過選擇合適的HTML標簽和屬性,使用Jsoup提供的API來獲取所需數據。例如,如果我需要獲取所有標題為
Document doc = Jsoup.connect("目標網址").get(); Elements titles = doc.select("h1"); for (Element title : titles){ System.out.println(title.text()); }
通過以上代碼,我可以輕松地獲取到目標網頁中所有
五、處理異常情況
在編寫代碼的過程中,我也遇到了一些異常情況。例如,有時候目標網頁會進行反爬蟲處理,限制訪問頻率或者要求登錄驗證。為了解決這些問題,我需要添加一些額外的代碼來模擬瀏覽器行為,例如設置User-Agent頭和處理Cookie等。此外,還需要注意異常處理,確保代碼的穩(wěn)定性和健壯性。
六、優(yōu)化性能
為了提高網頁數據抓取的效率和性能,我還進行了一些優(yōu)化工作。首先,我使用多線程技術來并發(fā)地抓取多個網頁,以減少等待時間。其次,我使用連接池來管理與目標網頁的連接,避免頻繁地創(chuàng)建和銷毀連接。最后,我對代碼進行了適當的優(yōu)化和緩存處理,以減少不必要的資源消耗。
七、總結與展望
通過使用JAVA抓取網頁數據的親身體驗,我深刻理解到了編程技術在信息獲取和處理中的重要性。通過合理選擇工具、分析網頁結構、編寫代碼、處理異常情況和優(yōu)化性能,我們可以輕松地實現網頁數據抓取功能,并為后續(xù)的數據分析和應用提供強有力的支持。未來,我將繼續(xù)探索更多關于JAVA抓取網頁數據的技巧和方法,并將其應用到實際項目中。
以上就是我親身體驗使用JAVA抓取網頁數據的故事。希望這篇文章能夠對想要學習或者應用這方面技術的讀者有所幫助。編程的世界充滿了無限的可能性,讓我們一起努力,不斷探索和創(chuàng)新!
*請認真填寫需求信息,我們會在24小時內與您取得聯系。