Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
在數(shù)字信息的海洋中,文字是連接過(guò)去與未來(lái)的橋梁。然而,當(dāng)這些文字被囚禁在圖像和PDF的牢籠中時(shí),它們便失去了自由流動(dòng)的力量。在這個(gè)世界里,有一個(gè)名為Umi的OCR軟件,它如同一位解放者,將文字從束縛中解救出來(lái),賦予它們新的生命。
初春的午后,陽(yáng)光透過(guò)半開(kāi)的窗簾,灑在了李明的辦公桌上。他的目光落在了電腦屏幕上,那里顯示著一份密密麻麻的英文報(bào)告。作為一名數(shù)據(jù)分析師,他每天都要處理大量的文檔,從中提取關(guān)鍵信息。但是,今天的工作似乎比往常更加繁重,因?yàn)檫@份報(bào)告是掃描版的PDF,文字被牢牢地鎖定在圖像之中。
李明嘆了口氣,他知道這意味著他需要手動(dòng)輸入這些文字,或者尋找一種方法將它們轉(zhuǎn)換成可編輯的文本。他記得曾經(jīng)聽(tīng)說(shuō)過(guò)OCR技術(shù),但市面上的軟件要么價(jià)格昂貴,要么需要依賴網(wǎng)絡(luò)連接。作為一名對(duì)技術(shù)充滿好奇心的人,他決定自己動(dòng)手,尋找一個(gè)解決方案。
他打開(kāi)了瀏覽器,輸入了“離線OCR軟件”幾個(gè)字,屏幕上立刻跳出了無(wú)數(shù)個(gè)搜索結(jié)果。就在這時(shí),一個(gè)名為“Umi-OCR”的軟件吸引了他的注意。根據(jù)網(wǎng)頁(yè)上的描述,這是一款免費(fèi)、開(kāi)源且支持批量操作的離線OCR軟件,它支持Windows和Linux系統(tǒng),并且內(nèi)置了多國(guó)語(yǔ)言庫(kù)。
李明的心跳微微加速,他感到一種探險(xiǎn)者發(fā)現(xiàn)新大陸般的興奮。他點(diǎn)擊了下載鏈接,一個(gè)小巧的.7z壓縮包很快就下載完成了。他雙擊文件,解壓到了桌面上的一個(gè)新建文件夾中。
軟件的界面簡(jiǎn)潔而直觀,沒(méi)有過(guò)多的裝飾,給人一種專業(yè)而高效的感覺(jué)。李明注意到界面的右上角有一個(gè)齒輪圖標(biāo),他點(diǎn)擊了它,進(jìn)入了全局設(shè)置。在這里,他可以調(diào)整軟件的各種參數(shù),包括語(yǔ)言、主題、字體大小,甚至是OCR插件的選擇。
他選擇了中文作為界面語(yǔ)言,軟件立刻響應(yīng)了他的選擇,所有的菜單和提示都變成了熟悉的中文。李明滿意地點(diǎn)了點(diǎn)頭,然后切換到了“截圖OCR”標(biāo)簽頁(yè)。他閱讀了使用說(shuō)明,了解到他可以通過(guò)快捷鍵喚起截圖功能,然后軟件會(huì)自動(dòng)識(shí)別圖中的文字。
他決定先做一個(gè)小測(cè)試。李明打開(kāi)了一個(gè)新的截圖工具,截取了報(bào)告的第一頁(yè),然后將圖片復(fù)制并粘貼到了Umi-OCR中。軟件立刻響應(yīng),開(kāi)始處理圖片。幾秒鐘后,屏幕上顯示出了識(shí)別結(jié)果,文字被整齊地排列在了窗口的右側(cè)。
李明仔細(xì)對(duì)比了原文和識(shí)別結(jié)果,發(fā)現(xiàn)準(zhǔn)確率相當(dāng)高,只有極少數(shù)的地方需要手動(dòng)修正。他的心情變得激動(dòng)起來(lái),這正是他所需要的工具。他開(kāi)始想象,有了Umi-OCR,他的工作效率將大大提高,再也不需要為處理掃描文檔而煩惱。
他繼續(xù)探索軟件的其他功能。在“批量OCR”標(biāo)簽頁(yè)中,他看到了支持多種圖片格式的選項(xiàng),以及文本后處理的功能,這可以讓識(shí)別后的文本更加適合閱讀和使用。他還發(fā)現(xiàn)了“忽略區(qū)域”的功能,這在處理含有水印或頁(yè)眉頁(yè)腳的文檔時(shí)非常有用。
在“文檔識(shí)別”標(biāo)簽頁(yè)中,李明發(fā)現(xiàn)Umi-OCR不僅能處理圖片,還能識(shí)別PDF和其他電子文檔中的文字。他嘗試著打開(kāi)了報(bào)告的PDF版本,軟件很快就完成了識(shí)別,并且提供了雙層可搜索的PDF輸出選項(xiàng)。
最后,他在“二維碼”標(biāo)簽頁(yè)中發(fā)現(xiàn)了掃碼和生成碼的功能。雖然這與他的工作不直接相關(guān),但李明覺(jué)得這是一個(gè)很有趣的額外功能。
當(dāng)李明關(guān)閉Umi-OCR的時(shí)候,窗外的夕陽(yáng)已經(jīng)開(kāi)始西下。他感到一種深深的滿足感,因?yàn)樗溃瑥慕裉扉_(kāi)始,他的工作方式將徹底改變。Umi-OCR不僅是一個(gè)軟件,更是一個(gè)解放者,它解放了被囚禁在圖像中的文字,也解放了李明的生產(chǎn)力。
上文使用AI潤(rùn)色軟件介紹,看官酌情輕噴,以下是軟件的正式介紹
軟件來(lái)源于開(kāi)源;文末有下載地址
簡(jiǎn)介:
OCR , free and offline. 開(kāi)源、免費(fèi)的離線OCR軟件。支持截屏/批量導(dǎo)入圖片,PDF文檔識(shí)別,排除水印/頁(yè)眉頁(yè)腳,掃描/生成二維碼。內(nèi)置多國(guó)語(yǔ)言庫(kù)。
適用環(huán)境:
適用于 x64 、Linux x64
使用方法/教程:
軟件發(fā)布包下載為 .7z 壓縮包或 .7z.exe 自解壓包。自解壓包可在沒(méi)有安裝壓縮軟件的電腦上,解壓文件。
本軟件無(wú)需安裝。解壓后,點(diǎn)擊 Umi-OCR.exe 即可啟動(dòng)程序。
界面語(yǔ)言
Umi-OCR 支持的界面多國(guó)語(yǔ)言。在第一次打開(kāi)軟件時(shí),將會(huì)按照你的電腦的系統(tǒng)設(shè)置,自動(dòng)切換語(yǔ)言。
如果需要手動(dòng)切換語(yǔ)言,請(qǐng)參考下圖,全局設(shè)置→語(yǔ)言/ 。
標(biāo)簽頁(yè)
Umi-OCR v2 由一系列靈活好用的標(biāo)簽頁(yè)組成。您可按照自己的喜好,打開(kāi)需要的標(biāo)簽頁(yè)。
標(biāo)簽欄左上角可以切換窗口置頂。右上角能夠鎖定標(biāo)簽頁(yè),以防止日常使用中誤觸關(guān)閉標(biāo)簽頁(yè)。
截圖OCR
截圖OCR:打開(kāi)這一頁(yè)后,就可以用快捷鍵喚起截圖,識(shí)別圖中的文字。
文本后處理
關(guān)于 OCR文本后處理 - 排版解析方案:可以整理OCR結(jié)果的排版和順序,使文本更適合閱讀和使用。預(yù)設(shè)方案:
上述方案,均能自動(dòng)處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)
批量OCR
批量OCR:這一頁(yè)用于批量導(dǎo)入本地圖片進(jìn)行識(shí)別。
忽略區(qū)域
關(guān)于 OCR文本后處理 - 忽略區(qū)域:批量OCR中的一種特殊功能,適用于排除圖片中的不想要的文字。
文檔識(shí)別
文檔識(shí)別:
二維碼
掃碼:
Aztec,Codabar,Code128,Code39,Code93,DataBar,,,EAN13,EAN8,ITF,,,,,PDF417,QRCode,UPCA,UPCE
生成碼:
全局設(shè)置
全局設(shè)置:在這里可以調(diào)整軟件的全局參數(shù)。常用功能如下:
調(diào)用接口:構(gòu)建項(xiàng)目第零步:(可選)fork本項(xiàng)目第一步:下載代碼
請(qǐng)參考 更新日志 開(kāi)頭的說(shuō)明。
后續(xù)步驟:
請(qǐng)?zhí)D(zhuǎn)下述倉(cāng)庫(kù),完成對(duì)應(yīng)平臺(tái)的開(kāi)發(fā)/運(yùn)行環(huán)境部署。
下載發(fā)行版
以下發(fā)布鏈接均長(zhǎng)期維護(hù),提供穩(wěn)定版本的下載。
?Scoop (點(diǎn)擊展開(kāi))
Scoop 是一款Windows下的命令行安裝程序,可方便地管理多個(gè)應(yīng)用。您可以先安裝 Scoop ,再使用以下指令安裝 Umi-OCR :
scoop bucket add extras
scoop install extras/umi-ocr
scoop install extras/umi-ocr-paddle
*請(qǐng)認(rèn)真填寫(xiě)需求信息,我們會(huì)在24小時(shí)內(nèi)與您取得聯(lián)系。