Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 91网址在线播放,日韩精品网址,成人国产精品2021

          整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          html文件刪除如何恢復?恢復誤刪html文件教程

          tml文件即超文本標記語言文件文檔,是擴展名、后綴名為html的文件。超文本標記語言的結構包括頭部分(Head)、和主體部分(Body),其中頭部(head)提供關于網頁的信息,主體(body)部分提供網頁的具體內容。html文件能夠被多種網頁瀏覽器讀取,傳遞。我們可以使用電腦上自帶的記事本進行編輯htm文件。那么html文件刪除如何恢復?

          通常情況下當您從電腦存儲設備中刪除html文件時,該html文件會保存在回收站中。 可以根據需要通過單擊還原選項將其還原。 但是不好運的情況下,如果您清空回收站或文件未經過回收站、或使用永久刪除鍵Shift + Delete將文件刪除怎么恢復呢?我們可以通過使用數據恢復軟件來恢復。

          html文件刪除恢復步驟如下:

          1、首先到官網下載并安裝好云騎士數據恢復軟件(注意:軟件不能安裝在丟失盤中),打開云騎士數據恢復軟件,根據需要選擇恢復功能,這里選擇場景模式下的誤刪除文件。

          2、選擇好以后選擇需要恢復數據的分區,如果是外接設備則可以將它插入電腦中,或者通過讀卡器插入電腦,點擊開始掃描。

          3、掃描結束以后,你會發現有很多數據,這時我們可以通過文件類型進行查找,這里勾選其他文件類型,然后找到了需要的html格式文件。

          因為文件丟失后有可能會因各種原因受損,所以遵循先預覽再恢復原則,通過預覽模式判斷文件是否正常再進行恢復。對于無法預覽或者不支持預覽的是無法判斷數據是好的還是壞的,只能恢復出來才能進行查看的。

          4、接著在需要恢復的html文件前面進行勾選,選擇好以后點擊立即恢復按鈕。

          5、彈出設置文件路徑窗口,將文件存儲在安全區域中(如果存儲盤不夠內存,可以外接其他設備進行存儲),點擊確定按鈕。

          6、耐心等待文件導出完成,點擊查看即可查看恢復出來的html文件了。

          知識普及:

          導致html文件丟失常見幾種原因:

          采用來源于Internet的各種各樣沒經驗證的第三方應用程序也許會使您的html文件遭遇風險。

          偶爾在下載那些應用程序時,某些惡意病毒也許會進入系統并破壞html文件結構,亦或它們也許會刪除桌面上的所有html文件,因此致使大量數據丟失。

          在重新分區或調整硬盤大小時,那些html文件也許會遺失。在重新分區時,一個重大的錯誤也會刪除存儲了所必需文件的分區,例如DOC、PPT、XLSX和HTML。

          總結:以上就是html文件刪除恢復教程了,如果在軟件使用過程中有不懂的問題,可以咨詢專業的在線客服人員為您解答~

          本文來自 yqssjhf.com>> 創作不易,轉載請注明出處。


          愛的用戶們,您是否曾經為了刪除HTML文本中的多余內容而煩惱?是否曾經為了批量處理文本而感到困擾?現在,我們為您帶來了一款全新的HTML文本處理工具,它可以輕松解決您的問題!

          首先,在首助編輯高手的主頁面板塊欄里,選擇“文本批量處理”板塊。

          第二步,進入板塊欄里,我們要點擊上方功能欄里的“添加文件”即可

          第三步,在彈出來的文件夾里,將您要刪除內容的HTML文件進行導入進去

          第四步,然后在下方的功能欄里,選擇“刪除內容”功能。有兩種選項,第一種是:刪除行,第二種是刪除字,小編選擇的的是刪除字。

          第五步,選擇完畢之后,我們就可以看見里面還有分成兩個類型,,一種是:單個內容刪除,另一種是:多個內容刪除。小編選擇單個內容刪除

          第六步,然后就要在刪除內容里將要刪除的內容進行輸入,再點擊批量刪除內容,即可

          第七步,等上方的狀態欄顯示刪除單個內容成功,我們就可以打開文件進行查看,發現我們多余的內容已經刪除完畢了

          我平時的工作中,偶爾會用 Java 做一些解析HTML的工作。有的時候我需要刪除所有的HTML標簽,只保留純文字內容。這個問題在做過一些爬蟲工作的朋友來說很簡單。下面來說說,我們平時使用到的集中解析的方法。

          使用正則表達式

          通過爬蟲爬到的HTML內容,從程序角度來講,就是一個字符串。我們可以對其按照純文本處理的方式來處理。

          我們在做文本處理的時候,第一個想到的就是正則表達式。從一個字符串中刪除HTML,對于正則來說,還是比較簡單的。畢竟還是有固定的格式,比如“<...>”。

          我們常用的的正則就是 <[^>]> 或者 <.*?>

          我們在使用正則的時候,需要注意的是正則默認是貪婪匹配。也就是說,正則表達式<.*> 能夠匹配到更多的HTML內容,而不是單個標簽。

          現在,讓我們測試一下它是否能從HTML源中刪除標簽。

          正則測試刪除標簽1

          在我們測試刪除HTML標簽之前,首先讓我們創建一個HTML例子,例如example1.html

          <!DOCTYPE html>
          <html>
          <head>
              <title>這是標題</title>
          </head>
          <body>
              <p>
                  如果應用程序X沒有啟動,可能的原因是<br/>
                  1. <a href="https://maven.apache.org">Maven</a>沒有安裝<br/>
                  2. 磁盤空間不足<br/>
                  3. 內存不足
              </p>
          </body>
          </html>
          
          

          現在,讓我們寫一個測試,用String.replaceAll()來刪除HTML標簽。

          String html = ... // load example1.html
          String result = html.replaceAll("<[^>]`>", "");
          System.out.println(result);
          

          如果我們運行這個測試方法,我們會看到結果。

              這是標題
          
          
          
                  如果應用程序X沒有啟動,可能的原因是
                  1.Maven沒有安裝
                  2.磁盤空間不足
                  3.沒有足夠的內存
          

          輸出結果保留了剝離后的HTML的空白處。我們在處理提取的文本時,可以很容易地刪除或跳過這些空行或空白處。

          正則測試刪除標簽2

          我們剛才已經看到了,通過使用Regex來刪除HTML標簽是非常簡單。但是粗暴的使用這種方法會有很多問題,我們不能預測最終的結果會是怎么樣的。

          例如,一個HTML文檔可能有<script><style>標簽,而我們可能不希望在結果中出現它們的內容。

          此外,<script><style>、甚至是<body>標簽中的文本可能包含 <>字符。如果是這種情況,我們的正則方法可能會出錯。

          現在,讓我們看看另一個例子,比如example2.html

          <!DOCTYPE HTML>
          <html>
          <head>
              <title>這是標題</title>
          </head>
          <script>
              // some js function
          </script>
          <body>
              <p>
                  如果應用程序X沒有啟動,可能的原因是<br/>
                  1. <a
                      id="link"
                      href="http://maven.apache.org/">
                      Maven
                      </a> 沒有安裝<br/>
                  2. 磁盤空間不足 (<1G) <br/>
                  3. 內存不足(<64MB)<br/>
              </p>
          </body>
          </html>
          

          現在我們有一個<script>標簽和 <字符在<body>標簽內。

          如果我們對example2.html使用同樣的方法,我們會得到如下內容。

             這是標題
              // some js function
                  如果應用程序X沒有啟動,可能的原因是
                  1. 
                      Maven
                       沒有安裝
                  2. 磁盤空間不足 (
                  3. 內存不足(
          

          顯然,由于"<"字符的存在,我們丟失了一些文本。所以正則在處理文本的時候并不是萬能的。我們可以使用一些 HTML 解析器來做這些比較復雜的場景。

          使用Jsoup

          Jsoup 是一個流行的HTML解析庫,如果想要從一個HTML文檔中提取文本,我們可以簡單地調用Jsoup.parse(htmlString).text()

          在項目中使用的時候,我們首先需要添加 jsoup 的依賴庫,我們這里就通過maven的方式引入。

          <dependency>
              <groupId>org.jsoup</groupId>
              <artifactId>jsoup</artifactId>
              <version>1.14.3</version>
          </dependency>
          

          我們用 example2.html來測試一下。

          String html = ... // load example2.html
          System.out.println(Jsoup.parse(html).text());
          

          如果我們讓這個方法運行,它就會打印出來。

          這是標題 如果應用程序X沒有啟動,可能的原因是 1.Maven沒有安裝 2.沒有足夠的(<1G)磁盤空間 3.沒有足夠的(<64MB)內存
          

          從輸出結果可知,Jsoup已經成功地從HTML文檔中提取了文本。另外,<script>元素中的文本已經被忽略了。

          此外,默認情況下,Jsoup會刪除所有的文本格式和空白處,比如換行符。

          使用HTMLCleaner

          HTMLCleaner 也是一個HTML解析庫。

          首先,我們需要在pom.xml中添加HTMLCleaner 依賴。

          <dependency>
              <groupId>net.sourceforge.htmlcleaner</groupId>
              <artifactId>htmlcleaner</artifactId>
              <version>2.25</version>
          </dependency>
          

          我們可以設置[各種參數](http://htmlcleaner.sourceforge.net/parameters.php)來控制HTMLCleaner的解析行為。我們在這里使用HTMLCleaner在解析example2.html時跳過<script>元素。

          String html = ... // load example2.html
          CleanerProperties props = new CleanerProperties();
          props.setPruneTags("script");
          String result = new HtmlCleaner(props).clean(html).getText().toString();
          System.out.println(result);
          

          運行一下,HTMLCleaner將產生這樣的輸出。

          這是標題
          
          
          
                  如果應用程序X沒有啟動,可能的原因是:
                  1.Maven沒有安裝
                  2.沒有足夠的(<1G)磁盤空間
                  3.內存不足(<64MB)
          

          我們可以看到,<script>元素中的內容被忽略了, <br/>標簽轉換為提取的文本中的換行符。另外, HTMLCleaner 保留了HTML的空白內容。

          總結

          在這篇文章中,我們學習了幾種去除HTML的方法,我們需要注意的是,正則在文本處理的過程中并不是萬能的。


          主站蜘蛛池模板: 日本高清不卡一区| 一区二区乱子伦在线播放| 国产福利一区视频| 久久精品国产亚洲一区二区| 精品午夜福利无人区乱码一区| 午夜无码一区二区三区在线观看 | 日本不卡一区二区三区| 日本一区二区三区精品视频| 久久久久人妻精品一区二区三区 | 日韩毛片基地一区二区三区| 一区二区三区人妻无码| 亚洲一区二区三区在线播放| 人妻互换精品一区二区| 精品无码成人片一区二区98| 国产视频一区在线观看| 岛国无码av不卡一区二区| 杨幂AV污网站在线一区二区| 亚洲欧美国产国产综合一区| 曰韩人妻无码一区二区三区综合部| 久久se精品一区精品二区国产 | 99久久人妻精品免费一区| 国产a∨精品一区二区三区不卡| 精品一区二区三区在线播放| 国产精品综合一区二区| 亚洲AV噜噜一区二区三区| 无码人妻一区二区三区免费手机| 无码人妻精品一区二区三区在线 | 亚洲男女一区二区三区| 久久精品一区二区三区四区 | 国产av一区二区精品久久凹凸| 国产精品区一区二区三| 欧洲精品码一区二区三区| 国产伦精品一区二区三区在线观看 | 91精品一区二区| 精品亚洲AV无码一区二区三区| 国产日韩一区二区三区| 中文字幕一区日韩精品| 日韩视频免费一区二区三区| 日韩免费视频一区| 一级毛片完整版免费播放一区| 久久免费视频一区|