Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 精品久久久久国产免费,www.亚洲精品.com,www.亚洲一区

          整合營銷服務商

          電腦端+手機端+微信端=數據同步管理

          免費咨詢熱線:

          Java 將HTML轉為XML

          文介紹如何通過Java后端程序代碼來展示如何將html轉為XML。此功能通過采用Word API- Free Spire.Doc for Java 提供的Document.saveToFile()方法來實現;該方法支持的目標文檔格式多達 30余種。另外,該API也提供了多種方法,如Document.saveToEpub()Document.saveToFile()Document.saveToImages()Document.saveToSVG()Document.saveToTxt()、Document.saveToTiff()等,可用于將源文件轉為Epub、圖片、文本文件等目標文檔格式。

          下面,將以html轉為xml格式為例,介紹如何實現轉換。以下是詳細方法及步驟。


          【關于如何導入jar包】

          通過 Maven倉庫 下載導入,如下配置pom.xml:

          <repositories>
              <repository>
                  <id>com.e-iceblue</id>
                  <url>https://repo.e-iceblue.cn/repository/maven-public/</url>
              </repository>
          </repositories>
          <dependencies>
              <dependency>
                  <groupId>e-iceblue</groupId>
                  <artifactId>spire.doc.free</artifactId>
                  <version>5.2.0</version>
              </dependency>
          </dependencies>

          如需手動導入,需要下載 jar包 到本地,然后解壓,找到lib文件夾下的Spire.Doc.jar文件。在IDEA中打開“Project Structure”界面,執行如圖步驟將本地路徑下的jar文件手動引入Java程序:


          【將HTML轉為XML】

          轉換時,可參考如下代碼步驟:

          • 創建Document類的對象。
          • 調用Document.loadFromFile(String fileName, FileFormat fileFormat)方法加載HTML文件。
          • 通過Document.saveToFile(String fileName, FileFormat fileFormat)方法保存為XML格式到指定路徑。

          Java

          import com.spire.doc.*;
          
          public class HTMLtoXML {
              public static void main(String[] args) {
                  //創建Document類的對象
                  Document doc = new Document();
          
                  //加載html文件
                  doc.loadFromFile("sample.html",FileFormat.Html);
          
                  //保存為XML格式
                  doc.saveToFile("HTMLtoXML.xml", FileFormat.Xml);
              }
          }

          轉換效果:

          —END—


          原文出處:https://www.cnblogs.com/Yesi/p/16392430.html

          如果本文對你有幫助,別忘記給我個3連 ,點贊,轉發,評論,

          學習更多JAVA知識與技巧,關注與私信博主(555),即可免費領取

          文以C#及VB.NET后端程序代碼示例展示如何將HTML轉為XML文件。轉換時,調用Word API -Free Spire.Doc for .NET 提供的文檔加載方法及文檔保存的方法來實現。轉換的代碼步驟很簡單,具體可參考以下內容。


          引入dll

          1.通過NuGet安裝dll(2種方法)

          1.1可以在Visual Studio中打開“解決方案資源管理器”,鼠標右鍵點擊“引用”,“管理NuGet包”,然后搜索“Free Spire.Doc”,點擊“安裝”。等待程序安裝完成。

          1.2將以下內容復制到PM控制臺安裝:

          Install-Package FreeSpire.Doc -Version 10.2

          2.手動添加dll引用

          可通過手動下載包到本地,然后解壓,找到BIN文件夾下的Spire.Doc.dll。然后在Visual Studio中打開“解決方案資源管理器”,鼠標右鍵點擊“引用”,“添加引用”,將本地路徑BIN文件夾下的dll文件添加引用至程序。


          將HTML轉為XML

          轉換時,可參考如下代碼來進行:

          1. 創建Document類的對象。
          2. 調用Document.LoadFromFile(string fileName, FileFormat fileFormat)方法加載HTML文檔。
          3. 通過Document.SaveToFile(string fileName, FileFormat fileFormat)方法保存為XML格式到指定路徑。

          C#

          using Spire.Doc;
          
          namespace HTMLtoXML
          {
              class Program
              {
                  static void Main(string[] args)
                  {
                      //創建Document類的對象
                      Document doc = new Document();
          
                      //加載html文件
                      doc.LoadFromFile("sample.html",FileFormat.Html);
          
                      //保存為XML格式
                      doc.SaveToFile("HTMLtoXML.xml", FileFormat.Xml);
                      System.Diagnostics.Process.Start("HTMLtoXML.xml");
                  }
              }
          }

          vb.net

          Imports Spire.Doc
          
          Namespace HTMLtoXML
              Class Program
                  Private Shared Sub Main(args As String())
                      '創建Document類的對象
                      Dim doc As New Document()
          
                      '加載html文件
                      doc.LoadFromFile("sample.html", FileFormat.Html)
          
                      '保存為XML格式
                      doc.SaveToFile("HTMLtoXML.xml", FileFormat.Xml)
                      System.Diagnostics.Process.Start("HTMLtoXML.xml")
                  End Sub
              End Class
          End Namespace

          轉換效果:

          —End—

          求場景:

          公司某個站點刪除大量稿件,但是這些稿件已經被百度收錄,這樣用戶訪問將會出現404,用戶體驗不太好,所以需要將刪除的稿件生成為xml格式文件,并且每個文件為5000條數據,然后提交至百度進行收錄刪除。

          普通文件:

          https://www.abc.com/html/ys/13003183/20191115/123456.html

          https://www.abc.com/html/ys/13003183/20191115/123765.html

          https://www.abc.com/html/ys/13003183/20191115/567567.html

          https://www.abc.com/html/ys/13003183/20191115/456456.html

          https://www.abc.com/html/ys/13003183/20191115/374456.html

          https://www.abc.com/html/ys/13003183/20191115/37456645.html

          xml格式文件:

          <urlset>

          <url> <loc> https://www.abc.com/html/ys/13003183/20191115/37404973.html </loc> </url>

          <url> <loc> https://www.abc.com/html/jb/13003184/20191115/37404988.html </loc> </url>

          <url> <loc> https://www.abc.com/html/jb/13003184/20191115/37404968.html </loc> </url>

          <url> <loc> https://www.abc.com/ylaq/13003182/20191115/37404860.html </loc> </url>

          <url> <loc> https://www.abc.com/ylaq/13003182/20191115/37404861.html </loc> </url>

          </urlset>

          腳本信息:

          cat xml.sh
          #!/bin/bash
          #
          sed -i 's/^/\<url\> \<loc\> /g' $1
          sed -i 's/$/ \<\/loc\> \<\/url\>/g' $1
          name=`echo $1 | awk -F"." '{print $1}'`
          echo $name
          split -l 5000 $1 ${name}_xml
          for filename in `find ./ -name "${name}_xml*"`
          do
           sed -i '1 i\\<urlset\>' $filename
           echo "</urlset>" >> $filename
           mv $filename ${filename}.xml
          done

          執行:

          sh xml.sh 文件名稱

          腳本講解:

          • 腳本使用sed對行首和行尾添加字段;
          • 定義變量去掉文件后綴名稱;
          • 使用split對文件進行分割;
          • 使用for循環對分割后的文件進行添加xml首部和尾部字段,然后進行重命名;

          主站蜘蛛池模板: 亚洲av成人一区二区三区在线观看 | 久久一区二区三区精华液使用方法| 无码精品人妻一区二区三区漫画 | 真实国产乱子伦精品一区二区三区 | 亲子乱av一区区三区40岁| 中文字幕在线精品视频入口一区| 日本精品一区二区三本中文| 亚洲AV无码一区二区三区牛牛 | 精品乱码一区内射人妻无码| 中文无码一区二区不卡αv| 中文字幕一区在线| 国产一区二区三区在线| 国产在线一区二区杨幂| 免费一区二区三区四区五区| 伊人久久精品一区二区三区| 色噜噜狠狠一区二区| 无码av人妻一区二区三区四区| 精品人伦一区二区三区潘金莲| 国产精品区一区二区三在线播放| asmr国产一区在线| 亚洲高清偷拍一区二区三区 | 蜜桃AV抽搐高潮一区二区| 成人中文字幕一区二区三区| 国产成人精品久久一区二区三区| 日韩精品一区二区亚洲AV观看| 国产精品日本一区二区在线播放| 久久精品岛国av一区二区无码| 久久精品免费一区二区三区| 亚洲熟妇av一区二区三区漫画| 国产综合无码一区二区辣椒| 久久一区二区精品| 亚洲视频一区在线观看| 精品国产精品久久一区免费式 | AA区一区二区三无码精片 | 中文字幕在线看视频一区二区三区| 国产suv精品一区二区33| 精品人妻中文av一区二区三区| 久久精品无码一区二区三区不卡| 夜夜高潮夜夜爽夜夜爱爱一区| 香蕉久久AⅤ一区二区三区| 中文字幕一区二区三|