是時候為你的C#程序進行代碼混淆

因

不管是C#還是Java,都是可以通過反編譯工具,進行反編譯后查看源碼,這個源碼雖然不是真正意義的源碼,但和真正源碼的相差不是很大.如果是單純的Web還好一些.因為只需要部署到服務器上,也很少人能看到部署文件.所以相對要好一些.如果是C#做客戶端的話,是需要安裝到客戶機上的.所以還是需要對程序做一下處理,對程序代碼進行代碼混淆.

這里主要使用Obfuscator這個工具,Obfuscator是源碼開源.且也是國人Lex Li(已經出國)所寫.

在VS中如何使用Obfuscator

1.在Nuget中,搜索Obfuscator,并進行安裝

在Nuget瀏覽器中,搜索Obfuscator

2.創建obfuscar.xml,并設置該文件為較新復制

在屬性中,設置文件較新復制

3. 在obfuscar.xml中指定配置信息

<?xml version="1.0" encoding="utf-8" ?>
<Obfuscator>
  <!--輸入路徑-->
  <Var name="InPath" value="." />
  <!--輸出路徑:加密混淆過的路徑-->
  <Var name="OutPath" value=".\Obfuscator_Output" />
  <!--混淆代碼的參數-->
  <Var name="ReuseNames" value="false" />
  <Var name="HideStrings" value="false" />
  <Var name="KeepPublicApi" value="false" />
  <Var name="HidePrivateApi" value="true" />
  <!--要混淆的模塊-->
  <Module file="$(InPath)\ConsoleApp2.exe" />
</Obfuscator>

參數信息,可以看這里: https://docs.obfuscar.com/getting-started/configuration.html

4.在程序生成之后調用Obfuscar.通過VS的生成事件實現.

在VS中生成后事件,調用Obfusacr 并加載obfuscar.xml

5.在Obfuscator_Output目錄,通過反編譯工具JustDecompilte查看混淆過的程序.

使用反編譯工具JustDecompilte查看混淆過的代碼

在命令行中使用Obfuscator

Obfuscator可以不在VS中直接使用,Obfuscator是一個單純的代碼混淆工具. 上邊說過Obfuscator代碼是開源的.

在GitHub項目地址: git@github.com:obfuscar/obfuscar.git
在Gitee項目地址: https://gitee.com/junweihuang_admin/obfuscar.git

因為Gitee速度要快于GitHub,如果Gitee上有的話,還是優先使用Gitee. 如果Gitee上面沒有的話,就得去Github上.打開Obfuscar.sln解決方案.進行編譯.發現是無法編譯成功的.發現Obfuscator依賴Baml項目中.

在Baml項目中,發現這幾個不存在的.

發現Baml項目中,有4個文件不存在

在Obfuscator項目中的Obfuscator.cs發現ILSpy.BamlDecompiler.Baml命名:

發現了ILSpy.BamlDecompiler.Baml這個命名空間

便懷疑是不是缺的這幾個文件在IlSpy中呀!于是便把IlSpy源碼下載到本地,最終找到了這幾個文件.將這幾個文件拷貝到Baml項目中,嘗試編譯,果真是編譯成功了.

生成后的目錄:

Obfuscar代碼混淆工具,只需要將要混淆的程序放入Input路徑下,在obfuscar.xml修改指定,雙擊run.bat就可以了

Obfuscar.Console.exe使用:

將要混淆的程序集放入Input目錄中
修改obfuscar.xml指定要混淆的程序集(exe或dll)
雙擊run.bat

文分享的是一個動畫效果源碼，演示JS代碼是如何被加密的。

先看效果：

一般我們在進行JS加密時，提交原始代碼，緊接著就直接得到了加密代碼，混淆加密過程是黑盒狀態，是不被我們知道的。

這個動畫，用慢放的效果，逐幀演示了JS代碼在進行混淆加密時發生的變化。

比如：變量名變短、回車換行消失、空格刪除、消除注釋、函數調用變成自執行函數。

注：動畫演示的是JShaman專業版使用部分功能對JS代碼進行混淆加密的效果。

下面給出這個動畫完整源碼，保存為html文件即可使用：

<h2>動畫演示：JShaman是怎樣對JS代碼混淆加密的</h2>
<button onclick="mini_change();">開始</button><br>
<br>
<textarea id="js_code" style="width:800px; height:200px;font-size:19px;">
function get_copyright(){
    var domain="JShaman專注于JS代碼混淆加密";
    var from_year=2017;
    var the_copyright="(c)" + from_year + "-" + (new Date).getFullYear() + "," + domain;
    return the_copyright;
}
//輸出信息
console.log(get_copyright());
</textarea>
<br>
注：演示的是JShaman專業版部分效果
<script>

    var index=0;
    var js_code_textarea=document.getElementById("js_code");
    var change_matrix=[
        ["\n",""],
        ["    ",""],
        ["var domain","var _"],
        ["\n",""],
        ["    ",""],
        ["var from_year","var _2"],
        ["\n",""],
        ["    ",""],
        ["var the_copyright","var _3"],
        ["from_year","_2"],
        ["\n",""],
        ["    ",""],
        ["\n",""],
        ["the_copyright","_3"],
        ["domain","_"],
        ["\n",""],
        ["//輸出信息",""],
        ["\n",""],
        ["function get_copyright(){",""],
        ["}",""],
        ["get_copyright()","function(){"+`var _="JShaman專注于JS代碼混淆加密";var _2=2017;var _3="(c)" + _2 + "-" + (new Date).getFullYear() + "," + _;return _3;`+"}()"],
        [`var _="JShaman專注于JS代碼混淆加密";var _2=2017;var _3="(c)" + _2 + "-" + (new Date).getFullYear() + "," + _;return _3;`,""],
    ]
    
    function mini_change(){
        js_code_textarea.value=js_code_textarea.value.replace(change_matrix[index][0], change_matrix[index][1]);
        index++;
        console.log(index[0]);

        if(index >change_matrix.length-1){
            console.log("執行");
            eval(js_code_textarea.value);
            alert("演示完成");
            return;
        }else{
            setTimeout(mini_change,1000);
        }
    }
</script>

這段代碼中，應用了一些不錯的JS技巧，參考修改，也可以用來做其它文本演示動畫。

們已經學到很多反爬機制以及相應的反反爬策略。使用那些手段，其實已經完全可以完成絕大多數的爬蟲任務。但是，還是有極個別的情況下，會出現諸如 JS 加密和 JS 混淆之類的高深反爬機制。

如果不幸遇到這種反爬機制，一個明智之舉是給站長點個贊，然后恭恭敬敬選擇放棄，去別的地方找數據。

當然，還是那句話，我們可以選擇不爬，但是對付 JS 加密和 JS 混淆的方法卻不可以不會。

這里就以中國空氣質量在線檢測平臺為例，介紹 JS 加密和 JS 混淆的實現和破解方法。

要爬取的網站：https://www.aqistudy.cn/html/city_detail.html

這個網站正在升級，所以頁面無法正常顯示。這也意味著這個網站本身的 JS 解密是有問題的（如果沒問題就能顯示了），所以最后我們并不能完全解析出數據來。雖然如此，這個網站仍然是學習 JS 加密和 JS 混淆的相當不錯的平臺。

閑話少說，開始干活！

首先瀏覽器打開網頁，并打開調試臺的抓包工具。修改查詢條件（城市的名稱 + 時間范圍），然后點擊查詢按鈕，捕獲點擊按鈕后發起請求對應的數據包。點擊查詢按鈕后，并沒有刷新頁面，顯然發起的是 ajax 請求。該請求就會將指定查詢條件對應的數據加載到當前頁面中（我們要爬取的數據就是該 ajax 請求請求到的數據）。

分析捕獲到的數據包

提取出請求的 url：https://www.aqistudy.cn/apinew/aqistudyapi.php
請求方式：post
請求參數：d: 動態變化一組數據（且加密）
響應數據：是加密的密文數據

該數據包請求到的是密文數據，為何在前臺頁面顯示的卻是原文數據呢？

原來，在請求請求到密文數據后，前臺接受到密文數據后使用指定的解密操作（JS 函數）對密文數據進行了解密操作，然后將原文數據顯示在了前臺頁面。

接下來的工作流程：

首先先處理動態變化的請求參數，動態獲取該參數的話，就可以攜帶該參數進行請求發送，將請求到的密文數據捕獲到。

將捕獲到的密文數據找到對應的解密函數對其進行解密即可。

【重點】需要找到點擊查詢按鈕后對應的 ajax 請求代碼，從這組代碼中就可以破解動態變化的請求參數和加密的響應數據對應的相關操作。

找 ajax 請求對應的代碼，分析代碼獲取參數 d 的生成方式和加密的響應數據的解密操作。直接在頁面中，并沒有辦法直接找到發送 ajax 請求的函數的，因為它以及被封裝到別的文件中了。我們可以基于火狐瀏覽器定位查詢按鈕綁定的點擊事件。

抽絲剝繭，首先從 getData 函數實現中找尋 ajax 請求對應的代碼。在該函數的實現中沒有找到 ajax 代碼，但是發現了另外兩個函數的調用，getAQIData() 和 getWeatherData()。ajax 代碼一定是存在于這兩個函數實現內部。

另外，這里記住一個參數，type==’HOUR‘，它的含義是查詢時間是以小時為單位。這個參數我們后來會用到。

接下來我們就去分析 getAQIData() 和 getWeatherData()，爭取能夠找到 ajax 代碼。

我們找到這兩個函數的定義位置，還是沒有找到 ajax 請求代碼。不過我們卻發現它們同時調用了另外一個函數，getServerData(method,param,func,0.5)。它的參數的值可以為：

method 可以是 ‘GETCITYWEATHER’ 或者 ‘GETDETAIL’
params 的值是 {city, type, startTime, endTime}，也就是查詢條件
func 是一個匿名函數，看樣子是在處理數據。

下一步當然就要找 getServerData 函數了，看看那個函數里面有沒有我們一致想要的發送 ajax 請求的代碼。

我們嘗試著在頁面中搜索，卻找不到這個函數。很顯然，它是被封裝到其他 js 文件中了。這時，我們可以基于抓包工具做全局搜索。

好消息是，我們順利找到了 getServerData 函數！壞消息是，這貨長得一點也不像是函數。

這是因為，這段 JS 函數代碼被加密的。這種加密的方式，我們稱為 JS 混淆。

JS 混淆，也就是對核心的 JS 代碼進行加密。

JS 反混淆，則是對 JS 加密代碼進行解密。

接下來我們要做的，就是 JS 反混淆，讓這段我們看不懂的東西，顯現出廬山真面目。

我們用的方法十分簡單粗暴，也就是暴力破解。使用這個網站就可以實現對 JS 混淆的暴力破解：https://www.bm8.com.cn/jsConfusion/

將 getServerData 函數所在的那一整行代碼都復制過來，粘貼到這個網址的文本輸入框中，然后點擊開始格式化即可：

終于，我們看到了 getServerData 的代碼，并且在其中發現了發送 ajax 的請求：

function getServerData(method, object, callback, period) {
    const key=hex_md5(method + JSON.stringify(object));
    const data=getDataFromLocalStorage(key, period);
    if (!data) {
        var param=getParam(method, object);
        $.ajax({
            url: '../apinew/aqistudyapi.php',
            data: {
                d: param
            },
            type: "post",
            success: function (data) {
                data=decodeData(data);
                obj=JSON.parse(data);
                if (obj.success) {
                    if (period > 0) {
                        obj.result.time=new Date().getTime();
                        localStorageUtil.save(key, obj.result)
                    }
                    callback(obj.result)
                } else {
                    console.log(obj.errcode, obj.errmsg)
                }
            }
        })
    } else {
        callback(data)
    }
}

從這段代碼中，我們不難得出下面這幾個信息：

ajax 請求成功后獲得到的 data 是加密的響應數據（就是我們最開始通過抓包工具看到的那一串神秘的相應字符串），通過 decodeData(data) 函數，可以將加密的數據解密成我們需要的明文數據。
發送請求時攜帶的參數，也就是 d 對應的值 param 是通過 getParam(method, object) 函數返回動的態變化的請求參數。這兩個參數我們前面也分析過：參數 method 可以是 ‘GETCITYWEATHER’ 或者 ‘GETDETAIL’參數 object 則為 {city, type, startTime, endTime}，是我們的查詢條件我們當然還可以繼續最終下去，刨根問題找到它們究竟是通過什么方式進行加密和解密的。然后，使用 Python 代碼，重復這個加密和解密的過程，完成請求數據的生成和響應數據的解析過程。

但是我們并不打算這么做。因為再繼續深挖下去，難度將會陡然增加。此時我們已經很疲憊了，如果繼續下去恐怕要瘋掉。而且，JavaScript 和 Python 畢竟是兩種語言，它們之間的方法和各種包都不相同。JavaScript 能實現的，Python 未必能夠輕松完成。所以重新寫一個加密和解密的腳本，并不是明智之舉。

更好的解決方案是，我們提供請求的明文數據，通過網站自己的 JS 代碼進行加密，得到加密的請求參數。使用這個參數，我們發送請求給服務端。拿到加密的響應數據后，再通過網站的 JS 代碼進行解密。

也就是說，我們接下來需要做的就是要調用兩個 JS 函數 decodeData 和 getParam，并拿到返回結果即可。

現在的問題是，在 Python 程序中如何調用 JS 函數呢？

這就涉及到一個新的概念：JS 逆向。JS 逆向，也就是在 Python 中調用 JS 函數代碼。

能夠實現 JS 逆向的方式有兩種：

手動將 JS 函數改寫稱為 Python 函數并執行。
這種方法我剛剛談過了，并不現實。因為 JS 能實現的，Python 未必能夠輕易實現。而且畢竟還要重寫函數，比較麻煩。
使用固定模塊，實現自動逆向（推薦）。
一個很好用的實現 JS 逆向的 Python 庫是 PyExecJS。
PyExecJS 庫用來實現模擬 JavaScript 代碼執行獲取動態加密的請求參數，然后再將加密的響應數據帶入 decodeData 進行解密即可。
PyExecJS 需要在本機安裝好 nodejs 的環境。
PyExecJS 的安裝：

pip install PyExecJS

接下來，我們就可以生成加密的請求數據了。

首先，把我們解析出來的那串代碼保存到本地，比如名為 code.js 的文件中。在里面我們補充一個函數，比如名字叫 getPostParamCode，用來發起我們的數據請求。之所以這樣做是因為使用 PyExecJS 調用 JS 函數時，傳入的參數只能是字符串。而 getParam 方法的參數需要用到 JS 的自定義對象。

我們只需在 code.js 中加上下面的代碼即可：

function getPostParamCode(method, type, city, start_time, end_time) {
    var param={};
    param.type=type;
    param.city=city;
    param.start_time=start_time;
    param.end_time=end_time;
    return getParam(method, param)
}

然后，使用 PyExecJS 調用里面的 getParam 方法，將我們的請求數據加密：

# 模擬執行decodeData的js函數對加密響應數據進行解密
import execjs
import requests

node=execjs.get()

# 請求參數
method='GETCITYWEATHER'
type='HOUR'
city='北京'
start_time='2020-03-20 00:00:00'
end_time='2020-03-25 00:00:00'

# 編譯js代碼
file='code.js'    # js代碼的路徑
ctx=node.compile(open(file, encoding='utf-8').read())

# 將請求數據加密
encode_js=f'getPostParamCode("{method}", "{type}", "{city}", "{start_time}", "{end_time}")'
params=ctx.eval(encode_js)

# 使用加密的參數，發起post請求
url='https://www.aqistudy.cn/apinew/aqistudyapi.php'
response_text=requests.post(url, data={'d': params}).text

# 將響應數據解密
decode_js=f'decodeData("{response_text}")'
decrypted_data=ctx.eval(decode_js)    # 如果順利，返回的將是解密后的原文數據
print(decrypted_data)    # 執行會報錯：目前頁面中沒有數據。解密函數只是針對頁面中原始的數據進行解密。

自此，我們完成了 JS 加密和 JS 混淆的處理。這里我們總結一下這幾個概念：

JS 加密，也就是通過 JS 代碼，將數據進行加密處理，將明文數據變成密文數據。如果不能將其解密，密文數據將毫無用處。
JS 解密：通過 JS 代碼，將加密的數據解密，也就是將密文數據解析成明文數據。JS 解密是 JS 加密的逆過程。
JS 混淆：將 JS 代碼（比如 JS 函數）本身進行加密。
JS 反混淆：將加密了的 JS 代碼解密成常規的 JS 代碼。通常直接使用暴力破解即可。
JS 逆向（重要）：通過 Python 代碼調用 JS 的函數。

附，ajax 請求的各個數據的含義：

在線咨詢

上一篇：HTML5“低能耗”版本你用黑客也會用
下一篇：一個簡單的標準 HTML 設計參考

您的項目需求

*請認真填寫需求信息，我們會在24小時內與您取得聯系。

整合營銷服務商

是時候為你的C#程序進行代碼混淆

因

在VS中如何使用Obfuscator

在命令行中使用Obfuscator

您的項目需求