Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537 Warning: error_log(/data/www/wwwroot/hmttv.cn/caches/error_log.php): failed to open stream: Permission denied in /data/www/wwwroot/hmttv.cn/phpcms/libs/functions/global.func.php on line 537
策 發自 凹非寺
量子位 報道 | 公眾號 QbitAI
訓練一個簡易AI對話交互式機器人需要什么?
一篇文檔+3分鐘足矣。
在今年的世界人工智能大會(WAIC)上,我算是見識到了。整個開發過程沒有用到一句代碼。
先上傳一篇Word格式文檔:
不到3分鐘的時間里,一個簡易AI客服快速生成,然后你就可以和“她”聊天了:
這是一家提供對話AI平臺的公司的最新產品:輸入文檔便可讓AI自動生成知識圖譜,知其然更知其所以然,成為一個真正掌握知識的AI。
而且這家公司的CEO還撂下“狠話”:圖靈測試不重要。
“對話AI落地應用需要產生價值,需要解決企業或個人使用上的問題,而不是在是否通過圖靈測試的問題上糾結。”
這家公司便是由前微軟(亞洲)互聯網工程院副院長簡仁賢先生創辦的竹間智能,這款前所未見的AI新作便是竹間推出的Gemini(Knowledge Factory)知識工程平臺。
“雖然是機器人,但我們確實解決了問題。”
既然AI能提高效率,為什么一定要糾結讓聊天機器人通過圖靈測試呢?
或許過去產業界真的走了彎路。
3年前,有個聊天機器人算是小范圍通過了圖靈測試,那就是谷歌推出的Duplex,一個可以幫用戶預訂餐廳的AI。餐廳店員聽到Duplex,甚至認為就是顧客本人在訂位。
但是3年后呢?除了谷歌之外,我們幾乎看不到哪個商用的對話AI通過了圖靈測試。
畢竟不是每個企業都如谷歌般財大氣粗,揮著大量的數據集和算力把AI訓練到以假亂真。
圖靈測試早已不再是檢驗機器人智能的唯一標準,是時候轉變觀念了:“解決問題才是王道!”
在這個問題上,學術界和產業界默契地達成了一致。
最近,華盛頓大學和艾倫人工智能研究院提出:人工審核不應該還是自然語言生成(NLG)的“黃金標準”,AI生成文本更重要的是內容是否正確、合乎邏輯。
企業當然也是這么想的,現階段通過圖靈測試不經濟也不現實,既然人們已經接受了和AI對話,那么對話到底有沒有“機器感”已經沒那么重要了。
國內類似的呼聲也越來越多。竹間智能的創始人兼CEO簡仁賢同樣也認為:關注AI的“實用性”。
要讓AI實用,就必須要讓它掌握知識舉一反三。
給AI一篇骨關節文檔,讓它變成健康顧問。倘若把醫學文檔換成商品描述、說明書和用戶評論,那么就可以得到一個更智能的電商推薦系統,比如輸入“防風效果最好的夾克”來精確尋找符合需求的商品,而不是輸入商品名稱搜索。
而這僅僅是一篇文章產生的效果。可以想象,當你擁有一個儲量豐富的知識文庫,包含PDF、Word、PPT等不同類型、不同格式的文檔,把他們統統輸入到這個平臺里,就可以得到一個針對特定行業的全能咨詢師。
現實問題是,許多企業并不缺乏巨量文檔,缺乏的是挖掘數據的能力。如果能把信息挖掘出來形成知識圖譜,就可以產生非常大的作用。
而知識圖譜的作用,就是能從海量數據中簡潔快速地找到回答復雜業務問題的答案。
這些年,我們看到了很多計算機視覺(CV)、自然語言處理(NLP)這類感知AI的廣泛商用,卻較少看到像知識圖譜這類認知AI的商用,為什么?
“一個文檔可能有2萬多字、10萬多字,你可能有2萬個文檔、5萬個文檔需要去處理,怎么處理呢?傳統的知識圖譜技術是沒有辦法做到的,必須要成千上萬人,用人工去看文檔,一個字一個字看下來再去建圖譜,這個不現實?!?/p>
竹間智能CEO簡仁賢解釋道。
所以,市場急需一個能夠自動化構建知識圖譜的工具。
而竹間智能給出了自己的解決方案,就是一個自動化平臺——Gemini(Knowledge Factory)知識工程平臺,從讀文檔、自動構建圖譜到機器人自動回答,整個流程各環節無縫對接,只需要很少的人工干預。
無論你是來自醫療、制造業,還是金融、電商領域,都可以使用Gemini平臺打造屬于自己行業的知識圖譜。
“知識圖譜技術可以讓AI更加高效。在機器學習和深度學習方面減少很多不必要的數據標注以及訓練,讓深度學習模型具備可解釋性,也可以輔助多任務的機器學習,從而提升整體效率。”
簡仁賢說。
這便是知識圖譜在當今AI落地中的一大主要優勢。
竹間智能“野心”不小,而Gemini平臺的誕生也不是一蹴而就,甚至曾走過“彎路”。
2015年,從微軟離職的簡仁賢創立了竹間智能,公司最初選擇了當時最為熱門的面向消費者市場的聊天機器人。
事實證明,這是一條選手眾多且難以差異化競爭的道路。
面對2C市場商業化的難題,竹間智能在2016年果斷轉變方向,進軍2B市場,為企業開發0代碼的對話AI平臺。從那時起,竹間智能就已在開發知識圖譜技術。
一年前竹間智能累積大量落地經驗,發布了全新升級的Bot Factory,到現在,公司已經創建了6大技術、6大平臺產品、6大行業解決方案。
不過從另一種角度來看,竹間智能也并未走彎路,而是帶著2C的創業初期理想,一路探索,結合各行業實際需求,找到了B2B2C的寬闊道路。
憑借過去在NLP技術能力上的沉淀,竹間智能將知識圖譜的推理能力結合自然語言理解能力,幫助企業更快地找到答案。
在成熟的對話式交互短文本NLP能力之上,結合機器閱讀和知識工程的長文本NLP能力, 使機器人能處理繁瑣且需要大量知識儲備的業務,以知識圖譜為現在的商用AI賦予認知智能,實現知識管理、運營服務和智能應用的全鏈條打通。
另外,竹間智能今年還完成了“ALL-in-Cloud”的全面云化策略,將六大核心產品平臺悉數升級為云平臺,可滿足企業公有云、私有云及混合云的多種部署要求,應對行業云化趨勢。
通過適配不同應用場景的需求,竹間智能的產品已經被數百家大型企業所采用。
從創業至今6年,竹間智能的技術逐漸獲得了大廠認可,迄今為止已有金融、互聯網、政務、汽車等行業的數百家大型企業使用其服務。
C端用戶雖然不是竹間業務的直接服務對象,你卻可能早已在不知不覺中用過竹間的技術,華為、OPPO手機中的語音助手就有竹間的技術支持。
簡仁賢表示,某消費者電子產品的公司也正在用竹間智能來改進其產品。一個對話AI如何改進電子科技產品呢?
原來電子產品公司依靠竹間智能的Gemini知識工程平臺,打造VOC(Voice of Customer)系統,聆聽客戶之聲,全面收集電商平臺上的用戶評論,洞察度量用戶的產品使用與購物體驗,從而對下一代產品進行改進。
不僅能上天,竹間的AI技術還扎根老百姓,上海各地街道居委也在用竹間智能。
自從去年新冠疫情爆發以來,竹間智能利用語音機器人代替人工幫助徐匯區完成了外來務工人群的流調工作,通過2萬通/日的防疫電話撥打,AI自動記錄人員所在地、來訪地、身體等信息,鞏固防疫堡壘。今年竹間智能接到200萬個接種疫苗通知電話的需求,AI機器人快速搭建落地、即刻投入運行,極大地減少了社區一線服務人員的工作量。
值得一提的是,在WAIC 2021上,中國信通院與竹間智能聯合發布了《2021認知智能發展研究報告》,在這份報告中,中國信通院提出認知智能未來的三大趨勢:
一、認知智能將進一步成為AI產業發展熱點;
二、行業知識圖譜和關系挖掘將推動認知智能在行業中更深層次的落地應用;
三、自動化、多模態、標準化的特征進一步凸顯,主要表現在知識工程流程將加快實現自動化。
簡仁賢對認知智能的這條賽道充滿信心。認知智能未來將釋放出更大的價值,受益的也不僅僅是竹間,而是千千萬萬家企業,更是無數的用戶和消費者。
— 完 —
量子位 QbitAI · 頭條號簽約
關注我們,第一時間獲知前沿科技動態
器之心整理
參與:張倩、思
500 頁圖模型巨著,從圖、概率圖、統計和因果推理帶你縱覽神奇的圖模型。
對因果推理感興趣的讀者想必對圖靈獎得主 Judea Pearl 并不陌生,他的《The Book of Why: The New Science of Cause and Effect》詳細闡述了自己在因果推理領域的研究成果,深受國內外讀者的歡迎。近日,這位大牛在 Twitter 上推薦一本新書——《Handbook of Graphical Models》。
書籍鏈接:https://stat.ethz.ch/~maathuis/papers/Handbook.pdf
該書由多位世界知名的統計學家合作完成,整理了圖模型自上世紀 80 年代誕生以來的發展脈絡,可以為傳統數據科學工作者學習因果建模提供一份有價值的入門材料。
該書由 Marloes Maathuis(蘇黎世聯邦理工學院統計學教授)、Mathias Drton(華盛頓大學統計學教授)、Steffen Lauritzen(哥本哈根大學數理統計教授)、Martin Wainwright(加州大學伯克利分校統計學、電子工程與計算機科學教授)以及多位貢獻者合作完成。
本書的主要作者(從左至右:Marloes Maathuis、Mathias Drton、Steffen Lauritzen、Martin Wainwright)。
圖模型是什么?
圖模型是一種與圖相關的統計模型。圖的節點對應感興趣的隨機變量,邊編碼變量之間允許的條件依賴?;趫D模型的因式分解特性便于使用多元分布進行易于處理的計算,使得該模型成為許多應用中的有用工具。此外,有向圖模型容許直觀的因果解釋,已經成為因果推理的基石。
為什么要讀這本書?
雖然目前已經有很多關于圖模型的優秀書籍,但這一領域發展得如此之快,單個作者很難覆蓋其全部內容。而且,圖模型本來就是跨學科的,其成果來自多個學科,如統計學、計算機科學、電氣工程、生物學、數學和哲學。通過介紹這些領域領先的研究成果,這本新書可以讓我們看到圖模型的當前發展狀況。
書中寫了哪些內容?
全書共分為 5 大部分,包含 21 個章節:
第一部分介紹了與圖模型相關的基礎知識,包括圖如何編碼隨機變量之間的條件獨立性(變量聯合分布的因式分解)。
第二部分講如何基于特定圖模型進行高效計算,重點解釋了相關因式分解特性的利用。
第三部分將重點轉到統計推理問題,如學習圖和從可用數據中估計相關參數。
第四部分是關于有向無環圖的因果解釋。相關章節概覽了因果推理的圖方法基本概念,同時還討論了一些統計問題,如從數據中學習有向無環圖。
最后一部分介紹了圖模型在司法科學、生物學等學科中的應用。
了解了這本書的基本信息之后,我們來看一下書中的詳細內容。
圖的定義
整本書都是圍繞「圖」這一數據結構,而圖模型將圖中的節點視為隨機變量,將連接的邊視為獨立性關系,那么圖模型也就成為了一種強大的建模工具。
作為圖模型的基礎,我們先要了解「圖」的標準定義,因此我們可以看看在這本書中 1.6 小節到底是如何定義圖的。
這一章節介紹了關于圖最基本的概念?,F在若定義 N 為有限非空索引集的通用符號,其元素對應于隨機變量,并且在圖模型中以節點的方式出現。通過 N 定義的圖可以理解為將 N 作為節點集合,本章考慮的圖沒有多重邊,因此它們通過邊可以分為無向圖和有向圖。
注:上面是原文對無向圖和有向圖的標準定義,其中無向圖指節點間的邊全是沒有指向的,而有向圖指節點間的邊是有指向的。
給定在 N 上定義的圖 G(無向圖或有向圖),且有非空節點集 T ? N,那么由 G 誘導出的子圖(induced subgraph)T 可以表示為 G_T。具體而言,G_T 表示在集合 T 上的圖,其中所有的邊即 G 中 T 個子節點間的邊。
圖 G 在 N 上的游走(walk)可以表示為從 i_1 到 i_k(k ≥ 1)的節點序列,序列中每一對相鄰的節點在圖 G 中都有一條邊相連。游走的端節點為 i_1 和 i_k,如果 k ≥ 3,那么其余的節點可以表示為 i_l(1 < l < k),它們都是內部節點。游走過程中邊的數量 k - 1 被稱為游走的長度。
如果 i_1, ..., i_k 是唯一的,那么該游走就稱為圖 G 的徑(Path);如果 k≥ 4,且滿足 i_1 = i_k、i_1, . . . , i_k?1 是唯一的,那么這樣的游走可以稱為環(Cycle)。在有向圖 G 中,一條徑或者一個環之所以稱為有向,是因為對于所有內部節點 l=1, ..., k-1,都有 i_l → i_l+1。
圖 1.3:兩種無向圖。
如果有向圖 G 不包括有向環,那么它按照慣例就可以稱為有向無環圖(DAG)。DAG 有一個眾所周知的等價描述,即如果有向圖 G 能枚舉節點 i_1, ..., i_|N|,且它們的指向是一致的,那么就可以稱為 DAG。即如果圖 G 中 i_l → i_k,那么有 l < k。
另外一種重要的概念是弦圖(無向圖),弦圖滿足對于節點至少為 4 的環,它都至少有一條弦。也就是說,環中節點的邊,并不是構成環的邊。一種非常著名的等價定義方法可以表示為,一個弦圖 G 指的是它的團可以以序列的方式組織 C_1, ...,C_m(m ≥ 1),它滿足 running intersection 屬性:對于所有 k ≥ 2,存在 l < k 以令
。
目錄
最后,讓我們看看整本書的目錄和主題(滑動目錄向下翻頁)。
incent van Gogh (1853 - 1890), Saint-Rémy-de-Provence, 1890
Credits: Van Gogh Museum, Amsterdam (State of the Netherlands, bequest of A.E. Ribbius Peletier)
題圖
4 月是生命力噴薄而出的季節,古語冠以「芳菲」二字有點過于文靜了,相信多數人都被怒放的花兒所震撼過。感謝 4 月帶給我們的這般熱烈的生命力。題圖為梵高在 1889 年 4 月畫的花期中的李子樹。
4 月的圖書也像花兒一樣爭奇斗艷。
本月為大家特別推薦的書是——《深入剖析Kubernetes》,推薦理由如下。
技術圖書作品
1. 深入剖析Kubernetes
作者:張磊
| 圖書特色
本書深入剖析了Kubernetes的本質、核心原理和設計思想,從開發者和使用者的真實邏輯出發,逐層剖析Kubernetes項目的核心特性,全面涵蓋集群搭建、容器編排、網絡、資源管理等核心內容,以通俗易懂的語言揭示了Kubernetes的設計原則和容器編排理念,是一本全面且深入的Kubernetes技術指南。
2. 斯坦福數據挖掘教程(第3版)
作者:Jure Leskovec,Anand Rajaraman,Jeffrey Ullman
譯者:王斌 , 王達侃
| 圖書特色
本書源自斯坦福大學公開課“CS246:海量數據挖掘”“CS224W:圖機器學習”和“CS341:項目實戰課”,主要關注極大規模數據的挖掘。書中包括分布式文件系統、相似性搜索、搜索引擎技術、頻繁項集挖掘、聚類算法、廣告管理及推薦系統、社會網絡圖挖掘和大規模機器學習等主要內容。第3版新增了決策樹、神經網絡和深度學習等內容。幾乎每節都有對應的習題,以此來鞏固所講解的內容。讀者還可以從網上獲取相關拓展資料。
3. 圖神經網絡導論
作者:劉知遠 周界
譯者:李濼秋
| 圖書特色
圖神經網絡(GNN)是基于深度學習的圖數據處理方法,因其卓越的性能而受到廣泛關注。本書全面介紹了GNN的基本概念、具體模型和實際應用。書中首先概述數學基礎和神經網絡以及圖神經網絡的基本概念,接著介紹不同種類的GNN,包括卷積圖神經網絡、循環圖神經網絡、圖注意力網絡、圖殘差網絡,以及幾個通用框架。此外,本書還介紹了GNN在結構化場景、非結構化場景和其他場景中的應用。讀完本書,你將對GNN的最新成果和發展方向有較為透徹的認識。
4. JavaScript深度學習
作者:蔡善清(Shanqing Cai), Stanley Bileschi,Eric D. Nielsen,Fran?ois Chollet
譯者:程澤
| 圖書特色
本書教你使用TensorFlow.js構建強大的JavaScript深度學習應用程序。本書作者均是谷歌大腦團隊的資深工程師,也是TensorFlow.js的核心開發人員。你將了解JavaScript與深度學習結合的獨特優勢,掌握客戶端預測與分析、圖像識別、監督學習、遷移學習、強化學習等核心概念,并動手在瀏覽器中實現計算機視覺和音頻處理以及自然語言處理,構建并訓練神經網絡,利用客戶端數據優化機器學習模型,開發基于瀏覽器的交互式游戲,同時為深度學習探索新的應用空間。你還可以獲得深度學習模型構建過程中不同問題所涉及的策略和相關限制的實用知識,同時了解訓練和部署這些模型的具體步驟以及重要的注意事項。
5. 獨角獸項目:數字化轉型時代的開發傳奇
作者:Gene Kim
譯者:張樂 , 孫振鵬 , 許峰
| 圖書特色
一部令你豁然開朗的 IT 勵志小說,沉浸式體驗從困獸到獨角獸的自我蛻變。
本書是運維名著《鳳凰項目:一個IT運維的傳奇故事》的姊妹篇,從軟件開發人員的角度繼續講述無極限零部件公司的故事。瑪克辛是開發主管兼架構師,因公司工資系統事故而被“流放”去做鳳凰項目的文檔工作。在這樣一家剛剛度過百年華誕的老牌公司里,在電子商務已然風生水起的當下,瑪克辛能否拯救那個已令數百名開發人員深陷其中的項目?作者在本書中提出“五大理念”,并相信有了這五個理念,企業就能打破壁壘、力排萬難,在數字化洪流中力挽狂瀾。
6. 數據驅動力:企業數據分析實戰
作者:Carl Anderson
譯者:張奎 , 郭鵬程 , 管晨
| 圖書特色
面對大數據這一勢不可擋的時代潮流,所有企業都需要思考如何在實際工作中挖掘數據,充分發揮數據分析師的才能,進而有效地利用數據完成商業決策。本書首先講解數據本身,重點介紹如何選擇正確的數據源,確保數據的質量和可靠性,然后討論數據分析,組織需要獲取擁有必備技術和工具并能洞察數據變化的人才。接下來幾章介紹具體的分析工
本書通過豐富的案例展示如何打造完整的分析價值鏈:收集正確、可靠的數據,合理分析,獲得見解,并將見解融入決策過程。
人生技能及科普作品
1. 寫作的邏輯:從清晰表達到高效溝通
作者:倉島保美
譯者:甘菁菁 柳慕云
| 圖書特色
邏輯性寫作,不同于文學寫作,它側重信息表達的清晰性、有效性、正當性,是高效思考、溝通的有力工具。
本書是基于邏輯學、認知心理學的寫作入門書。作者結合歐美大學開設的邏輯類寫作課程,從人腦理解信息的“心智模型”出發,通俗講述了“如何使用清晰、準確的語言進行表達”“怎樣構建易讀易懂、有說服力的文章結構”等內容,向讀者傳授了工作報告、技術報告、論文等邏輯類文章實用寫作方法。
本書適合有寫作需求的職場人士閱讀,也可作為本科生、研究生撰寫論文的參考資料。
2. 代數的歷史:人類對未知量的不舍追蹤(修訂版)
作者:[美] 約翰·德比希爾
譯者:張浩
| 圖書特色
代數究竟為何物?它起源于何處?
誰是真正的“代數之父”?
字母符號是如何從無到有的?
代數如何達到了越來越高的抽象層次?
牛頓與萊布尼茨的“微積分之爭”有無定論?
數學家在舉世矚目的成就背后,經歷了怎樣的磨難?
這是一部恢宏的數學史和人類思想史,一本闡明代數基本知識的“數學入門書”,一冊數學家的趣味故事集。
本書向讀者介紹了代數學自誕生以來的發展歷程,內容涵蓋代數學中的重要概念,如未知量、抽象概念、方程、向量空間、域論、代數幾何,等等。作者以詼諧的筆觸展現了代數幾千年發展史中的重大事件和核心人物,并介紹了代數的基本知識,以代數這一重要而有趣的角度呈現數學思維的戲劇性進化歷程,向讀者展現了一種感知世界的全新方式。作者憑借歷史學家的敘事能力,帶領讀者踏上一段令人稱嘆、充滿挑戰的數學之旅。本書適合對代數學及其歷史感興趣的讀者閱讀。
3. 圖表會說話:Excel數據可視化之美
作者:Jorge Cam?es
譯者:朱浩波
本書是寫給辦公白領的Excel數據可視化入門書,旨在幫助你理解數據可視化的一般規則。從辦公室白領的實際需求出發,將可視化的基本原理和Excel的技巧和理念有機結合起來,教你如何在商業環境中,將有效的信息和復雜的思想通過簡單的圖表傳遞出去,用Excel制作出有影響力的數據可視化作品。本書在煩瑣的理論和花哨的技巧之間尋求平衡,帶你重新認識“圖表”。打破以往按照圖表形式劃分圖表的弊端,教你從任務劃分圖表,輕松解決順序、組成、分布、趨勢、關系、概況,異常等6類問題。擺脫美學天賦的束縛,從圖表的功能性著手,讓圖表說話!
*請認真填寫需求信息,我們會在24小時內與您取得聯系。