隨著數字化、網絡化、智能化的到來,通過互聯網、物聯網采集到的數據呈現爆炸式的增長。其中,文本、圖片、音頻、視頻等無法用統一結構表示的非結構化數據,在海量數據中占據越來越高的比例。
數據是新基建的關鍵生產要素。明略科技首席科學家吳信東認為,知識圖譜技術有助于提升數據的生產要素效能,助力新基建價值最大化。
什么是知識圖譜?通俗地說,就是把所有不同種類的信息連接在一起而得到的一個語義關系網絡。它的一個特點,就是可以抽取實體關系、事件、標簽、模型、規則等條件,形成以圖為基礎的數據形式。和一般的數據存儲形式的區別在于,知識圖譜“保存”有推理規則和專家經驗,不僅僅能用數據反映事件,還能反映出事件之間的聯系。
吳信東打個比方,當車輛出現故障無法啟動,資深維修專家用小錘頭敲兩三次,根據聲音判斷就可能知道哪一個部件出了問題。新手則會把可能出問題的部件都拆開來檢查,嘗試所有的可能。知識圖譜相當于人工智能時代的行業專家。
“以前大家使用數據,只關注最終得出的結果,過程中的數據分析、計算等‘洞察力’并沒有積累下來,也就無法分享、復用這種經驗。”吳信東說,人工智能需要實現從感知到認知的能力跨越。知識圖譜是目前與人類大腦思維本質最趨近的人工智能底層技術,可通過實體、關系、事件挖掘實現對客觀世界的認知,并且由已有的知識產生新的知識。
目前,知識圖譜作為知識的一種形式,已經在語義搜索、智能問答、數據分析、自然語言理解、視覺理解、物聯網設備互聯等多個方面發揮越來越大的作用。在新冠肺炎疫情防控中,技術人員通過知識圖譜技術,快速搭建了疫情防控圖譜分析研判系統,為抗疫提供大數據支撐。
吳信東介紹,在人工智能領域,營銷智能國家新一代人工智能開放創新平臺就是聚焦消費者動態變化的個性化、碎片化需求,用基于行業知識圖譜的知識推理與服務技術,幫助企業從多源異構的海量數據中發現業務規律,建立從研發、生產、營銷、銷售到服務的完整智能商業閉環,實現精準洞察、實時決策和高效運轉。
在推動制造業升級和發展工業互聯網領域,基于知識圖譜的解決方案,可形成完整的智能服務平臺,有效降低對人的依賴程度。例如,結合知識圖譜與機器學習技術,可以搭建針對地鐵車輛故障維修的遠程診斷輔助決策系統,幫助售后部門遠程診斷并提供維修建議,通過這一系統,企業能夠加速和擴大維修經驗的積累和分享。
吳信東認為,圖譜化將是企業進行數據管理的未來趨勢,知識圖譜能夠連接上游大數據和下游人工智能應用任務,從而更有效地把數據轉化成為真正的行業知識,滿足行業應用需求。