大數(shù)據(jù)

知識圖譜如何為數(shù)據(jù)分析帶來變革?

ainet.cn   2022年02月11日

  數(shù)據(jù)大爆炸時代,企業(yè)面臨著全面數(shù)字化轉(zhuǎn)型的挑戰(zhàn)。如何挖掘數(shù)據(jù)之間的內(nèi)在關(guān)聯(lián),并將這些洞察應(yīng)用于關(guān)鍵業(yè)務(wù)決策,驅(qū)動從數(shù)據(jù)分析到數(shù)據(jù)智能的轉(zhuǎn)化成為關(guān)鍵。

  作為高級數(shù)據(jù)科學(xué)的一大趨勢,知識圖譜的應(yīng)用已經(jīng)滲透到不同領(lǐng)域的各個細(xì)分行業(yè)。根據(jù)Neo4j一項針對100名企業(yè)高管的相關(guān)調(diào)查揭示,88%的企業(yè)管理者已經(jīng)認(rèn)識到知識圖譜的價值,認(rèn)為知識圖譜可以幫助跨越管理和數(shù)據(jù)治理的瓶頸,在彌合數(shù)據(jù)孤島,改進(jìn)AI或者機(jī)器學(xué)習(xí),以及協(xié)助開辟新收入來源等方面發(fā)揮重要作用。

  什么是知識圖譜?阿蘭·圖靈研究所(Alan Turing Institute)將知識圖譜定義為“對知識進(jìn)行編碼以在開放、不斷發(fā)展、去中心化系統(tǒng)中大規(guī)模使用”的最佳方式。簡而言之,知識圖譜是具有豐富含義、相互關(guān)聯(lián)的數(shù)據(jù)集。企業(yè)可以針對基礎(chǔ)數(shù)據(jù)進(jìn)行推理,并且自信地將其用于復(fù)雜的分析和決策中。

Neo4j高級產(chǎn)品市場總監(jiān)Maya Natarajan博士

  Neo4j知識圖譜包含數(shù)據(jù)、顯示動態(tài)內(nèi)容的圖數(shù)據(jù)及語義在內(nèi)的三大要素。與關(guān)系型數(shù)據(jù)庫的平面結(jié)構(gòu)不同,當(dāng)數(shù)據(jù)被抽取到Neo4j動態(tài)圖結(jié)構(gòu)中存儲時,節(jié)點和節(jié)點之間的關(guān)系就被添加進(jìn)來,為數(shù)據(jù)提供了動態(tài)的內(nèi)容,即第一層上下文關(guān)系。而隨著信息不斷豐富,圖也會不斷增長。在圖中獲取數(shù)據(jù)并為它添加語義,就獲得一個知識圖。語義為圖添加了第二層上下文關(guān)系,圖譜就具備了深入動態(tài)的上下文關(guān)系。通過這個步驟將智能引入到數(shù)據(jù)當(dāng)中,便于系統(tǒng)或者客戶從中推斷出不同的含義。

  根據(jù)數(shù)據(jù)范圍,Neo4j知識圖譜的應(yīng)用范疇劃分為數(shù)據(jù)管理和數(shù)據(jù)分析。數(shù)據(jù)管理包括匯集、校驗、治理和探索數(shù)據(jù)。而數(shù)據(jù)分析側(cè)重推理、預(yù)測判定。相對應(yīng)的,Neo4j提供行為圖和決策圖兩種類型的知識圖譜,協(xié)助客戶從行為知識圖譜過渡到?jīng)Q策知識圖譜,實現(xiàn)數(shù)據(jù)分析到數(shù)據(jù)智能,完成數(shù)據(jù)創(chuàng)新。

  行為知識圖譜

  行為知識圖譜是以數(shù)據(jù)管理為核心的知識圖譜,其主要目的是提供數(shù)據(jù)保障,并通過數(shù)據(jù)洞察來推動決策行動。數(shù)據(jù)保障側(cè)重把不同數(shù)據(jù)源的數(shù)據(jù)聚合在一起,進(jìn)行數(shù)據(jù)交叉驗證從而產(chǎn)生洞察。而數(shù)據(jù)治理包括如何溯源數(shù)據(jù)目錄和結(jié)構(gòu),數(shù)據(jù)是否存在血緣關(guān)系以及是否合規(guī),以甄別存在的風(fēng)險。數(shù)據(jù)洞察超越了信息存儲的可見性,專注于新知識的探索、演繹和推理。

  行為知識圖譜常見的用例包括耳熟能詳?shù)目蛻?60和患者360、產(chǎn)品360、供應(yīng)鏈360等在內(nèi)的X360系列,以及金融行業(yè)身份驗證,訪問管理,欺詐、反洗錢的根本原因分析以及改善建議等。Neo4j行為知識圖譜幫助客戶更加深入了解并精準(zhǔn)地劃分用戶,以提供個性化的服務(wù)。

  決策知識圖譜

  決策知識圖譜側(cè)重于數(shù)據(jù)分析和預(yù)測、判定,提供基于圖的分析和基于圖的機(jī)器學(xué)習(xí)。數(shù)據(jù)分析添加不同的語義,幫助客戶從更深層次理解數(shù)據(jù),從而改進(jìn)決策系統(tǒng)并采取最佳的措施。

  決策知識圖譜的主要用例包括流失分析、欺詐分析、風(fēng)險分析、假設(shè)分析和影響分析以及實體解析和知識圖譜補全和預(yù)測模型等。由于數(shù)據(jù)是一個連續(xù)的圖譜,Neo4j客戶典型的數(shù)據(jù)圖都是從行為知識圖譜開始,進(jìn)而演進(jìn)到?jīng)Q策知識圖譜。從數(shù)據(jù)洞察到數(shù)據(jù)分析,最后到基于圖的機(jī)器學(xué)習(xí)。以金融行業(yè)反欺詐為例,欺詐識別是一個數(shù)據(jù)洞察用例,Neo4j添加了很多圖算法開展檢測并且進(jìn)行不同類型的分類和標(biāo)記。這些算法允許檢測不同的欺詐模式,同時通過算法來提取圖特征進(jìn)行訓(xùn)練,通過機(jī)器學(xué)習(xí)來實現(xiàn)建模,預(yù)測欺詐。

  知識圖譜如何助力企業(yè)實現(xiàn)數(shù)字化轉(zhuǎn)型?

  Neo4j知識圖譜解決方案是一個知識圖譜平臺,建立在豐富的產(chǎn)品基礎(chǔ)上,包括負(fù)責(zé)數(shù)據(jù)存儲的Neo4j圖數(shù)據(jù)庫,幫助建模的知識圖譜工作臺,致力數(shù)據(jù)分析的圖數(shù)據(jù)科學(xué) (GDS) 以及數(shù)據(jù)可視化工具Neo4j Bloom。

  每個企業(yè)或組織都有大量各自為政的數(shù)據(jù),數(shù)據(jù)孤島其實不是一件壞事,由于每個數(shù)據(jù)孤島都較小,用戶可以方便地對其進(jìn)行數(shù)據(jù)維護(hù)和控制,并制定政策。但另一方面,數(shù)據(jù)孤島會降低數(shù)據(jù)質(zhì)量、分析速度和報告的準(zhǔn)確性。Neo4j為知識圖譜添加各種關(guān)聯(lián)以及豐富的上下文關(guān)系,將數(shù)據(jù)孤島串聯(lián)起來,提供一個完整可見的數(shù)據(jù)查詢視圖。基于查詢視圖,過渡到更深入的數(shù)據(jù)聯(lián)邦,獲得更加豐富的內(nèi)容。在這個過程當(dāng)中,知識圖譜描述了整個結(jié)構(gòu)中各個數(shù)據(jù)源之間的關(guān)聯(lián)關(guān)系,并添加了上下文,提供數(shù)據(jù)的上下文智能。

  企業(yè)管理者越來越將數(shù)據(jù)視為商業(yè)的重要資產(chǎn),這意味他們現(xiàn)在更加關(guān)注怎樣獲取數(shù)據(jù)洞察力、改善決策制定、提高業(yè)務(wù)績效。為了確保從數(shù)據(jù)中獲得最大的價值,管理者會關(guān)注三個主要領(lǐng)域:側(cè)重數(shù)據(jù)管理和數(shù)據(jù)治理的業(yè)務(wù)大師、專注數(shù)據(jù)分析和機(jī)器學(xué)習(xí)及人工智能的分析師、數(shù)據(jù)創(chuàng)新者。知識圖譜將幫助企業(yè)在不改變現(xiàn)有數(shù)據(jù)格局和基礎(chǔ)設(shè)施的前提下進(jìn)行數(shù)據(jù)編排和自動化,為管理者提供一個連續(xù)觀察層,優(yōu)化數(shù)據(jù)管理、數(shù)據(jù)預(yù)測和數(shù)據(jù)創(chuàng)新,加速企業(yè)數(shù)字化轉(zhuǎn)型。

  作為圖數(shù)據(jù)平臺的領(lǐng)導(dǎo)者,Neo4j所有的圖數(shù)據(jù)科學(xué)項目都始于知識圖譜,其67%的客戶已經(jīng)成功地實施了知識圖譜,包括美國航空航天局(NASA)、易貝(eBay),UBS,思科(Cisco),卡特彼勒公司(Caterpillar)以及阿斯利康(AstraZeneca)等。

  作者:Neo4j高級產(chǎn)品市場總監(jiān)Maya Natarajan博士

(轉(zhuǎn)載)

標(biāo)簽:Neo4j 知識圖譜 我要反饋 
泰科電子ECK、ECP系列高壓直流接觸器白皮書下載
ABB協(xié)作機(jī)器人,自動化從未如此簡單
優(yōu)傲機(jī)器人下載中心
億萬克
專題報道
聚力同行 · 新智“碳”索
聚力同行 · 新智“碳”索

“新華社-智能·零碳”項目策劃以“聚力同行·新智‘碳’索”為主題的新能源專題,主要圍繞光伏、儲能、鋰電、氫能、風(fēng)能五大新... [更多]

2025中國國際機(jī)床展覽會
2025中國國際機(jī)床展覽會

4月21至26日,以“融合創(chuàng)新,數(shù)智未來”為主題的第十九屆中國國際機(jī)床展覽會在首都國際會展中心盛大舉辦。憑借場館的卓越服... [更多]

2023-2024 智能·零碳成果展映
2023-2024 智能·零碳成果展映

“2023-2024智能·零碳成果展映”展示國內(nèi)外企業(yè)推進(jìn)“雙碳”實踐的最新成果,鼓勵更多企業(yè)、科研機(jī)構(gòu)、投資機(jī)構(gòu)等廣泛... [更多]