計算機人工智能的發(fā)展已經(jīng)跨越了若干階段,從計算智能到感知智能不斷演化。如今,我們迎來了難度最大的人工智能階段——認知智能。如何利用錯綜復雜的關聯(lián)數(shù)據(jù),實現(xiàn)理解、推理和可解釋的認知智能并幫助企業(yè)更加精準地預測,成為企業(yè)在數(shù)據(jù)管理領域面臨的挑戰(zhàn)。
如今的企業(yè)需要將圖分析加入現(xiàn)有的分析能力中,圖分析技術最重要的貢獻在于幫助企業(yè)發(fā)掘數(shù)據(jù)中沒有被意識到或者認為不存在的隱藏關系和模式。圖分析是人工智能和機器學習跨越到新階段的關鍵,為機器學習提供高度可信和精準的關系模型和預測。認知智能階段,關聯(lián)以知識圖譜的方式呈現(xiàn),并在知識圖譜上運行,獲得可解釋的結果、數(shù)據(jù)以及算法,從而進行預測。這就是圖數(shù)據(jù)科學(Graph Data Science)受到極大關注并日漸流行的主要原因之一。
Neo4j 圖數(shù)據(jù)科學產(chǎn)品管理高級總監(jiān) Alicia Frame 博士
]預測關系演化, 解答關鍵問題
圖數(shù)據(jù)科學在事物關系上進行數(shù)據(jù)科學類的研究和分析,通過分析關系以及數(shù)據(jù)關聯(lián)得到新的答案。圖數(shù)據(jù)科學是讓關聯(lián)的數(shù)據(jù)“自己說話”。它可以通過運行一種無監(jiān)督圖算法在噪聲中發(fā)現(xiàn)信號,還可以基于客戶圖顯示其社區(qū)如何互動以及對數(shù)據(jù)分割有用的信息。
圖數(shù)據(jù)科學是關于利用數(shù)十億甚至數(shù)萬億數(shù)據(jù)點之間的關聯(lián)。用于數(shù)據(jù)科學的圖利用這些關聯(lián)確定什么是重要和有意義的。
企業(yè)可以通過在圖上進行監(jiān)督機器學習來更進一步。通過這種方式,他們可以預測圖未來如何變化。圖數(shù)據(jù)科學讓企業(yè)可以從圖結構中學習——不僅僅是相互關聯(lián)的人,而是整體圖,以預測接下來這些關系如何演化。
Neo4j圖數(shù)據(jù)科學是一個圖分析和建模平臺。它結合了現(xiàn)有數(shù)據(jù)中關系和網(wǎng)絡結構的預測能力,解答之前難以解決的問題并提高預測準確性。使用圖算法和機器學習,數(shù)據(jù)科學家可以識別模式和行為,改進他們的模型,以在引擎推薦、欺詐檢測、路線優(yōu)化和客戶360場景中使用,通過改進預測來實現(xiàn)更優(yōu)決策和創(chuàng)新。
知識圖譜提升數(shù)據(jù)價值
Neo4j圖數(shù)據(jù)科學分為知識圖譜、圖數(shù)據(jù)分析、圖數(shù)據(jù)特征工程、圖嵌入和圖神經(jīng)元網(wǎng)絡五大發(fā)展階段。作為圖數(shù)據(jù)科學的首要階段,知識圖譜把大量現(xiàn)有的關系型以及非結構化數(shù)據(jù)以圖的方式進行存儲、轉(zhuǎn)化和處理。
Neo4j相信知識圖譜對于企業(yè)應對業(yè)務挑戰(zhàn)至關重要。語義是知識圖譜的關鍵組成部分和優(yōu)勢之一。每個語義都有自己的特定含義,這使得每個知識圖譜也具備獨一無二的特性。語義與圖數(shù)據(jù)同步編碼,這就是知識圖如何將智能引入數(shù)據(jù)并顯著提高其價值的方式。
Neo4j的絕大多數(shù)客戶都是從知識圖譜開始,進而了解他們擁有哪些信息、信息與其他概念的關系以及與業(yè)務問題之間的關聯(lián)。知識圖譜建立后,圖數(shù)據(jù)科學項目就要判斷客戶試圖解決何種問題,他們想問什么問題,以及他們?nèi)绾螌⑵渌D(zhuǎn)化為準確的預測。
超60種算法提供全面預測
Neo4j圖數(shù)據(jù)科學提供業(yè)界最健全的圖算法和機器學習方案,支持用戶按需創(chuàng)建各類預測模型和擴展各類圖應用。Neo4j圖數(shù)據(jù)科學提供了包括路徑發(fā)現(xiàn)、中心度、社區(qū)檢測、監(jiān)督機器學習、鏈接預測、相似度在內(nèi)的五大類超過60種算法。
Neo4j圖算法支持高度并行處理并已在數(shù)百億個節(jié)點上進行測試,確保算法能夠完成并提供正確且易使用的答案。企業(yè)將成熟的數(shù)據(jù)庫產(chǎn)品與創(chuàng)新的數(shù)據(jù)科學相結合,將獲得全面的預測功能及處理能力。Neo4j的服務已達到了成熟、可擴展、快速和未來完整性的標準。
助力企業(yè)更優(yōu)決策
數(shù)字化社會中很多企業(yè)擁有數(shù)十億的節(jié)點和邊的數(shù)據(jù)。借助Neo4j圖數(shù)據(jù)科學,醫(yī)療企業(yè)可以讓在藥品研發(fā)中收集的百億條數(shù)據(jù)發(fā)揮最大價值,挖掘藥品和基因之間的關聯(lián),根據(jù)病患經(jīng)歷找到相似案例、病患集群并決定最佳的介入時機和方式;在線內(nèi)容推送服務商能夠識別匿名用戶的喜好傾向并做出精準實時推送,大大增加用戶粘性;金融企業(yè)可以更好地應對欺詐檢測挑戰(zhàn),在巨量數(shù)據(jù)庫中實時發(fā)現(xiàn)欺詐案例。
以Neo4j為一家大型全球制藥公司客戶提供的預測建模為例。該公司建立了電子病歷,為每個患者提供相應的數(shù)據(jù),這是他們在醫(yī)療保健過程所執(zhí)行的步驟??蛻舾信d趣的是獲取數(shù)據(jù)并從信息中學習:誰像是某些干預措施的受益者?誰是這種藥物的獲益者?將來誰會從這種藥物受益?然后他們知道將成為藥物受益者的圖模式是什么樣的。他們還可以找到具有相似特征的患者,并進行早期干預以改善患者的療效。
此外,全球領先的在線內(nèi)容推薦商將Neo4j圖數(shù)據(jù)科學用于身份消歧,在4.4TB數(shù)據(jù)(140億節(jié)點)中高效建立連接,應用圖算法,根據(jù)訪問行為識別唯一用戶,從而建立1.63億個唯一的用戶畫像,包含豐富且更長時間的數(shù)據(jù),為潛在客戶提供精準內(nèi)容,實現(xiàn)了612%的回頭客增長。