數(shù)據(jù)是人類最重要的財富之一,拓展了我們洞察客觀世界的能力。伴隨數(shù)據(jù)爆炸增長和應用場景的多樣化,彌補數(shù)據(jù)通向AI的鴻溝,軟件基礎設施建設面臨巨大的技術挑戰(zhàn)。
7月11日上午,2020 WAIC·開發(fā)者日特設「數(shù)據(jù)驅動AI專場」分論壇,邀請英特爾、PingCAP、Apache Kylin、Zilliz等工業(yè)界技術專家,暢想普惠AI理念,分享如何降低AI項目落地的門檻及成本,提高開發(fā)效率,以及他們所作出的創(chuàng)新嘗試。
議題一:Apache Kylin:簡化大數(shù)據(jù)機器學習
李棟,Apache Kylin項目管理委員會成員,Kyligence 公司初創(chuàng)團隊成員,技術合伙人兼產品負責人,負責Kyligence 商業(yè)產品線管理。Apache Kylin 是一個開源的大數(shù)據(jù)在線分析引擎;Kylin 將傳統(tǒng)數(shù)據(jù)倉庫理論與大數(shù)據(jù)技術相融合,為大規(guī)模數(shù)據(jù)提供亞秒級響應的SQL查詢接口,使得交互式分析成為可能,已被許多世界500強企業(yè)大規(guī)模使用。除了用在OLAP領域以外,Kylin還可以應用在機器學習中,為機器學習程序提供自助的數(shù)據(jù)服務。與Auto Machine Learning技術聯(lián)合使用,用戶無需精通大數(shù)據(jù)和機器學習技術,就可以實現(xiàn)自動化的預測分析,讓大數(shù)據(jù)機器學習的門檻更低,賦能各級分析人員使用高級分析能力。
議題二:開源生態(tài)助力智能制造--基于英特爾?架構的AI實踐
臧戰(zhàn),英特爾AI技術解決方案專家,現(xiàn)就職于英特爾AI TSS技術團隊,專長于機器視覺、時間序列以及各種機器學習算法。他會介紹英特爾在AI領域的開源貢獻和優(yōu)化工作,以及怎樣利用英特爾開源軟件建設典型的端-邊-云智能工廠架構。
議題三:基于Milvus的非結構數(shù)據(jù)服務平臺
顧鈞,Zilliz的合伙人、技術布道師,LF AI基金會,技術咨詢委員投票成員。據(jù)統(tǒng)計,未來80%的數(shù)據(jù)都屬于非結構化數(shù)據(jù),而深度學習已成為處理非結構化數(shù)據(jù)的標準。在過去,開發(fā)者偏重于算法與模型方向,但隨著這些模型還有算法的成熟,AI的痛點逐漸轉移到如何在海量的向量里面進行高速的分析搜索,而Milvus就是在工具鏈上的高速向量搜索引擎。本次演講,將詳細介紹:AI行業(yè)現(xiàn)狀;Milvus簡介;案例與使用場景;開源如何助力基礎軟件。
議題四:HTAP是什么,為什么我們需要HTAP
馬曉宇,PingCAP實時分析產品負責人,目前負責 TiDB 列存引擎 TiFlash 的研發(fā)。隨著數(shù)據(jù)業(yè)務交易和分析邊界不斷模糊,實時性需求不斷增加,HTAP 變成了一個越來越重要的探索方向,HTAP 是什么,為什么我們需要 HTAP,以及 TiDB HTAP 架構細節(jié)和案例。
議題五:使用BigDL和Analytics Zoo來開發(fā)統(tǒng)一的大數(shù)據(jù)分析和人工智能應用
史棟杰,Intel資深軟件架構師,多年的企業(yè)級計算、風控、大數(shù)據(jù)分析、云計算容器編排、數(shù)據(jù)分析與人工智能領域的研發(fā)經驗,也是英特爾開源框架BigDL與Analytics Zoo的貢獻者。眾所周知,深度學習在實際生產實踐中,很多時候并非是圍繞算法和數(shù)據(jù)建模,據(jù)統(tǒng)計90%的工作是在清理與規(guī)整數(shù)據(jù)。BigDL是基于Apache Spark的分布式深度學習框架,Analytics-Zoo是基于Apache Spark、Tensorflow、Keras和BigDL的大數(shù)據(jù)分析+ AI平臺。本議題主要介紹使用BigDL和Analytics Zoo來開發(fā)統(tǒng)一的大數(shù)據(jù)分析和人工智能應用。
(轉載)