更開放，更懂AI，新華三發(fā)布多元異構算力平臺

ainet.cn 2024年05月09日

生成式AI應用的不斷發(fā)展，使全社會對算力尤其是異構計算資源的需求達到新高度。作為新質生產力的重要動力引擎，算力資源的開放性和安全性直接關系到數(shù)字經濟的穩(wěn)定和發(fā)展。近日，紫光股份旗下新華三集團發(fā)布全新多元異構算力平臺H3C UniServer R5330 G7和H3C UniServer R5500 G7，以多元異構、開放包容、靈活高效等多重優(yōu)勢，提供高性能、高可靠的多元算力，為不同AI負載提供強勁算力支撐，為數(shù)字經濟高質量發(fā)展提供堅實后盾。

智能算力旗艦 H3C UniServer R5500 G7

為AI而生先進模塊化設計打造極致算力

“百模大戰(zhàn)”熱潮下,大模型的訓練及推理過程均需要強大的算力作為支撐。H3C UniServer R5500 G7是專為AI大模型訓練而設計的智能算力旗艦新品，支持千億級參數(shù)規(guī)模的大模型訓練。產品采用系統(tǒng)解耦的先進模塊化設計，兼容最新OCP OAI開放硬件標準，實現(xiàn)算力開放和可進化;通過搭載2顆最新處理器以及新一代OAM 8-GPU模組，為AI大模型訓練提供旗艦級算力與互聯(lián)帶寬，加速AGI時代到來。

算力旗艦，助力AI大模型訓練：

● 支持超過15種、千億級參數(shù)主流大模型訓練，覆蓋AIGC、計算機視覺、自然語言處理和大數(shù)據(jù)分析等多種AI應用場景。

● 采用先進模塊化設計，用戶可靈活選擇GPU計算模塊，提高系統(tǒng)的可擴展性和可維護性，節(jié)省成本。

● GPU模組算力可提升200%，Llama2-70B增量預訓練僅需15天。

生態(tài)兼容，AI業(yè)務平滑遷移：

● 主流開源大模型一鍵遷移，客戶模型零代碼改動。

● CUDA底層原生兼容，算子庫兼容可達95%以上。

● 適配國內外主流深度學習框架，原生適配國產飛槳深度學習框架。

可靠高效，算力管理智能靈活：

● CPU、GPU模組、BMC芯片等核心部件支持國產化，供應可靠。

● 結合傲飛算力平臺，可實現(xiàn)萬卡集群算力統(tǒng)一調度，算力高效使用。

● 算力資源統(tǒng)一管理、監(jiān)控、告警，智能靈活。

自主算力引擎H3C UniServer R5330 G7

直面異構算力卓越性能助力AGI時代

隨著多元異構算力的廣泛應用，伴隨而來的諸多挑戰(zhàn)也逐漸浮現(xiàn)。由于不同廠商硬件存在計算架構、緩存資源、互聯(lián)方式等差異，極大限制了算力資源的充分使用和靈活調度。新華三集團發(fā)布的自主算力引擎產品——H3C UniServer R5330 G7，搭載2顆最新處理器+GPU異構算力，可有效解決異構算力部署的技術難題;CUDA算子庫支持95%以上，讓底層適配更加高效便捷，實現(xiàn)生態(tài)無縫遷移;開放包容，異構賦能，為不同AI負載提供強勁算力支撐。

訓推一體，AI開發(fā)新范式：

● 對比上一代GPU，大模型訓練場景下的AI算力提升超過30%，顯存容量提升100%。

●大模型推理場景僅需單臺8-GPU便可支持在100用戶同時訪問情況下達到15 token/s，提供更快的服務響應速度。

●支持多元GPU異構算力大模型混合部署，更具靈活性，為用戶提供更多選擇。

生態(tài)開放，AI業(yè)務快速部署：

●CUDA算子庫支持95%以上，用戶代碼零改動。

●支持200種以上主流AI模型，軟件棧兼容國內外主流生態(tài)，支持原生社區(qū)分布式訓練方案。

●覆蓋通用計算、FFT(快速傅里葉變換)等多種計算模式。

異構賦能，實現(xiàn)智能算力調度：

●結合傲飛算力平臺，可實現(xiàn)萬卡集群算力統(tǒng)一調度。

●提供模型訓練、微調、評估、推理全流程服務。

●支持AI算力資源統(tǒng)一管理、監(jiān)控、告警，讓運維更智能、更靈活。