生成式AI應用的不斷發(fā)展,使全社會對算力尤其是異構計算資源的需求達到新高度。作為新質生產力的重要動力引擎,算力資源的開放性和安全性直接關系到數(shù)字經濟的穩(wěn)定和發(fā)展。近日,紫光股份旗下新華三集團發(fā)布全新多元異構算力平臺H3C UniServer R5330 G7和H3C UniServer R5500 G7,以多元異構、開放包容、靈活高效等多重優(yōu)勢,提供高性能、高可靠的多元算力,為不同AI負載提供強勁算力支撐,為數(shù)字經濟高質量發(fā)展提供堅實后盾。
智能算力旗艦 H3C UniServer R5500 G7
為AI而生 先進模塊化設計打造極致算力
“百模大戰(zhàn)”熱潮下,大模型的訓練及推理過程均需要強大的算力作為支撐。H3C UniServer R5500 G7是專為AI大模型訓練而設計的智能算力旗艦新品,支持千億級參數(shù)規(guī)模的大模型訓練。產品采用系統(tǒng)解耦的先進模塊化設計,兼容最新OCP OAI開放硬件標準,實現(xiàn)算力開放和可進化;通過搭載2顆最新處理器以及新一代OAM 8-GPU模組,為AI大模型訓練提供旗艦級算力與互聯(lián)帶寬,加速AGI時代到來。
算力旗艦,助力AI大模型訓練:
● 支持超過15種、千億級參數(shù)主流大模型訓練,覆蓋AIGC、計算機視覺、自然語言處理和大數(shù)據(jù)分析等多種AI應用場景。
● 采用先進模塊化設計,用戶可靈活選擇GPU計算模塊,提高系統(tǒng)的可擴展性和可維護性,節(jié)省成本。
● GPU模組算力可提升200%,Llama2-70B增量預訓練僅需15天。
生態(tài)兼容,AI業(yè)務平滑遷移:
● 主流開源大模型一鍵遷移,客戶模型零代碼改動。
● CUDA底層原生兼容,算子庫兼容可達95%以上。
● 適配國內外主流深度學習框架,原生適配國產飛槳深度學習框架。
可靠高效,算力管理智能靈活:
● CPU、GPU模組、BMC芯片等核心部件支持國產化,供應可靠。
● 結合傲飛算力平臺,可實現(xiàn)萬卡集群算力統(tǒng)一調度,算力高效使用。
● 算力資源統(tǒng)一管理、監(jiān)控、告警,智能靈活。
自主算力引擎H3C UniServer R5330 G7
直面異構算力 卓越性能助力AGI時代
隨著多元異構算力的廣泛應用,伴隨而來的諸多挑戰(zhàn)也逐漸浮現(xiàn)。由于不同廠商硬件存在計算架構、緩存資源、互聯(lián)方式等差異,極大限制了算力資源的充分使用和靈活調度。新華三集團發(fā)布的自主算力引擎產品——H3C UniServer R5330 G7,搭載2顆最新處理器+GPU異構算力,可有效解決異構算力部署的技術難題;CUDA算子庫支持95%以上,讓底層適配更加高效便捷,實現(xiàn)生態(tài)無縫遷移;開放包容,異構賦能,為不同AI負載提供強勁算力支撐。
訓推一體,AI開發(fā)新范式:
● 對比上一代GPU,大模型訓練場景下的AI算力提升超過30%,顯存容量提升100%。
●大模型推理場景僅需單臺8-GPU便可支持在100用戶同時訪問情況下達到15 token/s,提供更快的服務響應速度。
●支持多元GPU異構算力大模型混合部署,更具靈活性,為用戶提供更多選擇。
生態(tài)開放,AI業(yè)務快速部署:
●CUDA算子庫支持95%以上,用戶代碼零改動。
●支持200種以上主流AI模型,軟件棧兼容國內外主流生態(tài),支持原生社區(qū)分布式訓練方案。
●覆蓋通用計算、FFT(快速傅里葉變換)等多種計算模式。
異構賦能,實現(xiàn)智能算力調度:
●結合傲飛算力平臺,可實現(xiàn)萬卡集群算力統(tǒng)一調度。
●提供模型訓練、微調、評估、推理全流程服務。
●支持AI算力資源統(tǒng)一管理、監(jiān)控、告警,讓運維更智能、更靈活。
算力已成為數(shù)字經濟時代的關鍵生產要素。未來,新華三集團將繼續(xù)秉持“精耕務實,為時代賦智慧”的理念,加速算力平臺的智能再進化,為百行百業(yè)的數(shù)智變革夯實算力底座,推動新質生產力蓬勃發(fā)展。
(來源:新華三)