大數據

商湯科技將亮相WAIC 2024，商湯「日日新5.0」大模型帶來驚喜!

ainet.cn 2024年06月20日

2024年，世界人工智能大會暨人工智能全球治理高級別會議將在7月在上海舉辦，會議主題為“以共商促共享以善治促善智”。商湯科技將在WAIC 2024展出最新成果。

展覽時間：7月4日-7日

展覽地點：上海世博展覽館

展位號：H2-B110 & H2-B116

01 商湯大模型迎來全新升級!

商湯科技全新升級的「日日新SenseNova 5.0」大模型，具備更強的知識、數學、推理及代碼能力，綜合性能全面升級。

「日日新 5.0」能力提升主要得益三個方面：

1. 采用混合專家架構(MoE)，激活少量參數就能完成推理，且推理時上下文窗口達到 200K 左右。

2. 基于超過10TB tokens訓練、覆蓋數千億量級的邏輯型合成思維鏈數據。

3. 商湯AI大裝置SenseCore算力設施與算法設計的聯合調優(yōu)。

日前，中文大模型測評基準SuperCLUE發(fā)布最新榜單，對商湯科技全新升級「日日新SenseNova 5.0」大模型進行了全方位綜合性測評，結果顯示在SuperCLUE綜合基準上，日日新 5.0表現不俗，以總分80.03分的優(yōu)異成績刷新國內最好成績，這也是國內大模型首次在SuperCLUE中文基準測試中實現登頂。

02 率先完成“云端邊”全棧布局

此外，商湯科技前瞻洞察中心化算力需求向端側擴展的未來趨勢，以及企業(yè)級在邊緣側的AI需求，在業(yè)內首次推出“云、端、邊”全棧大模型產品矩陣，其中包括應用于終端設備的“商湯端側大模型”，以及面向金融、代碼、醫(yī)療、政務等多個領域的邊緣產品“商湯企業(yè)級大模型一體機”。

03 端側：模型位列行業(yè)首位滿足移動終端用戶需求

今年是端側大模型應用的元年，為了滿足移動終端用戶對大模型技術的應用需求，商湯推出日日新·端側大模型，性能實現同等尺度性能最優(yōu)，跨級尺度全面領先。

商湯還推出端云協同解決方案，可以通過智能化判斷協同發(fā)揮端云各自優(yōu)勢，需要聯網搜索或處理復雜場景時分流至云端處理，部分場景端側處理占比超過80%，從而顯著降低推理成本。

商湯日日新·端側大語言模型的推理速度達到了業(yè)內最快，可在中端平臺實現18.3字/s的平均生成速度，旗艦平臺更是達到了78.3字/s。

擴散模型同樣可在端側實現業(yè)內最快的推理速度，端側LDM-AI擴圖技術在某主流平臺上，推理速度小于1.5秒，比友商云端app快10倍，支持輸出1200萬像素及以上的高清圖片，支持在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。

04 邊側：推出企業(yè)級大模型一體機降低企業(yè)應用大模型的門檻

對于金融、代碼、醫(yī)療、政務等重點行業(yè)邊緣側日益增長的AI應用需求，商湯正式推出企業(yè)級大模型一體機，可同時支持企業(yè)級千億模型加速和知識檢索硬件加速，實現本地化部署，即買即用，降低企業(yè)應用大模型的門檻。相比行業(yè)同類產品，推理成本節(jié)約80%，檢索大大加速，CPU工作負載50%。

05 安全可信的大模型建設

大模型時代，推進符合倫理標準的人工智能技術至關重要。商湯率先推出“人工智能治理基礎設施SenseTrust”，以促進大模型開發(fā)、訓練及其應用的可靠性和可信度;此外，商湯還攜手中國信息通信研究院聯合發(fā)布了《大模型可信賴研究報告》，為人工智能大模型的可信發(fā)展提供了重要的方向參考，也對大模型風險管理體系化建設提供了框架依據。

（來源：世界人工智能大會）

標簽：世界人工智能大會商湯科技

我要反饋