2024年,世界人工智能大會暨人工智能全球治理高級別會議將在7月在上海舉辦,會議主題為“以共商促共享 以善治促善智”。商湯科技將在WAIC 2024展出最新成果。
展覽時間:7月4日-7日
展覽地點:上海世博展覽館
展位號:H2-B110 & H2-B116
01 商湯大模型迎來全新升級!
商湯科技全新升級的「日日新SenseNova 5.0」大模型,具備更強的知識、數學、推理及代碼能力,綜合性能全面升級。
「日日新 5.0」能力提升主要得益三個方面:
1. 采用混合專家架構(MoE),激活少量參數就能完成推理,且推理時上下文窗口達到 200K 左右。
2. 基于超過10TB tokens訓練、覆蓋數千億量級的邏輯型合成思維鏈數據。
3. 商湯AI大裝置SenseCore算力設施與算法設計的聯合調優(yōu)。
日前,中文大模型測評基準SuperCLUE發(fā)布最新榜單,對商湯科技全新升級「日日新SenseNova 5.0」大模型進行了全方位綜合性測評,結果顯示在SuperCLUE綜合基準上,日日新 5.0表現不俗,以總分80.03分的優(yōu)異成績刷新國內最好成績,這也是國內大模型首次在SuperCLUE中文基準測試中實現登頂。
02 率先完成“云端邊”全棧布局
此外,商湯科技前瞻洞察中心化算力需求向端側擴展的未來趨勢,以及企業(yè)級在邊緣側的AI需求,在業(yè)內首次推出“云、端、邊”全棧大模型產品矩陣,其中包括應用于終端設備的“商湯端側大模型”,以及面向金融、代碼、醫(yī)療、政務等多個領域的邊緣產品“商湯企業(yè)級大模型一體機”。
03 端側:模型位列行業(yè)首位 滿足移動終端用戶需求
今年是端側大模型應用的元年,為了滿足移動終端用戶對大模型技術的應用需求,商湯推出日日新·端側大模型,性能實現同等尺度性能最優(yōu),跨級尺度全面領先。
商湯還推出端云協同解決方案,可以通過智能化判斷協同發(fā)揮端云各自優(yōu)勢,需要聯網搜索或處理復雜場景時分流至云端處理,部分場景端側處理占比超過80%,從而顯著降低推理成本。
商湯日日新·端側大語言模型的推理速度達到了業(yè)內最快,可在中端平臺實現18.3字/s的平均生成速度,旗艦平臺更是達到了78.3字/s。
擴散模型同樣可在端側實現業(yè)內最快的推理速度,端側LDM-AI擴圖技術在某主流平臺上,推理速度小于1.5秒,比友商云端app快10倍,支持輸出1200萬像素及以上的高清圖片,支持在端上快速進行等比擴圖、自由擴圖、旋轉擴圖等圖像編輯功能。
04 邊側:推出企業(yè)級大模型一體機 降低企業(yè)應用大模型的門檻
對于金融、代碼、醫(yī)療、政務等重點行業(yè)邊緣側日益增長的AI應用需求,商湯正式推出企業(yè)級大模型一體機,可同時支持企業(yè)級千億模型加速和知識檢索硬件加速,實現本地化部署,即買即用,降低企業(yè)應用大模型的門檻。相比行業(yè)同類產品,推理成本節(jié)約80%,檢索大大加速,CPU工作負載50%。
05 安全可信的大模型建設
大模型時代,推進符合倫理標準的人工智能技術至關重要。商湯率先推出“人工智能治理基礎設施SenseTrust”,以促進大模型開發(fā)、訓練及其應用的可靠性和可信度;此外,商湯還攜手中國信息通信研究院聯合發(fā)布了《大模型可信賴研究報告》,為人工智能大模型的可信發(fā)展提供了重要的方向參考,也對大模型風險管理體系化建設提供了框架依據。
(來源:世界人工智能大會)