香港商報
-- 天氣
商湯發布日日新5.0大模型 對標GPT-4Turbo

商湯發布日日新5.0大模型 對標GPT-4Turbo

責任編輯:朱劍明 2024-04-23 16:29:22 來源:香港商報網

 AI龍頭商湯 (020)今日(23日)舉辦「商湯技術交流日」,商湯聯合創始人兼CEO徐立發布大模型「日日新5.0」版本,指當中主要有五大重點,包括採用混合專家架構;基於超過 10TB tokens訓練,大量合成數據;更上下文推理窗口擴至200k;知識、推理、數學、代碼場景全面對標 GPT-4 Turbo。

 徐立表示,根據尺度定律,AI公司在有限的研發資源上,只要找到更佳的模型架構和數據配方,就可讓模型能最高效地學習。

微信图片_20240423170846.jpg

 市場一直討論大模型商業化。徐立指出,商湯推出企業大模型一體機,採用242結構,大模型裝上高速4卡全互連,4國產大模型加速卡,2 國產AI 加速卡,算力可達 2P FLOPS@半精度,顯存可達 256 GB;互聯可達 448 GB/s。

 徐立表示,部分行業對於數據流動設嚴緊限制,而大模型一體機則直接部署在客戶端,商湯針對金融、政務、醫療、代碼推出行業專屬一體機。

 商湯去年發布「日日新」大模型系列以來,其大模型能力每隔三個月提升,在企業中的應用也隨之升級,而年初推出的日日新4.0版本,在數據分析、代碼編寫、和醫療問答等多場景中達到了與GPT-4相匹配的能力。

責任編輯:朱劍明 商湯發布日日新5.0大模型 對標GPT-4Turbo
香港商報PDF
股市

友情鏈接

承印人、出版人:香港商報有限公司 地址:香港九龍觀塘道332號香港商報大廈 香港商報有限公司版權所有,未經授權,不得複製或轉載。 Copyright © All Rights Reserved
聯絡我們

電話:(香港)852-2564 0768

(深圳)86-755-83518792 83518734 83518291

地址:香港九龍觀塘道332號香港商報大廈