了解金山云最新資訊
2025-04-21 14:09:00
日前,金山云星流訓(xùn)推平臺(tái)全面接入智譜GLM系列推理模型,為首批接入該系列推理模型的平臺(tái)之一。
聚焦高效部署與分布式推理協(xié)同,金山云星流訓(xùn)推平臺(tái)提供從模型部署到調(diào)用的服務(wù)能力,通過智能任務(wù)調(diào)度與跨節(jié)點(diǎn)并行計(jì)算,該平臺(tái)可實(shí)現(xiàn)模型的高效推理。無需復(fù)雜配置,用戶即可在公有云環(huán)境構(gòu)建穩(wěn)定、高性價(jià)比的模型服務(wù)。
金山云星流訓(xùn)推平臺(tái)部署GLM系列推理模型流程:
1. 進(jìn)入金山星流訓(xùn)推平臺(tái)控制臺(tái)并創(chuàng)建資源池
2. 進(jìn)入模型在線服務(wù)導(dǎo)航頁
3. 點(diǎn)擊新建,創(chuàng)建模型在線服務(wù)
a. 部署類型選擇模型部署
b. 選擇GLM系列推理模型,用戶可自主配置服務(wù)副本數(shù)
c. 填寫基本信息、資源、網(wǎng)絡(luò)等配置
d. 點(diǎn)擊確認(rèn),模型開始部署
*模型部署所需時(shí)間較長,請耐心等待
4. 調(diào)用模型服務(wù)
a. 支持內(nèi)網(wǎng)、公網(wǎng)調(diào)用和在線調(diào)試
b. 支持WebUI調(diào)用模型
*用戶可根據(jù)需求選擇調(diào)用方式進(jìn)行模型調(diào)用
32B/9B系列GLM模型是國產(chǎn)AI大模型獨(dú)角獸智譜于日前正式開源的,涵蓋基座、推理、沉思模型,均遵循 MIT 許可協(xié)議。
據(jù)悉,GLM-Z1-32B-0414是具有深度思考能力的推理模型,相較其32B基座模型提升了數(shù)理能力和解決復(fù)雜任務(wù)的能力。據(jù)智譜公開測試結(jié)果,在AIME 24/25、LiveCodeBench、GPQA 等基準(zhǔn)測試中,GLM-Z1-32B-0414 在數(shù)理推理能力、指令遵循能力和綜合工具調(diào)用能力等方面表現(xiàn)突出。沿用了上述一系列技術(shù),智譜還訓(xùn)練了一個(gè)9B的小尺寸模型。據(jù)智譜公開數(shù)據(jù),該小尺寸模型雖然參數(shù)量更少,但是在數(shù)學(xué)推理及通用任務(wù)上依然表現(xiàn)優(yōu)異。
此前,金山云星流訓(xùn)推平臺(tái)已完成DeepSeek等多款大模型部署。通過接入更多優(yōu)質(zhì)大模型,金山云將為各領(lǐng)域客戶提供更加高效、智能和更具性價(jià)比的模型服務(wù)。