了解金山云最新資訊
2025-02-11 18:00:00
金山云在公有云場景和國資云/政務(wù)云場景已支持DeepSeek-R1/V3。
場景一
公有云場景針對DeepSeek-R1蒸餾模型的多種鏡像服務(wù)
金山云已正式發(fā)布基于DeepSeek-R1蒸餾模型的多種鏡像服務(wù),用戶可以在金山云官網(wǎng),進入“金山云控制臺”免費體驗。
通過金山云發(fā)布的DeepSeek鏡像服務(wù),用戶可在公有云GPU云服務(wù)器、GPU裸金屬服務(wù)器分別搭建推理服務(wù)并進行調(diào)參驗證。
在云服務(wù)器控制臺按需選擇實例規(guī)格后,在“鏡像配置-鏡像市場-工具軟件”模塊選擇DeepSeek-R1系列的鏡像創(chuàng)建云服務(wù)器,登錄實例進行部署驗證。
vLLM 部署提供支持,適用于高性能大語言模型的推理和微調(diào)任務(wù),支持DeepSeek系列模型運行。DeepSeek模型部署推薦的實例規(guī)格配置以及詳細驗證方法,可參考金山云官網(wǎng)文檔內(nèi)置DeepSeek模型的使用方法:
https://docs.ksyun.com/documents/44126?type=3
當(dāng)前,金山云裸金屬GPU系列機型均能高效支持DeepSeek-R1蒸餾模型快速部署,部分機型可支持DeepSeek-R1滿血版671B模型的快捷使用。針對DeepSeek蒸餾模型提供自定義鏡像,開機即用,滿血版模型可通過KS3快速下載部署使用。
在裸金屬服務(wù)器的實例規(guī)格選擇界面選擇合適的機型后,進入“選擇鏡像”步驟,選取DeepSeek-R1系列鏡像創(chuàng)建裸金屬服務(wù)器實例。實例創(chuàng)建并成功啟動后即可通過遠程連接工具登錄到該實例驗證并使用。
*云服務(wù)器本次開放1.5B、32B兩種尺寸模型鏡像,其余尺寸模型鏡像陸續(xù)更新中。金山云公有云自研平臺推理部署模塊即將接入DeepSeek,更多國產(chǎn)芯片適配工作也在加速推進中。
場景二
金山云國資云/政務(wù)云場景
全面支持DeepSeek-R1/V3推理服務(wù)
金山云國資云/政務(wù)云平臺已正式上架 DeepSeek-R1和 DeepSeek-V3模型。通過集成金山云自研的內(nèi)容安全服務(wù),客戶可實現(xiàn)模型安全增強與企業(yè)級高可用保障。
金山云國資云/政務(wù)云平臺具備優(yōu)異的模型推理托管能力,支持vLLM、LMDeploy、TensorRT-LLM、SGLang等各類主流推理框架,可實現(xiàn)模型的自定義導(dǎo)入與部署,為開發(fā)者提供了高度靈活的開發(fā)環(huán)境。目前,金山云的人工智能技術(shù)已被多個央國企采納,顯著提升了其數(shù)據(jù)處理效率。
依托國資云/政務(wù)云平臺,金山云通過模型市場構(gòu)建豐富的模型資源,同時匹配包含數(shù)據(jù)加工、模型精調(diào)、模型評估、模型量化等關(guān)鍵環(huán)節(jié)在內(nèi)的一站式模型工具鏈,始終致力于為用戶提供全流程、一站式的AI服務(wù),助力客戶在實際業(yè)務(wù)場景中深度優(yōu)化模型性能。
在人工智能浪潮下,金山云將繼續(xù)堅持技術(shù)立業(yè),加速技術(shù)創(chuàng)新落地,攜手生態(tài)企業(yè)積極擁抱時代機遇,助力行業(yè)數(shù)智化轉(zhuǎn)型。