DeepSeek 今日宣布推出實(shí)驗(yàn)性模型 DeepSeek-V3.2-Exp,該版本被定位為新一代架構(gòu)研發(fā)的過渡性產(chǎn)品。基于此前發(fā)布的 V3.1-Terminus 模型,研發(fā)團(tuán)隊(duì)首次引入了自主研發(fā)的 DeepSeek Sparse Attention 稀疏注意力機(jī)制,重點(diǎn)針對(duì)長文本場景下的訓(xùn)練效率與推理性能展開優(yōu)化驗(yàn)證。
此次更新同步覆蓋多平臺(tái)服務(wù),官方移動(dòng)應(yīng)用、網(wǎng)頁端及小程序均已完成版本升級(jí)。技術(shù)團(tuán)隊(duì)特別強(qiáng)調(diào),V3.2-Exp 已在多個(gè)公開評(píng)測(cè)基準(zhǔn)中完成有效性驗(yàn)證,但考慮到實(shí)際使用場景的復(fù)雜性,仍需通過更大規(guī)模的測(cè)試來檢驗(yàn)?zāi)P托阅堋榇耍俜經(jīng)Q定臨時(shí)保留 V3.1-Terminus 的獨(dú)立 API 接口,方便開發(fā)者進(jìn)行對(duì)比測(cè)試。
在開發(fā)者服務(wù)層面,DeepSeek 宣布即日起下調(diào) API 調(diào)用價(jià)格,降幅超過 50%。這一調(diào)整將顯著降低企業(yè)級(jí)用戶的技術(shù)接入成本,尤其利好需要處理大規(guī)模文本數(shù)據(jù)的商業(yè)應(yīng)用場景。研發(fā)團(tuán)隊(duì)透露,價(jià)格優(yōu)化得益于稀疏注意力機(jī)制帶來的計(jì)算效率提升。
據(jù)技術(shù)文檔披露,DeepSeek Sparse Attention 通過動(dòng)態(tài)識(shí)別文本關(guān)鍵區(qū)域,在保持模型性能的同時(shí)減少無效計(jì)算。這種創(chuàng)新機(jī)制特別適用于法律文書分析、長篇內(nèi)容生成等需要處理超長文本的場景。目前,研發(fā)團(tuán)隊(duì)正在收集用戶反饋數(shù)據(jù),為后續(xù)架構(gòu)升級(jí)提供實(shí)證依據(jù)。















