一、DeepSeek-R1對標(biāo)OpenAIo1正式版,知識(shí)蒸餾技術(shù),讓小模型也能“聰明”推理
1月20日,DeepSeek正式發(fā)布一系列DeepSeek-R1模型,包括DeepSeek-R1-Zero、DeepSeek-R1和DeepSeek-R1-Distill系列。DeepSeek-R1模型推理能力優(yōu)異,基準(zhǔn)測試表現(xiàn)與OpenAI-o1-1217相當(dāng),且API服務(wù)定價(jià)遠(yuǎn)低于OpenAI同類產(chǎn)品。
此前,DeepSeek-R1-Zero在技術(shù)路線上實(shí)現(xiàn)了突破性創(chuàng)新,成為首個(gè)完全摒棄監(jiān)督微調(diào)環(huán)節(jié)、完全依賴強(qiáng)化學(xué)習(xí)訓(xùn)練的大語言模型。在此基礎(chǔ)上,DeepSeek-R1對R1-Zero進(jìn)行了改進(jìn)。通過引入冷啟動(dòng)數(shù)據(jù),并歷經(jīng)推理導(dǎo)向強(qiáng)化學(xué)習(xí)、拒絕采樣、監(jiān)督微調(diào)以及全場景強(qiáng)化學(xué)習(xí)的多階段訓(xùn)練,充分發(fā)揮了強(qiáng)化學(xué)習(xí)的自學(xué)習(xí)和自進(jìn)化能力。
DeepSeek團(tuán)隊(duì)深入探索了將R1的推理能力蒸餾到更小模型中的潛力,發(fā)現(xiàn)經(jīng)過R1蒸餾的小模型在推理能力上實(shí)現(xiàn)了顯著提升,甚至超過了在這些小模型上直接進(jìn)行強(qiáng)化學(xué)習(xí)的效果,證明了R1學(xué)到的推理模式具有很強(qiáng)的通用性和可遷移性,能夠通過蒸餾有效傳遞給其他模型。這些結(jié)論為業(yè)界提供了新的啟示,即對小模型而言,蒸餾優(yōu)于直接強(qiáng)化學(xué)習(xí),大模型學(xué)到的推理模式在蒸餾中得到了有效傳遞。
二、模型迭代、Agent升級(jí)、端側(cè)AI推新三方共振下,AI應(yīng)用商業(yè)化空間或不斷打開
DeepSeek-R1API服務(wù)定價(jià)為每百萬輸入tokens1元(緩存命中)/4元(緩存未命中),每百萬輸出tokens16元,遠(yuǎn)低于可比大模型API服務(wù)。DeepSeek-R1的高性價(jià)比API定價(jià)有助于開發(fā)者在使用后加速模型的功能迭代,從而解決目前模型存在的不足。
開源證券認(rèn)為,DeepSeek-R1基于強(qiáng)化學(xué)習(xí)再次讓“低成本+高性能”大模型成為可能,并有望引領(lǐng)模型往開源方向發(fā)展,強(qiáng)大的推理能力或助力其在教育、辦公、科研領(lǐng)域應(yīng)用加快落地;豆包、階躍星辰大模型不斷升級(jí)語音、情感、視覺理解及生成等多模態(tài)能力,在社交陪伴、影視、教育、電商、廣告等領(lǐng)域商業(yè)化或加快;智譜、OpenAI不斷推動(dòng)Agent成為AI應(yīng)用落地的重要工具。模型迭代、Agent升級(jí)、端側(cè)AI推新三方共振下,AI應(yīng)用商業(yè)化空間或不斷打開。
三、相關(guān)上市公司:實(shí)豐文化、天娛數(shù)科、引力傳媒
實(shí)豐文化:公司近期與靈優(yōu)智學(xué)(深圳)科技有限公司合作宣布達(dá)成戰(zhàn)略合作,雙方將在AIGC智能玩具領(lǐng)域展開全面合作,共同開發(fā)新一代智能玩具產(chǎn)品。
天娛數(shù)科:公司控股子公司山西鵬景科技有限公司已獲得今日頭條授權(quán)的巨量引擎全國地區(qū)除獨(dú)代范圍以外綜合代理商、巨量千川電商營銷服務(wù)商資質(zhì),主要服務(wù)于國內(nèi)在線教育、網(wǎng)絡(luò)服務(wù)、金融保險(xiǎn)、電商等行業(yè)重點(diǎn)客戶,能夠?yàn)榭蛻舻母黝惍a(chǎn)品提供基于短視頻廣告的推廣方案制作、創(chuàng)意素材創(chuàng)作、投放運(yùn)營優(yōu)化、電商營銷推廣、大數(shù)據(jù)跟蹤檢測等精準(zhǔn)數(shù)字營銷服務(wù)。
引力傳媒:公司取得了多家優(yōu)質(zhì)移動(dòng)媒體的獨(dú)家代理權(quán)或核心代理權(quán),與今日頭條、抖音、知乎、網(wǎng)易云音樂、樂動(dòng)力、課程格子、雪球、攜程、馬蜂窩等超過兩百家的優(yōu)質(zhì)移動(dòng)媒體建立了長期渠道合作關(guān)系。公司內(nèi)部自研上線“核力AI”的1.0版本、已具備“營銷文案 生成”、“圖片識(shí)別與生成”及“數(shù)字分身復(fù)刻及驅(qū)動(dòng)”等功能應(yīng)用。目前公司已明確完善在 AIGC 方向的「1+2+4」布局規(guī)劃,并與外部技術(shù)公司聯(lián)合打造“營銷與電商”垂類大模型,共同推動(dòng) AI多模態(tài)產(chǎn)品應(yīng)用場景落地。





