亚洲欧美激情国产区,亚洲最大的欧美日韩在线,国产精品bbbbxxxx,免费国产不卡一级αⅴ片

<td id="v65pv"><progress id="v65pv"><listing id="v65pv"></listing></progress></td>

    <address id="v65pv"></address>
    資訊中心

    最新更新文章排行

    掃描打開手機站
    隨時逛,更方便!
    當前位置: 首頁 > 汽車科技

    DeepSeek發(fā)布新版R1 能力接近美國頂尖模型

    時間:2025-05-30 10:15:55 來源:網絡作者: 網絡編輯

    人工智能起步公司深度求索(DeepSeek)發(fā)布其熱門推理模型R1的首次更新版本,稱新版R1模型深度思考能力得到強化,整體表現(xiàn)上已接近美國競爭對手OpenAI和谷歌推出的頂尖模型。

    DeepSeek星期四(5月29日)晚在官方微信公眾號發(fā)文稱,DeepSeek R1模型已完成小版本升級,當前版本為DeepSeek-R1-0528。

    DeepSeek-R1-0528仍然使用去年12月所發(fā)布的DeepSeek V3 Base模型作為基座,但在后訓練過程中投入了更多算力,顯著提升了模型的思維深度與推理能力。相較于舊版R1,新版模型在復雜推理任務中的表現(xiàn)有了顯著提升。

    文章特別提到,更新后的R1模型對“幻覺”問題(錯誤或誤導性輸出)進行了優(yōu)化,在改寫潤色、總結摘要、閱讀理解等場景中,幻覺率降低了45%至50%左右。其他方面的提升則包括更貼近人類偏好的創(chuàng)意寫作,和更好的前端代碼生成、角色扮演能力。

    DeepSeek表示,更新后的R1模型在數(shù)學、編程與通用邏輯等多個基準測評中,取得當前中國“所有模型中首屈一指的成績”,在整體表現(xiàn)上已接近OpenAI的o3和谷歌的Gemini-2.5-Pro等美國頂尖模型。

    DeepSeek同時也說,該公司在蒸餾DeepSeek-R1-0528的思維鏈后,訓練科技巨頭阿里巴巴的Qwen3-8B基礎模型,得到了DeepSeek-R1-0528-Qwen3-8B,在性能上比原版模型高出10%。

    DeepSeek稱:“我們相信,DeepSeek-R1-0528 的思維鏈對于學術界推理模型的研究和工業(yè)界針對小模型的開發(fā)都將具有重要意義?!?/p>

    DeepSeek也將繼續(xù)開源新版R1模型,允許用戶利用模型輸出、通過模型蒸餾等方式訓練其他模型。

    今年1月發(fā)布的R1在全球引發(fā)熱議,導致中國以外的科技股暴跌,挑戰(zhàn)了“擴展人工智能需要巨大算力和投資”這一觀點。阿里巴巴和騰訊等科技巨頭此后紛紛發(fā)布聲稱超越DeepSeek的模型。

    報道稱,DeepSeek的成功也顛覆美國出口管制阻礙人工智能進步的看法,因為它以極低成本發(fā)布了與美國行業(yè)領先模型相當甚至更好的人工智能模型。

    為了應對來自DeepSeek的競爭,谷歌的Gemini已推出折扣版本,而OpenAI也降低了價格,并發(fā)布對算力要求更低的o3 Mini模型。

    DeepSeek曾在3月發(fā)布V3大型語言模型的升級版。外界普遍預計DeepSeek將推出R1的后續(xù)版本R2,路透社3月曾引述消息人士稱,R2最初計劃在5月發(fā)布。


    免責聲明:本文內容由互聯(lián)網用戶自發(fā)貢獻,該文觀點僅代表作者本人。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。如發(fā)現(xiàn)本站有涉嫌抄襲侵權/違法違規(guī)的內容, 請發(fā)送郵件sdword@qq.com舉報,一經查實,本站將立刻刪除。

    本類推薦

    本站訪客:72548
    本站訪客:72548