国产成人一区二区三区久久精品 , 如果爱有天意在线观看免费完整版 , 香港战役电影完整版在线看未删减 , 夺冠电影在线观看完整版1080,国产少妇国语对白污,国产最新视频,久久色网站

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

DeepSeek多模態(tài)模型來了 已公布技術(shù)報告

2026-04-30 22:20:05

4月30日《每日經(jīng)濟新聞》記者注意到,DeepSeek在Github發(fā)布多模態(tài)模型及技術(shù)報告。DeepSeek提出基于視覺原語的思考這一創(chuàng)新推理框架,將空間標記融入思考。其模型基于高度優(yōu)化架構(gòu),視覺標記效率高,在基準測試上可與前沿模型媲美,為開發(fā)多模態(tài)智能指明方向。

每經(jīng)記者|葉曉丹    每經(jīng)編輯|廖丹    

4月30日,《每日經(jīng)濟新聞》記者注意到,DeepSeek在Github上正式發(fā)布了多模態(tài)模型,公布了背后的技術(shù)報告。

圖片來源:Github網(wǎng)站

DeepSeek在技術(shù)報告中提到,盡管多模態(tài)大語言模型(MLLMs)取得了顯著進展,但主流的思維鏈(CoT)范式仍主要局限于語言學(xué)領(lǐng)域。雖然近期研究重點通過高分辨率裁剪技術(shù)(例如基于圖像的思考)來彌合感知鴻溝,卻忽視了一個更根本的瓶頸:參照鴻溝。自然語言固有的模糊性往往無法為復(fù)雜的空間布局提供精確、明確的指引,導(dǎo)致需要嚴謹參照的任務(wù)出現(xiàn)邏輯崩潰。

而DeepSeek多模態(tài)技術(shù)報告提出基于視覺原語的思考——這一創(chuàng)新推理框架將點、邊界框等空間標記提升為“思維的基本單元”。通過將這些視覺原語直接融入思考過程,DeepSeek的模型在“推理”時能夠“指代”,從而將其認知軌跡有效錨定在圖像的物理坐標中。

值得注意的是,DeepSeek技術(shù)報告提到,其框架基于高度優(yōu)化的架構(gòu),具備極高的視覺標記效率。盡管模型規(guī)模緊湊且圖像標記預(yù)算顯著較低,DeepSeek的多模態(tài)模型在具有挑戰(zhàn)性的計數(shù)和空間推理基準測試上,能夠與GPT-5.4、Claude-Sonnet-4.6和 Gemini-3-Flash等前沿模型匹配。這為開發(fā)更高效、更具可擴展性的System-2類多模態(tài)智能指明了方向。

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關(guān)注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

2

0