www.日日操_国产 日韩 欧美在线_欧美婷婷精品激情_欧美一级视频免费看_伊人久久在线观看_黄色网址在线免费看_www亚洲成人_日本高清视频免费在线观看_51xx午夜影福利_中文字幕网av_日本在线视频www色_jizz欧美性11

登錄
首頁 > 今日新聞 > Vision-Zero:零數據VLM自我進化!陳怡然團隊提出零監督訓練

Vision-Zero:零數據VLM自我進化!陳怡然團隊提出零監督訓練

發布時間:2025-10-12 09:42:32

盡管目前VLM在多模態任務上表現突出,但訓練過度依賴人工標注的數據與精心設計的強化學習獎勵。這種依賴帶來數據稀缺問題:多模態標注成本高昂,限制了訓練數據的規模與多樣性。同時存在知識天花板:模型能力受人類監督邊界限制,難以突破人類已有知識和策略。曾經AlphaGo所使用的自博弈技術通過模型與自身副本競爭交互并自動獲取反饋,把計算轉變為數據的同時消除了對人工監督的依賴,這使得它能夠持續推動模型進步并突破人類能力上限。但是受制于VLM的多模態特性,目前鮮有對自博弈在VLM上應用的系統性研究。為此研究團隊設計了一套適應VLM特性的自博弈框架Vision-Zero,此框架有如下特點:

(1)策略自博弈框架:Vision-Zero在以社交推理類游戲為模板的環境中訓練VLM,使得agent在自博弈過程中自動生成高復雜度推理數據,而無需人工標注。

(2)任意形式的圖片都可作為輸入:和以往有限制條件的游戲化訓練框架不同的是,Vision-Zero可在任意形式的圖片上啟動游戲,這使得模型可以在很多不同的領域里獲得相應的能力提升,并有很好的泛化性能。

(3)持續的性能提升:研究團隊提出了自博弈和可驗證獎勵的強化學習(RLVR)交替優化的自博弈策略優化算法(Iterative-SPO),這一算法解決了傳統自博弈算法中常見的性能瓶頸問題。

盡管沒有用任何標注數據做訓練,Vision-Zero在多個領域如推理,圖表問答和Vision-Centric理解任務上超越了其他有標注的SOTA后訓練方法。



從棋盤到現實:

AlphaGo自博弈思想的泛化

自博弈作為OpenAI早期的重要技術路線之一,也是人工智能發展歷程中多項里程碑事件的關鍵推動力。典型代表包括2016年AlphaGo戰勝李世石,以及2019年OpenAI Five在Dota 2上擊敗世界冠軍OG戰隊。人們在看到自博弈在某些特定領域大幅超越人類智能的同時,往往也會思考我們是否有可能把這種思想應用到更多的開放場景中。然而讓AlphaGo從棋盤走入現實需要解決以下幾個難題:

(1)Agent為贏得博弈所習得的技能,應當與目標任務所需的技能高度一致。

(2)博弈環境應當足夠多樣且復雜,以便廣泛的目標任務都能夠滿足條件(1)。

(3)技能增長應當具有可擴展性:隨著自博弈的進行,環境應當不斷提高難度,使得越來越強的智能體能夠涌現,而不是讓訓練收斂到一個固定的上限。

受到社交推理游戲,如“誰是臥底”的啟發,研究團隊設計了一套完備的自博弈規則以解決上述難題,具體規則如下:

(1)游戲中有n名平民和1名臥底。玩家首先被告知自己的角色。

(2)每名玩家會得到一張圖片,臥底的圖片與平民略有不同(如缺失、添加或修改了某個物體)。

(3)線索階段:每位玩家觀察自己的圖片,并給出一個口頭線索,描述圖片內容(可以是物體描述、推斷信息等)。

(4)決策階段:多輪線索給出后,進入決策階段。玩家根據線索結合自己的圖片,投票找出臥底。



此游戲具有高度策略性與挑戰性,臥底需要根據他人線索推斷并偽裝自己,避免暴露。平民需要提供足夠準確但不泄密的線索,同時分析他人線索尋找可疑點。如此一來,Agent在游戲過程中便可生成足夠長且復雜的推理鏈條,并且隨著對手能力的提升,其所面臨的挑戰也會越來越大,并被激發出更強的視覺理解與推理能力。

Copyright 2014-2025 觀經濟 版權所有  京ICP備20151973號-1
www.日日操_国产 日韩 欧美在线_欧美婷婷精品激情_欧美一级视频免费看_伊人久久在线观看_黄色网址在线免费看_www亚洲成人_日本高清视频免费在线观看_51xx午夜影福利_中文字幕网av_日本在线视频www色_jizz欧美性11
欧美亚洲tv| 日韩在线麻豆| 日韩天堂av| 亚洲三级av| 久久久久久色 | 国产精品白丝一区二区三区| 久久福利在线| 亚洲激情二区| 97精品国产福利一区二区三区| 欧美1区免费| 欧美精品国产白浆久久久久| 久久久男人天堂| 国产一级一区二区| 精品99在线| 日韩精品高清不卡| 欧美日韩在线观看视频小说| 欧美一区91| 亚洲精品国产偷自在线观看| 精品高清久久| 亚洲久久视频| 在线一区电影| av高清一区| 国产精品久久久久9999高清| 久久高清精品| 国产成人精品免费视| 亚洲精品人人| 免播放器亚洲| 国产精品亚洲一区二区三区在线观看| 国产麻豆一区二区三区| 伊人成人在线视频| 欧美亚洲日本精品| 国产精品久久久久久久久久久久久久久| 黄色日韩精品| 99久久激情| 日韩欧美国产精品综合嫩v| 日韩av中文字幕一区| 99综合视频| 欧美日韩国产精品一区二区亚洲| 高潮一区二区| 福利一区二区免费视频| 国产精品黄网站| 亚洲精品综合| 亚洲激情另类| 国产美女精品| 久久午夜影视| 日韩中文字幕一区二区三区| 欧美粗暴jizz性欧美20| 久久婷婷久久| 激情综合网站| 久久精品影视| 亚洲二区在线| 午夜国产精品视频| 亚洲福利久久| 国产午夜精品一区二区三区欧美| 欧美在线亚洲综合一区| 激情五月色综合国产精品| 999国产精品视频| 在线人成日本视频| 亚洲成人国产| 欧美特黄一区| 日本综合精品一区| 日本视频中文字幕一区二区三区| 日韩不卡一区二区三区| 欧美午夜三级| 精品一区二区三区在线观看视频 | 欧美日韩一视频区二区| 亚洲精品进入| 老司机精品视频网| 成人va天堂| 欧美另类专区| 国产欧美日韩免费观看| 欧美韩日一区| 在线视频精品| 日韩va亚洲va欧美va久久| 麻豆精品蜜桃视频网站| 日韩深夜视频| 美女久久一区| 精品欠久久久中文字幕加勒比| 亚洲成人不卡| 日本亚洲欧美天堂免费| 久久这里只有| 2023国产精品久久久精品双| 首页国产欧美久久| 美女精品视频在线| 深夜福利视频一区二区| 快she精品国产999| 在线中文字幕播放| 欧美日韩视频| 中文字幕日本一区二区| 美女视频一区在线观看| 久久国产免费| 欧美久久精品| www成人在线视频| 亚洲日本在线观看视频| 麻豆一区二区99久久久久| 六月丁香综合在线视频| 欧美日韩视频| 福利一区二区| 日韩精品a在线观看91| 中国字幕a在线看韩国电影| 成人国产精品久久| 亚洲午夜久久| 91精品国产91久久久久久黑人| 日本99精品| 国产手机视频一区二区| 给我免费播放日韩视频| 日韩在线麻豆| 亚洲成人精品| 日本一区二区高清不卡| 国产精品亚洲欧美一级在线| 日韩精品一二三| 欧美91视频| 欧美www视频在线观看| 国产日韩欧美在线播放不卡| 欧美日韩国产免费观看| 亚洲人成在线网站| 国产精品久久亚洲不卡| 日本不卡视频在线| 免费不卡在线视频| 国产精品中文字幕亚洲欧美| 日本少妇一区二区| 亚洲九九精品| 在线免费观看亚洲| 亚洲综合专区| 亚州欧美在线| 婷婷视频一区二区三区| 免费在线观看日韩欧美| 欧美日一区二区在线观看| 亚洲三级网站| 国产精品毛片一区二区三区| 欧美高清一区| 午夜久久福利| 国产色综合网| 日韩专区视频网站| 97精品国产99久久久久久免费| 久久国产精品亚洲77777| 国产午夜久久| 日韩精品一区二区三区中文字幕| 亚洲字幕久久| 国产精品久久| 成人三级高清视频在线看| 国产精品久久久久av电视剧| 久久激情中文| 伊人久久婷婷| 日韩精品视频在线看| 国产探花在线精品一区二区| 国产精品欧美一区二区三区不卡| 国产美女精品| 综合激情在线| 日韩中出av| 欧美美女一区| 亚洲高清二区| 中文av在线全新| 日本视频中文字幕一区二区三区| 美女精品网站| 国产精品入口久久| 天堂8中文在线最新版在线| 欧美午夜精品一区二区三区电影| av最新在线| 99在线观看免费视频精品观看| 99热精品在线观看| 国产精品视频首页| 精品亚洲免a| 精品一区在线| 国产欧美精品| 国产一区日韩一区| 欧美一区在线观看视频| 国产亚洲一区二区手机在线观看 | 三上悠亚国产精品一区二区三区| 精品国产第一福利网站| 精品91久久久久| 国产精品红桃| 日韩午夜av在线| 精品视频黄色| 亚洲18在线| 久久久久久久久久久妇女| 日韩国产在线不卡视频| 日韩精品不卡一区二区| 亚洲精品韩国| 久久婷婷久久| 日韩综合在线| 欧美黄色精品| 日韩精品一区第一页| 老司机免费视频一区二区| 国产一区二区三区不卡av | 国产精品欧美在线观看| 在线亚洲欧美| 福利一区在线| 国产精品久久久久久久久久白浆| 亚洲天堂久久| 大香伊人久久精品一区二区 | 日韩国产成人精品| 天堂资源在线亚洲| 福利精品在线| 欧美激情福利| 日本综合精品一区| 综合激情网...| 免费在线欧美视频| 国产精品婷婷| 欧美成人亚洲|