91无码视频一区|蜜臀福利在线观看|日韩一极黄色视频|色欲人妻少妇Av一区二区|婷婷香蕉视频欧美三级片黄色|一级A片刺激高潮|国产精品污污久久|日韩黄色精品日韩久久综合网|中国一级片电影在线|超碰乱码久久久免费

LeCun揭露Meta刷榜黑幕,田淵棟創(chuàng)業(yè)官宣:未曾預料的結局

01-05 06:33
離職后的LeCun,立刻向Meta投下重磅一擊:備受詬病的Llama4確實存在刷榜作弊行為!


結果確實被篡改了一部分。為了獲得更優(yōu)的成績,團隊針對不同的基準測試采用了不同的模型。




都說不要招惹離職人員,不止LeCun,田淵棟也在個人年終總結中透露了一些內幕。


明明是被拉來為Llama4解決問題的,事先預想了四種可能性,結果小扎給了我第五種……



(扶額苦笑.jpg)



無論如何,至于離職后的計劃,兩位大神不約而同地表示:


創(chuàng)業(yè)!



Llama4刷榜引發(fā)離職潮


DeepSeek給小扎帶來的壓力實在太大了。


此前就有消息爆料,DeepSeek的突然崛起,讓Llama4還未發(fā)布就落在了后面,迫使小扎加大對AI的投資力度。


這一點也得到了LeCun的證實。


小扎確實慌了,在公司內部施壓,要求生成式AI部門加快AI開發(fā)和部署的速度,還請來原FAIR團隊的田淵棟來解決問題。


結果導致團隊之間的溝通直接斷裂。LeCun他們想要嘗試新的東西,但小扎更傾向于已經(jīng)被驗證過、可以直接落地的技術。


真正的導火索來自于Llama4的失敗。



不僅輸了比賽,還因為排行榜造假導致名聲一落千丈,于是小扎徹底對團隊所有人失去了信任,將他們全部邊緣化。


這也直接導致Meta開啟了團隊大換血:一邊不惜重金從硅谷各公司挖人,一邊又大刀闊斧地裁掉老員工。


田淵棟及其團隊是最先受到影響的一批人。


一月份被緊急安排加入Llama4項目,十月份Llama4.5一訓練完成就被“卸磨殺驢”。


這次田淵棟都得喊冤……


因為上級的壓力,整個小組被迫放下手頭正在進行的工作,來處理Llama4的爛攤子,距離發(fā)布截止日期只剩2個月,還要處理所有的臟活累活。


為此,田淵棟當時還專門畫了一個2x2的回報矩陣,計算了做這件事的四種結局



但老板都發(fā)話了,不得不干啊,田淵棟想著那就盡力而為,問心無愧吧。


結果辛辛苦苦干了幾個月,小扎一個都沒選,給出了Plan E:不追究負責人的責任,反而把田淵棟和組員們一腳踢了出去。



難怪田淵棟回顧這段經(jīng)歷時,也要說一句:


這也讓我對社會的復雜性有了更深刻的認識。



不過好在田淵棟自己也想得開,他說自己已經(jīng)在Meta待了十多年了,最近幾年更是抱著“公司快把我開了吧”的心態(tài),所以也算是因禍得福,還為他接下來的小說創(chuàng)作提供了不少新素材(doge)。



(咳咳)言歸正傳,這幾個月對于田淵棟來說,也不算毫無收獲,在強化學習訓練的核心問題上他也有了一些新的探索。


首先是大模型推理,繼2024年底團隊公開的連續(xù)隱空間推理(coconut)引發(fā)廣泛關注后,團隊繼續(xù)通過理論工作Reasoning by Superposition進一步闡明了連續(xù)隱空間推理的優(yōu)勢。


與此同時,也從不同角度嘗試提升模型推理效率:Token Assorted通過隱空間的離散token減少計算開銷、DeepConf基于置信度提前終止推理、ThreadWeaver制造并行思維鏈加速推理,以及在不同規(guī)模模型中用RL學習推理能力。


可解釋性方面,研究聚焦于Grokking(頓悟)這一特征涌現(xiàn)現(xiàn)象,從記憶到泛化的突變過程入手,試圖解釋模型究竟學到了什么、和輸入數(shù)據(jù)的關系、能達到怎樣的泛化,也就是打開模型的黑箱。


簡而言之,對于被拉來“背黑鍋”這件事,田淵棟對老東家還是手下留情了,雖然你不地道,但我已經(jīng)Let it go~



不過緊隨其后離職的LeCun就沒那么心軟了,直接痛批Meta內部對LLM過度癡迷,尤其是那些新挖來的超級智能實驗室成員。


他點名批評亞歷山大王:年輕且缺乏經(jīng)驗。


雖然學得快,但壓根不懂研究,不知道怎么做、也不知道如何和研究員們相處。


在LeCun面前,這個27歲的年輕人,簡直像個little baby。


但大語言模型并非他們所想象的那樣美好,LeCun直言,LLM有用但本質受限于語言,夸張一點說:


LLM是死胡同。



要實現(xiàn)人類水平的智能,就必須了解物理世界的運作規(guī)律,也就是LeCun長期專注的世界模型,但Meta對此已經(jīng)喪失了興趣。


在研究路線上的分歧,也讓LeCun不得不離開公司,開啟自己人生的下一章——創(chuàng)業(yè)。


離開Meta做點啥?創(chuàng)業(yè)


LeCun的新公司名為Advanced Machine Intelligence(AMI),做的還是他心心念念的世界模型,而且完全采用開源模式。


不過據(jù)他自己透露,他只會擔任新公司的執(zhí)行主席而不是CEO。


我是一名科學家,我能激勵人們工作,以及預測哪項技術會成功,但我不擅長組織管理,而且實在太老了。



LeCun將擁有和之前在Meta相同的研究自由度,而負責帶領AMI的將是法國醫(yī)療AI初創(chuàng)公司Nabla的聯(lián)合創(chuàng)始人兼CEO Alex LeBrun。



他們將目光聚焦在V-JEPA架構上,試圖通過學習視頻和空間數(shù)據(jù)來理解物理世界,讓AI完成規(guī)劃、推理并擁有長期記憶,也就是他常說的高級機器智能。


LeCun預計將在12個月內,見證該項技術初始版本的誕生,并在最近幾年內實現(xiàn)大規(guī)模進展,雖然它顯然還遠遠稱不上超級智能,但至少在通往AGI的道路上,它存在希望。



而作為LeCun的老下屬,田淵棟也拒絕了大廠們紛紛拋來的橄欖枝,剛剛正式宣布創(chuàng)業(yè)!


具體細節(jié)暫時未公布,但他表示:


趁著自己還年輕,去當一家新初創(chuàng)公司的聯(lián)合創(chuàng)始人。



不管怎樣,先安靜地忙活一陣。


參考鏈接:


[1]https://www.ft.com/content/e3c4c2f6-4ea7-4adf-b945-e58495f836c2


[2]https://zhuanlan.zhihu.com/p/1990809161458540818


本文來自微信公眾號“量子位”,作者:關注前沿科技,36氪經(jīng)授權發(fā)布。


本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。

免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com