91无码视频一区|蜜臀福利在线观看|日韩一极黄色视频|色欲人妻少妇Av一区二区|婷婷香蕉视频欧美三级片黄色|一级A片刺激高潮|国产精品污污久久|日韩黄色精品日韩久久综合网|中国一级片电影在线|超碰乱码久久久免费

OpenAI推出超強編程模型:性能超越谷歌,助力編程新突破

2025-11-21

IT之家11月20日消息,OpenAI于昨日(11月19日)發(fā)布博文,宣布推出GPT - 5.1 - Codex - Max智能體編程模型。該模型顯著提升了長遠推理能力、效率和實時交互能力,并且將取代GPT - 5.1 - Codex,成為Codex集成界面上的默認模型。


據IT之家援引博文介紹,此次發(fā)布緊跟谷歌Gemini 3 Pro之后。不過,在多個關鍵編程基準測試中,Codex - Max展現出更強的實力。例如,在衡量解決實際軟件問題的SWE - Bench Verified測試中,Codex - Max以77.9%的準確率小幅領先于Gemini 3 Pro的76.2%。


Codex - Max在Terminal - Bench 2.0測試中也處于領先地位,準確率達到58.1%,而Gemini的準確率為54.2%;在LiveCodeBench Pro(一項競爭激烈的編碼Elo基準測試)測試中,它的得分與Gemini的2439分持平。


GPT - 5.1 - Codex - Max的一項重大架構升級是引入了名為“壓縮”(Compaction)的機制。該機制能讓模型在接近其上下文窗口限制時,智能地保留關鍵上下文信息并丟棄無關細節(jié),從而實現跨越數百萬token的連續(xù)工作,且不會出現性能下降。


得益于這一機制,該模型在內部測試中已成功完成持續(xù)超過24小時的復雜任務,如多步驟代碼重構和自主調試。同時,這項技術還提升了約30%的token效率,有效降低了成本與延遲。


新模型目前已集成到OpenAI自家的多個Codex開發(fā)環(huán)境中,包括其官方命令行工具(Codex CLI)、內部代碼審查工具以及各類交互式編程環(huán)境。


開發(fā)者可以通過這些工具體驗到模型強大的實時交互能力,例如在可視化界面中進行強化學習訓練或模擬光學定律。不過,GPT - 5.1 - Codex - Max尚未通過公共API提供,但官方表示即將開放。普通用戶則需要訂閱ChatGPT Plus、Pro或企業(yè)版等付費計劃才能使用。


OpenAI透露,其內部95%的工程師每周都會使用Codex。自采用以來,這些工程師平均多提交了約70%的拉取請求(Pull Requests),顯著提升了內部開發(fā)速度。


盡管Codex - Max具備高度的自主性,OpenAI仍強調它應作為編碼“助手”而非人類的替代品。為保證透明度,模型會生成詳細的終端日志和測試引用,以便開發(fā)者審查和驗證其生成的所有代碼。此外,模型在默認情況下運行于嚴格的沙盒環(huán)境中,并禁用了網絡訪問,以確保安全性。


本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。

免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com