91无码视频一区|蜜臀福利在线观看|日韩一极黄色视频|色欲人妻少妇Av一区二区|婷婷香蕉视频欧美三级片黄色|一级A片刺激高潮|国产精品污污久久|日韩黄色精品日韩久久综合网|中国一级片电影在线|超碰乱码久久久免费

<li id="jfofu"><tbody id="jfofu"><bdo id="jfofu"></bdo></tbody></li>

<label id="jfofu"></label>

<button id="jfofu"><output id="jfofu"></output></button>

<center id="jfofu"></center>

<li id="jfofu"><tbody id="jfofu"></tbody></li>

<li id="cbpuk"></li>

<li id="cbpuk"></li>

OpenAI推出超強編程模型：性能超越谷歌，助力編程新突破

2025-11-21

IT之家11月20日消息，OpenAI于昨日（11月19日）發(fā)布博文，宣布推出GPT - 5.1 - Codex - Max智能體編程模型。該模型顯著提升了長遠推理能力、效率和實時交互能力，并且將取代GPT - 5.1 - Codex，成為Codex集成界面上的默認模型。

據IT之家援引博文介紹，此次發(fā)布緊跟谷歌Gemini 3 Pro之后。不過，在多個關鍵編程基準測試中，Codex - Max展現出更強的實力。例如，在衡量解決實際軟件問題的SWE - Bench Verified測試中，Codex - Max以77.9%的準確率小幅領先于Gemini 3 Pro的76.2%。

Codex - Max在Terminal - Bench 2.0測試中也處于領先地位，準確率達到58.1%，而Gemini的準確率為54.2%；在LiveCodeBench Pro（一項競爭激烈的編碼Elo基準測試）測試中，它的得分與Gemini的2439分持平。

GPT - 5.1 - Codex - Max的一項重大架構升級是引入了名為“壓縮”（Compaction）的機制。該機制能讓模型在接近其上下文窗口限制時，智能地保留關鍵上下文信息并丟棄無關細節(jié)，從而實現跨越數百萬token的連續(xù)工作，且不會出現性能下降。

得益于這一機制，該模型在內部測試中已成功完成持續(xù)超過24小時的復雜任務，如多步驟代碼重構和自主調試。同時，這項技術還提升了約30%的token效率，有效降低了成本與延遲。

新模型目前已集成到OpenAI自家的多個Codex開發(fā)環(huán)境中，包括其官方命令行工具（Codex CLI）、內部代碼審查工具以及各類交互式編程環(huán)境。

開發(fā)者可以通過這些工具體驗到模型強大的實時交互能力，例如在可視化界面中進行強化學習訓練或模擬光學定律。不過，GPT - 5.1 - Codex - Max尚未通過公共API提供，但官方表示即將開放。普通用戶則需要訂閱ChatGPT Plus、Pro或企業(yè)版等付費計劃才能使用。

OpenAI透露，其內部95%的工程師每周都會使用Codex。自采用以來，這些工程師平均多提交了約70%的拉取請求（Pull Requests），顯著提升了內部開發(fā)速度。

盡管Codex - Max具備高度的自主性，OpenAI仍強調它應作為編碼“助手”而非人類的替代品。為保證透明度，模型會生成詳細的終端日志和測試引用，以便開發(fā)者審查和驗證其生成的所有代碼。此外，模型在默認情況下運行于嚴格的沙盒環(huán)境中，并禁用了網絡訪問，以確保安全性。

本文僅代表作者觀點，版權歸原創(chuàng)者所有，如需轉載請在文中注明來源及作者名字。

免責聲明：本文系轉載編輯文章，僅作分享之用。如分享內容、圖片侵犯到您的版權或非授權發(fā)布，請及時與我們聯系進行審核處理或刪除，您可以發(fā)送材料至郵箱：service@tojoy.com

延伸閱讀

騙子新騙局！“消防隊聯誼舞會”是假的

華為首款Mate 80系列支持eSIM，最高可裝四個號

巴菲特：區(qū)分人生贏家與輸家的唯一選擇——愛

“我的男友竟是假上將？”

6款熱銷轎車輔助駕駛系統(tǒng)測試橫評（重寫）

項目推薦

康小虎 · 健康小屋

康老板 · 氧療堂