- Gemini 3 首次引入生成式介面,並提升了專家級推理能力。
- 增強了多模態性能,擁有 1 萬個令牌,並改進了圖像和視訊結果。
- 功能更強大的代理:反重力、工作區整合和工具使用。
- 廣泛部署和增強安全性,可透過應用程式、搜尋、AI Studio 和 Vertex AI 存取。

谷歌新一代人工智慧的到來目標明確:從對話轉向執行。憑藉 Gemini 3,該公司實現了顯著的飛躍。 推理、多模態和能動能力它也首次提出了一種不同的互動方式:模型本身會動態生成介面,幫助您實現目標,而無需浪費時間在中間步驟。
所有這些都伴隨著應用程式的重新設計和改進 Google 搜尋、Workspace 和開發者工具並高度重視安全性。所有用戶都能感受到明顯的改進,但許多變化在高級應用中最為顯著:例如程式設計、數據分析、視訊和影像處理等。 使用代理實現自動化 在人工監督下進行計劃和行動。
什麼是雙子座3號?為什麼它標誌著一個轉折點?
在實踐中,這意味著更直接、更有用的回复,減少某些聊天機器人常見的「奉承」行為,以及 更好地解讀上下文即使是處理冗長或異質的輸入(文字、圖像、視訊、音訊和程式碼)。
此外,Google從一開始就在多個平台上部署了 Gemini 3:Gemini 應用、搜尋引擎的 AI 模式、AI Studio、Vertex AI、模型的命令列介面 (CLI) 以及一個名為「智慧代理」的新平台。 Google反重力旨在透過存取編輯器、終端和瀏覽器來規劃和執行複雜的軟體任務。
為了強調此次發布的重要性,該公司回顧了雙子座時代的累積影響:經驗 人工智慧驅動視圖 它每月觸達數十億用戶,該應用程式的用戶超過數億,大多數谷歌雲端客戶已經在使用人工智慧功能,數百萬開發者已經利用其生成模型建立了解決方案。
生成式介面與全新使用者體驗
Gemini 3 推出了一款全新的應用程序,介面更簡潔、更現代,讓您更容易發起對話,並在資料夾中找到您創建的內容。 “我的東西”這次更新並非表面功夫:真正的飛躍在於… 生成式介面這是一種回應類型,其中模型決定最佳格式並產生動態視覺視圖,而不是純文字區塊。
首批實驗之一是「視覺設計」(a 雜誌式視圖 它提供照片和互動模組)以及“動態視圖”,旨在探索和個性化結果。如果你讓它“規劃一次夏季羅馬三日遊”,你會得到… 視覺行程 易於瀏覽,並設有後續問題和互動元素。
這個想法與所謂的 氛圍編碼你用自然語言描述目標,系統就會創造出介面或 需要程式碼 為了實現這一點,如果圖表、動畫或互動式小程式比段落更好,Gemini 3 會在體驗中產生它們,而無需您切換工具。
購物體驗也實現了飛躍:商品清單、比價表和價格直接整合在一起。 Google購物圖 (擁有數百億個引用)構建 互動指南 無需離開流程,以專門的推薦頁面風格,但由模型動態生成。
另一個實際的改進是,在搜尋引擎中,一部分訂閱用戶可以選擇使用以下變體: 雙子座3專業版 以推理為導向,以獲得更完整、更有依據的總結,而不僅僅是當前模式下的綜合性回應。

高級推理和深度思考模式
谷歌強調了高難度測試方面的一項重大進步:它談到了 博士級推理Gemini 3 Pro 在 Humanity's Last Exam (HLE) 和 GPQA Diamond 等基準測試中取得了極具競爭力的成績。具體來說,Gemini 3 Pro 在 HLE(無工具)測驗中取得了 37,5% 的分數,在 GPQA Diamond 測驗中取得了 91,9% 的分數,並在數學方面展現了卓越的表現。 MathArena Apex 23,4%.
模式 雙子座 3 深度思考 它更進一步,能夠應對特別複雜和新穎的挑戰。在內部評估中,它在多個方面都優於 Pro:在 Humanity's Last Exam(不使用工具)中得分 41,0%,在 GPQA Diamond 中得分 93,8%,在允許代碼執行的 ARC-AGI 中得分 45,1%——這是多項評估結果的綜合。 符號推理、工具使用和編程 專為解決難題而設計。
在智能體領域,該模型表現出良好的形式 終端工作台 2.0 (54,2%),此指標衡量他們透過終端機操作電腦的能力,以及在長時間環境下維持穩定決策的能力,例如: 自動販賣長椅 2在一次虛擬的商業模擬中,他在一年內獲得了超過五千美元的淨收益。
除了各項指標之外,更重要的是角色轉變:從回應的助理 代理人Gemini 3 會進行規劃,將任務分解成多個步驟,必要時請求批准,並在人工監督下執行。它可以整理 Gmail 收件匣,透過交叉比對可用性來安排日程,或準備一份… 工作流程 複雜的推理、工具呼叫和導航組合。
開發者和商業社群已經注意到了一些切實的改進:更好的視覺理解能力, 更可靠的程式碼生成 並且提高了長期任務的執行效率。所有這些都轉化為更有效率的智能體,它們能夠持續穩定地推進項目,並且隨著時間的推移始終不會偏離目標。

多模態和大規模背景
Gemini 3 Pro 強化了其 多模態理解 它在圖像和視訊方面也樹立了新的標竿:在 MMMU-Pro (81%) 和 Video-MMMU (87,2%) 測試中表現出色,並在 SimpleQA Verified (72,1%) 的事實準確性測試中展現出進步。其關鍵在於能夠將文字、程式碼、照片、音訊和視訊片段整合到同一上下文中,並進行有效解讀。 關係和細微差別.
該模型能夠處理大量信息,這得益於… 1 萬個 token 上下文窗口這足以處理篇幅較長的文章、整個課程、程式碼庫或多個並行運行的文件。它支援非常實用的應用場景:從統一手寫的家庭食譜(即使是多種語言的)並將其轉換為烹飪書,到將科學文章和長視頻轉換為… 互動式卡片和可視化.
對於程式設計師而言,Google所說的程式碼分析、抽象推理和受控執行方面的重大飛躍。在開發支援場景中,例如: 代碼助理 3.0它描述了對完整存儲庫架構的理解,以及高達 10 萬個令牌的擴展上下文窗口,這對於檢測可能因本地更改而破壞的依賴關係非常有用。
該模型還改進了 平行推理 利用視覺和文字數據,改進對表格、圖表和介面的解讀。這項進步至關重要,因為重要的不僅是「看到」圖像,還要將其與文字和數字交叉比對,從而得出結論並採取行動。
因此,答案並不總是逐字逐句的:有時理想的回答是… 互動式 Web 應用程式 (計算器、模擬器或即時小工具)可讓您在 Gemini 流程本身中更直觀地探索解決方案。
代理、開發和谷歌反重力平台
Gemini 3 現已開放給開發者。 谷歌人工智慧工作室Vertex AI 和 CLI,以及它的首次亮相 Google反重力這是一個基於代理的開發平台,可以直接存取編輯器、終端和瀏覽器。該系統可以 規劃並執行端對端軟體任務驗證自身程式碼並與 Gemini 系列中的其他介面(如電腦控制和影像編輯)協調。
該模型可進行諸如此類的測試。 WebDev Arena (ELO 評分 1.487),Terminal-Bench 2.0 得分 54,2%,SWE-bench Verified 得分 76,2%,在無範例程式碼產生和創建方面表現出色 豐富的 Web 介面 基於複雜的指令。對於企業而言,這可以加速開發客製化的、基於代理的解決方案。
現實世界中的案例已經開始利用這項技術:一些專門從事自動化演示的公司正在向模型輸入技術文檔,以產生以前分析師需要花費數小時才能完成的演示內容。而使用 Gemini 3,這項工作量大大減少… 幾分鐘這得歸功於多模態推理和擴展的上下文。
與 Google Workspace 和搜尋引擎集成
對球隊最明顯的影響將體現在以下方面: 谷歌工作區Gemini不再只是一個側邊欄;它現在已作為引擎整合到Gmail、文件、表格、日曆、YouTube和地圖中。例如,在Gmail中,它的功能遠不止於摘要: 起草、確定優先順序、回答和 會議日程 根據您的實際可用時間;在 Sheets 中,它就像一個資料分析師,可以根據您的問題建立圖表和資料透視表。
它還在鞏固 雙子座藤蔓它能夠從雲端硬碟文件生成完整的視訊演示文稿,並透過多模態內容增強協作:該模型能夠理解和組合文字、圖像和剪輯,從而在更短的時間內產生有用的資源。
En 搜尋除了人工智慧驅動的摘要之外,部分訂閱用戶還可以升級到 Gemini 3 Pro,以獲得基於其分析能力的更豐富的答案。在購物方面,Gemini 使用 購物圖 谷歌產生推薦指南的方式 價格和詳情 更新過程不會將您重新導向到其他體驗頁面。
另一個顯著的改進是,搜尋引擎能夠更好地將你的問題分解成子查詢,並代表你進行搜索,從而更準確地理解你的需求。 意向 並避免以前未被注意到的疏漏。
整體而言,這種整合前景廣闊。 減少摩擦你提出你的需求,如果合適,模型會在同一流程中產生視圖、表格、日曆或小程序,而無需你在標籤頁之間切換。
可用性、部署和安全性
谷歌聲稱 Gemini 3 是他們迄今為止最安全的型號。得益於他們所採用的更全面的評估方法。改進之處包括:減少奉承,增強抵抗能力。 及時注射 並改進了針對網路攻擊相關濫用行為的防禦措施,並得到了獨立專家和外部機構(例如…)的驗證。 英國鋼鐵協會)以及專業公司。
這次推廣規模龐大:終端用戶可以在 Gemini 應用和搜尋引擎的 AI 模式中找到它,開發者也可以在… Gemini API、AI Studio、Antigravity 和 CLI並透過 Vertex AI 和 Gemini Enterprise 為組織提供服務。一些高級功能,例如深度思考或某些代理功能,最初僅提供給訂閱用戶。 谷歌AI超級 而且它們還會繼續擴張。
實用說明: 雙子座3專業版 這項功能從上線第一天起就在應用程式和網頁端免費提供,這在以前是前所未有的,不過目前搜尋功能中的專業版升級僅限付費用戶。此外,用戶現在就可以在 Google AI Studio 中體驗這項功能,根據地區和產品的不同,這項功能將在未來幾天內全面推出。
谷歌用用戶採用數據來佐證其推廣計畫:搜尋中的 AI 體驗每月觸達數十億用戶,應用程式用戶遠超 5 億,超過 70% 的谷歌雲端客戶使用 AI 功能。 13萬開發商 他們利用自己的模型創造了解決方案。
企業應用程式及用例
在企業環境中,Gemini 3 允許設計整合式客製化解決方案。 代理、自動化和多模態人工智慧 在關鍵流程中發揮作用。從協助開發和改進資料管道,到創建能夠以統一的思路處理文件、圖像和視訊的對話式體驗。
許多公司將這些能力與最佳實踐相結合。 網路安全和滲透測試 為了保護模型和數據,他們部署了雲端基礎架構(AWS 和 Azure),以確保可擴展性、可用性和合規性。在分析方面,他們整合了儀表板和商業智慧服務(例如 Power BI),依靠推理和洞察生成,將資料轉化為可執行的決策。 可視化 就模型而言。
該套房也受益於 透過谷歌搜尋進行基礎學習Gemini 3 會根據時事新聞的準確資訊來引導使用者回應,從而最大限度地減少錯誤訊息。在程式設計方面,Gemini 3 能夠理解程式碼庫架構,提出修改建議,並對潛在的依賴關係問題發出警報,從而為技術團隊節省時間。
展望未來,Google預計… 徹底定制:無需任何流程,即可私密且安全地適應您組織的風格、基調和知識水平的模型。 微調 情況複雜。另外要注意的是:雖然一般使用者可能不會注意到所有變化,但技術和數據領域的人員確實能感受到明顯的改進。 精度、速度和能力.
Gemini 3 透過結合高階推理、實用代理程式和生成式介面,重新定義了我們與 AI 的交互方式:減少摩擦,增加上下文,並有可能獲得現實世界的回應。 互動體驗 它只需幾個明確的指示,就能引導你從目標走向實現。


