- Gemini 3 ra mắt giao diện tạo sinh và cải thiện khả năng suy luận ở cấp độ chuyên gia.
- Nâng cao tính đa phương thức với 1 triệu mã thông báo và cải thiện kết quả hình ảnh và video.
- Các tác nhân có khả năng hơn: Chống trọng lực, tích hợp không gian làm việc và sử dụng công cụ.
- Triển khai rộng rãi và tăng cường bảo mật, với quyền truy cập vào ứng dụng, Tìm kiếm, AI Studio và Vertex AI.

Thế hệ AI mới của Google ra mắt với tham vọng rõ ràng: chuyển từ trò chuyện sang thực thi. Với Gemini 3, công ty đã có một bước tiến đáng kể trong lý luận, đa phương thức và năng lực tác nhânVà nó cũng giới thiệu một cách tương tác khác: giao diện mà chính mô hình tạo ra ngay lập tức để giúp bạn đạt được mục tiêu mà không tốn thời gian vào các bước trung gian.
Tất cả những điều này đi kèm với việc thiết kế lại ứng dụng, cải tiến trong Google Tìm kiếm, Workspace và các công cụ dành cho nhà phát triểnvà tập trung mạnh mẽ vào bảo mật. Có những cải tiến rõ rệt cho tất cả mọi người, nhưng nhiều thay đổi sẽ dễ nhận thấy nhất trong các ứng dụng nâng cao: lập trình, phân tích dữ liệu, làm việc với video và hình ảnh, và tự động hóa với các tác nhân lập kế hoạch và hành động dưới sự giám sát của con người.
Gemini 3 là gì và tại sao nó lại đánh dấu bước ngoặt?
Trong thực tế, điều này chuyển thành những phản hồi trực tiếp và hữu ích hơn, giảm bớt "sự tâng bốc" thường thấy ở một số chatbot và diễn giải tốt hơn về bối cảnhngay cả khi làm việc với dữ liệu đầu vào dài hoặc không đồng nhất (văn bản, hình ảnh, video, âm thanh và mã).
Ngoài ra, Google đã triển khai Gemini 3 trên nhiều nền tảng ngay từ ngày đầu tiên: ứng dụng Gemini, Chế độ AI của công cụ tìm kiếm, AI Studio, Vertex AI, CLI của mô hình và một nền tảng mới dành cho các tác nhân có tên là Google Chống trọng lựcđược thiết kế để lập kế hoạch và thực hiện các tác vụ phần mềm phức tạp với quyền truy cập vào trình soạn thảo, thiết bị đầu cuối và trình duyệt.
Để nhấn mạnh phạm vi của lần ra mắt, công ty nhớ lại tác động tích lũy của kỷ nguyên Gemini: trải nghiệm của Chế độ xem hỗ trợ AI Ứng dụng này tiếp cận hàng tỷ người mỗi tháng, vượt qua hàng trăm triệu người dùng, hầu hết khách hàng của Google Cloud đã sử dụng các tính năng AI và hàng triệu nhà phát triển đã xây dựng các giải pháp bằng mô hình tạo ra ứng dụng này.
Giao diện sáng tạo và trải nghiệm người dùng mới
Gemini 3 ra mắt ứng dụng mới với giao diện hiện đại, gọn gàng hơn giúp bạn dễ dàng bắt đầu cuộc trò chuyện và tìm kiếm những gì bạn đã tạo trong thư mục "Đồ của tôi"Sự đổi mới không phải là hình thức: bước nhảy vọt lớn nằm ở giao diện tạo ra, một loại phản hồi trong đó mô hình quyết định định dạng tối ưu và tạo ra chế độ xem trực quan động thay vì một khối văn bản thuần túy.
Trong số những thí nghiệm đầu tiên có “thiết kế trực quan” (một chế độ xem theo phong cách tạp chí (có ảnh và các mô-đun tương tác) và "chế độ xem động", được thiết kế để khám phá và cá nhân hóa kết quả. Nếu bạn yêu cầu "lên kế hoạch cho chuyến đi 3 ngày đến Rome vào mùa hè", bạn sẽ nhận được hành trình trực quan có thể điều hướng, với các câu hỏi tiếp theo và các yếu tố tương tác.
Ý tưởng này có liên quan đến cái gọi là mã hóa rung cảmBạn mô tả mục tiêu bằng ngôn ngữ tự nhiên và hệ thống tạo ra giao diện hoặc mã cần thiết Để đạt được điều này, nếu sơ đồ, hình ảnh động hoặc ứng dụng nhỏ tương tác tốt hơn đoạn văn, Gemini 3 sẽ tạo ra nó trong trải nghiệm mà không buộc bạn phải chuyển đổi công cụ.
Trải nghiệm mua sắm cũng có bước tiến vượt bậc: danh sách, bảng so sánh và giá cả được tích hợp trực tiếp từ Biểu đồ mua sắm của Google (với hàng chục tỷ tài liệu tham khảo) để xây dựng hướng dẫn tương tác không thoát khỏi luồng, theo phong cách của một trang đề xuất chuyên biệt, nhưng được tạo ra ngay lập tức bởi mô hình.
Một cải tiến thực tế khác là trong công cụ tìm kiếm, một nhóm người đăng ký hạn chế có thể lựa chọn biến thể của Song Tử 3 Pro hướng tới lý luận để có được những bản tóm tắt đầy đủ và có căn cứ hơn, chứ không chỉ là phản ứng tổng hợp của chế độ hiện tại.

Chế độ suy luận nâng cao và tư duy sâu
Google nhấn mạnh một bước tiến đáng kể trong các bài kiểm tra có độ khó cao: nó nói về lý luận trình độ tiến sĩvới kết quả cạnh tranh cao trong các bài kiểm tra chuẩn như Kỳ thi cuối kỳ của Nhân loại và GPQA Diamond. Về mặt số liệu, Gemini 3 Pro đạt điểm số 37,5% trong bài thi HLE (không cần công cụ) và 91,9% trong bài thi GPQA Diamond, đồng thời thiết lập hiệu suất toán học tiên tiến với 23,4% trên MathArena Apex.
Chế độ Song Tử 3 Suy nghĩ sâu sắc Nó tiến xa hơn một bước đối với những thử thách đặc biệt phức tạp và mới lạ. Trong các đánh giá nội bộ, nó vượt trội hơn Pro trên nhiều phương diện: 41,0% trong bài kiểm tra Humanity's Last Exam (không có công cụ), 93,8% trong bài kiểm tra GPQA Diamond và 45,1% trong bài kiểm tra ARC-AGI khi cho phép thực thi mã—một sự kết hợp của lý luận tượng trưng, sử dụng công cụ và lập trình được thiết kế cho những vấn đề khó.
Trong các miền tác nhân, mô hình cho thấy hình thức tốt trong Terminal-Bench 2.0 (54,2%), đo lường khả năng vận hành máy tính thông qua thiết bị đầu cuối và duy trì khả năng ra quyết định ổn định trong môi trường kéo dài như Quầy bán hàng tự động 2nơi ông đạt được lợi nhuận ròng hơn năm nghìn đô la trong một mô phỏng kinh doanh trong một năm ảo.
Ngoài các số liệu, điều quan trọng là sự thay đổi về vai trò: từ trợ lý phản hồi tác nhân hành độngGemini 3 lập kế hoạch, chia nhỏ nhiệm vụ thành các bước, yêu cầu phê duyệt nếu cần và thực hiện dưới sự giám sát của con người. Nó có thể sắp xếp hộp thư đến Gmail, sắp xếp lịch trình bằng cách tham chiếu chéo tính khả dụng hoặc chuẩn bị một quy trình làm việc phức tạp kết hợp lý luận, gọi công cụ và điều hướng.
Cộng đồng nhà phát triển và doanh nghiệp đã nhận thấy những cải tiến rõ rệt: khả năng hiểu trực quan tốt hơn, tạo mã đáng tin cậy hơn và cải thiện hiệu suất trong các nhiệm vụ dài hạn. Tất cả những điều này chuyển thành các tác nhân hữu ích hơn, có khả năng duy trì dự án một cách nhất quán và không đi chệch khỏi mục tiêu theo thời gian.

Đa phương thức và bối cảnh quy mô lớn
Gemini 3 Pro củng cố hiểu biết đa phương thức Và nó nâng cao tiêu chuẩn về hình ảnh và video: nó vượt trội trong MMMU-Pro (81%) và Video-MMMU (87,2%) và cho thấy sự tiến bộ về độ chính xác thực tế với SimpleQA Verified (72,1%). Chìa khóa nằm ở khả năng kết hợp văn bản, mã, ảnh, âm thanh và video clip trong cùng một bối cảnh, diễn giải mối quan hệ và sắc thái.
Mô hình hoạt động với lượng thông tin lớn nhờ vào Cửa sổ ngữ cảnh 1 triệu tokenĐiều này đủ cho các bài viết dài, toàn bộ lớp học, kho lưu trữ mã hoặc nhiều tài liệu chạy song song. Nó cho phép sử dụng trong nhiều trường hợp thực tế: từ việc hợp nhất các công thức nấu ăn viết tay của gia đình (thậm chí bằng nhiều ngôn ngữ) và biến chúng thành sách dạy nấu ăn, đến việc chuyển đổi các bài báo khoa học và video dài thành... thẻ tương tác và hình ảnh trực quan.
Đối với các lập trình viên, Google đề cập đến một bước tiến đáng kể trong phân tích mã, suy luận trừu tượng và thực thi có kiểm soát. Trong các tình huống hỗ trợ phát triển như Hỗ trợ mã 3.0Nó mô tả sự hiểu biết về toàn bộ kiến trúc kho lưu trữ và cửa sổ ngữ cảnh mở rộng lên tới 10 triệu mã thông báo, hữu ích để phát hiện các phụ thuộc có thể bị phá vỡ do thay đổi cục bộ.
Mô hình này cũng cải thiện lý luận song song Sử dụng dữ liệu hình ảnh và văn bản, tinh chỉnh việc diễn giải các bảng biểu, sơ đồ và giao diện. Sự tiến bộ này rất quan trọng khi điều quan trọng không chỉ là "nhìn" hình ảnh, mà còn là đối chiếu nó với văn bản và số liệu để rút ra kết luận và hành động.
Kết quả là, câu trả lời không phải lúc nào cũng đúng nguyên văn: đôi khi câu trả lời lý tưởng là ứng dụng web tương tác (máy tính, trình mô phỏng hoặc tiện ích thời gian thực) cho phép bạn khám phá giải pháp trực quan hơn trong chính luồng Gemini.
Các tác nhân, sự phát triển và nền tảng Google Antigravity
Gemini 3 hiện đã có sẵn cho các nhà phát triển tại Studio AI của GoogleVertex AI và CLI, và nó ra mắt Google Chống trọng lựcĐây là một nền tảng phát triển dựa trên tác nhân với khả năng truy cập trực tiếp vào trình soạn thảo, thiết bị đầu cuối và trình duyệt. Hệ thống có thể lập kế hoạch và thực hiện các tác vụ phần mềm đầu cuối, xác thực mã của riêng nó và phối hợp với các bề mặt khác trong nhóm Gemini (chẳng hạn như điều khiển máy tính và chỉnh sửa hình ảnh).
Mô hình dẫn đầu các thử nghiệm như Đấu trường WebDev (1.487 ELO), đạt 54,2% trong Terminal-Bench 2.0 và 76,2% trong SWE-bench Verified, xuất sắc trong việc tạo mã không có ví dụ và trong việc tạo giao diện web phong phú dựa trên các hướng dẫn phức tạp. Đối với doanh nghiệp, điều này giúp đẩy nhanh quá trình phát triển các giải pháp tùy chỉnh dựa trên tác nhân.
Các ví dụ thực tế đã tận dụng điều này: các công ty chuyên về thuyết trình tự động đang cung cấp cho mô hình các tài liệu kỹ thuật để tạo ra các phần mà trước đây phải mất hàng giờ để một nhà phân tích tạo ra. Với Gemini 3, công việc đó được rút gọn chỉ còn... vấn đề trong vài phút, nhờ vào lý luận đa phương thức và bối cảnh mở rộng.
Tích hợp với Google Workspace và công cụ tìm kiếm
Tác động rõ ràng nhất đối với các đội sẽ đến Không gian làm việc của GoogleGemini không còn chỉ là một thanh bên nữa; giờ đây nó đã được tích hợp như một công cụ tìm kiếm trong Gmail, Docs, Sheets, Calendar, YouTube và Maps. Ví dụ, trong Gmail, Gemini không chỉ đơn thuần là tóm tắt: soạn thảo, ưu tiên, trả lời và lịch họp với khả năng thực tế của bạn; trong Trang tính, nó hoạt động như một nhà phân tích dữ liệu tạo biểu đồ và bảng tổng hợp từ các câu hỏi của bạn.
Nó cũng đang củng cố Dây leo Song TửCông cụ này có khả năng tạo ra các bài thuyết trình video hoàn chỉnh từ tài liệu Drive và khả năng cộng tác được nâng cao với nội dung đa phương thức: mô hình hiểu và kết hợp văn bản, hình ảnh và clip để tạo ra các nội dung hữu ích trong thời gian ngắn hơn.
En Tìm kiếmNgoài các bản tóm tắt được hỗ trợ bởi AI, một số thuê bao có thể nâng cấp lên Gemini 3 Pro để có câu trả lời phong phú hơn dựa trên khả năng phân tích của họ. Và đối với việc mua sắm, Gemini sử dụng Biểu đồ mua sắm Cách Google tạo ra hướng dẫn đề xuất với giá cả và chi tiết được cập nhật mà không chuyển hướng bạn ra khỏi trải nghiệm.
Một cải tiến đáng chú ý khác là công cụ tìm kiếm có thể phân chia câu hỏi của bạn thành các truy vấn phụ để nghiên cứu thay mặt bạn, hiểu chính xác hơn ý định và tránh những thiếu sót trước đây không được chú ý.
Nhìn chung, sự tích hợp này hứa hẹn ít ma sát hơnBạn yêu cầu những gì bạn cần và nếu phù hợp, mô hình sẽ tạo chế độ xem, bảng, lịch hoặc miniapp trong cùng một luồng mà không bắt bạn phải chuyển đổi giữa các tab.
Tính khả dụng, triển khai và bảo mật
Google tuyên bố rằng Gemini 3 là mô hình an toàn nhất của họ cho đến nayNhờ vào bộ đánh giá toàn diện hơn mà họ đã áp dụng. Trong số những cải tiến: ít nịnh hót hơn, khả năng phục hồi tốt hơn tiêm nhanh chóng và cải thiện khả năng phòng thủ chống lại việc sử dụng sai mục đích liên quan đến các cuộc tấn công mạng, với sự xác thực từ các chuyên gia độc lập và các cơ quan bên ngoài (chẳng hạn như AISI của Vương quốc Anh) và các công ty chuyên ngành.
Việc triển khai rất lớn: người dùng cuối tìm thấy nó trong ứng dụng Gemini và trong Chế độ AI của công cụ tìm kiếm, các nhà phát triển trong Gemini API, AI Studio, Antigravity và CLIvà các tổ chức thông qua Vertex AI và Gemini Enterprise. Một số tính năng nâng cao, chẳng hạn như Deep Think hoặc một số khả năng của tác nhân, ban đầu được cung cấp cho người đăng ký Google AI siêu cấp và chúng sẽ tiếp tục mở rộng.
Một lưu ý thực tế: Song Tử 3 Pro Tính năng này được cung cấp miễn phí ngay từ đầu trên ứng dụng và web, một điều chưa từng có tiền lệ cho đến nay, mặc dù việc nâng cấp lên Pro trong Tìm kiếm hiện chỉ dành cho các gói trả phí. Hơn nữa, tính năng này hiện đã có thể được thử nghiệm trên Google AI Studio và việc triển khai rộng rãi sẽ được kích hoạt trong những ngày tới tùy thuộc vào khu vực và sản phẩm.
Google hỗ trợ việc triển khai bằng dữ liệu áp dụng: trải nghiệm AI trong tìm kiếm tiếp cận hàng tỷ người dùng hàng tháng, ứng dụng vượt xa con số nửa tỷ và hơn 70% khách hàng của Google Cloud sử dụng các chức năng AI. 13 triệu nhà phát triển Họ đã tạo ra các giải pháp bằng mô hình của mình.
Ứng dụng trong công ty và trường hợp sử dụng
Trong môi trường doanh nghiệp, Gemini 3 cho phép thiết kế các giải pháp tùy chỉnh tích hợp tác nhân, tự động hóa và AI đa phương thức trong các quy trình chính. Từ việc hỗ trợ phát triển và cải thiện đường ống dữ liệu, đến việc tạo ra trải nghiệm đàm thoại xử lý tài liệu, hình ảnh và video theo một chủ đề chung.
Nhiều công ty kết hợp những khả năng này với các phương pháp hay nhất an ninh mạng và thử nghiệm xâm nhập Để bảo vệ mô hình và dữ liệu, họ triển khai cơ sở hạ tầng đám mây (AWS và Azure) đảm bảo khả năng mở rộng, tính khả dụng và tính tuân thủ. Trong phân tích, họ tích hợp bảng điều khiển và dịch vụ thông minh kinh doanh (ví dụ: với Power BI) để chuyển đổi dữ liệu thành các quyết định khả thi, dựa trên lý luận và tạo ra thông tin chi tiết. hình dung về phía người mẫu.
Suite cũng được hưởng lợi từ nối đất với Google Tìm kiếmGemini 3 neo phản hồi vào thông tin chính xác về các sự kiện hiện tại, giảm thiểu thông tin sai lệch. Về mặt lập trình, Gemini 3 hiểu kiến trúc kho lưu trữ, đề xuất thay đổi và cảnh báo về các phụ thuộc có khả năng bị hỏng, giúp tiết kiệm thời gian cho các nhóm kỹ thuật.
Nhìn về phía trước, Google dự đoán một tùy chỉnh triệt để: các mô hình thích ứng, riêng tư và an toàn, với phong cách, giọng điệu và kiến thức của tổ chức của bạn mà không cần quy trình tinh chỉnh phức tạp. Và lưu ý: mặc dù người dùng thông thường có thể không nhận thấy tất cả các thay đổi, nhưng các lĩnh vực kỹ thuật và dữ liệu nhận thấy những cải tiến rõ ràng trong độ chính xác, tốc độ và khả năng.
Gemini 3 định nghĩa lại cách chúng ta làm việc với AI bằng cách kết hợp lý luận tiên tiến, tác nhân thực tế và giao diện tạo ra: ít ma sát hơn, nhiều ngữ cảnh hơn và khả năng phản hồi trong thế giới thực. trải nghiệm tương tác đưa bạn từ mục tiêu đến thực hiện với một vài hướng dẫn cụ thể.
Mục lục
- Gemini 3 là gì và tại sao nó lại đánh dấu bước ngoặt?
- Giao diện sáng tạo và trải nghiệm người dùng mới
- Chế độ suy luận nâng cao và tư duy sâu
- Đa phương thức và bối cảnh quy mô lớn
- Các tác nhân, sự phát triển và nền tảng Google Antigravity
- Tích hợp với Google Workspace và công cụ tìm kiếm
- Tính khả dụng, triển khai và bảo mật
- Ứng dụng trong công ty và trường hợp sử dụng


