- Gemini 3 introducerer generative grænseflader og forbedrer ræsonnement på ekspertniveau.
- Forbedret multimodalitet med 1 million tokens og forbedrede billed- og videoresultater.
- Mere kapable agenter: Antigravity, integration af arbejdsområder og værktøjsbrug.
- Bred implementering og forbedret sikkerhed med adgang i app, Search, AI Studio og Vertex AI.
Googles nye generation af AI ankommer med en klar ambition: at gå fra at tale til at udføre. Med Gemini 3 tager virksomheden et bemærkelsesværdigt spring ræsonnement, multimodalitet og agentkapacitetOg den introducerer også en anderledes måde at interagere på: grænseflader, som modellen selv genererer undervejs for at hjælpe dig med at nå dit mål uden at spilde tid på mellemliggende trin.
Alt dette kommer med et redesign af appen, forbedringer i Google Søgning, Workspace og udviklerværktøjerog et stærkt fokus på sikkerhed. Der er synlige forbedringer for alle, men mange af ændringerne vil være mest mærkbare inden for avanceret brug: programmering, dataanalyse, arbejde med videoer og billeder, og automatisering med agenter der planlægger og handler under menneskelig opsyn.
Hvad er Gemini 3, og hvorfor markerer det et vendepunkt?
I praksis betyder dette mere direkte og nyttige svar, en reduktion i den "smiger", der er typisk for nogle chatbots, og en en bedre fortolkning af kontekstenselv når man arbejder med lange eller heterogene input (tekst, billeder, video, lyd og kode).
Derudover har Google implementeret Gemini 3 på tværs af flere platforme siden dag ét: Gemini-appen, søgemaskinens AI-tilstand, AI Studio, Vertex AI, modellens CLI og en ny platform for agenter kaldet Google Antigravitydesignet til at planlægge og udføre komplekse softwareopgaver med adgang til editor, terminal og browser.
For at understrege lanceringens omfang minder virksomheden om den kumulative effekt af Gemini-æraen: oplevelsen af AI-drevet visning Den når ud til milliarder af mennesker om måneden, appen har over hundredvis af millioner brugere, de fleste Google Cloud-kunder bruger allerede AI-funktioner, og millioner af udviklere har bygget løsninger med dens generative modeller.
Generative grænseflader og en ny brugeroplevelse
Gemini 3 lancerer en ny app med en renere og mere moderne æstetik, der gør det nemmere at starte samtaler og finde det, du har produceret, i mappen. "Mine ting"Fornyelsen er ikke kosmetisk: det store spring ligger i generative grænseflader, en type svar, hvor modellen bestemmer det optimale format og genererer dynamiske visuelle visninger i stedet for en blok af almindelig tekst.
Blandt de første eksperimenter er "visuelt design" (a magasinlignende visning med fotos og interaktive moduler) og den "dynamiske visning", der er designet til at udforske og personliggøre resultater. Hvis du beder den om at "planlægge en 3-dages tur til Rom om sommeren", får du en visuel rejseplan navigerbar, med opfølgende spørgsmål og interaktive elementer.
Ideen er knyttet til den såkaldte vibe kodningDu beskriver målet i naturligt sprog, og systemet opretter grænsefladen eller kode nødvendig For at opnå dette, hvis et diagram, en animation eller en interaktiv mini-app er bedre end et afsnit, genererer Gemini 3 det i oplevelsen uden at tvinge dig til at skifte værktøj.
Shoppingoplevelsen tager også et spring fremad: annoncer, sammenligningstabeller og priser er integreret direkte fra Google Shopping-graf (med titusindvis af milliarder af referencer) at bygge interaktive guider uden at forlade flowet, i stil med en specialiseret anbefalingsside, men genereret on-the-fly af modellen.
En anden praktisk forbedring er, at en begrænset gruppe abonnenter i søgemaskinen kan vælge varianten af Gemini 3 Pro orienteret mod ræsonnement for at modtage mere komplette og underbyggede resuméer, og ikke blot den syntetiske respons fra den nuværende tilstand.

Avanceret ræsonnement og dyb tænkningstilstand
Google fremhæver et betydeligt fremskridt inden for tests med høj sværhedsgrad: de taler om ræsonnement på doktorniveaumed yderst konkurrencedygtige resultater i benchmarks som Humanity's Last Exam og GPQA Diamond. Talmæssigt opnår Gemini 3 Pro scorer som 37,5% i HLE (værktøjsfri) og 91,9% i GPQA Diamond og etablerer en state-of-the-art præstation i matematik med en 23,4% på MathArena Apex.
tilstand Gemini 3 Dyb Tænkning Den går et skridt videre for særligt komplekse og nye udfordringer. I interne vurderinger overgår den Pro på flere fronter: 41,0 % i Humanity's Last Exam (uden værktøjer), 93,8 % i GPQA Diamond og 45,1 % i ARC-AGI, når kodeudførelse er tilladt – en kombination af Symbolsk ræsonnement, værktøjsbrug og programmering designet til vanskelige problemer.
Inden for agentdomæner viser modellen god form i Terminalbænk 2.0 (54,2%), hvilket måler deres evne til at betjene en computer via terminal og opretholder stabil beslutningstagning i langvarige miljøer som f.eks. Automatbænk 2hvor han opnåede et nettoafkast på over fem tusind dollars i en forretningssimulering i løbet af et virtuelt år.
Ud over metrikken er det relevante ændringen i rolle: fra assistent, der reagerer på agent, der handlerGemini 3 planlægger, opdeler opgaver i trin, anmoder om godkendelse om nødvendigt og udfører dem med menneskelig overvågning i løkken. Den kan sortere en Gmail-indbakke, organisere tidsplaner ved at krydsreferere til tilgængelighed eller forberede en workflow kompleks kombination af ræsonnement, værktøjskald og navigation.
Udviklerne og erhvervslivet bemærker allerede håndgribelige forbedringer: bedre visuel forståelse, mere pålidelig kodegenerering og forbedret ydeevne på langsigtede opgaver. Alt dette resulterer i mere nyttige agenter, der er i stand til at opretholde projekter konsekvent og uden at afvige fra målet over tid.

Multimodalitet og storskala kontekst
Gemini 3 Pro forstærker sin multimodal forståelse Og den hæver barren inden for billede og video: den udmærker sig i MMMU-Pro (81%) og Video-MMMU (87,2%) og viser fremskridt i faktuel nøjagtighed med SimpleQA Verified (72,1%). Nøglen ligger i dens evne til at kombinere tekst, kode, fotos, lyd og videoklip inden for samme kontekst og fortolke. relationer og nuancer.
Modellen arbejder med store mængder information takket være en 1 million tokens kontekstvindueDette er tilstrækkeligt til lange artikler, hele klasser, kodelagre eller flere dokumenter, der kører parallelt. Det muliggør meget praktiske anvendelsesscenarier: fra at samle håndskrevne familieopskrifter (selv på flere sprog) og omdanne dem til en kogebog, til at omdanne videnskabelige artikler og lange videoer til interaktive kort og visualiseringer.
For programmører taler Google om et betydeligt spring fremad inden for kodeanalyse, abstrakt ræsonnement og kontrolleret udførelse. I udviklingsstøttescenarier som f.eks. Kodehjælp 3.0Den beskriver en forståelse af den komplette repository-arkitektur og et udvidet kontekstvindue på op til 10 millioner tokens, hvilket er nyttigt til at detektere afhængigheder, der kan blive brudt af en lokal ændring.
Modellen forbedrer også parallel ræsonnement Brug af visuelle og tekstuelle data, raffinering af fortolkningen af tabeller, diagrammer og grænseflader. Denne udvikling er afgørende, når det vigtigste ikke blot er at "se" billedet, men at krydsreferere det med tekst og tal for at drage konklusioner og handle.
Som følge heraf er svarene ikke altid ordret: nogle gange er det ideelle svar en interaktiv webapp (en lommeregner, en simulator eller en realtidswidget), der giver dig mulighed for at udforske løsningen mere intuitivt i selve Gemini-flowet.
Agenter, udvikling og Google Antigravity-platformen
Gemini 3 er nu tilgængelig for udviklere på Google AI StudioVertex AI og CLI, og den har premiere Google AntigravityDet er en agentbaseret udviklingsplatform med direkte adgang til editoren, terminalen og browseren. Systemet kan planlægge og udføre end-to-end softwareopgaver, validering af sin egen kode og koordinering med andre overflader i Gemini-familien (såsom computerstyring og billedredigering).
Modellen fører tests som f.eks. WebDev Arena (1.487 ELO), scorer 54,2% i Terminal-Bench 2.0 og 76,2% i SWE-bench Verified, udmærker sig ved eksempelfri kodegenerering og i at skabe rige webgrænseflader baseret på komplekse instruktioner. For virksomheder fremskynder dette udviklingen af skræddersyede, agentbaserede løsninger.
Eksempler fra den virkelige verden udnytter allerede dette: Virksomheder, der specialiserer sig i automatiserede præsentationer, fodrer modellen med tekniske dokumenter for at generere dele, der tidligere tog en analytiker timer at lave. Med Gemini 3 reduceres det arbejde til... et par minutter, takket være multimodal ræsonnement og den udvidede kontekst.
Integration med Google Workspace og søgemaskinen
Den mest synlige effekt på holdene vil komme i Google-arbejdsområdeGemini er ikke længere bare en sidebjælke; den er nu integreret som en motor i Gmail, Docs, Sheets, Kalender, YouTube og Maps. I Gmail gør den for eksempel mere end blot at opsummere: udarbejde, prioritere, besvare og mødeplan med din faktiske tilgængelighed; i Sheets opfører det sig som en dataanalytiker, der opretter diagrammer og pivottabeller ud fra dine spørgsmål.
Det konsoliderer også Gemini-vinstokkeDen er i stand til at generere komplette videopræsentationer fra Drive-dokumentation, og samarbejdet forbedres med multimodalt indhold: modellen forstår og kombinerer tekst, billeder og klip for at producere nyttige aktiver på kortere tid.
En SøgUd over AI-drevne resuméer kan visse abonnenter opgradere til Gemini 3 Pro for at få mere omfattende svar baseret på deres analytiske evner. Og til shopping bruger Gemini Shopping graf Googles metode til at generere anbefalingsguider med priser og detaljer opdateret uden at omdirigere dig væk fra oplevelsen.
En anden bemærkelsesværdig forbedring er, at søgemaskinen bedre kan opdele dine spørgsmål i underforespørgsler, som den undersøger på dine vegne, og dermed få en mere præcis forståelse af hensigt og undgå udeladelser, der tidligere gik ubemærket hen.
Samlet set lover denne integration mindre friktionDu anmoder om det, du har brug for, og hvis det er relevant, genererer modellen visningen, tabellen, kalenderen eller miniappen i samme flow, uden at du skal hoppe mellem faner.
Tilgængelighed, implementering og sikkerhed
Google hævder, at Gemini 3 er deres sikreste model til datoTakket være det mere omfattende sæt af vurderinger, de har anvendt. Blandt forbedringerne: mindre smiger, større modstandsdygtighed over for hurtig indsprøjtning og forbedret forsvar mod misbrug i forbindelse med cyberangreb, med valideringer fra uafhængige eksperter og eksterne organer (såsom AISI i Storbritannien) og specialiserede virksomheder.
Udrulningen er massiv: slutbrugere finder den i Gemini-appen og i søgemaskinens AI-tilstand, udviklere i Gemini API, AI Studio, Antigravity og CLIog organisationer gennem Vertex AI og Gemini Enterprise. Nogle avancerede funktioner, såsom Deep Think eller visse agentfunktioner, tilbydes i første omgang til abonnenter på Google AI Ultra og de vil fortsætte med at ekspandere.
En praktisk bemærkning: Gemini 3 Pro Det tilbydes gratis fra dag ét på appen og nettet, noget der er hidtil uset, selvom opgraderingen til Pro i Søgning i øjeblikket er forbeholdt betalte abonnementer. Derudover kan det allerede testes fra Google AI Studio, og den generelle udrulning vil blive aktiveret i de kommende dage afhængigt af region og produkt.
Google bakker udrulningen op med adoptionsdata: AI-oplevelsen i søgninger når milliarder af månedlige brugere, appen overstiger langt en halv milliard, og mere end 70 % af Google Cloud-kunderne bruger AI-funktioner. 13 millioner udviklere De har skabt løsninger med deres modeller.
Anvendelser i virksomheder og use cases
I virksomhedsmiljøer giver Gemini 3 mulighed for design af skræddersyede løsninger, der integrerer agenter, automatiseringer og multimodal AI i nøgleprocesser. Fra at bistå med udvikling og forbedring af datapipelines til at skabe samtaleoplevelser, der håndterer dokumenter, billeder og videoer med en fælles tråd.
Mange virksomheder kombinerer disse muligheder med bedste praksis cybersikkerhed og penetrationstest For at beskytte modeller og data implementerer de cloud-infrastrukturer (AWS og Azure), der sikrer skalerbarhed, tilgængelighed og overholdelse af regler. Inden for analyser integrerer de dashboards og business intelligence-tjenester (f.eks. med Power BI) for at omdanne data til handlingsrettede beslutninger baseret på ræsonnement og generering af indsigt. visualiseringer fra modellens side.
Suiten har også fordel af jordforbindelse med Google-søgningGemini 3 forankrer svar til præcise oplysninger om aktuelle begivenheder og minimerer misinformation. I programmering forstår Gemini 3 repository-arkitekturen, foreslår ændringer og advarer om potentielt ødelagte afhængigheder, hvilket sparer tid for tekniske teams.
Fremadrettet forventer Google en radikal tilpasningModeller, der tilpasser sig, privat og sikkert, til din organisations stil, tone og viden uden behov for processer finjustering kompleks. Og bemærk: Selvom den almindelige bruger måske ikke bemærker alle ændringerne, oplever de tekniske og datamæssige områder tydelige forbedringer i præcision, hastighed og kapacitet.
Gemini 3 omdefinerer, hvordan vi arbejder med AI, ved at kombinere avanceret ræsonnement, praktiske agenter og generative grænseflader: mindre friktion, mere kontekst og muligheden for en respons i den virkelige verden. interaktiv oplevelse der fører dig fra mål til udførelse med et par veludførte instruktioner.
Indholdsfortegnelse
- Hvad er Gemini 3, og hvorfor markerer det et vendepunkt?
- Generative grænseflader og en ny brugeroplevelse
- Avanceret ræsonnement og dyb tænkningstilstand
- Multimodalitet og storskala kontekst
- Agenter, udvikling og Google Antigravity-platformen
- Integration med Google Workspace og søgemaskinen
- Tilgængelighed, implementering og sikkerhed
- Anvendelser i virksomheder og use cases


