Google Translate: Sanntidsstemme og kunstig intelligens skal bryte ned språkbarrierer

Siste oppdatering: 22 januar 2026
Forfatter: TecnoDigital
  • Google Translate integrerer Gemini og PaLM 2 for å tilby mer kontekstuelle, naturlige oversettelser med støtte for 110 nye språk.
  • Appen legger til sanntids stemmeoversettelse på skjermen til alle headset, med en innledende betaversjon i USA, Mexico og India og mer enn 70 språk.
  • Samtaleøvelser og AI-drevne adaptive læringsfunksjoner er innlemmet, med sikte på å forbedre muntlig forståelse og uttrykksevne.
  • Disse innovasjonene påvirker turisme, næringsliv og viktige tjenester, og reduserer språkbarrierer for millioner av brukere.

AI-drevet stemmeoversettelse

Det blir stadig mer vanlig å reise, jobbe med internasjonale team eller bare se på videoer på et annet språk, og i alle disse tilfellene Språkbarrierer kan ikke lenger overvinnes bare med ordbøker eller enkle oversettere.Google tar et stort sprang med Google Translate ved å integrere det fullt ut. kunstig intelligens Gemini og andre modeller som PaLM 2 for å gjøre tekst- og taleoversettelse mye mer naturlig, flytende og nyttig i hverdagen.

Det som en gang var en oversetter som jobbet nesten ord for ord, streber nå etter å bli det en slags personlig tolk som forstår konteksten, tonen og til og med intonasjonen i samtalerVidere bruker Google den samme teknologien, i motsetning til andre plattformer som DeepL, for å tilby verktøy for språktrening i appen, noe som gjør Translate til noe mer som en privatlærer enn et enkelt verktøy å klare seg med.

Google Translate bruker Gemini og PaLM 2 for å forstå språket bedre

Med ankomsten av Gemini har Google redesignet måten oversetteren deres behandler språk på, støttet av språkmodeller og nevrale nettverk: Den erstatter ikke lenger bare termer, men tolker intensjonen og hele konteksten i setningene.Dette gjør at faste fraser, dagligdagse uttrykk eller idiomer kan oversettes på en måte som er mye nærmere hvordan en morsmålstalende av målspråket ville oversatt dem.

I praksis betyr dette at Google Translate er i stand til å å oppdage når en frase ikke skal oversettes bokstavelig, men med en passende kulturell ekvivalentEt typisk eksempel ville være engelske uttrykk som «stealing my thunder», som AI-en prøver å oversette med sin virkelige betydning og ikke som en absurd ordrekke som ingen ville sagt på spansk.

Denne utviklingen er spesielt merkbar i tekstoversettelser mellom engelsk og nesten tjue andre språk som f.eks. Spansk, kinesisk, japansk, tysk eller hindiGoogle har begynt å rulle ut disse forbedringene i USA og India, både i mobilappen og nettversjonen. Google Chrome, og vil gradvis utvide dem til andre markeder etter hvert som modellene justeres med mer data og tilbakemeldinger fra brukerne.

Ved siden av Gemini har Google også utnyttet potensialet til PaLM 2, en språkmodell med svært avanserte flerspråklige funksjoner Dette har muliggjort en dramatisk økning i antall støttede språk i oversetteren. Takket være denne motoren har selskapet lagt til 110 nye språk, fra kantonesisk, et språk som lenge har vært etterspurt av brukere, til minoritetsspråk som manx og språk fra urfolkssamfunn.

PaLM 2 har blitt brukt til å identifisere hvilke språk som er relatert til hverandre og å legge til rette for opplæring når det finnes lite data.For eksempel, når det gjelder awadhi og marwadi. Selv om ikke alle de nye språkene har de samme funksjonene ennå (som kameraoversettelse, taleoversettelse eller tekst-til-tale), er spranget betydelig fordi det betjener mer enn 614 millioner mennesker, omtrent 8 % av verdens befolkning.

  Markedsføring med kunstig intelligens og utviklingen av SEO

Grensesnitt for sanntidsoversettelse

Sanntids taleoversettelse: mer naturlige samtaler

En av de mest slående endringene er Sanntids taleoversettelse designet for ansikt-til-ansikt-samtalerI stedet for å måtte trykke på knapper eller lese skjermen hver gang noen snakker, tar AI-en seg av å lytte, oversette og vise resultatet nesten umiddelbart.

Inne i Google Translate-applikasjonen finnes det nå en modus for å «live translation» transkriberer det talerne sier og viser det på begge språk på skjermenSamtidig spiller den av den allerede oversatte lyden, slik at du kan følge tråden uten å måtte følge med på hver tekstlinje som om det var en permanent undertekst.

For å oppnå dette bruker Google Avanserte stemmegjenkjenningsmodeller designet for å isolere lyder og redusere bakgrunnsstøyDette er spesielt nyttig i kompliserte områder som kafeer, flyplasser, stasjoner eller andre travle steder, hvor mange stemmegjenkjenningssystemer frem til nå har gått seg vill blant stemmer og lyder.

Denne simultanoversettelsesfunksjonen via appen er i sin første fase tilgjengelig for brukere av USA, India og Mexico, med støtte for mer enn 70 språkDisse inkluderer store globale språk som spansk, arabisk, fransk, hindi, koreansk og tamil, noe som gjør det til et svært allsidig verktøy for turisme, fjernarbeid og opplæring.

Den underliggende ideen er at i virkelige situasjoner – en legetime, et improvisert møte, å spørre om veien eller å forhandle i en butikk – Pausene, aksentene og endringene i intonasjon gjenspeiles også i oversettelsen.Gemini prøver å justere rytmen til den syntetiserte stemmen og opprettholde, så mye som mulig, tonen til den opprinnelige taleren, slik at samtalen føles mindre robotisk.

Hodetelefoner som personlig oversetter: Live Translate i ørene dine

Hvis oversettelse på skjermen allerede er praktisk, er neste steg enda mer ambisiøst: Få taleoversettelse direkte til alle hodetelefonerGoogle har forbedret denne funksjonen slik at den ikke lenger er avhengig av sine egne enheter som Pixel Buds, men kan fungere med så godt som alle modeller som er koblet til mobiltelefonen.

Operasjonen er relativt enkel: brukeren Koble hodetelefonene til telefonen, åpne Google Translate og aktiver Live Translate-modus eller «Sanntidsoversettelse».Velg deretter språket du vil oversette – eller la appen oppdage det automatisk – rett telefonen mot personen som snakker, og la AI-en gjøre jobben sin.

Mens den andre personen snakker sitt eget språk, Gemini behandler lyden, oversetter den og sender den til hodetelefonene, og legger den oversatte stemmen over den virkelige stemmen.Samtidig ser brukeren transkripsjonen av dialogen på begge språk på skjermen, noe som bidrar til å repetere vokabularet eller forsterke forståelsen ved språklæring.

Ifølge Google er systemet optimalisert for bevare tonen, vektleggingen og kadensen til den opprinnelige stemmenDette gjør opplevelsen mindre «robotbasert» og mer som å ha en menneskelig tolk som hvisker oversettelsen i øret ditt. Denne funksjonen er spesielt attraktiv for forretningsmøter, guidede turer, konferanser eller situasjoner der det er upraktisk å stadig lese telefonen.

I denne første fasen lanseres sanntidsoversettelse gjennom et hvilket som helst headset som Begrenset betaversjon for Android i USA, Mexico og IndiaDen støtter også mer enn 70 språk. Google har bekreftet at den samme funksjonen vil komme på iPhone via Google Translate-appen, men iOS-kompatibilitet er planlagt for 2026, så Apple-mobileiere må vente litt lenger.

  IT Service Management: Hva er det og hvordan fungerer det?

Hodetelefoner med sanntidsoversettelse

Språkpraksis med AI: fra oversetter til læringspartner

Google ønsker ikke bare at Translate skal være nyttig for å komme seg rundt på en reise eller forstå en viktig e-post, men ønsker også å forvandle appen til en plattform for å lære og praktisere språk på en personlig måteDerfor har den lagt til spesifikke verktøy basert på kunstig intelligens for å jobbe med samtale og muntlig forståelse.

En av de nye funksjonene er en modus for øve på personlige samtaler der brukeren kan simulere virkelige situasjonerFra uformelle samtaler med venner eller familie til mer formelle sammenhenger som jobbintervjuer, studier i utlandet eller arbeidsmøter, genererer AI dialoger tilpasset de spesifikke målene til hver person.

Når du åpner appen på mobilenheten din, er det mulig Velg språket forklaringene vises på og språket du ønsker å øve på.I tillegg til å velge nivå: grunnleggende, mellomnivå eller avansert. Disse nivåene kan endres over tid etter hvert som brukeren gjør fremskritt, og appen justerer automatisk vanskelighetsgraden på aktivitetene.

Verktøyet integrerer aktiviteter fra Lytteforståelse og muntlig uttrykksevne, med AI-veiledede øvelser som korrigerer og veilederBrukeren lytter til dialoger, svarer på spørsmål, gjentar fraser eller samhandler med simulerte scenarier generert av systemet, som gir forslag til vokabular, grammatiske strukturer og mer naturlige uttrykk.

Du kan også Klikk på bestemte ord i dialogene for å se betydningen eller bruksvariasjonene deresDette gir mulighet for finjustering av nyanser og mer aktiv læring. Videre sporer appen fremgang og foreslår daglige eller ukentlige mål, i likhet med andre språklæringsplattformer, noe som bidrar til å opprettholde langsiktig motivasjon.

For øyeblikket er denne læringsmodusen i Betafase for engelsktalende som ønsker å lære spansk eller franskOg for spansk-, fransk- og portugisisktalende som ønsker å forbedre engelskkunnskapene sine, har Google indikert at de vil utvide språkene og kombinasjonene etter hvert som de samler inn bruksdata og forbedrer samtalemodellene som er involvert.

Massiv utvidelse av språk og funksjoner basert på språk

Styrkingen av AI forbedrer ikke bare kvaliteten på oversettelsene, men har også bidratt til å utvide utvalget av tilgjengelige språk og inkludere språk med få talere eller som er i ferd med å bli revitalisertDette har en direkte innvirkning på lokalsamfunn som frem til nå knapt har hatt noen teknologiske verktøy tilpasset deres språklige virkelighet.

Tilføyelsen av 110 nye språk ved hjelp av PaLM 2 spenner fra språk som er mye etterspurt til mindre kjente, inkludert urfolksspråk og minoritetsspråk med få morsmålstalendeTeknologien gjør det mulig å skalere støtte selv når mengden data som er tilgjengelig for å trene modellene er begrenset.

Google påpeker at for mange av disse språkene, Prioriteten har vært å respektere arbeidet med kulturell revitalisering og bevaringBruk av oversetteren som et støtteverktøy for dokumentasjon, utdanning og kommunikasjon mellom generasjoner. En tilstedeværelse på Translate kan gi en betydelig økning i synligheten din i det digitale miljøet.

Selskapet presiserer imidlertid også at Ikke alle funksjoner er tilgjengelige på alle nye språkDet kan ta lengre tid før kameraoversettelse, taleoversettelse eller tekst-til-tale blir tilgjengelig for enkelte språk, ettersom de krever spesifikke modeller for håndskriftgjenkjenning, fonetikk og talesyntese.

  Kunstig intelligens for matematikk: Verktøy, fordeler og hvordan man bruker dem

Selv med disse innledende begrensningene er strategien klar: Fortsett gradvis å innlemme språk, og utvide settet med tilknyttede funksjoner gradvisAI gjør det enklere å dekke et bredere språklig spekter med hver ny modell og treningssyklus, uten å være så avhengig av populariteten eller antallet talere av hvert språk.

Innvirkning på turisme, næringsliv og viktige tjenester

Forbedringen av oversettelser og fremveksten av sanntidstale er ikke bare et merkelig teknologisk fremskritt, men de har også direkte konsekvenser for hvordan mennesker og organisasjoner kommuniserer i en globalisert verdenSektorer som turisme, helse, utdanning og internasjonal handel drar allerede nytte av disse verktøyene på en svært konkret måte.

Tenk deg for eksempel en tur til et land hvis språk du ikke kan: Med live-oversettelse og hodetelefoner kan du ha en rimelig flytende samtale med en taxisjåfør, hotellresepsjonist eller reiseleder. uten å måtte ty til profesjonelle oversettere. Det er ikke perfekt, men det reduserer friksjonen i hverdagssituasjoner betraktelig.

I næringslivet er Google Translate og de nye funksjonene posisjonert som støtte for flerspråklig kundeservice, internasjonale møter eller intern opplæringSelv om menneskelige tolker fortsatt brukes i svært kritiske miljøer, kan AI dekke mange interaksjoner med lavere risiko med mer enn akseptabel kvalitet.

Google presenterer selv disse forbedringene som en del av en bredere strategi for å Demokratisering av konversasjonsbasert og kontekstuell AI i møte med konkurrenter som Microsoft, Apple eller MetaMens Google Translate prioriterer generell tilgjengelighet og integrering på tvers av ulike enheter, fokuserer Microsoft sterkt på bedriftsmiljøer, Apple på personvern i sitt lukkede økosystem og innebygd integrering, og Meta utforsker oversettelse i bærbare enheter og utvidet virkelighet.

Innen offentlige tjenester, utdanning og helsevesen, muligheten for Oversett samtaler i sanntid til mer enn 70 språk med bare en mobiltelefon og hodetelefoner Det kan utgjøre en betydelig forskjell. Fra å hjelpe pasienter som ikke snakker landets språk, til å legge til rette for tilgang til opplæringsmateriell eller viktige administrative prosedyrer.

Samlet sett forvandler alle disse nye funksjonene Oversetteren fra en enkel, rask frasekonverterer til en en omfattende plattform som omfatter maskinoversettelse, språkpraksis og støtte for profesjonell og personlig kommunikasjonOg alt dette drives av Gemini sin kunstige intelligens og PaLM 2 som ryggrad, og behandler tekst, stemme og til og med visuelt innhold i noen tilfeller.

Utviklingen av Google Translate gjør det tydelig at maskinoversettelse har gått fra å være et begrenset og bokstavelig hjelpemiddel til et system som stadig er nærmere forståelsen av menneskelig språk, der Kontekst, tonefall, stemmekadens og brukermål er like viktige som ordene i seg selv.noe som bringer oss litt nærmere ideen om å kunne forstå nesten hvem som helst, uansett hvilket språk de snakker.

Deepl-oversetter
Relatert artikkel:
DeepL Translator: The Revolution of Machine Translation