Google päivittää Gemini Liven näkökyvyllä ja tunteiden tunnistuksella

Gemini Live sai ison päivityksen visuaaliseen tunnistamiseen. Kun suuntaamme kameran esineitä tai maisemia kohti, tekoäly tunnistaa nyt tiettyjä kohteita ja korostaa ne valkoisin reunoin. Samalla ympäröivä näkymä himmenee luoden selkeän fokuksen haluttuun kohteeseen.

Käytännön sovellukset arkielämässä:

Pysäköintisääntöjen navigointi vieraissa maissa
Oikeiden painikkeiden löytäminen laitteista
Lintujen tunnistaminen laumoista
Sopivien kenkien valinta eri tilanteisiin

Gemini Live saa pian visuaalisia ohjeita, jotka korostavat kameran kautta näkyviä kohteita. Järjestelmä yhdistää digitaalisen avun reaalimaailman navigointiin tavalla, joka tekee tekoälyn käytöstä intuitiivisempaa.

Visuaaliset peittokuvat toimivat monivaiheisen päättelyn avulla. Kun kuvaamme esimerkiksi sekavia katukylttejä, AI analysoi paikallisia sääntöjä, kääntää tekstin ja osoittaa tarkasti, missä ilmainen pysäköinti on sallittua. Tämä ominaisuus muuttaa tapaamme olla vuorovaikutuksessa fyysisen ympäristön kanssa.

Gemini Live tunnistaa nyt puhujan tunteet

Generatiivinen tekoäly on saavuttanut uuden tason äänipohjaisen tunnetilan havaitsemisessa. Gemini Liven uusi äänimalli tulkitsee käyttäjien äänensävyjä ja tunnelmia entistä tarkemmin.

Keskeiset ominaisuudet:

Äänenpainojen analyysi: Järjestelmä tunnistaa innostuneisuuden, huolestuneisuuden ja muita tunneilmaisuja
Kontekstisidonnaiset vastaukset: AI sovittaa vastauksensa käyttäjän tunnelmaan
Taustakeskustelujen erottaminen: Teknologia erottaa suorat kyselyt taustapuheesta

Vertex AI -alustalla toimiva järjestelmä tukee yli 30 erilaista ääntä 24 kielellä. Affektiivinen dialogiteknologia mahdollistaa tekoälylle sopivan reagoinnin käyttäjien tunneilmaisuihin keskustelun aikana.

Proaktiivinen ääniteknologia varmistaa, että AI vastaa vain kun sitä puhutellaan suoraan. Tämä parantaa käyttäjäkokemusta eliminoimalla tarpeettomia keskeytyksiä taustakeskustelujen aikana.

Ominaisuus	Kielimäärä	Äänityypit
Tunnepohjainen dialogi	24	30+

Laajempi konteksti ja tuleva saatavuus

Google esitteli nämä Gemini Live -parannukset Made by Google -tapahtumassaan asemoimalla Pixel 10 -sarjan tekoälyominaisuuksiensa esittelyalustaksi. Vaikka ominaisuudet julkistettiin uusien puhelimien yhteydessä, ne tulevat saataville kaikille Android-käyttäjille, joilla on Google One AI Premium -tilaus – ne eivät siis ole yksinoikeudella Pixel-laitteissa.

Päivitykset heijastavat Googlen laajempaa strategiaa integroida tekoäly luontevammin päivittäisiin älypuhelinvuorovaikutuksiin. Gemini Live -keskustelut ovat osoittautuneet viisi kertaa pidemmiksi kuin tekstipohjaiset vuorovaikutukset, mikä viittaa vahvaan käyttäjien sitoutumiseen keskusteleviin tekoälyominaisuuksiin.

Nämä parannukset tekevät Gemini Livestä kattavamman digitaalisen avustajan, joka kykenee ymmärtämään:

Visuaalisen kontekstin reaaliaikaisesti
Tunneperäiset vivahteet inhimillisessä viestinnässä
Monipuolisen sisällön eri lähteistä

Suunta on selvä: tekoälystä halutaan tehdä luontevampi osa puhelimen arkikäyttöä.

Google päivittää Gemini Liven näkökyvyllä ja tunteiden tunnistuksella

Up next

iPhone tunnistaa nyt ilmeitäsi – ohjaa laitetta pelkällä kulmakarvojen nostolla tai kielen liikkeellä

Author

Juha

Share article

Gemini Live tunnistaa nyt puhujan tunteet

Laajempi konteksti ja tuleva saatavuus

Opas tekoälypohjaisiin koodausavustajiin vuonna 2025 – vertailu ChatGPT:n, Copilotin, Clauden ja Geminin välillä

ChatGPT muistaa pian kaiken, mitä olet koskaan kertonut sille

Mitä on agenttinen tekoäly? — Ymmärtämässä siirtymää passiivisista ohjelmista itsenäisiin agentteihin

OpenAI:n jättisopimus USA:n kanssa voi mullistaa tekoälyn tulevaisuuden

Google julkaisee GenTabs AI-työkalun sovellusten luomiseen selainvälilehdistä

Google paljastaa Gemini-käyttörajoitukset: Näin monta pyyntöä ja kuvaa saat eri tasoilla

Taitettava iPhone: Huhut, ominaisuudet ja julkaisupäivä

Apple Watch Ultra 3: Kaikki uudet ominaisuudet ja päivitykset paljastettu

Apple paljastaa iPhone 17 -malliston: Kaikki mitä odottaa

Google Geminin tietosuoja: pääsy viesteihin ja sovelluksiin selvenee

Google Pixel 10 ensimmäinen puhelin jolla voi soittaa WhatsApp satelliittipuheluita

iPhone tunnistaa nyt ilmeitäsi – ohjaa laitetta pelkällä kulmakarvojen nostolla tai kielen liikkeellä

Google julkaisee GenTabs AI-työkalun sovellusten luomiseen selainvälilehdistä

Google paljastaa Gemini-käyttörajoitukset: Näin monta pyyntöä ja kuvaa saat eri tasoilla

Taitettava iPhone: Huhut, ominaisuudet ja julkaisupäivä

Apple Watch Ultra 3: Kaikki uudet ominaisuudet ja päivitykset paljastettu

Google päivittää Gemini Liven näkökyvyllä ja tunteiden tunnistuksella

Up next

Author

Share article

Gemini Live tunnistaa nyt puhujan tunteet

Laajempi konteksti ja tuleva saatavuus

You May Also Like