Már a kamera és a telefonunk képét is képes értelmezni a Gemini

2025 / 04 / 08 / Bobák Áron
Már a kamera és a telefonunk képét is képes értelmezni a Gemini
A Google chatbotja nagy lépést tett afelé, hogy teljes értékű személyi asszisztensként használhassuk.

A Google a tavaly májusban megrendezett fejlesztői konferenciáján rántotta le a leplet egy izgalmas új fejlesztésről, a Project Astráról, amely a Gemini nagy nyelvi modell képességeit kihasználva, a telefon kamerája segítségével képes értelmezni az őt körülvevő világot, és nagyjából bármilyen kérdést megválaszolni a látottakkal kapcsolatban.

A Google most bejelentette, hogy a funkciót fokozatosan elérhetővé teszik a Google Advanced előfizetéssel rendelkező felhasználók számára, akik a kamera képe mellett a telefon képernyőjét is megoszthatják a Geminivel és bármilyen kérdést feltehetnek neki a látottakkal kapcsolatban - akár magyarul is. Ehhez a felhasználóknak nincs más dolguk, mint az alkalmazásban a jobb alsó sarokban található ikonra kattintva bekapcsolni a Gemini Live funkciót, majd itt a kamera ikonra vagy a mellette található képernyőmegosztás ikonra kattintani. A Google közleménye szerint a funkció elsőként a Google Pixel és a Samsung Galaxy S25 telefonnal rendelkezők számára válik elérhetővé, de nekünk például már Galaxy S22 Ultra telefonon is működik, így feltehetőleg a más androidos telefonnal rendelkező felhasználóknak sem kell sokat várniuk az újdonságra.

Hogy az új funkció mi mindenre használható, annak leginkább csak a felhasználók fantáziája szab határt, az alábbi videóban mindenesetre kapunk egy kis ízelítőt belőle, hogyan tud segíteni a Gemini, ha például a lakásban egyszer csak elmegy az internet.

A funkciót még nem volt időnk mélységeiben letesztelni, de a fentihez hasonló kérdésre például magyarul is használható válaszokat kaptunk a Google chatbotjától. Az ellenben egyelőre gondot okoz a Gemininek, hogy pontosan megmondja, hány könyv van egy polcon vagy hogy hány billentyű található a laptop klaviatúráján.

Bár hasonló funkcióval egyelőre kevés chatbot rendelkezik, nem a Gemini az első, amelynél a kameramegosztás elérhetővé vált: az OpenAI már hónapokkal ezelőtt élesített egy hasonló funkciót, amely a Speciális Hang módon belül érhető el, egyelőre szintén csak az előfizetéssel rendelkező felhasználók számára.

(Borítókép: Google)

Ezek a videók mutatják meg igazán, milyen fejlett kognitív képességekkel rendelkezik a Google új AI-asszisztense A Project Astra megmosolyogtatóan ügyetlen rajzokról is gond nélkül megmondja, hogy mit ábrázolnak, ha pedig egymásután több képet mutatnak neki, akkor utólag is képes mindegyiket helyesen megnevezni.


A következő 25 év - mítoszok, jóslatok és a valóság
A következő 25 év - mítoszok, jóslatok és a valóság
Európa legnagyobb jövőfesztiválja, a Brain Bar idén is megnyitja kapuit. A rendezvény a 21. század első negyedének elteltével arra a kérdésre keresi a választ: hogy fest majd az emberiség következő 25 éve. A diákok és pedagógusok számára ingyenes eseménynek szeptember 18-19-én a Magyar Zene Háza ad otthont.
A csaló telefonhívásokon és a nem létező gázszámlákon túl –  7 módszer, amivel ellophatják az adatainkat az interneten
A csaló telefonhívásokon és a nem létező gázszámlákon túl – 7 módszer, amivel ellophatják az adatainkat az interneten
Az ESET kiberbiztonsági szakértői most összefoglalják, milyen módszerekkel lophatják el a személyes adatainkat – és mit tehetünk azért, hogy ez ne történhessen meg.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.