Már a kamera és a telefonunk képét is képes értelmezni a Gemini

2025 / 04 / 08 / Bobák Áron
Már a kamera és a telefonunk képét is képes értelmezni a Gemini
A Google chatbotja nagy lépést tett afelé, hogy teljes értékű személyi asszisztensként használhassuk.

A Google a tavaly májusban megrendezett fejlesztői konferenciáján rántotta le a leplet egy izgalmas új fejlesztésről, a Project Astráról, amely a Gemini nagy nyelvi modell képességeit kihasználva, a telefon kamerája segítségével képes értelmezni az őt körülvevő világot, és nagyjából bármilyen kérdést megválaszolni a látottakkal kapcsolatban.

A Google most bejelentette, hogy a funkciót fokozatosan elérhetővé teszik a Google Advanced előfizetéssel rendelkező felhasználók számára, akik a kamera képe mellett a telefon képernyőjét is megoszthatják a Geminivel és bármilyen kérdést feltehetnek neki a látottakkal kapcsolatban - akár magyarul is. Ehhez a felhasználóknak nincs más dolguk, mint az alkalmazásban a jobb alsó sarokban található ikonra kattintva bekapcsolni a Gemini Live funkciót, majd itt a kamera ikonra vagy a mellette található képernyőmegosztás ikonra kattintani. A Google közleménye szerint a funkció elsőként a Google Pixel és a Samsung Galaxy S25 telefonnal rendelkezők számára válik elérhetővé, de nekünk például már Galaxy S22 Ultra telefonon is működik, így feltehetőleg a más androidos telefonnal rendelkező felhasználóknak sem kell sokat várniuk az újdonságra.

Hogy az új funkció mi mindenre használható, annak leginkább csak a felhasználók fantáziája szab határt, az alábbi videóban mindenesetre kapunk egy kis ízelítőt belőle, hogyan tud segíteni a Gemini, ha például a lakásban egyszer csak elmegy az internet.

A funkciót még nem volt időnk mélységeiben letesztelni, de a fentihez hasonló kérdésre például magyarul is használható válaszokat kaptunk a Google chatbotjától. Az ellenben egyelőre gondot okoz a Gemininek, hogy pontosan megmondja, hány könyv van egy polcon vagy hogy hány billentyű található a laptop klaviatúráján.

Bár hasonló funkcióval egyelőre kevés chatbot rendelkezik, nem a Gemini az első, amelynél a kameramegosztás elérhetővé vált: az OpenAI már hónapokkal ezelőtt élesített egy hasonló funkciót, amely a Speciális Hang módon belül érhető el, egyelőre szintén csak az előfizetéssel rendelkező felhasználók számára.

(Borítókép: Google)

Ezek a videók mutatják meg igazán, milyen fejlett kognitív képességekkel rendelkezik a Google új AI-asszisztense A Project Astra megmosolyogtatóan ügyetlen rajzokról is gond nélkül megmondja, hogy mit ábrázolnak, ha pedig egymásután több képet mutatnak neki, akkor utólag is képes mindegyiket helyesen megnevezni.


Megérkezett a nagyágyú: a CANAL+ belép a magyar streamingpiacra
Megérkezett a nagyágyú: a CANAL+ belép a magyar streamingpiacra
Volt idő, amikor egy péntek esti „mit nézzünk?” kérdésre elég volt végiglapozni a tévéműsort. Ma már inkább az a kihívás, hogy melyik streamingplatformot nyissuk meg először, és mennyi idő alatt fulladunk bele a „folytasd a nézést” listákba. A streaming az elmúlt másfél évtizedben nemcsak technológiai újítás lett, hanem kulturális alapállapot: egyszerre nézzük ugyanazokat a sorozatokat, ugyanazokról a cliffhangerekről beszélünk másnap.
„Nem vagyok ölelkezős típus” – így mondd el, ha neked ez már túl sok
„Nem vagyok ölelkezős típus” – így mondd el, ha neked ez már túl sok
Határokat húzni nem önzés, hanem az önbecsülés és a kölcsönös tisztelet egyik legfontosabb eszköze – a digitális világtól a mindennapi érintkezésig.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.