Már a kamera és a telefonunk képét is képes értelmezni a Gemini

2025 / 04 / 08 / Bobák Áron
Már a kamera és a telefonunk képét is képes értelmezni a Gemini
A Google chatbotja nagy lépést tett afelé, hogy teljes értékű személyi asszisztensként használhassuk.

A Google a tavaly májusban megrendezett fejlesztői konferenciáján rántotta le a leplet egy izgalmas új fejlesztésről, a Project Astráról, amely a Gemini nagy nyelvi modell képességeit kihasználva, a telefon kamerája segítségével képes értelmezni az őt körülvevő világot, és nagyjából bármilyen kérdést megválaszolni a látottakkal kapcsolatban.

A Google most bejelentette, hogy a funkciót fokozatosan elérhetővé teszik a Google Advanced előfizetéssel rendelkező felhasználók számára, akik a kamera képe mellett a telefon képernyőjét is megoszthatják a Geminivel és bármilyen kérdést feltehetnek neki a látottakkal kapcsolatban - akár magyarul is. Ehhez a felhasználóknak nincs más dolguk, mint az alkalmazásban a jobb alsó sarokban található ikonra kattintva bekapcsolni a Gemini Live funkciót, majd itt a kamera ikonra vagy a mellette található képernyőmegosztás ikonra kattintani. A Google közleménye szerint a funkció elsőként a Google Pixel és a Samsung Galaxy S25 telefonnal rendelkezők számára válik elérhetővé, de nekünk például már Galaxy S22 Ultra telefonon is működik, így feltehetőleg a más androidos telefonnal rendelkező felhasználóknak sem kell sokat várniuk az újdonságra.

Hogy az új funkció mi mindenre használható, annak leginkább csak a felhasználók fantáziája szab határt, az alábbi videóban mindenesetre kapunk egy kis ízelítőt belőle, hogyan tud segíteni a Gemini, ha például a lakásban egyszer csak elmegy az internet.

A funkciót még nem volt időnk mélységeiben letesztelni, de a fentihez hasonló kérdésre például magyarul is használható válaszokat kaptunk a Google chatbotjától. Az ellenben egyelőre gondot okoz a Gemininek, hogy pontosan megmondja, hány könyv van egy polcon vagy hogy hány billentyű található a laptop klaviatúráján.

Bár hasonló funkcióval egyelőre kevés chatbot rendelkezik, nem a Gemini az első, amelynél a kameramegosztás elérhetővé vált: az OpenAI már hónapokkal ezelőtt élesített egy hasonló funkciót, amely a Speciális Hang módon belül érhető el, egyelőre szintén csak az előfizetéssel rendelkező felhasználók számára.

(Borítókép: Google)

Ezek a videók mutatják meg igazán, milyen fejlett kognitív képességekkel rendelkezik a Google új AI-asszisztense A Project Astra megmosolyogtatóan ügyetlen rajzokról is gond nélkül megmondja, hogy mit ábrázolnak, ha pedig egymásután több képet mutatnak neki, akkor utólag is képes mindegyiket helyesen megnevezni.


A személyesség luxusa: így lesz az ajándékból igazi emlék
A személyesség luxusa: így lesz az ajándékból igazi emlék

A karácsonyi ajándékozás az egyik legnehezebb műfaj. Na nem azért, mert ne lenne miből választani… épp ellenkezőleg! Sok a lehetőség, közben sok az elvárás, mégis valahogy eltűnik a lényeg, mégpedig az, hogy a figyelmünket adjuk. Karácsony előtt mindig ugyanaz a kérdés kering a fejemben: vajon mit adjak annak, akinek tényleg szeretném megmutatni, hogy mennyire fontos nekem?

Őszi stílus, határozott karakterrel – megérkezett a Beverly Hills Polo Club legújabb kollekciója
Őszi stílus, határozott karakterrel – megérkezett a Beverly Hills Polo Club legújabb kollekciója
Pontosan erre az időszakra készült: magabiztos, kényelmes és kortalan darabokkal, amelyek egyszerre működnek a hétköznapokban és az elegánsabb alkalmakon is.
Ezek is érdekelhetnek
HELLO, EZ ITT A
RAKÉTA
Kövess minket a Facebookon!
A jövő legizgalmasabb cikkeit találod nálunk!
Hírlevél feliratkozás

Ne maradj le a jövőről! Iratkozz fel a hírlevelünkre, és minden héten elküldjük neked a legfrissebb és legérdekesebb híreket a technológia és a tudomány világából.



This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.