Google I/O 2026: Nowe funkcje Gemini i inteligentne okulary AI

20.05.2026 14:43 Mateusz Szałowski

I/O 2026: Google prezentuje szereg zmian w Gemini, nowe funkcje AI i inteligentne okulary

Tegoroczna edycja konferencji I/O trwała dwie godziny i potwierdziła, że sztuczna inteligencja jest najważniejszym kierunkiem rozwoju usług Google. Firma zaprezentowała nową generację agentów opartych na modelach Gemini, rozszerzyła ekosystem o wielomodalny model „Gemini Omni” i przedstawiła kolejne kroki w integracji AI z codziennymi narzędziami – od zakupów internetowych po inteligentne okulary.

Agenci AI i ewolucja rodziny Gemini

Najwięcej uwagi przyciągnęły „Gemini Spark” – osobiste agenty asystujące, które łączą dane z Gmaila, Kalendarza i List Zadań, a następnie priorytetyzują obowiązki użytkownika. W praktyce oznacza to poranne podsumowanie kluczowych spotkań, przypomnień i terminów wraz z propozycjami kolejnych kroków, takich jak rezerwacja sali czy wysłanie materiałów zespołowi. Równolegle zadebiutował „Google Flow”, czyli środowisko do planowania i realizacji złożonych projektów. Dzięki technologii „vibe coding” użytkownik może w jednym miejscu generować narzędzia do edycji wideo czy prototypowania animacji, a model Nano Banana w nowej aplikacji „Google Pics” traktuje elementy obrazu jako odrębne obiekty, co ułatwia ich precyzyjną modyfikację.

Gemini Omni: model wielomodalny następnej generacji

„Gemini Omni” to pierwszy model Google, który przyjmuje dane wejściowe w postaci wideo, a docelowo ma obsługiwać pełne spektrum multimodalne: obraz, tekst i dźwięk. Wersja „Omni Flash”, dostępna już w aplikacji Gemini, w Google Flow oraz w YouTube Shorts, skraca czas inferencji i zwiększa dokładność rozumienia kontekstu scen wizualnych. Google zapowiedziało udostępnienie interfejsu API dla deweloperów i klientów korporacyjnych w nadchodzących miesiącach, co otworzy drogę do budowy aplikacji analizujących wideo w czasie rzeczywistym – od diagnostyki przemysłowej po wsparcie dla twórców treści.

Gemini 3.5 Flash i nowy interfejs aplikacji

Model „Gemini 3.5 Flash” zastępuje poprzednią wersję, oferując czterokrotnie szybsze odpowiedzi oraz lepszą obsługę zadań programistycznych, takich jak refaktoryzacja kodu czy generowanie testów jednostkowych. Aplikacja Gemini przeszła gruntowny redesign oparty na języku projektowania „Neural Expressive”: wprowadzono płynne animacje, żywszą paletę kolorów i haptyczne informacje zwrotne. Nowy silnik rozpoznawania mowy umożliwia dłuższe, bardziej naturalne konwersacje, a obsługa dialektów regionalnych ma pojawić się jeszcze w tym roku.

Universal Cart – zakupy zarządzane przez sztuczną inteligencję

„Universal Cart” konsoliduje proces zakupowy w ekosystemie Google. Użytkownik może dodawać produkty podczas wyszukiwania, w aplikacji Gemini czy na YouTube, a agent w tle monitoruje historię cen, wyszukuje promocje i powiadamia o najkorzystniejszym momencie zakupu. Latem funkcja trafi do wyszukiwarki i aplikacji Gemini w Stanach Zjednoczonych, później ma zostać zintegrowana z YouTube i Gmailem oraz udostępniona na rynkach międzynarodowych.

Inteligentne okulary nowej generacji

Na zakończenie prezentacji Google pokazało parę inteligentnych okularów opracowanych z markami Gentle Monster i Warby Parker. Dostępne będą dwa warianty: model audio z asystentem głosowym w zausznikach oraz wersja z przezroczystym wyświetlaczem projekcyjnym. Funkcje obejmują: tłumaczenie tekstu i mowy w czasie rzeczywistym; nawigację z instrukcjami wyświetlanymi w polu widzenia; rejestrowanie oraz natychmiastowe udostępnianie zdjęć i wideo; obsługę komend głosowych do wysyłania wiadomości i zamawiania usług mobilnych. Premiera rynkowa została zaplanowana na jesień, najpierw w wybranych krajach Ameryki Północnej i Europy, a następnie w rozszerzonej dystrybucji.

Według harmonogramu producenta: „Gemini Spark” i „Google Flow” trafiają do zaufanych testerów już dziś, subskrybenci Workspace AI Pro i Ultra zyskają dostęp do „Google Pics” latem, interfejs API „Gemini Omni” obejmie klientów korporacyjnych w trzecim kwartale, a kolejne aktualizacje modeli językowych będą wdrażane etapami w aplikacji Gemini. Zapowiedziany pakiet nowości jasno wskazuje, że Google konsekwentnie buduje spójny, wielowarstwowy ekosystem AI – od zaawansowanych modeli, przez agentów kontekstowych, po urządzenia noszone, których zadaniem jest przeniesienie inteligentnych funkcji z ekranu smartfona bezpośrednio do codziennego otoczenia użytkownika.