Google Gemini, агентен AI и генеративно видео са сред основните акценти в новото развитие на приложението Gemini, представено по време на Google I/O 2026. Компанията обяви мащабно обновяване както на интерфейса, така и на функциите на своя AI асистент, като фокусът вече е върху по-активна помощ, автоматизиране на задачи и създаване на мултимедийно съдържание.
Новите възможности превръщат Gemini от чатбот за отговори в по-практичен AI асистент, който може да помага с имейли, календарни събития, документи, ежедневни задачи и видео съдържание. Google подчертава, че агентните функции са проектирани да работят под контрола на потребителя и че по-чувствителни действия, като изпращане на имейл или харчене на пари, ще изискват изрично потвърждение.
Gemini има нов облик
Google обновява визуалния език на приложението Gemini с дизайн, наречен Neural Expressive. Той включва нови анимации, цветове, типография и подобрена haptic обратна връзка. Целта е взаимодействието с AI асистента да бъде по-динамично, по-визуално и по-малко зависимо от дълги текстови отговори.
Gemini Live вече е интегриран директно в приложението Gemini, което позволява по-лесно преминаване от писане към гласов разговор с AI. Промените във voice chat режима дават възможност потребителят да говори със собствено темпо, без системата да го прекъсва или да изисква постоянен поток от реч.
Google планира и опция Gemini да говори с регионални диалекти, което може да направи AI асистента по-персонализиран за различни потребители. Според компанията отговорите вече няма да изглеждат като „стена от текст“, а ще могат да включват изображения, интерактивни времеви линии, разказани видеа и динамични графики. Новият дизайн се разпространява за web, Android и iOS.
Gemini Spark превръща приложението в личен AI агент
Gemini Spark е ключовата стъпка на Google към агентен AI в приложението Gemini. Функцията е замислена като личен AI агент, който може да изпълнява задачи по зададени от потребителя инструкции, включително когато лаптопът или телефонът не се използват активно.
Сред примерите, представени от Google, са повтарящи се задачи и автоматични проверки, като сканиране на сметки по кредитна карта за нови или скрити абонаментни такси, обработване на бележки от срещи и създаване на завършен документ в Google Docs, както и подготвяне на придружаващ имейл за старт на проект.
Gemini Spark може да бъде обучаван да следи крайни срокове за училищни задачи и да споделя информация със съпруг или съпруга, така че родителите да имат по-добър поглед върху ангажиментите на детето, без постоянно да проверяват пощата му.
Google акцентира върху това, че Spark работи по команди на потребителя. Потребителят ще избира до кои приложения Gemini Spark има достъп, а действия с по-висок риск, като плащания или изпращане на имейли, ще изискват изрично съгласие. Функцията започва да се предлага първо за Google AI Ultra абонати в САЩ, а по-късно ще достигне и до Gemini приложението за macOS, където ще може да автоматизира работни процеси с локални файлове.
Daily Brief създава персонализиран сутрешен преглед
Gemini получава и нова функция за сутрешни обобщения, наречена Daily Brief. Тя работи само при изрично включване от потребителя и използва достъп до Gmail, Calendar и задачи, за да подготвя преглед на предстоящия ден.
Daily Brief е създаден да приоритизира задачите според целите на потребителя и да предлага следващи стъпки за справяне с важните ангажименти. Потребителите ще могат да дават обратна връзка чрез бърза положителна или отрицателна оценка, което ще помага на системата да настройва препоръките си.
Функцията започва да се разпространява в САЩ за Google AI Plus, Pro и Ultra абонати, като изисква потребителят да е избрал свързване на Google приложенията си.
Gemini Omni превръща идеи в кинематографични видеа
Една от най-съществените новини е Gemini Omni, нов модел за създаване и редактиране на видео. Той позволява комбиниране на текст, изображения, аудио и видео входове за генериране на нови видеа. Първият модел от тази линия е Gemini Omni Flash, който започва с фокус върху видео генерацията.
Google описва Gemini Omni Flash като модел, който може да създава и редактира видео чрез разговорни команди. Това означава, че потребителят може да поиска смяна на фон, прилагане на кинематографичен zoom ефект или използване на шаблони върху кадри от камерата, без да има професионален опит със софтуер за видео обработка.
Функцията включва и възможност за създаване на персонализиран AI аватар, който изглежда и звучи като потребителя и може да бъде добавян във видеа. Това прави технологията по-достъпна за създатели на съдържание, маркетинг екипи и малки бизнеси, но отваря и сериозни въпроси около deepfake съдържанието и злоупотребата с образа на реални хора.
Точно затова Gemini Omni поставя важен акцент върху етичната страна на генеративното видео. Създаването на видеа с лица на реални хора остава чувствителна зона, в която са необходими ясни правила, защита на идентичността и ефективни механизми срещу злоупотреби.
Контекстът около AI видео пазара е особено важен, след като OpenAI прекрати Sora web и app преживяванията на 26 април 2026 г., а Sora API е планирано да бъде спрян на 24 септември 2026 г.
Какво означава това за потребителите и бизнеса
Новият Gemini показва посоката, в която се развиват AI асистентите: по-малко пасивни отговори и повече активна помощ. За потребителите това означава по-персонализирана организация на деня, по-лесна работа с имейли и документи и по-бързо създаване на съдържание.
За бизнеса, маркетинг екипите и създателите на съдържание промяната е още по-значима. Gemini Spark може да ускори административни процеси и управление на задачи, Daily Brief може да служи като AI оперативен асистент, а Gemini Omni отваря нови възможности за видео съдържание, рекламни формати, социални мрежи и персонализирани визуални кампании.
В същото време новите функции поставят и по-високи изисквания към контрола, сигурността и прозрачността. Колкото повече AI асистентите получават възможност да действат от името на потребителя, толкова по-важни стават ясните разрешения, видимостта върху действията и защитата срещу неоторизирана употреба.