Google официално пусна Gemini 3, най-модерния си модел с изкуствен интелект досега. Той предлага подобрения, които издигат както ежедневното взаимодействие, така и работните процеси за разработчици на ново ниво. Интернет гигантът е убеден, че с Gemini 3 хората ще могат да реализират всякакви идеи и да планират и създават почти всичко.

Докато Google постепенно внедрява Gemini 3 във всички свои продукти, ранните тестове подчертават мощни подобрения в разсъжденията, потребителския интерфейс, автономните агенти и мултимодалния интелект. В основата на Gemini 3 е значително подобрение в способността за разсъждение.

Подобреният режим „Deep Think“ осигурява още по-добра производителност при сложни задачи, превъзхождайки по-ранните версии в тестове на високо ниво. Това означава, че Gemini 3 може по-добре да разбира нюансирани или многопластови заявки, което го прави по-надежден и проницателен. Той няма само да повтаря повърхностни факти, но може да задълбочава в по-дълбок контекст.

Най-голямата промяна обаче е в неговата мултимодална мощ

Gemini 3 може безпроблемно да синтезира и разсъждава върху текст, изображения, видео, аудио и код. Това интегрирано разбиране отключва нови практически способности както за потребителите, така и за разработчиците.

Например моделът вече може щателно да гледа спортно видео и да предлага подробни, практични съвети или да анализира сложна лекция и да генерира структурирани, обобщени бележки. Той може също така да управлява извличането на сложни данни, да чете ръкописни бележки или академични статии, да извлича структурирана информация дори от документи с ниско качество и да превежда многоезични рецепти в унифициран, споделяем формат на готварска книга. Разработчиците ще се възползват значително от оптимизирани агентни и кодиращи възможности на модела, което му позволява да превежда творческа чернова и техническа спецификация директно в работещ код, дори да се отличава в конкурентни тестове за кодиране.

Gemini 3 не е просто по-умен, но е и по-креативен

Google продължава да лансира своите модели Imagen и Veo заедно с Gemini, а Gemini 3 предлага по-тясна интеграция. Потребителите на премиум нива могат да генерират висококачествени изображения с Imagen 3 или да превърнат статични изображения в динамични, кратки Veo 3 видеоклипове със звук и прости анимации. Оптимизиран е и Flow, инструментът на Google за комбиниране на Gemini, Veo и Imagen за създаване на кратки кинематографични сцени и разказвателни поредици.

Gemini 3 също така идва в Google Search, по-специално в „AI Mode“ за абонати на Google AI Pro и Ultra. В този режим Gemini 3 използва усъвършенствана техника за „разделяне на заявки“: разделя въпроса ви на подзаявки, за да събере по-подходящи източници и след това ги синтезира в по-смислен отговор. Интересното е, че Google вгражда автоматичен избор на модел, така че по-трудни или по-нюансирани въпроси се насочват към Gemini 3, докато по-простите заявки все още могат да използват по-леки и по-бързи модели.

За да се справи със сложни, многоетапни, реални проблеми, обхващащи различни приложения, Google пуска Gemini Agent на своите Ultra абонати. Тази функция позволява да организира и изпълнява трудни задачи във всички свързани услуги на Google. Агентът е специално проектиран да функционира като ваш интелигентен асистент, способен да се справя със задачи като организиране на претрупаната пощенска кутия, ефективно управление на календара и задаване на многостранни напомняния.

Агентът може да изпълнява сложни, многоетапни задачи, които изискват задълбочено проучване и действие в мрежата. Най-важното е, че Gemini Agent поддържа контрол и безопасност на потребителя, като разделя сложните инструкции на по-малки, управляеми стъпки и изисква потвърждение преди предприемане на каквито и да е критични, последващи действия като изпращане на имейл или иницииране на покупка.

Ново изживяване за потребителя

Gemini 3 въвежда новаторска концепция, която предефинира потребителското взаимодействие: Генеративни интерфейси. Моделът вече не просто връща блок от текст в отговор на сложно подканване; вместо това, той динамично проектира и кодира персонализиран, интерактивен потребителски интерфейс (UI), съобразен прецизно с дадената заявка. Този подход се проявява в два ключови експеримента, които започват да се внедряват в приложението Gemini:

Първият, Visual Layout, генерира завладяващи отговори в стил списание, допълнени със снимки и интерактивни модули. Например запитването за подробно тридневно пътуване до Рим може да доведе до визуален, персонализируем маршрут, който можете лесно да изследвате и усъвършенствате въз основа на вашата непосредствена обратна връзка.

Dynamic View, развива тази визуална концепция още по-далеч. Той използва агентното кодиране на Gemini 3, за да проектира уникално, интерактивно преживяване в реално време. Ако го помолите да „обясни галерията на Ван Гог с житейски контекст“, моделът може да предостави визуален интерфейс, който ви позволява да докосвате и превъртате през интерактивни произведения на изкуството и дълбоки биографични подробности, напълно персонализирани в движение.

Gemini 3 ще бъде достъпен първо в приложението Gemini за всички, а за платените абонати (Google AI Pro и Ultra) и в AI режима на Search. Разработчиците ще имат достъп до него и чрез Gemini API, Google AI Studio, Vertex AI и Antigravity.