Google официално пусна Gemini 3, най-модерния си модел с изкуствен интелект досега. Той предлага подобрения, които издигат както ежедневното взаимодействие, така и работните процеси за разработчици на ново ниво. Интернет гигантът е убеден, че с Gemini 3 хората ще могат да реализират всякакви идеи и да планират и създават почти всичко.
Докато Google постепенно внедрява Gemini 3 във всички свои продукти, ранните тестове подчертават мощни подобрения в разсъжденията, потребителския интерфейс, автономните агенти и мултимодалния интелект. В основата на Gemini 3 е значително подобрение в способността за разсъждение.
Подобреният режим „Deep Think“ осигурява още по-добра производителност при сложни задачи, превъзхождайки по-ранните версии в тестове на високо ниво. Това означава, че Gemini 3 може по-добре да разбира нюансирани или многопластови заявки, което го прави по-надежден и проницателен. Той няма само да повтаря повърхностни факти, но може да задълбочава в по-дълбок контекст.
Шефът на Google: Няма компания, която да е защитена, ако AI балонът се спука
Най-голямата промяна обаче е в неговата мултимодална мощ
Gemini 3 може безпроблемно да синтезира и разсъждава върху текст, изображения, видео, аудио и код. Това интегрирано разбиране отключва нови практически способности както за потребителите, така и за разработчиците.
Например моделът вече може щателно да гледа спортно видео и да предлага подробни, практични съвети или да анализира сложна лекция и да генерира структурирани, обобщени бележки. Той може също така да управлява извличането на сложни данни, да чете ръкописни бележки или академични статии, да извлича структурирана информация дори от документи с ниско качество и да превежда многоезични рецепти в унифициран, споделяем формат на готварска книга. Разработчиците ще се възползват значително от оптимизирани агентни и кодиращи възможности на модела, което му позволява да превежда творческа чернова и техническа спецификация директно в работещ код, дори да се отличава в конкурентни тестове за кодиране.
Gemini 3 не е просто по-умен, но е и по-креативен
Google продължава да лансира своите модели Imagen и Veo заедно с Gemini, а Gemini 3 предлага по-тясна интеграция. Потребителите на премиум нива могат да генерират висококачествени изображения с Imagen 3 или да превърнат статични изображения в динамични, кратки Veo 3 видеоклипове със звук и прости анимации. Оптимизиран е и Flow, инструментът на Google за комбиниране на Gemini, Veo и Imagen за създаване на кратки кинематографични сцени и разказвателни поредици.
Gemini 3 също така идва в Google Search, по-специално в „AI Mode“ за абонати на Google AI Pro и Ultra. В този режим Gemini 3 използва усъвършенствана техника за „разделяне на заявки“: разделя въпроса ви на подзаявки, за да събере по-подходящи източници и след това ги синтезира в по-смислен отговор. Интересното е, че Google вгражда автоматичен избор на модел, така че по-трудни или по-нюансирани въпроси се насочват към Gemini 3, докато по-простите заявки все още могат да използват по-леки и по-бързи модели.
Какво разкриват снимките ни за всички без да осъзнаваме
Сателитната комуникация става важна част от iPhone
За да се справи със сложни, многоетапни, реални проблеми, обхващащи различни приложения, Google пуска Gemini Agent на своите Ultra абонати. Тази функция позволява да организира и изпълнява трудни задачи във всички свързани услуги на Google. Агентът е специално проектиран да функционира като ваш интелигентен асистент, способен да се справя със задачи като организиране на претрупаната пощенска кутия, ефективно управление на календара и задаване на многостранни напомняния.
Агентът може да изпълнява сложни, многоетапни задачи, които изискват задълбочено проучване и действие в мрежата. Най-важното е, че Gemini Agent поддържа контрол и безопасност на потребителя, като разделя сложните инструкции на по-малки, управляеми стъпки и изисква потвърждение преди предприемане на каквито и да е критични, последващи действия като изпращане на имейл или иницииране на покупка.
Ново изживяване за потребителя
Gemini 3 въвежда новаторска концепция, която предефинира потребителското взаимодействие: Генеративни интерфейси. Моделът вече не просто връща блок от текст в отговор на сложно подканване; вместо това, той динамично проектира и кодира персонализиран, интерактивен потребителски интерфейс (UI), съобразен прецизно с дадената заявка. Този подход се проявява в два ключови експеримента, които започват да се внедряват в приложението Gemini:
Първият, Visual Layout, генерира завладяващи отговори в стил списание, допълнени със снимки и интерактивни модули. Например запитването за подробно тридневно пътуване до Рим може да доведе до визуален, персонализируем маршрут, който можете лесно да изследвате и усъвършенствате въз основа на вашата непосредствена обратна връзка.
Google предлага AI да помогне в пазаруването за подаръци
Как да защитим данните си при пътувания
Dynamic View, развива тази визуална концепция още по-далеч. Той използва агентното кодиране на Gemini 3, за да проектира уникално, интерактивно преживяване в реално време. Ако го помолите да „обясни галерията на Ван Гог с житейски контекст“, моделът може да предостави визуален интерфейс, който ви позволява да докосвате и превъртате през интерактивни произведения на изкуството и дълбоки биографични подробности, напълно персонализирани в движение.
Google: Да сме откровени за риска с изкуствения интелект
Резултатите на Microsoft, Alphabet и Meta помрачени от растящите страхове от балон в AI
Gemini 3 ще бъде достъпен първо в приложението Gemini за всички, а за платените абонати (Google AI Pro и Ultra) и в AI режима на Search. Разработчиците ще имат достъп до него и чрез Gemini API, Google AI Studio, Vertex AI и Antigravity.