И зползването на изкуствен интелект за създаване на изображения от нулата не е нещо ново. Въпреки това, прилагането на AI за стратегическо или дори прецизно манипулиране на реални снимки винаги е било по-сложно. Наскоро Google представи усъвършенствани възможности за редактиране на снимки в рамките на платформата Gemini, известна като Gemini Nano Banana.Тази технология може да се сравни с Photoshop, но в много отношения го надминава, пише DEV.
Мистериозното появяване на Nano Banana
Представете си следното: тайнствен AI модел се появява на LMArena (платформа за анонимно тестване на изкуствен интелект) и започва да превъзхожда всички останали генератори на изображения. Потребителите не знаят коя компания стои зад него. Общността го нарича "Nano Banana" заради многобройните препратки към банани, които се появяват в резултатите от тестовете. Инженерите на Google започват да публикуват емотикони с банани в Twitter без никакво обяснение. AI общността полудява, опитвайки се да разбере кой е създателят. Изненадващ обрат: през цялото време това е бил Google. Сега този модел официално е представен като Gemini 2.5 Flash Image.
Какви са плюсовете на Nano Banana?
- Скорост
Докато други инструменти за генериране на изображения с AI отнемат между 10 и 15 секунди, Nano Banana реагира за 1-2 секунди.
- Съгласуваност на образите
Основното предизвикателство на генерирането на изображения с AI: да запази един и същ човек с идентичен външен вид в множество редакции. Предишните модели често променяха лица, изражения или черти, а за момента, Nano Banana се справя добре в повечето случаи.
- Редактиране чрез естествен език
Вместо сложни инструкции, просто кажете:
- "Премахни фона и добави гора"
- "Накарай я да се усмихне и добави слънчеви очила"
- "Облечи го в бизнес костюм"
- "Смеси тези две снимки заедно"
-Включване на общо познание за света
За разлика от други генератори на изображения, които просто преработват обучителните си данни, Nano Banana разбира контекста, културните препратки и логиката на реалния свят. Това не е просто създаване на красиви снимки – той "мисли" за това, което има смисъл.
Числата
- Класация на LMArena: №1 модел за редактиране на изображения в световен мащаб
- Скорост на обработка: 1-2 секунди
- Потребителски предпочитания: Най-висок общ резултат в сравнение с ChatGPT-4o, FLUX.1 и Qwen Image Edit
- Степен на успех: Точност от първия опит, която е впечатляващо добра
Недостатъци
- Все още има трудности с малки лица и фини детайли
- Изобразяването на текст в изображенията изисква доработки
- Многократните кръгове на редактиране понякога могат да изкривят лицата
- Съгласуваността на образите не е 100% надеждна
Воден знак SynthID
Всяко изображение получава невидим цифров воден знак, който го идентифицира като генерирано от AI.
Hindustan Times тества четири добри употреби за Nano Banana:
Променете фона на вашите изображения
Това може да бъде ваш портрет или просто обект, чийто фон искате да замените. Вместо да прекарвате часове в приложения като Photoshop, можете да качите снимката в Google Gemini и да изпратите инструкция с молба да премахне или промени фона. Например, можете да помолите Gemini да замени обикновен фон със студио обстановка, допълнена с професионално осветление. Това е изключително полезно за хора, които предлагат продукти на пазара, наред с други приложения.
Преосмислете интериора на дома си
Друг интересен начин за използване е преосмислянето на интериора на вашия дом. Чудили ли сте се как би изглеждала определена картина или различен цвят на стената? Можете просто да изпратите изображение на стаята си на Gemini и да го помолите да добави картина. Имате възможност да качите отделен файл с изображение на картината. Също така можете да поискате различни видове цветове, за да видите как биха изглеждали.
Създайте комбинирана снимка
Има моменти, когато приятел може да липсва на групова снимка – може би по време на пътуване или в друга ситуация. Просто качете негова снимка заедно с вашата групова снимка и след това помолете Gemini да ги обедини, така че всички да бъдат заедно, дори ако е само в пиксели. Като алтернатива, можете да премахнете конкретни хора от групова снимка с минимални усилия. Това спестява много време и ако не харесвате някого, можете просто да го изключите от изображението.
Интересен съвет: можете също да създадете снимки на хора, които не са живели в един и същ период от време. Например, представете си, че събирате Майкъл Джексън и някой като Бела Рамзи на една снимка.
Направете селективни части от изображението си анимирани или в стил аниме
Представете си снимка на вашата котка в скута ви. Можете просто да помолите Gemini да превърне котката ви в герой в стил аниме, като остави всичко останало непроменено. Това означава, че вие и заобикалящата ви среда оставате реалистични, докато котката ви е в анимиран стил. Можете да приложите същия подход и за други обекти, като храна.