OpenAI обяви пускането на „New ChatGPT Images“, който представя като значително подобрен алгоритъм за генериране на изображения. Той използва най-новия флагмански модел и е достъпен за всички потребители.
Тази актуализация превръща ChatGPT в креативно студио, способно както да генерира оригинално изкуство, така и да извършва прецизни, сложни редакции на съществуващи снимки, всичко това със забележителна скорост и придържане към намерението на потребителя. Базовият модел също се разпространява в API като GPT Image 1.5. Новият алгоритъм е 4 пъти по-бърз от предишния и цели да навакса изоставането в генерирането на изображения спрямо Nano Banana Pro на Google Gemini.
В основата си, ChatGPT Images внася драстично подобрен енджин за изображения в познатия интерфейс на ChatGPT. Актуализацията се фокусира върху три ключови области, които са били проблемни точки в по-ранните системи за генериране на изображения: точност на инструкциите, точност на редактиране и скорост. Резултатът е инструмент, който може не само да генерира подробни визуализации от текстови подкани, но и да прави прецизни редакции на качени снимки, без да променя други елементи.
Gemini става още по-добър преводач в реално време
Когато потребител качи снимка и поиска промяна, например на дрехиte, добавяне на обект или транспониране на елементи, моделът надеждно променя само това, което е поискано. Детайли като осветление, композиция и дори външният вид на човек остават еднакви в оригиналното изображение, крайния резултат и последващите редакции.
Моделът е отличен в запазването на същността и идентичността на хора и обекти, което го прави идеален за задачи като виртуални пробвания на дрехи, реалистични промени в прическите или прилагане на артистични филтри, които запазват целостта на оригиналната снимка. Макар че понякога алгоритъмът изменя лицето леко, вероятно, за да се предпази от обвинения в създаване на дийп фейкове.
Трикове, за да използваме пълната мощ на компютъра си
Скоростта е едно от най-забележимите подобрения. Според OpenAI, новият модел може да създава изображения до четири пъти по-бързо от предишните версии, помагайки на потребителите да стигнат от идеята до визуалния продукт с по-малко време на чакане. Това увеличение на скоростта е особено ценно за дизайнери, маркетолози, студенти и любители, които интегрират създаването на изображения в ежедневните си работни процеси.
Отвъд обикновената редакция, моделът блести в креативните трансформации, като лесно променя стила на изображението. Например превръщането на снимка във филмов плакат или фитнес реклама от 80-те, като същевременно запазва ключови детайли и концепции.
Още ползи от USB порта на телефона освен за зареждане
Apple и Google улесняват връзката между Android и iOS
Освен това, моделът е направил значителна крачка напред в рендирането на текст, способен да обработва по-плътен и по-малък текст в изображенията с по-голяма точност от предишните версии, което е ключова характеристика за генериране на маркетингови материали или инфографики. Така обновеното предложение на OpenAI позиционира ChatGPT не само като разговорен ИИ, но и като цялостен творчески партньор, който поддържа както визуално, така и текстово творчество.
OpenAI направи функцията по-лесна за достъп: в страничната лента на ChatGPT вече се появява специален раздел „Изображения“, предлагащ предварително зададени стилове, креативни идеи и рационализиран начин за започване на нови проекти. Много потребители вече виждат актуализацията в интерфейса си на ChatGPT, което прави създаването на изображения по-достъпно за всички, от обикновени потребители до професионалисти с платен абонамент.