OpenAI представи ChatGPT Images 2.0, като значително подобрение на възможностите си за генериране на изображения, позиционирайки инструмента като по-мощна, гъвкава и професионална творческа система. Актуализацията въвежда редица подобрения, които далеч надхвърлят простото създаване на изображения, отразявайки по-широка промяна към инструменти, които могат да „мислят“, разсъждават и изпълняват сложни визуални задачи с прецизност.
В основата на ChatGPT Images 2.0 е модел от ново поколение, предназначен да създава по-висококачествени и по-точни визуализации. Едно от най-забележителните подобрения е подобреното следване на инструкциите. Системата вече може по-добре да интерпретира подробните подкани, като гарантира, че елементи като композиция, оформление и взаимоотношения между обектите се изобразяват точно както е поискано. Това адресира дългогодишно ограничение в по-ранните модели на изображения, където сложните инструкции често водеха до противоречиви резултати.
Друго основно подобрение е възможността за генериране на множество изображения от едно задание, като същевременно се запазва последователност. Потребителите могат да създават до осем варианта едновременно, като моделът запазва героите, стиловете и визуалните детайли във всеки от тях. Това е особено полезно за разказване на истории, дизайнерска работа или създаване на съдържание, където последователността е от значение.
Умните домове са модерни, но трябва да внимаваме с тях
Определяща характеристика на новата система е нейната способност за „мислене“. За разлика от по-ранните модели, които генерираха изображения директно от подкани, ChatGPT Images 2.0 може да обмисли заявка, преди да генерира резултат. Това включва анализ на структура, проверка на детайли и дори включване на информация от мрежата, когато е необходимо. Резултатът е по-контекстно-осъзнат и точен процес на генериране на изображения, особено за сложни или богати на информация визуализации.
Рендирането на текст, исторически слабо място за инструментите за изображения с изкуствен интелект, също претърпява значителни подобрения. Новият модел може да генерира по-ясен и по-четлив текст в изображения, включително етикети, менюта и инфографики.
Многоезичната поддръжка е друго ключово подобрение. ChatGPT Images 2.0 може да генерира текст и визуализации на множество езици, включително сложни писмености като китайски, японски и хинди. Това разширява използваемостта му за глобална аудитория и дава възможност за по-разнообразни творчески резултати.
Google прави създаването на AI видео достъпно за всички
Технологии от филмите, които не се сбъднаха както трябва
По отношение на визуалното качество, моделът поддържа по-високи резолюции, до 2K, и по-гъвкави съотношения на страните, вариращи от широки кинематографични формати до вертикални оформления, подходящи за мобилно съдържание. Тази гъвкавост позволява на създателите да създават всичко – от графики за социални медии до подробни дизайнерски макети, в рамките на една система.
Актуализацията също така засилва творческата гъвкавост. Потребителите могат да генерират голямо разнообразие от типове изображения, включително фотореалистични сцени, илюстрации, комикси и дори сложни многопанелни оформления.
Батериите са ахилесовата пета на смартфоните
Зукърбърг прави своя AI версия за служителите си
Актуализацията не е само за по-добри пиксели. Тя е за по-добра интеграция. За потребителите на Mac, Images 2.0 вече е вграден директно в приложението Codex, което позволява на разработчиците да генерират указания за потребителски интерфейс и прототипи заедно с кода си. Освен това, всички генерирани изображения вече се запазват автоматично в централизирана библиотека „Моите изображения“, което позволява на потребителите да разглеждат и използват повторно минали разработки, без да се ровят в стари преписи на чатове.