Технологии
ChatGPT‑4o мина на друго ниво: ИИ вече е с по-добри способности за генериране на изображения
Моделът може да прави по-реалистични визуализации, диаграми, инфографики и лога

От OpenAI обявиха, че са направили подобрения на своя ИИ модел ChatGPT‑4o. Чатботът вече разполага с по-добри способности за генериране на изображения, благодарение на усъвършенстван генератор за визуализации. Моделът вече разбира не само как изображенията се свързват с езика, но и как текстът и снимката могат да се свързват помежду си.
„Ние обучихме нашите модели за едновременно разпознаване и комбиниране на онлайн изображения и текст. Резутатът - ChatGPT‑4o вече разполага с изненадваща визуална плавност, способен е да генерира изображения, които са полезни, последователни и съобразени с контекста“, коментират от компанията.
Разработчиците на OpenAI подчертават, че с нововъведението генерирането на изображения вече е естествен процес за GPT‑4o, като позволява на потребителя да прецизира изображения чрез обикновен разговор.
„Например, ако проектирате герой от видео игра, външният вид на героя остава последователен в множество итерации, докато усъвършенствате и експериментирате“, уточняват от компанията.





От OpenAI отчитат, че докато други системи се борят с между 5-8 обекта, GPT‑4o вече може да обработва до 10-20 различни обекта.
Освен това GPT‑4o може да анализира и да се учи от вече качени изображения, което позволява моделът да свърже знанията си между текст и изображения. Подобрението му позволява вече да създава значително по-добре обработени диаграми, инфографики и лога за професионална употреба.
„Нашият модел не е перфектен. В момента сме наясно с множество ограничения, за чието отстраняване ще работим чрез подобрения на модела след първоначалното стартиране“, заявяват още от компанията.