Стартап Илона Маска xAI выпустил бета-версии моделей искусственного интеллекта Grok-2 и Grok-2 mini. Новые модели способны генерировать изображения в социальной сети X, сейчас доступ к ним имеют только подписчики Premium и Premium+.
Разработчик указывает, что Grok-2 ушла значительно вперёд в сравнении с Grok-1.5. Модель имеет передовые возможности в общении, кодировании и рассуждениях, пишет xAI. Стартап назвал Grok-2 mini «маленьким, но способным братом Grok-2». Раннюю версию Grok-2 под названием sus-column-r протестировали в таблице LMSYS:
Компания планирует сделать обе модели доступными для разработчиков через свой корпоративный API в конце августа.
Первые изображения, созданные пользователями, показывают, что функция генерации изображений в Grok-2 не имеет никаких ограничений. Некоторые воспользовались этим, чтобы создать изображения с политиками. Однако с приближением президентских выборов в США xAI, вероятно, столкнётся с давлением, чтобы ограничить эту опцию.
Из текста под подсказками к образцу изображения следует, что для генерации изображений Grok применяет модель FLUX.1 от Black Forest Labs.
К настоящему моменту компания представила мало подробностей о реальных возможностях Grok-2. Исследователь приложений Нима Оуджи утверждает, что модель стала лучше в задачах генерации кода, письме и новостях, хотя эксперт не привёл конкретных доказательств в пользу этого.
Стоит отметить, что первая итерация Grok часто ошибалась при обобщении новостей. ИИ-модель под лицензией Apache 2.0 вышла в ноябре прошлого года.
Без ограничений на генерацию изображений Grok-2 может стать инструментом для создания дезинформации в X и других соцсетях, полагают в TechCrunch. Неизвестно, имеют ли изображения, сгенерированные при помощи Grok, какие-либо метаданные, которые бы указывали на природу их создания.
Разработчик сообщил, что планирует развернуть Grok-2 и Grok-2 mini в функциях на основе ИИ в X, речь идёт об улучшенных возможностях поиска, аналитике постов и функциях ответа. Также xAI пообещала выпустить предварительную версию мультимодального понимания как основной части опыта Grok в X и API.
Источник: habr.com