Компания OpenAI представила новую модель — GPT-4o mini, которая является компактной и экономичной версией GPT-4o. Эта модель демонстрирует впечатляющие результаты на тестах MMLU (82 балла из 100), MGSM (87%) и HumanEval (87.2%), превосходя конкурентов, таких как Gemini Flash и Claude Haiku. Главные преимущества GPT-4o mini включают доступность и низкую стоимость: 15 центов за миллион входных токенов и 60 центов за миллион выходных, что в 10 раз дешевле предыдущих моделей. Модель также обладает контекстным окном в 128 тысяч токенов, что позволяет обрабатывать большой объем информации, и поддерживает мультимодальное мышление.
GPT-4o mini станет доступной для пользователей ChatGPT на тарифах Free, Plus и Team, заменяя GPT-3.5 Turbo, и будет также доступна разработчикам через API. OpenAI уделила большое внимание безопасности модели, применяя методы фильтрации данных, обучение с подкреплением на основе отзывов людей (RLHF) и новый метод иерархии инструкций.
В новейшей модели компании GPT-4o Mini появилась новая технология под названием «иерархия инструкций». Она заключается в том, что чат-бот, обученный с её помощью, всегда будет ставить системные команды разработчика выше запросов пользователей.
Оливье Годман, руководитель разработки API-платформы OpenAI, утверждает, что эта технология поможет предотвратить возможные манипуляции. По его словам, «иерархия инструкций» делает модели более безопасными, чётко разделяя системные команды и запросы пользователей.
OpenAI рассматривает идею самостоятельного создания чипов, чтобы решить проблему их дефицита при разработке моделей искусственного интеллекта. Также компания активно нанимает бывших сотрудников Google.
Представитель OpenAI сообщил изданию The Information, что компания постоянно ведёт переговоры с заинтересованными сторонами из отрасли и правительства об увеличении доступа к инфраструктуре, необходимой для обеспечения широкого использования преимуществ искусственного интеллекта.
Крупные IT-компании, включая Microsoft, Google, Nvidia, Intel, IBM, PayPal, Amazon, OpenAI и другие, объявили о создании «Коалиции за безопасный искусственный интеллект» (Coalition for Secure AI, CoSAI). Эта организация направлена на обеспечение безопасности ИИ-систем через методологии с открытым исходным кодом, стандартизированные фреймворки и инструменты. CoSAI будет уделять особое внимание безопасной разработке, интеграции, развертыванию и эксплуатации ИИ, снижая риски кражи моделей, компрометации данных и кибератак.
Основные задачи CoSAI включают улучшение безопасности цепочек поставок программного обеспечения для ИИ-систем, подготовку специалистов по кибербезопасности и разработку передовых практик для управления безопасностью ИИ. Сопредседатель совета управляющих CoSAI от Google Дэвид ЛаБьянка отметил, что создание коалиции направлено на демократизацию знаний и достижений для безопасной интеграции ИИ.
Исследовательская лаборатория искусственного интеллекта EleutherAI собирала данные из различных источников без разрешения правообладателей. На основе этих данных был сформирован обучающий набор под названием «Pile».
Apple отреагировала на обвинения, заявив, что использовала «Pile» для обучения моделей OpenELM с открытым исходным кодом. Эти модели не поддерживают фирменные функции искусственного интеллекта или машинного обучения Apple и не предназначены для использования в продуктах компании.
Компания Mistral AI представила новую модель искусственного интеллекта под названием Mistral NeMo. Модель разработана совместно с NVIDIA и содержит 12 миллиардов параметров.
Модель выпущена по лицензии Apache 2.0, что позволяет использовать её в коммерческих целях. Также в модели используется новый токенизатор Tekken, основанный на Tiktoken. Он обучен более чем на 100 языках и эффективнее сжимает текст и исходный код, чем SentencePiece — токенизатор, который использовался в предыдущих моделях Mistral. В частности, при работе с исходным кодом, китайским, итальянским, французским, немецким, испанским и русским языками он эффективнее примерно на 30%.
Приложение Microsoft Designer на базе искусственного интеллекта вышло из предварительной версии и теперь доступно всем пользователям iOS и Android. В нём можно создавать открытки, стикеры, коллажи и многое другое, а также редактировать фото с использованием ИИ.
Designer почти год находился в предварительной версии. Оно поддерживает стандартные текстовые запросы и множество шаблонов для создания различных изображений. С помощью ИИ можно изменять или удалять фон, людей и предметы с фото, добавлять текст, рамки и другие декоративные элементы.
Вице-президент компании Figma Ной Левин объяснил, почему новая экспериментальная ИИ-опция Make Designs скопировала дизайн приложения «Погода» от Apple. Выяснилось, что специалисты проекта не проверили должным образом компоненты и примеры экранов, добавленные в инструмент за неделю до выхода проекта в общий доступ. Левин признал, что некоторые из этих ресурсов были похожи на аспекты реальных приложений и появлялись в результатах работы ИИ-функции.
После выявления проблемы разработчики Figma удалили ресурсы, которые были источником сходства, и временно отключили функцию Make Designs для доработки и улучшения процесса контроля качества. Вице-президент Figma, Крис Расмуссен, отметил, что компания рассчитывает включить эту функцию в ближайшее время. Сооснователь Figma, Дилан Филд, подчеркнул, что система Figma AI не обучается на контенте пользователей или существующих приложениях, а проблема возникла из-за недостаточной вариативности ИИ.
Microsoft разработала ИИ-систему SpreadsheetLLM для анализа и интерпретации данных в Excel, используя большие языковые модели. Инструмент обрабатывает двумерные сетки данных, гибкие макеты и различные форматы, сериализуя данные и включая адреса ячеек, значения и форматы. SpreadsheetLLM включает компонент, сжимающий электронные таблицы с тремя модулями: анализ структуры, преобразование данных в эффективное представление и агрегирование данных.
Хотя у инструмента есть ограничения, такие как игнорирование цвета фона ячеек и недостаток семантического сжатия для ячеек с текстом, он показал превосходство на 25,6% в тестах контекстного обучения GPT-4 и сократил использование токенов на 96%. SpreadsheetLLM может упростить обработку данных для нетехнических пользователей и специалистов в областях, требующих анализа больших объемов данных. Инструмент также может уменьшить галлюцинации в результатах, используя электронные таблицы как "источник истины". SpreadsheetLLM пока находится на стадии исследования.