СМИ «Вестник Национального бюро экспертизы интеллектуальной собственности»

Зарегистрированное средство массовой информации (свидетельство Роскомнадзора №ФС77-66781 от 08 августа 2016 г.)

Искусственный интеллект столкнулся с острой нехваткой данных

14 Января 2025
Изображение: Freepik
Уникальный
медиа-проект
Новости
интеллектуальной
собственности
доступным языком
Нас уже
15 000

Компании, разрабатывающие искусственный интеллект, оказались на грани истощения доступных данных для обучения своих моделей. По словам Илона Маска, объём публично доступной информации, необходимой для тренировки ИИ, был исчерпан еще в прошлом году.

«Совокупная сумма человеческих знаний исчерпана в обучении ИИ. Это произошло по сути в прошлом году», – сообщил Маск.

Параллельно с этим выяснилось, что некоторые блогеры начали продавать свои неизданные видео для обучения ИИ. По данным инсайдеров, компании, включая OpenAI, предлагают от 1 до 4 долларов за минуту уникального контента, особенно ценного для тренировки моделей. Видео в 4K-качестве и 3D-анимации оцениваются дороже.

Компании также всё чаще обращаются к синтетическим данным, создаваемым самими ИИ-моделями. Тем не менее, эксперты предупреждают о риске «коллапса моделей», при котором повторное использование искусственно созданного материала может снизить качество и оригинальность результатов.

Скорость исчерпания данных для обучения ИИ ускоряется. Ещё летом мы сообщали, что согласно подсчётам группы исследователей в области искусственного интеллекта, общедоступные данные, которые разработчики могут правомерно собирать, закончатся с 2026 по 2032 годы. Сейчас выясняется, что общедоступные данные могут уже быть исчерпаны.

Однако в этой новости нет ничего удивительного. Ещё год назад мы также писали, о признании компании OpenAI в том, что она не может развивать ИИ без материалов, которые защищены авторским правом. Это стало вынужденным заявлением после подачи иска к OpenAI газетой New York Times.

Может быть интересно

Наверх