В OpenAI случайно удалили данные, которые изучали юристы The New York Times в рамках судебного дела о нарушении авторских прав
Компания OpenAI подверглась критике в рамках судебного спора с газетами The New York Times и Daily News после того, как её сотрудники случайно удалили данные, собранные истцами для анализа обучения ИИ-моделей.
В декабре 2023 года OpenAI предоставила доступ для поиска материалов, предположительно использованных в обучении ИИ. Однако 14 ноября со стороны Open AI по ошибке были стёрты данные на одной из виртуальных машин, включая структурированные папки и названия файлов.
По словам The New York Times, на анализ было затрачено более 150 часов работы экспертов и юристов. Теперь эти усилия придется повторить.
Истцы утверждают, что у них нет оснований полагать, что удаление данных было преднамеренным, но инцидент подчеркивает необходимость проведения подобных анализов непосредственно OpenAI, которая лучше знает собственные наборы данных.
В своем ответе адвокаты OpenAI назвали инцидент результатом технической ошибки, связанной с запросом истцов на изменение конфигурации одной из машин. По их словам, папки и имена файлов удалились из-за изменения настроек кэша, но сами файлы не были потеряны.
Но OpenAI продолжает утверждать, что использование данных, включая статьи газет, для обучения своих моделей является добросовестным использованием и не требует лицензирования.
Тем не менее компания всё равно заключила соглашения о лицензировании с несколькими крупными издателями, включая Associated Press и Financial Times.
Газета The New York Times утверждает, что OpenAI и её партнер Microsoft незаконно использовали миллионы статей для обучения своих ИИ-инструментов, которые теперь конкурируют с их контентом.