Apple уличили в обучении ИИ на более чем 170 тыс. видео с YouTube без разрешения
Как утверждают в своём широко разлетевшемся расследовании Proof News, массивом данных с извлечёнными субтитрами пользовались Apple, Nvidia, Salesforc и Anthropic.
Потенциальным нарушителем авторских прав может быть некоммерческая организация EleutherAI, помогающая в обучении искусственного интеллекта. Эта компания опубликовала массив данных The Pile, который находится в публичном доступе.
Proof News отмечают, что в базе данных имеются субтитры 173536 видео с YouTube, которые были выгружены с более чем 48 тысяч каналов. Среди них есть MrBeast (305 млн), PewDiePie (111 млн) и другие крупные блогеры.
Массив данных мог использоваться при обучении таких продуктов Apple, как Intelligence и OpenELM, представленных в апреле 2024 года.
Расследование была вынуждена прокомментировать и сама Apple. Компания подтвердила, что для системы ИИ OpenELM действительно были использованы данные из спорного массива данных, но OpenELM не использовалась в создании Apple Intelligence.
В свою очередь OpenELM, как утверждает Apple, был создан только с целью вклада в развитие исследовательского сообщества.