Apple и NVIDIA тренировали свои нейросети на видеороликах с YouTube

База данных для обучения ИИ охватывает 48 000 каналов.

Apple и NVIDIA тренировали свои нейросети на видеороликах с YouTube

Эксперты из Proof News совместно с Wired провели расследование и выяснили, что сразу несколько крупных компаний, включая Apple, Nvidia и Salesforce, использовали набор данных из 170 000 видеороликов с YouTube для обучения своих систем искусственного интеллекта.

Источники отмечают, что компании тренировали свои нейросети на субтитрах к видеороликам на YouTube. Разумеется, разрешения у блогеров или самой платформы они не брали. В датасет вошли видео с 48 000 каналов, но только текстовая часть — видео и изображения не использовались. Примечательно, что компании брали видео с популярных каналов, таких как MrBeast, MKBHD, The Verge и нескольких новостных агентств.

Эксперты Proof News выпустили интерактивный инструмент, который позволяет находить каналы в датасете. Представители платформы YouTube пока не ответили на запросы СМИ.

Читайте также: 

Источник: The Verge 

Рекомендуем