Apple и NVIDIA тренировали свои нейросети на видеороликах с YouTube
База данных для обучения ИИ охватывает 48 000 каналов.
Эксперты из Proof News совместно с Wired провели расследование и выяснили, что сразу несколько крупных компаний, включая Apple, Nvidia и Salesforce, использовали набор данных из 170 000 видеороликов с YouTube для обучения своих систем искусственного интеллекта.
Источники отмечают, что компании тренировали свои нейросети на субтитрах к видеороликам на YouTube. Разумеется, разрешения у блогеров или самой платформы они не брали. В датасет вошли видео с 48 000 каналов, но только текстовая часть — видео и изображения не использовались. Примечательно, что компании брали видео с популярных каналов, таких как MrBeast, MKBHD, The Verge и нескольких новостных агентств.
Эксперты Proof News выпустили интерактивный инструмент, который позволяет находить каналы в датасете. Представители платформы YouTube пока не ответили на запросы СМИ.
Читайте также:
- Nintendo Switch — приставка-долгожитель, она остается актуальной вот уже 2687 дней
- HONOR Magic V3 представлен официально: это самый тонкий складной смартфон в мире
- Илон Маск хочет построить город на Марсе под гигантским куполом
- Эксперты Digital Foundry сравнили производительность iPhone 15 Pro с Xbox One S в Assassin's Creed Mirage
- YouTube в России начали замедлять
Источник: The Verge