Bitget App
Торгуйте разумнее
Купить криптоРынкиТорговляФьючерсыBotsEarnКопитрейдинг
СМИ: Apple и Nvidia использовали YouTube для обучения ИИ без согласия авторов

СМИ: Apple и Nvidia использовали YouTube для обучения ИИ без согласия авторов

Incrypted2024/07/19 12:36
Автор:Serhii Pantyukh
  • СМИ узнали о копировании материалов YouTube для обучения ИИ-моделей.
  • Такие компании, как Apple, Nvidia, Anthropic и Salesforce, использовали данные видеороликов без согласия авторов.
  • Набор данных, преимущественно состоящий из субтитров к видео, является частью глобального сборника информации Pile.

Крупные технологические компании, среди которых Apple, Nvidia, Anthropic и Salesforce, использовали «десятки тысяч видеороликов» с YouTube для обучения ИИ-моделей. Эти действия совершались без согласия авторов видео, говорится в отчете, опубликованном Proof News .

По утверждению СМИ, некоторые компании могли нарушить правила YouTube, запрещающие сбор и копирование материалов платформы без разрешения авторов.  Журналистское исследование показало, что фирмы использовали субтитры в 173 536 видеороликах, взятые с более чем 48 000 YouTube-каналов.

Набор данных под названием YouTube Subtitles включал в себя трансляции и записи с образовательных каналов, в том числе Khan Academy, MIT и Harvard. Кроме того, для обучения ИИ-моделей использовались видеоролики популярных блогеров: MrBeast (289 млн подписчиков), Jacksepticeye (почти 31 млн подписчиков), Marques Brownlee (19 млн подписчиков) и некоторых других.

«Никто не приходил ко мне и не просил разрешения на копирование информации. Это мой заработок, и я вкладываю время, ресурсы и деньги в создание контента», — заявил ведущий The David Pakman Show Дэвид Пакман.

Аудитория Пакмана превышает 2 млн человек, а его ролики набирают сотни тысяч просмотров. Между тем, почти 160 авторских записей Пакмана включили в обучающий набор данных для ИИ, утверждает источник.

Генеральный директор потокового сервиса Nebula Дэйв Вискус назвал действия Apple и других компаний воровством. По его словам, использование сторонних материалов без согласия авторов демонстрирует неуважение к их творчеству. 

«Мы разочарованы тем, что наш тщательно подготовленный образовательный контент был использован без нашего согласия», — заявила генеральный директор компании Complexly Джули Уолш Смит.

Представители EleutherAI — разработчика наборов данных для ИИ — не ответили на просьбу журналистов Proof News прокомментировать результаты отчета. Согласно исследованию , опубликованному командой EleutherAI, набор данных является частью сборника, выпущенного некоммерческой организацией Pile. 

Помимо материалов с YouTube, он включает в себя данные Европейского парламента, англоязычной версии Wikipedia и электронные письма сотрудников Enron, опубликованные в рамках федерального расследования в отношении фирмы.

Почти все компании подтвердили использование набора данных Pile в своей работе. В частности, Apple применяла полученную информацию для обучения ИИ и модели OpenELM.

«Правила YouTube распространяются на прямое использование материалов платформы, а не на набор данных The Pile. Что касается возможных нарушений условий обслуживания, рекомендуем обратиться к авторам The Pile», — говорится в заявлении Anthropic.

Ранее мы сообщали, что Anthropic профинансирует создание нового бенчмарка для оценки ИИ. Кроме того, компания представила новую версию чат-бота под названием Claude и заявила о намерении привлечь $750 млн инвестиций.

Еще одна организация Salesforce также подтвердила использование материалов Pile в «академических и исследовательских целях». Представители фирмы подчеркнули, что набор данных Pile является общедоступным.

Компании, которые занимаются вопросами изучения ИИ, конкурируют друг с другом. Они ведут борьбу за получение более качественных данных, считает научный сотрудник CyberBRICS Джай Випра. Это объясняет, почему фирмы стараются держать свои источники информации в тайне, добавил он.

Напомним, в июне 2024 года ИИ-стартап OpenAI и журнал TIME заключили соглашение о сотрудничестве. В рамках совместной работы компания получит доступ к материалам издания за более чем 100 лет.

0

Дисклеймер: содержание этой статьи отражает исключительно мнение автора и не представляет платформу в каком-либо качестве. Данная статья не должна являться ориентиром при принятии инвестиционных решений.

PoolX: вносите активы и получайте новые токены.
APR до 12%. Аирдропы новых токенов.
Внести!

Вам также может понравиться

Coinbase Derivatives готовится запустить фьючерсы на XRP и nano XRP 21 апреля

Краткий обзор Биржа деривативов Coinbase подала заявку в CFTC на листинг двух новых фьючерсных контрактов: фьючерсы на XRP и нано фьючерсы на XRP. Ожидается, что оба контракта начнут торговаться 21 апреля после самосертификации.

The Block2025/04/04 13:13
Coinbase Derivatives готовится запустить фьючерсы на XRP и nano XRP 21 апреля

BUIDL, выпущенный Securitize от BlackRock, выплатил рекордные дивиденды в размере $4,17 млн в марте

Краткий обзор В марте был зафиксирован самый высокий ежемесячный платеж для токенизированного денежного рынка BlackRock на сегодняшний день. Фонд на блокчейне, выпущенный Securitize, распределил около $25,4 миллиона в виде дивидендов с момента его создания год назад.

The Block2025/04/04 13:13
BUIDL, выпущенный Securitize от BlackRock, выплатил рекордные дивиденды в размере $4,17 млн в марте

Блокчейн, который исправляет ошибки всех — почему Hydra Chain может переопределить будущее криптовалюты

Быстрая окончательность: транзакции фиксируются менее чем за секунду — без ожидания и неопределенности. Экономика, адаптирующаяся к вам: вознаграждения растут на позитивных рынках, а дефляция включается, когда страх берет верх. Децентрализация по замыслу: революционная модель стейкинга, которая дает больше влияния мелким игрокам, защищая сеть от консолидации.

The Block2025/04/04 13:13
Блокчейн, который исправляет ошибки всех — почему Hydra Chain может переопределить будущее криптовалюты

Протокол SocialFi Lens запускает основную сеть Lens Chain с технологиями Avail DA и ZKsync

Краткий обзор Протокол Lens от Стани Кулечова запустил совместимую с EVM сеть второго уровня для ончейн социальных сетей и владения данными. Сеть использует решение Avail для доступности данных для оптимизации потребностей в хранении, стек разработчика ZKsync для дешевых транзакций и стейблкоин Aave GHO в качестве нативного газового токена.

The Block2025/04/04 13:13
Протокол SocialFi Lens запускает основную сеть Lens Chain с технологиями Avail DA и ZKsync