.

Hoje, soube-se que a Apple e outras empresas usaram conteúdo de vídeos do YouTube para treinar modelos de IA sem a permissão dos criadores desses vídeos. De acordo com este novo relatório, um terceiro criou um arquivo de legendas tiradas de mais de 170.000 vídeos. Esses vídeos incluem conteúdo do crítico de tecnologia de longa data Marquees Brownlee (MKBHD) e dos comediantes de fim de noite Stephen Colbert e Jimmy Kimmel.
“As empresas de tecnologia têm agido de forma imprudente. As pessoas estão preocupadas com o fato de que não tiveram escolha no assunto”, disse Keller. “Acho que é isso que é realmente problemático.” – Amy Keller, sócia do escritório de advocacia DiCello Levitt
No entanto, grandes empresas como a Apple estavam usando esse conjunto de dados criado pela EleutherAI chamado YouTube Subtitles, que não inclui imagens, mas apresenta texto simples das legendas dos vídeos. Este último também inclui traduções para idiomas como japonês, alemão e árabe. O YouTube Subtitles contém conteúdo de mais de 12.000 vídeos, alguns dos quais foram excluídos do YouTube. Um criador não identificado excluiu todos os seus vídeos que estavam online e descobriu que seu trabalho ainda estava incluído em alguns modelos de IA.
O problema é que nenhum dos criadores do YouTube foi solicitado a dar permissão para que os vídeos que eles fizeram fossem usados para treinar modelos de IA. Embora tenha havido processos contra membros da comunidade de IA por usar conteúdo sem permissão, empresas como Open AI e Meta defenderam suas ações dizendo que suas ações eram apoiadas pela doutrina Fair Use, que permite o uso não licenciado de material protegido por direitos autorais em certas situações.
.








