top of page

OpenAI y Google utilizan YouTube para entrenar sus modelos de IA



Imagen Alusiva a IA
Imagen Alusiva a IA

La inteligencia artificial (IA) está revolucionando la forma en que interactuamos con la tecnología, y dos de los actores más destacados en este campo son OpenAI y Google. Según informes recientes, tanto OpenAI como Google han utilizado transcripciones de videos de YouTube para entrenar sus modelos de IA. Esta práctica plantea interrogantes sobre los derechos de autor y la ética en el uso de contenido generado por usuarios para el desarrollo de la tecnología de IA.


El uso de transcripciones de YouTube para entrenar modelos de IA


Según un informe del New York Times, OpenAI ha utilizado su herramienta de reconocimiento de voz llamada Whisper para transcribir más de un millón de horas de videos de YouTube. Estas transcripciones se han utilizado para entrenar su modelo de lenguaje avanzado (LLM) llamado GPT-4. OpenAI también ha utilizado videos y podcasts de YouTube para entrenar otros dos sistemas de IA. Greg Brockman, presidente de OpenAI, formó parte del equipo encargado de este proyecto.

Por otro lado, Google también ha utilizado contenido de YouTube para entrenar sus propios modelos de IA. Sin embargo, Google ha afirmado que solo utiliza videos de creadores que han dado su consentimiento para este fin. La compañía ha señalado que se adhiere a las políticas de YouTube y que no permite el raspado o descarga no autorizada de contenido.


Violación de derechos de autor y ética en el uso de contenido de YouTube


El uso de transcripciones de videos de YouTube plantea preocupaciones legales y éticas relacionadas con los derechos de autor y la propiedad intelectual. Los creadores de contenido de YouTube tienen derechos sobre sus videos, incluyendo el texto y el audio. El uso no autorizado de estas transcripciones podría infringir los derechos de los creadores y generar conflictos legales.

Además de las preocupaciones legales, el uso de contenido de YouTube para entrenar modelos de IA plantea cuestiones éticas sobre la privacidad y el consentimiento de los usuarios. Los videos de YouTube a menudo contienen información personal y sensible, y su uso sin el consentimiento de los usuarios puede violar su privacidad.


Respuesta de YouTube y las compañías involucradas


Neal Mohan, CEO de YouTube, ha declarado en una entrevista con Bloomberg que el uso de videos de YouTube por parte de OpenAI iría en contra de las políticas de la plataforma. Sin embargo, Mohan no confirmó ni negó si OpenAI realmente utilizó contenido de YouTube para entrenar su modelo de IA.

Por su parte, Google ha afirmado que solo utiliza contenido de YouTube con el consentimiento de los creadores. La compañía ha declarado que cualquier cambio en su política de privacidad se realiza para mejorar la claridad y no implica el uso no autorizado de contenido.


El uso de transcripciones de videos de YouTube para entrenar modelos de IA plantea desafíos legales y éticos. Aunque OpenAI y Google han utilizado este enfoque para mejorar sus modelos de IA, es importante considerar los derechos de autor y la privacidad de los usuarios. El uso no autorizado de contenido de YouTube podría tener consecuencias legales y dañar la confianza de los creadores y usuarios.

Es fundamental que las empresas desarrolladoras de IA establezcan políticas claras en relación con el uso de contenido generado por usuarios y respeten los derechos de los creadores. Además, se deben implementar mecanismos adecuados para obtener el consentimiento de los usuarios y garantizar la protección de su privacidad.

En última instancia, el desarrollo de la IA debe ir de la mano con la ética y el respeto por los derechos de autor. Solo así podremos aprovechar todo el potencial de esta tecnología sin comprometer los valores fundamentales de nuestra sociedad.

bottom of page