La vicefiscalía de desaparecidos participó en un operativo de búsqueda de Ricardo Silva Pérez, reportado como ilocalizable desde el 22 de febrero ...
La Fiscalía del Estado informó que ambos agresores tienen prohibido acercarse a las víctimas por seis meses....
El organismo contrató en 2022 a una empresa para que recuperara la cartera vencida, pero el año pasado perdió un juicio contra ella en el TJA y que...
La reforestación fue encabezada por personal de la Dirección de Medio Ambiente del gobierno tapatío....
La UNAM y la Embajada China buscan fomentar el intercambio de educación superior al considerar que la relación entre ambas naciones se encuentra en ...
hasta el momento se tiene un registro histórico de 86 casos los cuales más del 50 por ciento han sido desestimados....
El multimillonario empresario Warren Buffett anunció que planea renunciar a su cargo de consejero delegado del conglomerado Berkshire Hathaway...
La presidenta de México y el secretario de Economía ven como un avance la decisión de EU...
...
El presidente estadounidense, Donald Trump, extenderá esta semana la fecha tope que en otras dos ocasiones ha dado a TikTok para desligarse de su mat...
Decomisaron 110 mil pastillas de este opioide, en Ciudad Juárez...
Claudia Sheinbaum aseguró en su conferencia matutina que su Gobierno ha reforzado el sistema de apoyo a los connacionales y a los consulados...
El Papa León XIV pidió este domingo detener los conflictos en Medio Oriente y poner fin al sufrimiento de la población civil, en especial en Gaza, ...
El Real Madrid mostró su jerarquía y capacidad de reacción al imponerse 3-1 al Pachuca en la segunda jornada del Grupo H del Mundial de Clubes, pes...
El cortometraje fue premiado en el Festival Internacional de Cine de Morelia....
Con Lewis Hamilton en la producción, F1: The movie llega esta semana a los cines de todo el mundo. ...
El grupo surcoreano de k-pop se alista para lo que viene, tras completar el servicio militar....
Aproximadamente 120 niñas y niños de preescolar y primaria participaron en este proyecto que continuará su recorrido por otros municipios....
Su presentación de esta noche promete transformar la perspectiva de la vida de los asistentes. ...
A no ser opacos
Monseñor
OpenAI creó un programa para transcribir más de un millón de horas de videos de YouTube con el objetivo de entrenar el modelo de generación de texto GPT-4, su modelo más avanzado abierto al público, según una exclusiva de The New York Times (NYT) publicada este sábado.
El diario asegura que OpenAI, una empresa sin ánimo de lucro, desarrolló un programa bautizado como 'Whisper' que extrajo texto de más de un millón de horas en videos para obtener datos de entrenamiento de modelos de generación de lenguaje, conocidos como LLM.
Las fuentes consultadas por el NYT aseguran que el equipo encargado de Whisper incluía a Greg Brockman, presidente de OpenAI.
La empresa mantuvo un debate interno sobre si la extracción de texto de los vídeos alojados en la plataforma propiedad de Google suponían una violación de términos de uso.
Según el artículo, OpenAI consideró que necesitaba más datos de entrenamiento en 2021 y discutió si obteneros de Youtube, podcast o audiolibros.
En una reciente entrevista el consejero ejecutivo de YouTube, Neal Mohan, aseguró que si OpenAI ha usado vídeos de la plataforma para entrenar 'Sora', su modelo de generación de vídeos realistas, estaría violando sus términos de servicio.
"Los creadores de contenido que vienen a Youtube tienen ciertas expectativas, entre ellas que los términos de servicio se cumplen. Nuestros términos permiten extraer cierto contenido como el título, el nombre de canal o el nombre del creador para facilitar la web abierta", explicó Mohan.
"No está permitido descargar las transcripciones o partes de los videos. Eso es una violación clara de nuestros términos de contenido", añadió el directivo.
La portavoz de OpenAI Lindsay Held indicó en una respuesta a la exclusiva obtenida por The Verge que la compañía crea bases de datos "únicas" y utiliza "numerosas fuentes disponibles públicamente y realiza acuerdos para obtener dato que no es público".
Google transcribe los videos de Youtube para obtener texto para alimentar a sus modelos de generación de texto, algo que violaría los derechos de los creadores que suben sus videos a la plataforma, según fuentes consultadas por el diario.
Los derechos sobre el contenido usado para entrenar modelos de Inteligencia Artificial aún no están bien definidos y la competitividad para conseguir los mejores modelos de generación de contenido realista está llevando a empujar las fronteras de la legalidad en derechos de autor.
El gigante tecnológico Meta, creador de Facebook, debatió el año pasado si comprar la editorial Simon & Schuster para obtener acceso a su material de largo formato, según el contenido de reuniones entre gerentes, abogados e ingenieros de la compañía a los que tuvo acceso el NYT.
EH