Frank Pérez, relató Chávez Ogazón, es uno de los abogados con más experiencia al defender a narcotraficantes, fue investigador de narcóticos, mi...
Las redes sociales de los habitantes de Tequila dan el más sentido pésame a la familia de Jorge Rodolfo Ochoa Rodarte por su muerte....
Lo uniformados se dieron cuenta del vehículo tripulado por la pareja, quienes trataron de evadir a los uniformados....
Protección Civil Jalisco asegura que es parte de la misma zanja....
Fue decisión del Consejo General Universitario de la Universidad de Guadalajara abrir esta nueva sede....
Mexicanos Primero Jalisco encuestó a docentes sobre sus sentimientos al cierre de este ciclo escolar....
Ramírez de la O recordó que en 2021 López Obrador le pidió desarrollar el Plan México, un programa "para crear conciencia de que México, al igua...
Señalaron que el T-MEC ha representado un éxito para México, al aumentar la inversión y mejores salarios para los mexicanos...
Meta pone a disposición del público general esta herramienta a través del código abierto, pues, según anota este martes en un comunicado su cofun...
En el centro Kennedy, esta etapa se ensamblará a otro cohete y a la cápsula Orión, dentro de la cual viajarán los cuatro tripulantes de la Artemis...
El líder del Cártel de Sinaloa fue detenido la tarde de este jueves 25 de julio en Texas, Estados Unidos...
Romero Herrera lamentó que Morena y sus aliados se cierren a los comentarios y sugerencias para mejorar la reforma judicial...
Hastings es uno de los donantes del Partido Demócrata más poderosos que presionaron al mandatario Joe Biden para que desistiera de su candidatura pa...
Sin solución por parte de los organizadores para este imprevisto, los deportistas que llegan al estadio tras recorrer en barco 6 km del río Sena agu...
Los Juegos Olímpicos buscan asombrar al mundo con su ceremonia inaugural, misma que pretende ser histórica e inigualable....
El colombiano está en proceso de mudarse a México, ya que consiguió su residencia recientemente....
Grupos artísticos de Cultura Jalisco ofrecen conciertos a personas privadas de su libertad....
La pareja anunciaba apenas su noviazgo en junio pasado, unas semanas después del rompimiento de Nodal con Cazzu, con quien tiene a su hija de 10 mese...
Once grupos buscarán ir a la gran final en el Teatro Degollado....
La UdeG entrega el reconocimiento Helen Ladrón de Guevara 2024....
Solo así regreso a la política
Lengua-je soez
OpenAI creó un programa para transcribir más de un millón de horas de videos de YouTube con el objetivo de entrenar el modelo de generación de texto GPT-4, su modelo más avanzado abierto al público, según una exclusiva de The New York Times (NYT) publicada este sábado.
El diario asegura que OpenAI, una empresa sin ánimo de lucro, desarrolló un programa bautizado como 'Whisper' que extrajo texto de más de un millón de horas en videos para obtener datos de entrenamiento de modelos de generación de lenguaje, conocidos como LLM.
Las fuentes consultadas por el NYT aseguran que el equipo encargado de Whisper incluía a Greg Brockman, presidente de OpenAI.
La empresa mantuvo un debate interno sobre si la extracción de texto de los vídeos alojados en la plataforma propiedad de Google suponían una violación de términos de uso.
Según el artículo, OpenAI consideró que necesitaba más datos de entrenamiento en 2021 y discutió si obteneros de Youtube, podcast o audiolibros.
En una reciente entrevista el consejero ejecutivo de YouTube, Neal Mohan, aseguró que si OpenAI ha usado vídeos de la plataforma para entrenar 'Sora', su modelo de generación de vídeos realistas, estaría violando sus términos de servicio.
"Los creadores de contenido que vienen a Youtube tienen ciertas expectativas, entre ellas que los términos de servicio se cumplen. Nuestros términos permiten extraer cierto contenido como el título, el nombre de canal o el nombre del creador para facilitar la web abierta", explicó Mohan.
"No está permitido descargar las transcripciones o partes de los videos. Eso es una violación clara de nuestros términos de contenido", añadió el directivo.
La portavoz de OpenAI Lindsay Held indicó en una respuesta a la exclusiva obtenida por The Verge que la compañía crea bases de datos "únicas" y utiliza "numerosas fuentes disponibles públicamente y realiza acuerdos para obtener dato que no es público".
Google transcribe los videos de Youtube para obtener texto para alimentar a sus modelos de generación de texto, algo que violaría los derechos de los creadores que suben sus videos a la plataforma, según fuentes consultadas por el diario.
Los derechos sobre el contenido usado para entrenar modelos de Inteligencia Artificial aún no están bien definidos y la competitividad para conseguir los mejores modelos de generación de contenido realista está llevando a empujar las fronteras de la legalidad en derechos de autor.
El gigante tecnológico Meta, creador de Facebook, debatió el año pasado si comprar la editorial Simon & Schuster para obtener acceso a su material de largo formato, según el contenido de reuniones entre gerentes, abogados e ingenieros de la compañía a los que tuvo acceso el NYT.
EH