Mundo
OpenAI

Medios y páginas web bloquean bot de OpenAI por miedo a "saqueo" de contenido

Medios bloquean acceso a GPTBot de OpenAI por recolectar datos sin permiso. Tensiones por remuneración y transparencia en IA.
Medios y páginas web bloquean bot de OpenAI por miedo a "saqueo" de contenido (AFP)
30-08-2023

Varios medios de comunicación han optado por bloquear la herramienta de seguimiento de páginas web utilizada por OpenAI, la entidad detrás de ChatGPT, con el objetivo de mejorar sus modelos de inteligencia artificial.

El 8 de agosto, medios como The New York Times, CNN, la emisora australiana ABC, Reuters y Bloomberg tomaron la decisión de bloquear el acceso a GPTBot, un rastreador de páginas web recién lanzado. Medios franceses, incluyendo France 24, RFI, Mediapart, Radio France y TF1, se sumaron a la medida más adelante.

La presidenta de Radio France, Sibyle Veil, enfatizó en una rueda de prensa que el "saqueo no autorizado de contenidos" no sería tolerado en ningún caso.

GPTBot tiene la misión de recolectar datos e información de páginas web para nutrir los modelos de inteligencia artificial generativa. Sin embargo, la startup californiana se enfrenta a un creciente rechazo de diversas páginas digitales, a pesar de haber compartido cómo se puede evitar que el robot acceda a los datos de un sitio web.

Según Originality.ai, una herramienta que detecta plagios, casi el 10% de las páginas más importantes del mundo negaron el acceso a GPTBot en las dos semanas siguientes a su lanzamiento. Esto incluye sitios como Amazon.com, Wikihow.com, Quora.com y Shutterstock. De acuerdo con Originality.ai, la proporción de sitios web que prohíben el acceso a GPTBot aumentará un 5% por semana.

En medio de estas tensiones, la remuneración y la transparencia se han convertido en temas centrales. Laurent Frisch, director de estrategia digital e innovación de Radio France, afirmó que no existe razón para que estas empresas se beneficien de los contenidos de otros sin ofrecer nada a cambio.

Las herramientas de IA, como ChatGPT y generadores de imágenes como DALL-E 2, Stable Diffusion y Midjourney, ganaron popularidad el año pasado por su capacidad de generar gran cantidad de contenido a partir de mensajes cortos. Sin embargo, las empresas detrás de estas herramientas, como OpenAI y Stability AI, se enfrentan ahora a demandas de artistas y autores que alegan que sus trabajos han sido utilizados sin permiso.

La agencia de prensa Associated Press (AP) abrió la puerta en Estados Unidos al firmar un acuerdo con OpenAI en julio. El acuerdo permite a AP acceder a archivos desde 1985 a cambio de acceso a tecnología y experiencia en IA. OpenAI también se ha comprometido a donar cinco millones de dólares al American Journalism Project y a proporcionar cinco millones en créditos para apoyar la implementación de tecnologías de IA.

Un consorcio de medios de comunicación, incluyendo AFP, Associated Press y Gannett/USA Today, emitió una carta abierta en agosto instando a las empresas de IA a solicitar permiso antes de utilizar textos e imágenes para generar contenido.