La actualización de la política de Google confirma que todo el contenido que publiques se utilizará para el entrenamiento de la IA

Rubén Castro, 5 julio 2023

La actualización de la política de privacidad de Google introdujo nuevos términos… Anteriormente afirmaba que los datos de los usuarios se utilizarían para entrenar modelos “lingüísticos”, mencionando únicamente Google Translate. La versión actualizada cambia este término a “modelos de IA”, mencionando específicamente Bard y Cloud AI junto a Translate.

Ver la política de privacidad de Google. El documento establece ahora explícitamente que la empresa se reserva el derecho a recopilar y analizar prácticamente todo lo que la gente comparte en la web para entrenar sus sistemas de IA.

Uno de los muchos problemas polémicos de los sistemas de IA generativa como ChatGPT y Bard es la forma en que extraen y utilizan los datos. Puede que se trate de información pública, pero eso no evita los problemas de plagio y privacidad, por no mencionar la posibilidad de que la IA malinterprete lo que se ha dicho u ofrezca respuestas antiguas y desfasadas. Incluso Google ha advertido a sus empleados que tengan cuidado al utilizar chatbots como su propio Bard, ya que pueden hacer sugerencias de código no deseadas.

También está la cuestión de si este tipo de extracción de datos es legal. OpenAI, creadora de ChatGPT, se enfrenta a demandas por acusaciones de recopilar ilegalmente información personal de usuarios de Internet y utilizarla para crear sus productos.

OpenAI también se enfrenta a una demanda por infracción de derechos de autor y violación de la privacidad en relación con las acusaciones de que utilizó libros protegidos por derechos de autor sin permiso para entrenar sus sistemas de IA. La empresa supuestamente copió texto de estos títulos de forma ilegal al no obtener el consentimiento de los titulares de los derechos de autor y no darles crédito ni compensación.

La extracción de datos parece ser un tema especialmente controvertido para Elon Musk. El fin de semana, Twitter limitó temporalmente el número de tuits que las cuentas podían leer al día para hacer frente a los “niveles extremos” de robo de datos y “manipulación del sistema” en la plataforma, aunque no todo el mundo está de acuerdo en que este fuera el motivo de la limitación.

Reddit también se ha enfrentado a una serie de problemas desde que desactivó el acceso gratuito a sus API para detener la recolección de datos. La medida provocó que más de 8.000 subreddits se oscurecieran en señal de protesta y que algunos cambiaran a NSFW.

Rubén Castro

Redactor

Apasionado de explorar y diseccionar lo último en tecnología. Tengo mucha experiencia en el mundo de los ordenadores y el gaming, aunque también me gustan todos los tipos de gadgets.