Google quiere entrenar su IA con tus datos
por Jesus Lucena profile image Jesus Lucena

Google quiere entrenar su IA con tus datos

Recientemente Google anunció cambios en su política de privacidad y ahora sabemos cómo van a entrenar su IA.

Hace unos días, Google actualizó sus políticas de privacidad y la decisión generó gran atención y preocupación. La razón fue una nueva cláusula que llama bastante la atención de muchos, ya que revela cómo Google planea entrenar sus modelos de inteligencia artificial a partir de ahora.

Vamos a explorar los detalles de esta actualización y analicemos las implicaciones y desafíos asociados.

Antes que nada, ¿qué dice la nueva cláusula de privacidad de Google?

La cláusula actualizada establece lo siguiente:

"Google puede recoger información públicamente disponible online, o a partir de otras fuentes públicas, para ayudar a entrenar modelos de IA de Google y desarrollar productos y funciones como el Traductor de Google, Bard y funciones de IA de Cloud".

Aquí queda claro que Google tiene la intención de utilizar datos públicos disponibles en internet para el entrenamiento de sus modelos de IA.

Las redes sociales no están muy felices con esto

La implicación directa de esta cláusula es que cualquier cosa que sea de dominio público en Internet, incluidos los datos compartidos en plataformas como Reddit y Twitter, puedes ser usados por Google para entrenar su IA.

Ante esta realidad, las redes sociales antes mencionadas empezaron a cobrar por el uso de su API, ya que miles de empresas están entrenando sus propios modelos de IA empleando datos de redes sociales sin dar nada a cambio a las plataformas.

Esta situación plantea una pregunta crucial: ¿cómo determina Google qué es público y qué no lo es?

En realidad, no existe una forma definitiva de determinar esto. Los modelos de IA se alimentan de enormes cantidades de datos, y es incierto si estos datos son realmente adecuados para su uso en el entrenamiento de la IA.

La regulación viene al rescate

Unión Euopea. iStock por Getty Images/robertiez

Dada la complejidad y las implicaciones de la recopilación y el uso de datos públicos para entrenar IA, los gobiernos y las organizaciones internacionales están trabajando para establecer regulaciones claras en este ámbito.

La Unión Europea, en particular, está avanzando en la creación de una ley que busca regular la Inteligencia Artificial. Uno de los aspectos clave de esta legislación es la transparencia en el proceso de entrenamiento de los modelos de IA.

Aunque Google ha compartido algunos detalles sobre el origen de los datos utilizados para entrenar su IA, todavía hay incertidumbre sobre la veracidad de esta información.

La competencia entre los desarrolladores de IA es muy grande, y las empresas no están muy contentas con compartir sus fuentes de datos utilizados, ya que esto podría permitir que sus competidores también alimenten sus modelos con la misma información.


En vista de la falta de una regulación clara y la incertidumbre en torno al uso de datos públicos para entrenar IA, es importante que pensemos bien lo que publicamos en Internet. El hecho de que los datos sean de dominio público no garantiza que sean adecuados para su uso en la formación de modelos de IA.

En un mundo donde la información personal puede ser recolectada y utilizada sin nuestro conocimiento, es crucial ser consciente de las implicaciones y tomar decisiones informadas sobre lo que es bueno compartir y lo que no.

💡
¿Con ganas de saber más sobre la IA? Mira todos nuestros blogs sobre este sema
por Jesus Lucena profile image Jesus Lucena
Actualizado el
Inteligencia Artificial