Los datos son el combustible de los sistemas basados en Inteligencia Artificial y sin ellos no podríamos construir los modelos de razonamiento o comportamiento.

En el episodio de hoy veremos cómo se relacionan y cómo la Inteligencia Artificial necesita a los datos, y viceversa.

La IA dentro del ciclo de vida del dato

Los datos son la gasolina de los sistemas basados en Inteligencia Artificial. Sin datos, sin información no podríamos construir modelos de razonamiento o comportamiento.

Plantearse cómo interactúan estas dos disciplinas es como preguntarse qué fue primero, el huevo o la gallina. La lógica nos dice que primero llegaron los datos y, a posteriori, la IA, pero el concepto de datos se desarrolló después, aunque estos siempre han estado ahí, se hayan interpretado o no.

Sin datos no podríamos ejecutar ninguno de los algoritmos necesarios para poner en marcha la IA ni sus modelos de razonamiento. Sin datos, probablemente estaríamos ante una IA muy limitada, al nivel de una tecnología de hace más de 50 años. Lo importante, además de los conjuntos de datos, es la calidad de los mismos.

La calidad de los datos como elemento clave

La calidad de los datos es un elemento muy importante a la hora de construir un modelo de razonamiento o de comportamiento fiable, pero no un factor clave. Cuando la IA inicia el proceso de construcción asume que los datos son fiables, no realiza aseveraciones sobre su calidad.

De manera que se generará un modelo con respecto a los datos, si existe un sesgo en los datos o estos incluyen información incorrecta lo más probable es que este sesgo se refleje en el modelo como ya hemos visto en famosos sistemas basados en IA como Tesla (atropello de persona negra en entorno con condiciones meteorológicas complicadas) o Amazon (selección de candidatos únicamente masculinos por falta de información (lack of data).

La importancia del gobierno del dato

Ante la gran avalancha de datos que generamos en las últimas décadas, surge la disciplina del gobierno del dato, que de una forma muy resumida consiste en eficientar todas las líneas de gestión de datos, entre ellas las de calidad.

Dentro de este marco de gobierno es importante definir cómo podemos identificar la calidad de los datos, que deben de estar certificados por una entidad. Para ello, hay entidades privadas y entidades públicas nacionales o supranacionales (EU) que definen la calidad de los datos.

Dónde escuchar nuestros podcast

Tanto si es la primera vez que te pasas por aquí, como si eres habitual, este capítulo puedes escucharlo en las principales plataformas de podcast: Ivoox, Spotify, YouTube, Google Podcast, Apple Podcast y Amazon Music.

¿Te has quedado con ganas de más?

En este capítulo podrás escuchar la parte 2 de este podcast, en el que seguimos debatiendo cuál es la relación entre la IA y los datos.

Cuéntanos qué te parece.

Los comentarios serán moderados. Serán visibles si aportan un argumento constructivo. Si no estás de acuerdo con algún punto, por favor, muestra tus opiniones de manera educada.

Suscríbete