La tecnología cambia y las empresas deben estar adaptadas a las innovaciones más recientes. Uno de los campos donde las compañías necesitan a personal capacitado con mayor urgencia es en inteligencia artificial generativa y, en concreto, en prompt engineering.

En este episodio vemos la importancia de este rol. Si bien es cierto que no existe ninguna formación que se centre puramente en esta disciplina, existen multitud de formaciones que nos guían hacia el manejo efectivo de esta habilidad.

¿Qué conocimientos técnicos tiene que tener un/a lingüista computacional?

Lo más importante es saber de lingüística, porque conocer la sintaxis, semántica, morfología, fonología y pragmática son esenciales para el análisis y procesamiento del lenguaje. Serían recomendable los siguientes conocimientos técnicos:

¿Qué librerías tiene que dominar un/a lingüista computacional para desarrollar su trabajo?

Las más básicas de procesamiento de lenguaje natural serían NLTK, spaCy y StanfordNLP. Si hablamos de Machine Learning, entonces las librerías principales son scikit-learn, TensorFlow o PyTorch, en Python.

Y ya, si queremos hacer cosas de IA generativa, viene bien conocer Langchain, que se está convirtiendo en el estándar para trabajar con distintos tipos de documentos, distintos LLMs y distintas bases de datos.

¿Cómo ha evolucionado el rol de lingüística computacional con el boom de la IA generativa?

A todas las tareas que tiene normalmente un/a lingüística computacional (revisar y etiquetar datos lingüísticos para entrenar, revisar los outputs de los sistemas de NLP, generación de lenguaje natural o NLG) se han unido las de crear el prompt, revisarlo, testearlo y modificarlo. Ser de alguna manera el “guardián” de ese texto tan importante en IA generativa que es el prompt.

¿Qué herramientas de IA generativa son las que más utiliza este perfil?

Como hemos mencionado anteriormente, la librería de Langchain podríamos decir que es fundamental. También está Langfuse, que es una herramienta que facilita mucho la gestión de las versiones de los prompts y de los datasets de evaluación, así que también es de las que más se usan.

Y por último, dependiendo del caso de uso que estés desarrollando, en algunas ocasiones vas a necesitar usar lenguajes de consulta bases de datos, como SQL.

¿Dónde escuchar nuestros podcast?

Puedes escucharlos en las principales plataformas de podcast: Ivoox, Spotify, YouTube, Google Podcast, Apple Podcast y Amazon Music.

Imagen de portada: Unsplash

Cuéntanos qué te parece.

Los comentarios serán moderados. Serán visibles si aportan un argumento constructivo. Si no estás de acuerdo con algún punto, por favor, muestra tus opiniones de manera educada.

Suscríbete