La tecnología cambia y las empresas deben estar adaptadas a las innovaciones más recientes. Uno de los campos donde las empresas necesitan personal cualificado con mayor urgencia es en inteligencia artificial generativa, y en concreto en prompt engineering. Si bien es cierto que no existe ninguna formación que se centre exclusivamente en esta disciplina, existen multitud de formaciones que guían hacia el manejo efectivo de esta habilidad.

En múltiples profesiones se está comenzando a exigir con mayor frecuencia conocimientos en prompt engineering. Estos conocimientos van más allá de los conocimientos que pueda poseer un especialista en IA tradicional o de perfiles que hagan uso ocasional de herramientas de IA generativa como ChatGPT o Gemini. Así pues, surgen nuevas habilidades necesarias en roles cuyas funciones ya estaban definidas dentro del sector. Un ejemplo claro de esto son los lingüistas, especialmente los lingüistas computacionales, quienes han visto cómo sus responsabilidades se han alejado aún más de su formación original y abrazan el surgimiento de la tecnología más disruptiva del momento. Pero, ¿cómo evoluciona la carrera de un lingüista hasta el punto de manejar y entender código? ¿Qué etapas ha atravesado alguien que ya ha recorrido ese camino?

¿Quiénes son lingüistas computacionales?

Primero, definamos quiénes son los lingüistas computacionales. Según observamos en nuestro entorno, son filólogos, traductores y lingüistas que durante los estudios de grado, normalmente al final, despiertan interés por la programación y por la automatización de procesos lingüísticos. Si bien pueden contar con conocimientos de lingüística computacional adquiridos durante su etapa estudiantil, es probable que la disciplina resulte ajena a otros profesionales provenientes de otros itinerarios universitarios. Aunque la programación puede asustar al que la desconoce, no hace falta tener un nivel alto para adentrarse en el mundo de la lingüística computacional.

¿De qué sabe un lingüista computacional?

Aunque es probable que un lingüista no cuente con buena parte de los conocimientos mencionados a continuación, debemos recalcar que no es extraño porque la gran mayoría de los excepcionales lingüistas computacionales que conocemos han pasado por ahí. A grandes rasgos, un lingüista computacional junior tiene una sólida base en los fundamentos de la lingüística, además de una base mínima en programación. Conoce aspectos clave de la sintaxis, semántica, morfología, fonología y pragmática, esenciales para el análisis y procesamiento del lenguaje. Además, posee habilidades en Python y en sus librerías y frameworks dedicados al procesamiento de lenguaje natural (NLP), como NLTK y spaCy.

También le resultan familiares las técnicas básicas como la tokenización, la lematización, el etiquetado de partes de la oración (conocido como POS tagging) y la extracción de entidades nombradas (named entity recognition o NER), entre otras. También puede tener conocimientos iniciales en machine learning, utilizando librerías como scikit-learn para tareas de clasificación de textos y análisis de sentimientos.

Un lingüista computacional especializado contará con un bagaje de hard skills ampliado. A los lenguajes de programación se le añade R y posiblemente Java, y los frameworks se amplían con TensorFlow y PyTorch. Además, conocerá otro tipo de tecnologías que son periféricas a la disciplina, pero muy importantes en el desarrollo de productos y servicios digitales, como el manejo de base de datos, el preprocesamiento y análisis de datos, o las tecnologías cloud. Esto es el estadio final, y no queremos asustarte si estás descubriendo la disciplina o planteándote un cambio. Veamos cuáles son los senderos que abren las puertas de la lingüística computacional en el ámbito empresarial, que ayuden a empleados actuales a pivotar a esta disciplina.

El camino previo

Para lograr desenvolverse como lingüista computacional existen diversos caminos. De entre todos ellos, el más común es un máster universitario. Suele ser al terminar el grado universitario cuando decidimos buscar algunos de los escasos másteres que hay en España que se dedican, parcial o enteramente, a la lingüística computacional. También hemos encontrado multitud de casos donde profesionales de las empresas compaginan su trabajo con la realización de estos estudios, buscando adaptarse más rápido a un nuevo puesto o responsabilidades, o a fin de indagar en algo que usan diariamente en el trabajo. A continuación mencionamos algunos másteres:

Estos estudios cuentan con un profesorado que forma o ha formado parte del ámbito corporativo, y mantienen lazos con empresas que probablemente necesiten de lingüistas computacionales en un breve periodo de tiempo. Además, estos másteres tienen acuerdos con empresas donde los alumnos pueden realizar sus prácticas. Si bien unas prácticas no aseguran un contrato indefinido, es sin duda una gran oportunidad que añadir al curriculum. Estos itinerarios enseñan las bases de la programación en Python y técnicas de procesamiento de lenguaje natural, entre otros, y sientan los precedentes para que el futuro lingüista computacional se desenvuelva y comprenda el entorno de trabajo donde abundan los ingenieros.

El siguiente camino más común es un bootcamp o formación similar. Este tipo de estudios suele ser más intensivo que un máster, temporalmente hablando. Buscan convertir al estudiante en un experto en una determinada materia en un corto plazo, haciéndole dedicar gran parte de su tiempo a la realización de actividades prácticas. Entre los lingüistas computacionales de nuestro entorno triunfa el Curso de Procesamiento del Lenguaje Natural (PLN) de Cálamo & Cran.

Además, existen multitud de proveedores de este tipo de certificaciones que, si bien no cuentan con programas específicos para convertirse en un lingüista computacional, sí que cuentan con asignaturas estrechamente relacionadas en sus itinerarios de data science, machine learning o inteligencia artificial. Es este el caso de programas como el bootcamp Data Science and AI de The Bridge, el Data Science y Machine Learning de Ironhack, el Programa Profesional en Inteligencia Artificial y Data Science de KSchool o el Máster en Ciencia de Datos e Inteligencia Artificial de AFI.

Asimismo, podemos recurrir a proveedores internacionales con itinerarios en inglés, como el Post Graduate Program in AI & ML de la prestigiosa Purdue University americana. Muchos de estos bootcamps mantienen acuerdos con empresas punteras en muchos ámbitos, como la banca, las finanzas o la consultoría, lo que puede implicar que sus alumnos se beneficien de una cierta consideración preferencial a la hora cubrir vacantes.

Al ser un campo digital, hay espacio para el aprendizaje autónomo que, si bien no cuenta con una acreditación oficial, es sin duda una fuente de conocimiento altamente recomendable. En este campo destacan plataformas online como Coursera, donde encontramos el Programa especializado en Procesamiento de Lenguaje Natural impartido por DeepLearning.ai; o Udemy, donde destaca NLP - Natural Language Processing with Python de Jose Portilla. Sin fecha fija de inicio o final, su principal handicap es el aislamiento del estudiante y la falta de conexiones con el mundo empresarial. Entre sus ventajas se encuentra su precio asequible comparado con másteres y bootcamps, contar con un contenido altamente actualizado debido a la competencia entre instructores, y el reconocimiento del mundo empresarial a ciertos proveedores de estas formaciones.

Un camino más que te puede abrir las puertas de la lingüística computacional en el mundo empresarial es el doctorado. Si bien es un camino que puede resultar no ser óptimo desde el punto de vista económico al principio de la vida laboral, pues se retrasa la entrada al mercado, resulta en la “ultraespecialización” en un ámbito concreto de la disciplina, lo que permite no solo tener abiertas las mismas puertas que un lingüista computacional que haya tomado las otras vías, sino también encontrarse en un muy selecto grupo a la hora de optar a puestos muy específicos. Por ejemplo, en puestos relacionados con el procesamiento o generación de contenido de audio a partir de texto, se puede requerir altos conocimientos de TTS, STT, el Alfabeto Fonético Internacional (IPA) o X-Sampa, usado por ejemplo en Apple. Aunque más tarde nos adentraremos en las funciones que desarrolla un lingüista computacional dentro de las empresas, desde ahora destacamos que el doctor hará labores más enfocadas su especialidad dentro de la disciplina, a la toma de decisiones y al diseño de soluciones, no siendo su rol requerido en tareas tediosas como la anotación.

El último método es el de ser contratado para labores puramente lingüísticas y, una vez dentro de la empresa, experimentar una evolución del rol hacia tareas más técnicas. Las empresas han requerido históricamente de expertos en letras para diversas tareas, como la redacción o traducción de contenidos, transcripción de audios, revisión de textos… En nuestro entorno encontramos lingüistas computacionales que originalmente entraron en empresas para llevar a cabo alguna de esta funciones y que, al adoptar la organización alguna nueva tecnología que no requería de un muy alto nivel técnico (tal y como ocurre ahora con la adopción de la IA generativa), se especializó en tareas programáticas simples, dejando atrás las labores puramente lingüísticas.

En entrevistas de trabajo

Según nuestra experiencia personal, la mayoría de lingüistas computacionales no tardan en encontrar un puesto relacionado con algunos de los aspectos de la disciplina una vez tienen la formación mínima. El paso intermedio es, como en cualquier otro trabajo, un proceso de selección. Una vez ya tienes la formación básica en la disciplina para acceder al mercado laboral, y con un poco de suerte puede que coincidan en el tiempo, te enfrentarás a entrevistas de trabajo para puestos de lingüística computacional o similares. Estas entrevistas difieren entre empresas, pero el denominador común suele englobar:

Otras preguntas relativas al puesto de lingüista computacional pueden ir relacionadas con la generación de lenguaje natural, como reducir un texto a un cierto número de caracteres para que quepa en un reloj inteligente; con adaptar el contenido a niños; con el conocimiento de procedimientos de audio, como SSML para el marcado de audios, X-Sampa, TTS (Text-to-Speech) o SST (Speech-to-Text); o con el conocimiento de otras tecnologías que sean parte del proyecto específico para el que se contrata (git, tecnologías cloud…).

Cada año hay vacantes de nivel internship para lingüistas computacionales, por lo que recomendamos activar las alertas en LinkedIn u otras plataformas de búsqueda de empleo. Además, recomendamos afianzar un buen networking dentro del sector: nunca se sabe cuándo en la empresa de un antiguo compañero de clase necesita a más personal para ese puesto.

El día a día

Una vez te hagas con tu puesto de lingüista computacional te asignarán una serie de tareas que, según nuestra experiencia, es bastante probable que se enmarquen dentro de las siguientes labores tradicionales:

Evolución del rol

Algo que vale y mucho la pena mencionar es que el lingüista computacional siempre está formándose. De hecho, la inmensa mayoría del conocimiento no se adquiere durante cualquiera de las formaciones mencionadas anteriormente. Tal y como atisbamos al principio de este texto, en los últimos dos años el rol está sufriendo una evolución hacia el campo de la inteligencia artificial generativa. Tras el boom de la disciplina ocurrido a finales de 2022 con la salida de ChatGPT (véase nuestro post) se hace extraño ver una oferta de trabajo para el puesto de lingüista computacional donde no se precisen conocimientos en IA generativa, LLMs, RAG, y en concreto prompt engineering. Esta innovación ha supuesto que buena parte de la interacción con los LLMs recaiga en el rol del lingüista computacional.

El lingüista computacional es ahora también un prompt engineer, es decir, la persona que crea la instrucción que enviar al LLM, y también la persona que evalúa la performance de estos modelos. Es un puesto altamente necesario tanto en consultoras donde los clientes están destinando parte de su presupuesto a proyectos basados en IA generativa, en los que más allá de ingenieros de IA y otros puestos altamente técnicos también se requerirá la labor de un creador y evaluador de prompts, como en cliente final, donde las empresas han constituido equipos propios para la realización de proyectos dentro de esta innovadora disciplina. Si bien esta ampliación de requerimientos supone un paso más que puede hacer retrasar la obtención de los conocimientos mínimos para optar a un puesto dentro de la disciplina, conocerlo a fondo supone un inmenso punto a su favor dentro de un proceso de selección (recomendamos por experiencia personal los “Code Along” de la empresa DataCamp para la formación en estas tecnologías).

En resumen

Adentrarse en el mundo de la lingüística computacional a nivel empresarial puede parecer un proceso complejo y técnico, pero una vez te adaptas a la inercia y empiezas a aprender cosas nuevas, descubres que en casi todos los casos lo que aprendes es combinable con lo anteriormente aprendido, y encajará con lo que te queda por aprender. Es un campo en crecimiento, pues las empresas cada vez van a necesitar más personal con este perfil, especialmente para hacerse cargo de las interacciones con los LLMs y todo lo de ellas derivado.

Cuéntanos qué te parece.

Los comentarios serán moderados. Serán visibles si aportan un argumento constructivo. Si no estás de acuerdo con algún punto, por favor, muestra tus opiniones de manera educada.

Suscríbete