Dos años de avances de la IA Generativa: ¿Cómo lograr los resultados esperados?

29 de julio de 202429 de julio de 2024 Alberto Marin

Bogotá D.C., julio de 2024. Desde su aparición en público, la Inteligencia Artificial Generativa ha mostrado importantes avances, que han permitido revolucionar las relación entre las personas y la tecnología. En dos años, hemos visto cómo el avance de esta nueva tecnología es imparable. Miles de empresas alrededor del mundo han empezado a implementar procesos usando la IA Generativa, logrando de esta forma diferencias competitivas.

Algunos de los principales hitos, como el lanzamiento del ChatGPT, sumado al uso de herramientas como Dall-E (modelo es capaz de generar imágenes completamente nuevas y originales a partir de descripciones de texto) o soluciones que pueden entender y generar código de programación, incluyendo la traducción de lenguaje natural a código, la propuesta de Azure OpenAI Service para que las empresas pudieran acceder a modelos avanzados de IA e incorporarlos en sus proyectos corporativos, o la puesta en el mercado de dos nuevos modelos de lenguaje de IA de Amazon para que las empresas puedan construir sus propios bots, llegaron para revolucionar el mundo empresarial.

Detrás del fenómeno: definiciones y tecnología

Para lograr los resultados esperados en la aplicación de la IA Generativa es necesario contar con algunas de las tecnologías antes mencionadas, y aplicar otra serie de herramientas y conceptos que, al final, permiten desarrollar las soluciones que cada empresa requiere. Nubiral seleccionó los aspectos más relevantes que permiten lograr grandes resultados:

· Transformers: Es una arquitectura de modelos de aprendizaje automático que inicialmente se utiliza para el procesamiento del lenguaje natural (NLP, por sus siglas en inglés), aunque han desarrollado aplicaciones aplicadas en el análisis de otros tipos de datos como imágenes. Está específicamente diseñada para procesar secuencias de datos y capturar las relaciones entre ellas.

· LLM: Siglas en inglés por large language models, o modelos de lenguajes grandes. Es un modelo de IA muy grande que utiliza arquitecturas avanzadas de aprendizaje profundo generalmente empleando la arquitectura transformer para procesar enormes cantidades de datos de lenguaje natural. Pueden interpretar y producir textos (“entender” y “razonar”) en diferentes idiomas y contextos. Ejemplos: GPT (Generative Pre-trained Transformer) en sus diferentes versiones, LLAMA (Large Language Model Meta AI) y Claude.

· Embeddings: Representaciones numéricas (vectores) de palabras o frases generadas por modelos de aprendizaje profundo que capturan el significado semántico y la relación entre ellas. Se almacenan en bases vectoriales y sirven para poder aplicar técnicas de búsqueda avanzada.

· Ventana de Contexto: Es la cantidad de tokens que un LLM puede tomar como entrada al generar respuestas. El modelo lo utiliza para comprender el significado y generar respuestas coherentes y relevantes. El modelo de GPT 4o, por ejemplo, acepta hasta 128.000 tokens (1.000 tokens equivalen a aproximadamente 750 palabras).

· Tokens: Un token es la unidad básica de información que un LLM puede procesar. Puede ser una palabra, un símbolo, un carácter o incluso una oración completa. Los tokens se utilizan para representar el lenguaje de una manera que el modelo pueda entender y manipular.

· Entendimiento del contexto: A diferencia de generaciones anteriores de chatbots, esta IA utiliza la información contextual en las conversaciones para generar respuestas más precisas e informadas.

“Para obtener los resultados deseados por el usuario, es fundamental el diseño de las instrucciones o de las consultas que se realizan al modelo. A esta actividad se la conoce como “prompt engineering” (o “ingeniería de prompts”). Su importancia radica en que el modelo de lenguaje interpreta y genera texto basándose en las instrucciones o consultas que se le presentan. Si se formula correctamente el prompt, la respuesta será más precisa, oportuna y adecuada” señaló Ignasi Puit, gerente de ventas de Nubiral para Colombia.

Nubiral ha identificado que la combinación de todas estas herramientas y tecnologías, con los métodos de entrenamiento adecuados, ha aportado cualidades únicas como:

· Entregar respuestas generativas: desde el punto de vista del usuario, la sensación es que la máquina está “pensando” antes de entregar su texto.

· Guardar el contexto. A diferencia de generaciones anteriores de chatbots, esta IA utiliza la información contextual para generar nuevas respuestas.

· Capacidades que se traducen en aplicaciones concretas como mejoras en la traducción automática, mayor comprensión del lenguaje natural, generación de texto más “real” y una mayor automatización de tareas de procesamiento vinculadas precisamente al lenguaje natural. La mayor eficiencia en el procesamiento del lenguaje natural que proveen las diferentes versiones de GPT tiene implicaciones significativas para una amplia gama de aplicaciones, incluyendo la atención al cliente, el análisis de sentimientos, la generación de contenido o la automatización de procesos de negocio.

De acuerdo con los expertos de Nubiral, la tendencia es imposible de frenar, por lo cual las organizaciones deben tomar las ventajas que ofrece la IA Generativa y los servicios cognitivos ligados a herramientas como ChatGPT o GPT-4. En este camino, es muy importante entender bien las necesidades de cada negocio y qué valor aportaría el uso de la IA Generativa.

Entradas relacionadas