Estrategias de Optimización de Costos en GenAI con Python y AWS

¿Es posible escalar la Inteligencia Artificial Generativa sin que el éxito del proyecto comprometa la estabilidad financiera de la organización? En esta sesión se abordará cómo transformar el despliegue de modelos de lenguaje de gran tamaño (LLMs) mediante un diseño de arquitectura orientado a la eficiencia operativa. En lugar de aceptar el consumo elevado de tokens como un costo inevitable, se explorará un modelo de costos sostenible que permite construir aplicaciones inteligentes y escalables sin sacrificar la rentabilidad. A través de una ruta técnica centrada en Python y los servicios de AWS, se analizarán estrategias clave como el arbitraje de modelos, donde la lógica de la aplicación decide dinámicamente qué motor de inteligencia utilizar según la complejidad de la tarea. Se profundizará en cómo el uso inteligente de bases de datos vectoriales de bajo impacto y el almacenamiento en caché semántico permiten reutilizar conocimientos previos, logrando ahorros significativos en infraestructura. Los asistentes descubrirán cómo la implementación de flujos asíncronos y el procesamiento por lotes permiten optimizar los recursos disponibles. Esta charla es una guía práctica para arquitectos y desarrolladores que buscan liderar la transición de prototipos costosos a sistemas en producción que sean técnica y económicamente viables.

Speaker

Juan Diego David Melo Alarcón

Application Architect @ IBM

Soy un arquitecto de soluciones enfocado en la eficiencia sistémica y en la construcción de software diseñado para los retos del mundo real. Mi enfoque profesional se sitúa en la intersección de la IA generativa y las arquitecturas cloud native, donde el verdadero desafío no es solo lograr que un modelo responda, sino que lo haga de forma resiliente, escalable y financieramente lógica. A lo largo de mi trayectoria, he liderado la modernización de aplicaciones en entornos de nube híbrida, enfrentando la complejidad de integrar servicios de vanguardia con infraestructuras críticas.

View speaker

Want to know more?

Join PyCon Colombia newsletter and get a complete overview of our events, speakers and community participation.