Discover the Talks at PyCon Colombia 2026 ✨
Browse every accepted session—titles, tracks, levels, and speakers—before you plan your days in Medellín.
Camila Plejia, asistente virtual, aplicado a personas con tetraplejia
La combinación de distintas herramientas y tecnologías del área de la inteligencia artificial — Computer Vision, OCR, PNL, RPA, Voice to text, text to voice — da lugar a la creación de un asistente virtual, Camila Plejia, que ayuda personas con tetraplejia, facilitando su cotidiano quehacer en tareas simples como leer noticias, conocer el estado del tiempo, revisar, leer y escribir un correo electrónico, revisar, enviar y leer mensajes de WhatsApp, buscar y ver un determinado video en YouTube, entre otras. Permite a la persona tetrapléjica tener una ventana de comunicación con el mundo exterior, pensando que pasa mucho tiempo aislada entre cuatro paredes y depende de la asistencia de un tercero para realizar actividades.
Clean Code in the Era of LLMs: Do Good Practices Still Matter?
Instead, research from METR, CodeRabbit, and GitClear is converging on an uncomfortable truth: code duplication has quadrupled, copy-pasted code now exceeds moved code, bugs have risen 70%, and security issues have nearly tripled. AI didn't break our codebases. It amplified what was already broken. So what do we actually do about it? This talk makes the case that clean code, SOLID, DDD, TDD, and design patterns matter more than ever when LLMs write half the code. Your codebase is now a prompt: clean code leads to better AI suggestions, which make it easier to stay clean. We'll walk through which practices now matter more, which ones have quietly turned against you, and how to collaborate with an LLM without becoming a rubber stamp for its output. You'll leave with a concrete framework, Adversarial Collaboration: generate, critique, refactor, verify. Not vibe coding. Real engineering, just faster.
Construyendo un Transformer con Rust
Los Transformers suelen percibirse como gigantes incomprensibles. Esta charla propone demostrar lo contrario: no son cajas negras, sino mecanismos elegantes que pueden entenderse y dominarse desde sus fundamentos. Presentamos Molinete AI, un modelo tipo GPT-2 construido estrictamente desde cero en Rust. Sin frameworks de deep learning: solo tensores, matemáticas y control total. Inspirado en Feste de Tag1 Consulting (entrenado con Shakespeare), este proyecto plantea un reto distinto: entrenar la red con la obra de Miguel de Cervantes para generar texto con el estilo del Siglo de Oro. A lo largo de la sesión, desmontaremos el modelo pieza por pieza. Con el apoyo de una presentación animada en Manim (más de 4.000 líneas de código), haremos visible cómo fluye la información dentro de la red. Partiremos desde la tokenización (BPE) y la construcción de operaciones básicas, para luego adentrarnos en el núcleo del modelo: embeddings, máscara causal y Multi-Head Self-Attention. Finalmente, exploraremos el proceso de aprendizaje, observando cómo los gradientes recorren la red durante el entrenamiento. Más que una demostración, esta charla busca proporcionar una visión clara y operativa de los Transformers, conectando la teoría con una implementación real desde cero.
De voz a acción: construyendo un asistente de IA con Python y Google Workspace
Saltar entre pestañas de Gmail, Calendar, Drive y Jira para tareas repetitivas es agotador. Por eso construimos Attento, un asistente que permite ejecutar acciones reales en Google Workspace usando lenguaje natural. En esta charla construimos Attento, un asistente de voz end-to-end que convierte lenguaje natural en acciones reales sobre Google Workspace. Veremos arquitectura con FastAPI, autenticación OAuth 2.0 con PKCE, function calling con Gemini, streaming con NDJSON, buenas prácticas con uv y Pydantic Settings, y el camino de demo a producción con Postgres y briefings matutinos automatizados.
Juan Manuel Marín Bedoya
Senior Data Engineer @ Huge
Juliana Suárez Ávila
Data Scientist @ Cuesta Partners
Elevate your code quality in Python with modern, ultra-fast tooling
AI coding assistants have changed how we build software. We can now generate features, refactors, and entire services in minutes — but speed without strong engineering practices quickly becomes technical debt. In this talk, I'll show how modern Python teams can build fast and reliable development workflows using tools like Astral's Ruff, Ty, and uv. We'll explore how traditional slow and noisy quality pipelines are being replaced by a new generation of tooling that provides near-instant feedback while improving code quality and developer experience. Topics include why AI-generated code makes automated quality gates more important than ever, using Ruff for formatting and linting, using Ty for modern static typing, structuring formatter → linter → type-checker workflows, pre-commit hooks and CI pipelines developers actually enjoy using, and reducing friction between local development and CI/CD.
Empleabilidad en la era de la IA
La inteligencia artificial está cambiando el mercado laboral más rápido que nunca. Muchos desarrolladores se preguntan: ¿la IA me reemplazará o me potenciará? En esta charla compartiré mi experiencia real pasando de ser desarrollador en Latinoamérica a trabajar para empresas de Estados Unidos, enfrentando entrevistas, optimizando mi perfil profesional y adaptándome a un entorno donde la IA ya es parte del día a día. Exploraremos cómo la IA no reemplaza al desarrollador, sino que redefine el valor que aportamos: desde escribir código hasta resolver problemas reales, comunicar ideas y construir soluciones completas. La charla incluirá el futuro de la programación, cómo cambiar tu mentalidad frente a la IA, qué habilidades realmente importan hoy, cómo destacar en procesos de selección internacionales, el rol de herramientas de IA en tu crecimiento profesional y errores comunes que frenan tu empleabilidad.
Estrategias de Optimización de Costos en GenAI con Python y AWS
¿Es posible escalar la Inteligencia Artificial Generativa sin que el éxito del proyecto comprometa la estabilidad financiera de la organización? En esta sesión se abordará cómo transformar el despliegue de modelos de lenguaje de gran tamaño (LLMs) mediante un diseño de arquitectura orientado a la eficiencia operativa. En lugar de aceptar el consumo elevado de tokens como un costo inevitable, se explorará un modelo de costos sostenible que permite construir aplicaciones inteligentes y escalables sin sacrificar la rentabilidad. A través de una ruta técnica centrada en Python y los servicios de AWS, se analizarán estrategias clave como el arbitraje de modelos, donde la lógica de la aplicación decide dinámicamente qué motor de inteligencia utilizar según la complejidad de la tarea. Se profundizará en cómo el uso inteligente de bases de datos vectoriales de bajo impacto y el almacenamiento en caché semántico permiten reutilizar conocimientos previos, logrando ahorros significativos en infraestructura. Los asistentes descubrirán cómo la implementación de flujos asíncronos y el procesamiento por lotes permiten optimizar los recursos disponibles. Esta charla es una guía práctica para arquitectos y desarrolladores que buscan liderar la transición de prototipos costosos a sistemas en producción que sean técnica y económicamente viables.
Feeding the Invisible: Seguridad alimentaria en ciudades intermedias con Python
En muchos países, la inseguridad alimentaria no solo es un problema social, sino también un problema de datos. En Colombia, sistemas clave de monitoreo han perdido continuidad, dejando vacíos críticos de información para la toma de decisiones públicas. Esta charla presenta el desarrollo de un prototipo en Python para la construcción de un sistema de monitoreo y predicción del riesgo de inseguridad alimentaria en ciudades intermedias, utilizando únicamente datos abiertos. A partir de un pipeline reproducible, se integran múltiples componentes de ciencia de datos: ingesta y procesamiento de datos de precios de alimentos (SIPSA), modelos de series de tiempo para pronóstico de precios (incluyendo enfoques clásicos y machine learning como XGBoost), segmentación de hogares mediante clustering a partir de encuestas socioeconómicas, construcción de un índice compuesto que relaciona ingresos, precios y vulnerabilidad, y desarrollo de un prototipo de sistema de soporte a la decisión (DSS). Los asistentes se llevarán un enfoque replicable para construir indicadores complejos, estrategias para trabajar con datos abiertos imperfectos, ideas para integrar modelos, datos socioeconómicos y visualización en un solo sistema, y un ejemplo real de aplicación de Python en política pública y desarrollo territorial.
From Typosquatting to Infrastructure Poisoning
En 2026, la seguridad de la cadena de suministro de Python ha dejado de ser un problema de nombres mal escritos para convertirse en un campo de batalla de infraestructura. Esta charla analiza la transición técnica desde ataques simples de Typosquatting hacia el envenenamiento sofisticado de herramientas de CI/CD y entornos de ejecución. Exploraremos casos reales recientes como la campaña de TeamPCP y el compromiso de Aqua Security Trivy, analizando técnicas de persistencia mediante archivos .pth que permiten ejecución maliciosa sin necesidad de un import explícito. Finalmente, presentaremos la hoja de ruta para la defensa moderna: desde Sigstore y el PEP 740 hasta el cumplimiento de la Ley de Resiliencia Ciberactiva (CRA).
Hacking AI Agents with Python
La inteligencia artificial está evolucionando de modelos estáticos a sistemas autónomos capaces de razonar, tomar decisiones y ejecutar acciones mediante herramientas y APIs. Estos sistemas, conocidos como agentes de IA, están siendo construidos principalmente en Python. Pero con esta evolución también aparece una nueva superficie de ataque. En esta charla exploraremos cómo los agentes de IA pueden ser explotados desde una perspectiva ofensiva, utilizando Python para demostrar ataques reales como: prompt injection en pipelines de agentes, exfiltración de información a través de RAG, manipulación de decisiones mediante inputs adversarios y abuso de herramientas y APIs conectadas. A partir de estos escenarios, mostraremos cómo diseñar pruebas de seguridad (pentesting) específicas para sistemas de IA, incluyendo enfoques de caja negra, gris y blanca. La charla no solo se enfocará en ataques, sino también en cómo mitigarlos, presentando un roadmap práctico para evaluar y fortalecer sistemas de IA en producción. Esta sesión está dirigida a desarrolladores Python, data scientists y engineers que están construyendo o integrando sistemas de IA y quieren entender cómo asegurar lo que están creando.
Lecciones aprendidas reportando vulnerabilidades en el ecosistema de Python
Seguramente has recibido esa notificación indicando que debes actualizar una dependencia debido a un fallo de seguridad. Pero, ¿te has preguntado qué sucede desde que alguien descubre esa vulnerabilidad hasta que el parche llega a tu proyecto? En esta charla, compartiré mi experiencia reportando vulnerabilidades en el ecosistema de Python. Exploraremos el detrás de escena: desde el hallazgo técnico, el proceso de reporte, hasta la colaboración con los mantenedores y la publicación del parche. No solo abordaremos los aspectos técnicos, sino también el factor humano, ambos cruciales para una resolución efectiva de las vulnerabilidades. Los retos que enfrentan los mantenedores y la comunidad, sobre todo en esta nueva era de seguridad para el software open source donde la inteligencia artificial juega un papel cada vez más relevante.
Machine Learning aplicado a secuencias genéticas
DNA contains massive amounts of biological information, but how can artificial intelligence help us understand it? In this talk, we will explore how Python and Machine Learning can be used to analyze genetic sequences in a practical and beginner-friendly way. Using public biological datasets, we will demonstrate how DNA sequences can be transformed into data suitable for machine learning models, covering concepts such as feature extraction, sequence representation, and basic classification techniques. We will also review popular Python tools used in bioinformatics, including Biopython, pandas, and scikit-learn, while discussing real-world challenges when working with biological data, such as high dimensionality, noise, and interpretability limitations. By the end of the talk, attendees will have a clear understanding of how to start building genetic analysis projects using accessible tools from the Python ecosystem, even without prior bioinformatics experience.
NLP sin etiquetas: cómo clusterizar N procesos jurídicos del Estado colombiano y convertir el caos en un clasificador en producción
¿Qué haces cuando tienes 600.000 quejas jurídicas, cero datos etiquetados y una entidad del Estado esperando resultados? Esta charla recorre el proceso completo de construcción de un sistema de clasificación NLP no supervisado para la Procuraduría General de la Nación. Partiendo de texto administrativo en bruto — ruidoso, lleno de abreviaciones y jerga institucional — mostraré cómo TF-IDF, SVD truncado y KMeans se combinaron para organizar más de medio millón de registros en 64 grupos semánticamente coherentes, sin una sola etiqueta manual. Pero la clusterización es solo el punto de partida. Cubriré cómo se validaron los clusters, cómo se entrenó un clasificador de Regresión Logística sobre ellos para hacer el sistema desplegable, y cómo el pipeline final fue empaquetado en un .pkl que hoy usan colegas no técnicos en producción. En el camino, enfrentaremos los problemas reales: curvas de codo que no se comportan, desbalances de tamaño entre clusters de 1:20, y la tensión entre elegancia matemática y usabilidad institucional. Porque en el sector público, un modelo que nadie usa no es un modelo — es un PDF acumulando polvo.
No todo clavo necesita un martillo de IA: Arquitecturas que piensan antes de generar
Vivimos en la era donde todo “necesita IA generativa”… o eso nos venden. En esta charla desmonto el hype para hablar de lo que realmente importa: diseñar arquitecturas limpias, intencionadas y sostenibles. Vamos a explorar cómo combinar lo mejor del mundo tradicional con las herramientas emergentes sin caer en el over-engineering. Porque a veces, un regex bien puesto le gana a un LLM de millones de parámetros. Si estás cansado de ver Ferraris estacionados en el supermercado, esta charla es para ti.
Provenance by Default: AI Media Pipelines in Python
A model can now generate a video that looks indistinguishable from one your camera recorded. The same is true for an image, a voice, or a song. As Python developers, we are building those pipelines — and we are also the ones who will be asked, very soon, to prove what came out of them. This talk is about building generative media pipelines in Python in a way that answers that question by default. We'll walk through Genblaze, an open-source SDK (github.com/backblaze-labs/genblaze, MIT licensed) that I work on at Backblaze, and use it as a vehicle to talk about the design problems any team faces when wiring AI generation into a real product. We will cover, with live code: the Pipeline pattern with a fluent Pipeline → Step → Run → Manifest API built on Pydantic v2; one API across eleven providers; provenance that survives the file with SHA-256-verified manifests embedded into PNG, JPEG, MP4, MP3, and WAV; privacy and policy controls; storage and replay; and agent loops with lineage. By the end, attendees will have a clear reference for how to architect generative-AI features in Python so that what did this system actually produce, and can I prove it? is a one-line answer instead of a ticket.
Python y Machine Learning para Optimización Termoquímica Sostenible
La ingeniería química sigue dependiendo en gran parte de ensayos experimentales costosos y lentos para evaluar condiciones de operación en procesos termoquímicos. Esta charla propone un enfoque práctico basado en Python y machine learning para acelerar ese proceso: construir modelos predictivos a partir de datos fisicoquímicos que permitan estimar resultados clave sin necesidad de probar cada escenario en laboratorio. Se mostrará un flujo completo orientado a aplicaciones reales, desde datos hasta decisiones, con el objetivo de reducir tiempos de análisis, disminuir costos experimentales y apoyar la optimización de procesos con impacto ambiental.
Real-Time Voice Systems: diseño y arquitectura en 5 niveles
Los sistemas de voz han avanzado rápidamente en los últimos años, pero la mayoría de implementaciones aún se quedan en demos: combinaciones simples de Speech-to-Text, modelos de lenguaje y Text-to-Speech que funcionan en entornos controlados, pero fallan al enfrentarse a condiciones reales. Esta charla propone un enfoque distinto: entender los sistemas de voz como una arquitectura que evoluciona en niveles de madurez, desde prototipos básicos hasta sistemas en tiempo real listos para producción. A través de un framework de 5 niveles, recorreremos el camino completo de un sistema de Conversational AI: desde la integración de componentes básicos, pasando por los retos de orquestación (streaming, latencia, turn-taking), hasta los problemas menos evidentes pero críticos como calidad de audio, robustez y experiencia de usuario, llegando a arquitecturas en tiempo real con tecnologías como LiveKit, y finalmente, explorando hacia dónde va el futuro con sistemas end-to-end y agentes multimodales. La charla está basada en experiencia real construyendo sistemas de voz en producción, y se enfoca en decisiones de ingeniería más que en herramientas específicas. Los asistentes se llevarán un entendimiento claro de cómo diseñar sistemas de voz modernos con Python, qué problemas deben anticipar y cómo estructurar sus propias arquitecturas para construir experiencias conversacionales de clase mundial.
Sistemas de IA vulnerables: datos reales, diseño responsable
El 29% de los ataques pasan los filtros de seguridad de los LLMs más usados en producción. No es un bug. Es la naturaleza del sistema. Los LLMs son procesos estocásticos entrenados sobre lenguaje humano, el medio más flexible, ambiguo y manipulable que existe. Esta charla presenta los resultados de llm-break-bench: 3.360 pruebas adversariales sobre GPT-4o, Claude, Gemini, Grok y DeepSeek usando MLCommons AI Safety v0.5 y OWASP LLM Top 10 como estándares. El modelo más inteligente del benchmark es 5 veces más vulnerable que el más barato. Los datos se conectan con casos de uso reales donde los LLMs están en producción: RAGs, chatbots, agentes, asistentes de código. El cierre es accionable: 5 pilares de diseño para sistemas de IA que no dependan del modelo para su propia seguridad, con código real de NVIDIA NeMo Guardrails y Meta LlamaFirewall.
Structured Learning: Plataforma impulsada por IA que transforma papers académicos en experiencias de aprendizaje interactivas
Structured Learning es una plataforma que convierte un paper de investigación en un módulo completo de aprendizaje — explicaciones capítulo por capítulo, código ejecutable incremental, chat con RAG, flashcards con repetición espaciada FSRS, derivaciones de ecuaciones, y un grafo de conocimiento en Neo4j. Esta charla cubre el producto, la ingeniería de un pipeline de workflows agénticos que lleva un issue de GitHub hasta un PR fusionado con worktrees aislados, auto-patching tras review fallido y GitHub como API de los agentes, y cómo corre en AWS con LocalStack para paridad dev-prod. Los agentes no reemplazan ingenieros, reemplazan el pegamento entre ingenieros y el aburrido 80% del SDLC — y ahí es donde viven los retornos compuestos.
STUART: Un agente hacker autónomo hecho en Python
¿Qué pasaría si le das una dirección IP a un agente de Python y le pides que encuentre las vulnerabilidades del servidor por su cuenta? Eso es exactamente lo que hice. En esta charla presento STUART, un agente autónomo de pentesting que construí con AG2 (AutoGen) y GPT-4. El agente es capaz de analizar sistemas objetivo sin intervención humana, siguiendo las primeras etapas del Cyber Kill Chain: reconocimiento e identificación de vulnerabilidades. La arquitectura es 100% Python: un AssistantAgent respaldado por GPT-4 que razona y planifica, y un UserProxyAgent con un Code Executor que interactúa directamente con el sistema objetivo. Todo orquestado por AG2, el framework open-source para construir sistemas multi-agente. La charla incluye una demostración en vivo donde STUART analizará un sistema vulnerable desplegado en Docker. Verán paso a paso cómo el agente escanea puertos, identifica servicios, detecta vulnerabilidades y reporta sus hallazgos — todo de forma autónoma, decidiendo por sí mismo qué hacer en cada paso. Te vas a llevar conocimiento práctico sobre cómo construir agentes que actúan en el mundo real con AG2, y una perspectiva concreta sobre lo que la IA ofensiva puede hacer hoy. Si un agente de Python puede encontrar tus vulnerabilidades, ¿cómo deberían prepararse los equipos de defensa? Todas las demostraciones se realizan en entornos controlados y éticos.
Understanding Cognitive Complexity in Python
Modern Python makes it incredibly easy to write code quickly, but much harder to keep it understandable as projects grow. This talk explores cognitive complexity: a metric focused not on what code does, but on how difficult it is for humans to read, reason about, and maintain. Through real Python examples, we will analyze how nested conditionals, branching logic, async flows, exceptions, and growing business rules silently increase the mental load required to work with a codebase. We will also discuss why traditional metrics such as cyclomatic complexity often fail to reflect actual readability, and how cognitive complexity provides a more human-centered perspective on maintainability. The talk includes practical refactoring techniques, common anti-patterns found in production Python projects, and lessons learned while building complexipy, an open source cognitive complexity analyzer for Python written in Rust, designed to provide fast local feedback and CI integration.
Vision-Language-Action Models: de los chatbots a la interacción con el mundo físico
Los chatbots impulsados por LLMs marcaron un antes y un después en la inteligencia artificial, permitiendo sistemas capaces de comprender y generar lenguaje natural con gran fluidez. Más recientemente, los modelos multimodales ampliaron estas capacidades al incorporar imágenes, audio y video, acercando la IA a una comprensión más completa de su entorno. En esta charla exploraremos los Vision-Language-Action Models (VLA), arquitecturas que combinan visión por computadora, lenguaje natural y toma de decisiones para permitir que agentes inteligentes interpreten su entorno y ejecuten acciones en el mundo físico. También veremos cómo el ecosistema Python se ha convertido en una pieza fundamental para desarrollar este tipo de soluciones mediante herramientas modernas como PyTorch, Hugging Face, simuladores robóticos y frameworks open source utilizados actualmente en robótica e inteligencia artificial multimodal.