Talks

Discover the Talks at PyCon Colombia 2026 ✨

Browse every accepted session—titles, tracks, levels, and speakers—before you plan your days in Medellín.

Artificial IntelligenceMachine LearningCore Python

Clean Code in the Era of LLMs: Do Good Practices Still Matter?

Instead, research from METR, CodeRabbit, and GitClear is converging on an uncomfortable truth: code duplication has quadrupled, copy-pasted code now exceeds moved code, bugs have risen 70%, and security issues have nearly tripled. AI didn't break our codebases. It amplified what was already broken. So what do we actually do about it? This talk makes the case that clean code, SOLID, DDD, TDD, and design patterns matter more than ever when LLMs write half the code. Your codebase is now a prompt: clean code leads to better AI suggestions, which make it easier to stay clean. We'll walk through which practices now matter more, which ones have quietly turned against you, and how to collaborate with an LLM without becoming a rubber stamp for its output. You'll leave with a concrete framework, Adversarial Collaboration: generate, critique, refactor, verify. Not vibe coding. Real engineering, just faster.

Pablo Restrepo Henao

Machine Learning Lead @ Loka

View talk

Artificial IntelligenceMachine LearningScientific Computing

Construyendo un Transformer con Rust

LEVEL: Advanced LANGUAGE: Spanish

Los Transformers suelen percibirse como gigantes incomprensibles. Esta charla propone demostrar lo contrario: no son cajas negras, sino mecanismos elegantes que pueden entenderse y dominarse desde sus fundamentos. Presentamos Molinete AI, un modelo tipo GPT-2 construido estrictamente desde cero en Rust. Sin frameworks de deep learning: solo tensores, matemáticas y control total. Inspirado en Feste de Tag1 Consulting (entrenado con Shakespeare), este proyecto plantea un reto distinto: entrenar la red con la obra de Miguel de Cervantes para generar texto con el estilo del Siglo de Oro. A lo largo de la sesión, desmontaremos el modelo pieza por pieza. Con el apoyo de una presentación animada en Manim (más de 4.000 líneas de código), haremos visible cómo fluye la información dentro de la red. Partiremos desde la tokenización (BPE) y la construcción de operaciones básicas, para luego adentrarnos en el núcleo del modelo: embeddings, máscara causal y Multi-Head Self-Attention. Finalmente, exploraremos el proceso de aprendizaje, observando cómo los gradientes recorren la red durante el entrenamiento. Más que una demostración, esta charla busca proporcionar una visión clara y operativa de los Transformers, conectando la teoría con una implementación real desde cero.

Jerónimo Hoyos Botero

Estudiante @ Universidad Nacional de Colombia Sede Medellín

View talk

Artificial IntelligenceMachine LearningCore PythonWeb

De voz a acción: construyendo un asistente de IA con Python y Google Workspace

LEVEL: All levels LANGUAGE: Spanish

Saltar entre pestañas de Gmail, Calendar, Drive y Jira para tareas repetitivas es agotador. Por eso construimos Attento, un asistente que permite ejecutar acciones reales en Google Workspace usando lenguaje natural. En esta charla construimos Attento, un asistente de voz end-to-end que convierte lenguaje natural en acciones reales sobre Google Workspace. Veremos arquitectura con FastAPI, autenticación OAuth 2.0 con PKCE, function calling con Gemini, streaming con NDJSON, buenas prácticas con uv y Pydantic Settings, y el camino de demo a producción con Postgres y briefings matutinos automatizados.

Juan Manuel Marín Bedoya

Senior Data Engineer @ Huge

Juliana Suárez Ávila

Data Scientist @ Cuesta Partners

View talk

Machine LearningData Science

Feeding the Invisible: Seguridad alimentaria en ciudades intermedias con Python

LEVEL: All levels LANGUAGE: Spanish

En muchos países, la inseguridad alimentaria no solo es un problema social, sino también un problema de datos. En Colombia, sistemas clave de monitoreo han perdido continuidad, dejando vacíos críticos de información para la toma de decisiones públicas. Esta charla presenta el desarrollo de un prototipo en Python para la construcción de un sistema de monitoreo y predicción del riesgo de inseguridad alimentaria en ciudades intermedias, utilizando únicamente datos abiertos. A partir de un pipeline reproducible, se integran múltiples componentes de ciencia de datos: ingesta y procesamiento de datos de precios de alimentos (SIPSA), modelos de series de tiempo para pronóstico de precios (incluyendo enfoques clásicos y machine learning como XGBoost), segmentación de hogares mediante clustering a partir de encuestas socioeconómicas, construcción de un índice compuesto que relaciona ingresos, precios y vulnerabilidad, y desarrollo de un prototipo de sistema de soporte a la decisión (DSS). Los asistentes se llevarán un enfoque replicable para construir indicadores complejos, estrategias para trabajar con datos abiertos imperfectos, ideas para integrar modelos, datos socioeconómicos y visualización en un solo sistema, y un ejemplo real de aplicación de Python en política pública y desarrollo territorial.

David Alejandro Rivera Correa

Profesional I - Analítica de Datos y conocimiento del cliente @ EDEQ

View talk

Artificial IntelligenceMachine LearningDevOps

From Expert Judgment to Autonomous Optimization: Encoding Human Expertise into LLM Judges with DSPy

LEVEL: Intermediate LANGUAGE: English

A single misread clause in a reinsurance contract can mean millions in liability. Our LLM pipeline could extract and summarize these documents, but how do you know the output is actually correct? String matching fails ("USD 5,000,000" vs "$5M" scores zero), human review at scale is unaffordable, and a single LLM-as-judge prompt gives inconsistent, uncalibrated scores. The real bottleneck was never generation; it was evaluation. This talk shows how we solved it in two steps, both built entirely in Python. First, we encoded expert evaluation at scale using DSPy to distill judgments from five domain experts into a panel of calibrated LLM judges, each targeting a single quality dimension, weighted to reflect what experts actually care about. Then we closed the loop using DSPy's MIPROv2 and GEPA optimizers, wiring the judge panel as a fitness function and letting the system rewrite prompts autonomously, with regression guards and CI gates so humans review only the final score delta. The stack is Python-native: DSPy, MLflow, LiteLLM, Pydantic. You will leave with a concrete recipe for encoding expert knowledge into automated LLM evaluation and self-improving optimization, applicable to any domain where "correct" is nuanced.

Mateo Rios Querubin

Senior ML Engineer @ Provectus / Universidad EAFIT

Sebastián Gómez Ahumada

Middle ML Engineer @ Provectus

View talk

Artificial IntelligenceMachine LearningData ScienceScientific Computing

Machine Learning aplicado a secuencias genéticas

LEVEL: Beginner LANGUAGE: Spanish

DNA contains massive amounts of biological information, but how can artificial intelligence help us understand it? In this talk, we will explore how Python and Machine Learning can be used to analyze genetic sequences in a practical and beginner-friendly way. Using public biological datasets, we will demonstrate how DNA sequences can be transformed into data suitable for machine learning models, covering concepts such as feature extraction, sequence representation, and basic classification techniques. We will also review popular Python tools used in bioinformatics, including Biopython, pandas, and scikit-learn, while discussing real-world challenges when working with biological data, such as high dimensionality, noise, and interpretability limitations. By the end of the talk, attendees will have a clear understanding of how to start building genetic analysis projects using accessible tools from the Python ecosystem, even without prior bioinformatics experience.

Alfonso Palacio

Data Engineer @ Globant

View talk

Machine LearningData ScienceCore PythonDevOps

NLP sin etiquetas: cómo clusterizar N procesos jurídicos del Estado colombiano y convertir el caos en un clasificador en producción

LEVEL: Advanced LANGUAGE: Spanish

¿Qué haces cuando tienes 600.000 quejas jurídicas, cero datos etiquetados y una entidad del Estado esperando resultados? Esta charla recorre el proceso completo de construcción de un sistema de clasificación NLP no supervisado para la Procuraduría General de la Nación. Partiendo de texto administrativo en bruto — ruidoso, lleno de abreviaciones y jerga institucional — mostraré cómo TF-IDF, SVD truncado y KMeans se combinaron para organizar más de medio millón de registros en 64 grupos semánticamente coherentes, sin una sola etiqueta manual. Pero la clusterización es solo el punto de partida. Cubriré cómo se validaron los clusters, cómo se entrenó un clasificador de Regresión Logística sobre ellos para hacer el sistema desplegable, y cómo el pipeline final fue empaquetado en un .pkl que hoy usan colegas no técnicos en producción. En el camino, enfrentaremos los problemas reales: curvas de codo que no se comportan, desbalances de tamaño entre clusters de 1:20, y la tensión entre elegancia matemática y usabilidad institucional. Porque en el sector público, un modelo que nadie usa no es un modelo — es un PDF acumulando polvo.

Jonatan Esteban Gonzalez Balaguera

Profesional @ Procuraduría General de la Nación

View talk

Artificial IntelligenceMachine Learning

No todo clavo necesita un martillo de IA: Arquitecturas que piensan antes de generar

LEVEL: Intermediate LANGUAGE: Spanish

Vivimos en la era donde todo “necesita IA generativa”… o eso nos venden. En esta charla desmonto el hype para hablar de lo que realmente importa: diseñar arquitecturas limpias, intencionadas y sostenibles. Vamos a explorar cómo combinar lo mejor del mundo tradicional con las herramientas emergentes sin caer en el over-engineering. Porque a veces, un regex bien puesto le gana a un LLM de millones de parámetros. Si estás cansado de ver Ferraris estacionados en el supermercado, esta charla es para ti.

Brayan Echenique Ardila

AI Software Engineer @ Proteccion S.A

View talk

Artificial IntelligenceMachine Learning

Opening the Black Box: Mechanistic Interpretability of LLMs

LEVEL: Beginner LANGUAGE: English

A medida que los agentes se implementan en contextos de alto riesgo (finanzas, manufactura, salud), comprender cómo toman decisiones, y no solo qué deciden, se vuelve fundamental para la seguridad y la confianza. Por ejemplo, cuando un agente recibe la instrucción "Buscar los resultados del tercer trimestre de nuestra empresa" y elige buscar en documentos internos en lugar de en la web pública, ¿qué proceso interno impulsa esa elección? La ingeniería de la respuesta, las pruebas de comportamiento y el análisis de la cadena de pensamiento describen correlaciones o narrativas; ninguna revela el mecanismo real. Comprender cómo un agente llega a una conclusión es un componente crítico para desarrollar IA de manera responsable, especialmente en lo que respecta a la confiabilidad y la transparencia en los sistemas de IA. Las interpretaciones de modelos son una forma en que los desarrolladores pueden generar confianza y coherencia en sus sistemas y respaldar la implementación segura de agentes de IA.

David Cardozo

Senior AI Engineer @ Dataiku

View talk

Machine LearningScientific Computing

Python y Machine Learning para Optimización Termoquímica Sostenible

LEVEL: Intermediate LANGUAGE: Spanish

La ingeniería química sigue dependiendo en gran parte de ensayos experimentales costosos y lentos para evaluar condiciones de operación en procesos termoquímicos. Esta charla propone un enfoque práctico basado en Python y machine learning para acelerar ese proceso: construir modelos predictivos a partir de datos fisicoquímicos que permitan estimar resultados clave sin necesidad de probar cada escenario en laboratorio. Se mostrará un flujo completo orientado a aplicaciones reales, desde datos hasta decisiones, con el objetivo de reducir tiempos de análisis, disminuir costos experimentales y apoyar la optimización de procesos con impacto ambiental.

Nieng Yordan Lee Gaitan

Estudiante de maestría en Ingeniería Química @ Universidad Nacional de Colombia - Grupo TAYEA

View talk

Artificial IntelligenceMachine LearningWebDevOps

Real-Time Voice Systems: diseño y arquitectura en 5 niveles

LEVEL: Advanced LANGUAGE: Spanish

Los sistemas de voz han avanzado rápidamente en los últimos años, pero la mayoría de implementaciones aún se quedan en demos: combinaciones simples de Speech-to-Text, modelos de lenguaje y Text-to-Speech que funcionan en entornos controlados, pero fallan al enfrentarse a condiciones reales. Esta charla propone un enfoque distinto: entender los sistemas de voz como una arquitectura que evoluciona en niveles de madurez, desde prototipos básicos hasta sistemas en tiempo real listos para producción. A través de un framework de 5 niveles, recorreremos el camino completo de un sistema de Conversational AI: desde la integración de componentes básicos, pasando por los retos de orquestación (streaming, latencia, turn-taking), hasta los problemas menos evidentes pero críticos como calidad de audio, robustez y experiencia de usuario, llegando a arquitecturas en tiempo real con tecnologías como LiveKit, y finalmente, explorando hacia dónde va el futuro con sistemas end-to-end y agentes multimodales. La charla está basada en experiencia real construyendo sistemas de voz en producción, y se enfoca en decisiones de ingeniería más que en herramientas específicas. Los asistentes se llevarán un entendimiento claro de cómo diseñar sistemas de voz modernos con Python, qué problemas deben anticipar y cómo estructurar sus propias arquitecturas para construir experiencias conversacionales de clase mundial.

Nicolas Danies

Data Science Manager @ Visa

View talk

Artificial IntelligenceMachine LearningData Science

The GenAI Revolution Reaches RecSys

LEVEL: Intermediate LANGUAGE: English

When we talk about the generative AI revolution, the conversation usually stays close to chatbots, image generation, and code assistants. But the same architectures that powered that wave (transformers, autoregressive modeling, scaling laws) are quietly reshaping fields most people don't associate with GenAI at all. Recommender systems are one of the most interesting examples. Meta, Netflix, Google, Spotify and others are replacing decades-old recsys pipelines with transformer-based foundation models, and the results are hard to ignore. This talk is a practical tour of that shift from a Python engineer's seat.

Carlos Andrés Osorio Alcalde

Sr Machine Learning Engineer @ Factored

View talk

Artificial IntelligenceMachine LearningData ScienceCore Python

Your AI Eval Is Lying To You

LEVEL: Intermediate LANGUAGE: English

When you set temperature=0 and run your AI eval, you expect the same input to give the same output. It doesn't. Recent measurements on Qwen3-235B at temperature=0 produced 80 unique completions on a single prompt. So when your eval reports "92% pass rate," what does that actually mean? This talk is about the gap between how the AI eval ecosystem talks about scores and what those scores can actually support. We walk through five specific tools that fix the gap: Pass@k versus pass^k, Wilson confidence intervals, Bayesian pass@k with Beta-Binomial conjugacy, sequential drift detection with EWMA, CUSUM, and OLS, and family-wise error control via Benjamini-Hochberg procedures. Each method gets a short demo in pure Python with no framework dependency. The audience leaves with reference implementations they can paste into an existing pytest setup tonight.

Sankalp Gilda

Staff MLE @ DeepThought Solutions

View talk