Skip to content

MLOps y Automatización

Bases de Datos Vectoriales y Embeddings


Course
Profesor Altea
Access code required
Enroll

Domina las bases de datos vectoriales y embeddings para transformar datos complejos en valor práctico. Aprende a crear, almacenar, buscar y aplicar embeddings en soluciones reales de IA y recuperación semántica, con un enfoque inmediato y orientado a la industria.

¿Te gustaría entender cómo los motores de inteligencia artificial encuentran respuestas relevantes más allá de simples coincidencias de palabras? Este curso te lleva paso a paso al corazón de las bases de datos vectoriales y embeddings, herramientas esenciales en la nueva ola de aplicaciones inteligentes que revolucionan sectores como el ecommerce, la salud o las finanzas. Aquí, la teoría solo es el punto de partida: cada concepto se convierte en una técnica práctica que puedes implementar el mismo día en tus proyectos, sea para mejorar la búsqueda, analizar grandes volúmenes de datos o integrar modelos de IA. A lo largo de cinco módulos cuidadosamente secuenciados, partirás de los fundamentos de los embeddings y su poder para convertir textos, imágenes o audio en vectores numéricos que capturan significado y contexto. Descubrirás los distintos tipos de embeddings y aprenderás a generarlos con modelos modernos, entendiendo cómo medir similitud y distancias para búsquedas semánticas eficaces. Profundizarás en el almacenamiento eficiente y la indexación vectorial, explorando herramientas líderes como Pinecone, Milvus o Weaviate, y resolviendo desafíos de escalabilidad, actualización y seguridad. Finalmente, aterrizarás todos estos conocimientos en casos de uso reales y en las tendencias emergentes del sector, preparándote para integrar bases de datos vectoriales con modelos de IA y APIs especializadas. El curso está diseñado para que puedas aplicar cada aprendizaje de inmediato, utilizando recursos gratuitos o de bajo costo, y midiendo tu progreso en cada etapa. No solo aprenderás los principios técnicos, sino que comprenderás las razones detrás de cada decisión arquitectónica, con ejemplos que conectan directamente con tu experiencia profesional. De la mano de referentes como Geoffrey Hinton y Yann LeCun, y con una narrativa envolvente que te guía de lo conocido a lo novedoso, saldrás preparado para construir soluciones robustas, eficientes y seguras en el mundo de los datos vectoriales.

Here is the course outline:

1. Fundamentos de Embeddings y Datos Vectoriales

Este módulo introductorio sienta las bases: explora qué son los embeddings, por qué revolucionan la representación de datos no estructurados y cómo se miden las distancias o similitudes en espacios vectoriales. Servirá de brújula conceptual para comprender todo el flujo de trabajo que se desarrollará en los módulos posteriores.

De lo intangible a lo numérico: ¿qué son los embeddings?
Mapa de sabores: tipos de embeddings y sus dominios de uso
Midiendo la cercanía: similitud y distancias en espacios vectoriales
Ensayo: Comprensión integral de los fundamentos de embeddings y datos vectoriales
Quiz: Fundamentos de Embeddings y Datos Vectoriales
Proyecto Práctico: Transformando Datos No Estructurados en Valor con Embeddings

2. Creación y Procesamiento de Embeddings

Aquí el estudiante aprenderá a generar embeddings de texto e imágenes, diseñar pipelines de preprocesamiento eficientes y aplicar la recuperación semántica para obtener resultados relevantes desde el primer día.

Preparación del terreno: pipeline de procesamiento de datos
Manos a la obra: creación de embeddings de texto e imagen
Recuperación semántica: encontrando la aguja en el pajar vectorial
Ensayo Integrador: Del Procesamiento al Valor Semántico en Embeddings
Quiz: Creación y Procesamiento de Embeddings
Proyecto Práctico: De Datos a Recuperación Semántica con Embeddings

3. Almacenamiento, Índices y Escalabilidad

Este módulo profundiza en las estrategias para guardar grandes volúmenes de vectores, construir índices óptimos, habilitar búsqueda aproximada y mantener alto rendimiento aun cuando se actualicen o eliminen registros.

Del disco a la RAM: estrategias de almacenamiento de vectores
Índices y búsqueda aproximada: velocidad con precisión controlada
Escalabilidad viva: rendimiento, actualización y borrado sin fricciones
Ensayo Integrador: Estrategias de Almacenamiento, Indexado y Escalabilidad en Bases de Datos Vec...
Quiz: Almacenamiento, Índices y Escalabilidad en Bases de Datos Vectoriales
Proyecto Integrador: Diseña un Sistema Vectorial Escalable y Óptimo

4. Integración y Casos de Uso en Producción

Se presentarán las bases de datos vectoriales más populares, sus APIs y lenguajes de consulta, la conexión con modelos de IA y las mejores prácticas de privacidad, evaluación de calidad y optimización de costos mediante ejemplos reales de industria.

Panorama de bases vectoriales y sus APIs de consulta
Conectando la IA: integración y privacidad en entornos productivos
Medir, optimizar y convencer: evaluación, costes y casos reales
Ensayo Integrador: De la Selección a la Optimización de Bases Vectoriales en Producción
Quiz: Integración y Aplicación de Bases de Datos Vectoriales en Producción
Proyecto Integrador: Implementacin y Evaluacin de un Sistema Vectorial en un Caso de Uso Real

5. Síntesis y Perspectivas Futuras

El módulo final resume los aprendizajes clave, conecta todos los elementos vistos y analiza las tendencias emergentes que marcarán el futuro de los embeddings y las bases de datos vectoriales.

Mapa completo: conectando los aprendizajes clave
Mirando hacia adelante: tendencias emergentes en embeddings
Tu hoja de ruta: próximos pasos profesionales y de investigación
Ensayo de Síntesis: Tendencias y Futuro de los Embeddings y Bases Vectoriales
Quiz: Síntesis y Perspectivas Futuras en Embeddings y Bases de Datos Vectoriales
Proyecto Final: Hoja de Ruta Profesional con Embeddings y Bases de Datos Vectoriales
Glossary
Study guide
Back to top