Cómo uso agentes de IA para gestionar 4 marcas de cosmética (caso real)

Tabla de contenido

Este no es un post de teoría sobre IA. Es lo que realmente tengo montado, lo que ha funcionado, lo que no, y por qué creo que la forma en que muchas empresas están aproximándose a los agentes de IA está mal planteada.

Contexto: gestiono la distribución de varias marcas de cosmética de lujo en España. Marcas con catálogos grandes (cientos de productos), terminología muy específica (ingredientes activos, protocolos de tratamiento, formaciones de terapeuta), y materiales que constantemente hay que adaptar: manuales, fichas de producto, presentaciones para clientes, contenido para redes sociales.

Todo eso requería mucho trabajo manual. Actualizar una ficha cuando cambia un precio o una fórmula. Adaptar un manual de la marca francesa al mercado español. Generar descripciones de producto consistentes con el posicionamiento de la marca. Responder consultas técnicas del equipo comercial.

Este año cambié el enfoque completamente. Aquí está lo que monté y cómo funciona.

El problema real (no el que crees que es)
#

Cuando la gente piensa en “IA para el negocio” suele pensar en automatizar tareas concretas: generar un email, resumir un documento, traducir algo. Eso está bien, pero es el nivel más básico.

El problema más gordo que tenía yo no era la generación de contenido. Era el conocimiento disperso y no accesible. Tenía:

PDFs de formación de las marcas (algunos en inglés, algunos en francés, algunos en español)
Catálogos de producto en varios formatos
Fichas técnicas con ingredientes activos y mecanismos de acción
Protocolos de tratamiento específicos por objetivo
Materiales de marketing con el brand voice de cada marca
Historiales de consultas del equipo comercial

Todo eso existía, pero era opaco. Cuando alguien del equipo necesitaba saber el ingrediente activo clave de un sérum concreto, tenía que buscar en el PDF correcto, en el capítulo correcto. Cuando necesitaba escribir una descripción de producto manteniendo la voz de la marca, era a ojo.

La IA bien montada no es un generador de texto. Es un sistema de conocimiento accesible.

La arquitectura que uso
#

Tengo varios agentes especializados corriendo en máquinas virtuales en mi homelab. Cada marca tiene su propio agente con su propio contexto:

Un agente para Gemology (piedras preciosas, minerales, cosmetología gemológica)
Un agente para Codage Paris (cosmética personalizable, biotecnología)
Un agente para Mansard (nicho premium, en evaluación)
El agente principal (Alfred) que coordina y tiene acceso a todo

Cada agente tiene:

Base de conocimiento vectorizada — todos los documentos de la marca indexados para búsqueda semántica
Contexto de identidad — quién es la marca, cuál es su brand voice, qué términos usa y cuáles evita
Acceso a herramientas — web, email, documentos, APIs cuando existen

La magia no está en un modelo de IA potente. Está en darle al modelo el contexto correcto en el momento correcto.

Los 9 manuales generados: cómo funciona el proceso
#

Este fue uno de los primeros proyectos concretos. Tenía que generar manuales de producto para una de las marcas: documentos de 20-30 páginas que combinan ficha técnica, protocolo de aplicación, ingredientes clave, preguntas frecuentes y argumentario de venta.

Antes: uno de estos manuales tardaba 2-3 días de trabajo entre recopilar información, redactar, maquetar y revisar.

Con el sistema actual el proceso es:

1. Preparación de fuentes
#

1
2
3
# Indexar todos los documentos de la marca
# (fichas, PDFs de formación, catálogos anteriores)
# → ChromaDB con embeddings semánticos

Todo el material existente de la marca va a una base de datos vectorial. No para “entrenar un modelo” (eso es otro concepto), sino para que cuando el agente necesite información sobre el Producto X, pueda buscar semánticamente en todos los documentos y encontrar lo relevante.

2. Template del manual
#

Diseñé un template estructurado con las secciones que necesita cada manual:

Concepto y posicionamiento
Ingredientes activos clave (con mecanismo de acción)
Protocolo de aplicación paso a paso
Sinergias con otros productos del catálogo
Preguntas frecuentes del terapeuta
Argumentario para el cliente final

El agente tiene este template y sabe que cada sección tiene requerimientos específicos (por ejemplo, que los ingredientes se describan con nombre INCI, nombre común y función).

3. Generación con contexto
#

1
2
3
4
5
6
Agente: "Genera el manual del Producto X"
Sistema: busca en base vectorial todo lo relacionado con Producto X
→ encuentra fichas técnicas, menciones en catálogos, referencias en formaciones
→ inyecta todo eso en el contexto del modelo
→ genera el manual siguiendo el template
→ usa la voz y terminología de la marca (también en el contexto)

4. Revisión humana
#

El agente genera el borrador. Yo reviso. La revisión ahora toma 20-30 minutos en vez de crear desde cero.

El resultado: 9 manuales completos en una semana. Consistentes en formato, consistentes en brand voice, con información técnica correcta porque venía de las fuentes originales.

Brand books y vectorización
#

Cada marca tiene su brand book: el documento madre que define quién es la marca, cómo se comunica, qué valores tiene, qué palabras usa y cuáles evita. Es el documento más importante para mantener coherencia de marca.

El problema con los brand books: nadie los lee. Están en una carpeta en Dropbox, tienen 40 páginas, y cuando alguien escribe algo para la marca lo hace a ojo o preguntando.

Mi solución: el brand book vectorizado es el contexto del agente.

Cuando el agente de Gemology genera cualquier contenido, tiene el brand book de Gemology en su contexto de forma semántica. No como un documento que “leer”, sino como conocimiento accesible.

Esto significa:

Consistencia automática en el tono y las palabras
El agente sabe qué promesas puede hacer la marca y cuáles no
Conoce el posicionamiento respecto a competidores
Usa los nombres correctos de líneas y familias de productos

Cómo vectorizé los brand books
#

Proceso básico:

PDF → texto limpio (quitando headers, footers, numeración)
Dividir en chunks de ~500 tokens con overlap de ~50 tokens
Generar embeddings (uso modelos de embeddings locales cuando puedo, APIs cuando no)
Almacenar en ChromaDB con metadatos (marca, sección, tipo de documento)

 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
# Proceso simplificado
import chromadb
from langchain.text_splitter import RecursiveCharacterTextSplitter

# Cargar documento
with open("brand_book_gemology.pdf", "rb") as f:
    texto = extraer_texto_pdf(f)

# Dividir en chunks
splitter = RecursiveCharacterTextSplitter(
    chunk_size=500,
    chunk_overlap=50
)
chunks = splitter.split_text(texto)

# Almacenar con metadata
client = chromadb.Client()
collection = client.get_or_create_collection("gemology_docs")
collection.add(
    documents=chunks,
    metadatas=[{"marca": "gemology", "tipo": "brand_book"} for _ in chunks],
    ids=[f"bb_gemology_{i}" for i in range(len(chunks))]
)

Una vez indexado, el agente puede hacer búsquedas como:

“¿Cuál es el tono de comunicación de Gemology para redes sociales?”
“¿Qué diferencia a Gemology de otras marcas de cosmética de minerales?”
“¿Qué ingredientes gemológicos son los más importantes para la línea de diamante?”

Y obtiene respuestas basadas en el brand book real, no inventadas.

Automatización de contenido: el caso de las fichas de producto
#

Las marcas actualizan sus catálogos periódicamente. Cuando llega actualización (nuevos precios, nuevas fórmulas, nuevos productos), hay que actualizar fichas, descripciones web, materiales de venta…

Antes: proceso manual de varios días. Ahora: el agente recibe el catálogo actualizado, detecta cambios, y genera los materiales actualizados manteniendo el formato y el tono correctos.

El flujo concreto
#

1
2
3
4
5
6
1. Llega PDF de catálogo actualizado de la marca
2. El agente lo compara con la versión anterior (también vectorizada)
3. Identifica productos nuevos y productos modificados
4. Para cada producto nuevo: genera ficha completa (descripción, ingredientes clave, modo de uso, FAQ)
5. Para productos modificados: actualiza solo las secciones afectadas
6. Genera un resumen de qué cambió para que yo revise

Esto que antes tardaba días, ahora tarda horas. Y la mayor parte de ese tiempo es mi revisión, no la generación.

Formación del equipo comercial
#

Un caso de uso que no tenía previsto inicialmente pero que resultó ser muy valioso: el agente como asistente de formación.

El equipo comercial tiene dudas técnicas constantemente. “¿Qué protocolo recomiendo para piel grasa con rosácea?”, “¿El Producto X es compatible con tratamientos Indiba?”, “¿Qué le explico a una terapeuta que quiere comparar Gemology con [marca competidora]?”

Antes esas preguntas llegaban a mí o a formación. Ahora hay un canal donde el equipo puede preguntar directamente al agente, que tiene todo el conocimiento técnico de las marcas disponible.

El agente sabe cuándo está seguro de la respuesta y cuándo no. Cuando no sabe, escala la pregunta.

Lo que no funciona (siendo honesto)
#

No todo ha sido fácil. Problemas reales que he encontrado:

Alucinaciones en información técnica
#

Los modelos de IA pueden inventarse cosas. En cosmética esto es especialmente problemático: si el agente dice que un ingrediente actúa de una forma que no está en ningún documento, puede ser falso.

La solución: diseñar el sistema para que el agente cite las fuentes. Si no puede citar un documento específico para una afirmación técnica, no la hace.

Inconsistencias cuando los documentos fuente son inconsistentes
#

Si los PDFs de la marca tienen información contradictoria (algo que pasa más de lo que debería), el agente puede generar contenido inconsistente también.

La solución: curar bien las fuentes antes de vectorizarlas. Calidad entra, calidad sale.

El mantenimiento de la base de conocimiento
#

Los documentos no son estáticos. Los brand books se actualizan, los catálogos cambian, las fichas técnicas se revisan. Hay que mantener la base vectorial actualizada.

Tengo un proceso semestral de revisión de documentos y re-indexación. No es perfecto pero funciona.

El problema del idioma y la terminología específica
#

Los materiales de las marcas llegan en varios idiomas (inglés, francés, español). Los modelos de IA general funcionan bien con esto, pero la terminología muy específica (nombres de ingredientes INCI, nombres propios de tecnologías patentadas) a veces se maneja mal.

Solución parcial: tener glosarios de términos clave en el contexto del agente.

Herramientas que uso
#

Sin entrar en detalles propietarios:

ChromaDB — base de datos vectorial (self-hosted en mi homelab)
Claude Sonnet/Opus — modelo principal para generación
Modelos de embeddings locales — para vectorizar documentos sin costes de API cuando el volumen es grande
OpenClaw/Alfred — el agente principal que coordina todo
n8n — automatización de workflows (recibir PDF → procesar → generar → enviar)
Gitea — control de versiones de prompts y templates
python-docx / weasyprint — para generar los documentos finales en Word/PDF

Todo self-hosted excepto las APIs de los modelos de IA. El homelab que tengo aguanta perfectamente la carga.

Lo que aprendí del proceso
#

Los agentes no reemplazan el juicio humano
#

El agente genera el 80% del trabajo. El 20% restante (revisar, ajustar el tono, validar información técnica, tomar decisiones de posicionamiento) sigue siendo mío. Y ese 20% es el que realmente importa.

La trampa es pensar que el objetivo es llegar al 100% de automatización. No lo es. El objetivo es liberar tiempo humano para el trabajo que realmente añade valor.

El contexto lo es todo
#

Un modelo de IA sin contexto es un generador de texto genérico. Un modelo de IA con el brand book completo de Gemology, el catálogo actualizado, y el historial de consultas del equipo… eso es una herramienta completamente diferente.

La mayor parte del trabajo no fue configurar el modelo. Fue preparar y organizar el conocimiento de las marcas de forma que el modelo pudiera acceder a él eficientemente.

Empieza pequeño, itera rápido
#

El primer agente que monté era un prototipo simple. Un solo documento de fuente, un solo caso de uso, un solo tipo de salida. Lo usé, vi qué fallaba, lo mejoré.

No intenté montar el sistema completo desde el principio. Cada iteración añadía complejidad solo cuando la complejidad anterior estaba funcionando.

El ROI es claro si mides bien
#

9 manuales × ~2 días de trabajo cada uno = ~18 días de trabajo ahorrados. A eso le sumo la generación continua de fichas de producto, el soporte al equipo comercial, la consistencia mejorada en los materiales…

El coste de las APIs de IA para todo esto en un mes es inferior al coste de un día de trabajo. La infraestructura de homelab que ya tenía montada no cuenta como coste incremental.

El siguiente paso
#

Lo que estoy explorando ahora:

Agente que monitoriza la competencia — analiza webs de competidores, detecta cambios en posicionamiento o lanzamientos de nuevos productos
Generación de vídeo de producto — OpenShorts para crear reels con IA de los productos Gemology sin necesitar producción física
Pipeline de contenido para redes — que el agente proponga contenido para Instagram de cada marca basándose en temporada, productos en stock, y eventos del sector

La cosmética de lujo es un sector donde el conocimiento de producto es crítico y el volumen de materiales es enorme. Los agentes de IA son especialmente útiles aquí, no porque sustituyan el expertise humano, sino porque lo amplifican.

El coste real de montarlo (spoiler: menos de lo que crees)
#

Una pregunta frecuente cuando cuento esto: “¿cuánto cuesta?”

Desglose real de lo que tengo montado:

Infraestructura (ya tenía todo esto):

Servidor homelab con VMs: ya estaba montado para otras cosas
ChromaDB self-hosted: gratis
n8n self-hosted: gratis
Almacenamiento: incluido en el NAS que ya tenía

APIs de IA (coste mensual real):

Claude API (principal): ~$30-50/mes dependiendo del volumen
Embeddings: <$5/mes (o gratis con modelos locales)
OpenShorts cuando lo pruebe: ~$0.65-2 por vídeo generado

Tiempo de montaje inicial:

Primer agente funcional: ~2 días
Sistema completo con todas las marcas: ~3 semanas de trabajo intermitente
Mantenimiento mensual: 2-3 horas

Comparado con el ahorro de tiempo, el ROI es ridículo. La barrera real no es el dinero, es el conocimiento técnico inicial para montar la infraestructura.

Cómo replicarlo sin homelab propio
#

Si no tienes homelab, el mismo sistema funciona con herramientas cloud:

ChromaDB → Pinecone (free tier disponible)
n8n self-hosted → n8n.io cloud (tiene plan gratuito)
Agentes → OpenAI Assistants o Claude Projects
Documentos → Google Drive o Notion como fuente

La diferencia es que en cloud pagas por lo que usas y no tienes control total. Para empezar a validar el concepto, está bien. Para escalar y tener privacidad total sobre los datos de las marcas (que pueden ser sensibles), self-hosted es mejor.

Una reflexión final sobre el sector cosmético y la IA
#

La cosmética de lujo tiene algunas características que la hacen especialmente apta para este tipo de automatización:

Catálogos grandes y estables. Una marca puede tener 200-300 referencias. No cambian radicalmente cada mes. Eso significa que el trabajo de vectorizar el conocimiento se amortiza durante mucho tiempo.

Terminología muy específica. Los ingredientes activos, los mecanismos de acción, los protocolos de tratamiento… es conocimiento técnico que los modelos de IA general no tienen bien. Pero si se lo das en el contexto (brand book + fichas técnicas), el modelo lo usa correctamente.

Múltiples formatos de salida. El mismo conocimiento base genera: descripción web, ficha para terapeuta, argumentario comercial, post para Instagram, respuesta a consulta técnica. Con el agente bien montado, cada uno en el formato y tono correcto.

Regulación. Las marcas de cosmética tienen restricciones sobre lo que pueden y no pueden prometer. El agente, con el brand book y las guías de comunicación en el contexto, sabe estas limitaciones y no hace afirmaciones que puedan crear problemas legales.

Si estás en distribución, retail de lujo, o cualquier sector con catálogos grandes y conocimiento técnico profundo, el patrón es el mismo. La cosmética fue mi laboratorio, pero funciona igual en perfumería, vino, equipamiento médico, o cualquier sector donde el conocimiento de producto sea el activo más valioso.

Si gestionas una marca o distribuyes varias marcas y quieres hablar sobre cómo monté esto, cuéntamelo en los comentarios. Hay mucho que adaptar según el caso concreto pero el patrón básico es bastante transferible.

El problema real (no el que crees que es)#

La arquitectura que uso#

Los 9 manuales generados: cómo funciona el proceso#

1. Preparación de fuentes#

2. Template del manual#

3. Generación con contexto#

4. Revisión humana#

Brand books y vectorización#

Cómo vectorizé los brand books#

Automatización de contenido: el caso de las fichas de producto#

El flujo concreto#

Formación del equipo comercial#

Lo que no funciona (siendo honesto)#

Alucinaciones en información técnica#

Inconsistencias cuando los documentos fuente son inconsistentes#

El mantenimiento de la base de conocimiento#

El problema del idioma y la terminología específica#

Herramientas que uso#

Lo que aprendí del proceso#

Los agentes no reemplazan el juicio humano#

El contexto lo es todo#

Empieza pequeño, itera rápido#

El ROI es claro si mides bien#

El siguiente paso#

El coste real de montarlo (spoiler: menos de lo que crees)#

Cómo replicarlo sin homelab propio#

Una reflexión final sobre el sector cosmético y la IA#