product · 8 min de lectura
Cómo CommonWealth Ops recolecta y procesa inteligencia publicitaria (visión técnica)
Última actualización: junio de 2026
¿Cómo recolecta CommonWealth Ops la inteligencia publicitaria técnicamente?
CommonWealth Ops corre un cron semanal los lunes a las 23:00 UTC que (1) scrapea Meta Ad Library y TikTok Ad Library para un conjunto fijo de nichos, (2) descarga vídeos de anuncios TikTok y los transcribe con Whisper small int8 ASR, (3) normaliza el conjunto capturado en una base de datos estructurada, (4) genera posts de inteligencia por nicho en /blog. Escala actual: ~50-100 anuncios comerciales capturados por semana en los nichos fitness y skincare, cobertura geográfica pesada en India, datos de gasto estructuralmente walled por política de plataforma.
La arquitectura en un diagrama
El sistema tiene cuatro capas, cada una una preocupación separada:
- KobiiSpy — la capa scraper. Dos adaptadores basados en Playwright: uno para Meta Ad Library, uno para TikTok Ad Library. Con scope por-nicho y por-país.
- Transcripción Whisper — los vídeos de anuncios TikTok pasan por faster-whisper small int8 CPU ASR para extraer hooktext del audio hablado. Las transcripciones fallidas son explícitamente marcadas '[audiounclear]' o '[system_voice]' en lugar de fabricadas.
- Ingester de CommonWealth Ops — pulls la tabla `scrapedads` de KobiiSpy a la tabla `adperformance_signals` en el Postgres de CW Ops, con semántica de UPSERT idempotente para que re-correr la misma niche-week nunca produzca duplicados.
- Generador de post semanal — lee `adperformancesignals`, clasifica creativos por arquetipo, aplica una fórmula de trending_score y emite un archivo MDX por (niche, lang) bajo `frontend/content/blog/`.
Los posts de inteligencia en /blog son la superficie cara al usuario. Todo lo de arriba es fontanería.
Qué captura CommonWealth Ops
Para anuncios Meta, los campos capturados por fila son:
- `advertiser` (el nombre de Página)
- `niche` (asignado por el scraper basado en qué niche-query encontró el anuncio)
- `hook_text` (el primer segmento del texto principal del anuncio)
- `visual_format` (imagen / vídeo / carrusel / unknown)
- `cta_type` (Shop Now / Learn More / Sign Up / etc.)
- `country`
- `datefirstseen` y `datelastseen` (espejando los First/Last shown de la Ad Library)
- `scraped_at` (cuándo CommonWealth Ops capturó la fila)
Para anuncios TikTok, los campos capturados añaden `viewsband` (la banda de alcance categórica: 0-1K, 1K-5K, 5K-10K, 10K-100K, 100K-1M, 1M-10M, 10M+). El `hooktext` para anuncios TikTok viene de la transcripción Whisper del vídeo del anuncio, NO del DOM público (la biblioteca de TikTok expone texto mínimo por anuncio).
Qué NO captura CommonWealth Ops
Los muros estructurales acotan el dataset:
- Gasto para anuncios comerciales en cualquier plataforma. Meta expone gasto solo para anuncios políticos bajo DSA UE + reglas electorales US. TikTok no expone gasto en absoluto en la Ad Library pública. CommonWealth Ops documenta esto en vault wall docs dedicados en lugar de rellenar estimaciones.
- Segmentación de audiencia. Ninguna plataforma expone esto públicamente. CommonWealth Ops no lo infiere.
- Métricas de rendimiento (CTR, tasa de conversión, ROAS). Ambas plataformas mantienen esto privado; CommonWealth Ops no las estima.
Cuando CommonWealth Ops publica un post B-type (data-led), cada valor citado proviene del conjunto capturado. Cuando el dato tiene un muro estructural, el post lo reconoce explícitamente en lugar de sustituir un número fabricado. Esto está codificado en nuestra regla interna Apex 45.
La cadencia semanal en pasos concretos
Lunes 23:00 UTC:
- La enriquecimiento Whisper ASR corre primero — re-procesa cualquier fila con hook_text NULL donde el vídeo fuente sigue accesible.
- El ingester de KobiiSpy pulls `scrapedads` fresco a `adperformance_signals`.
- El generador de post de inteligencia corre para cada par (niche, lang): fitness/en, fitness/es, skincare/en, skincare/es.
- Los archivos MDX generados se commitean al branch main del repo vía commit pathspec-scoped (frontend/content/blog/* solamente).
- El hook post-receive del lane de deploy reconstruye el contenedor de producción Next.js.
- El paso notify del Google Indexing API corre para cualquier URL nueva (reconocido en nuestra doctrina interna UT-19 que Google solo actúa sobre JobPosting y BroadcastEvent — los Articles del blog reciben 200 OK pero Google ignora la señal de crawl, así que trackeamos el intento sin reclamar indexación exitosa).
El ciclo completo lleva 5-15 minutos dependiendo de la profundidad de cola de transcripción Whisper. El post de inteligencia está vivo en /blog por las 00:00 UTC del martes.
Escala actual
Para la ventana de mayo-junio 2026:
- Nicho fitness: 47 anuncios comerciales capturados en Meta en 30 días, 10 en TikTok. Cobertura pesada en India.
- Nicho skincare: 15+ anuncios comerciales capturados en Meta en 30 días, cobertura TikTok muy fina.
- Filas totales `scraped_ads` en la base de datos kobiispy: 108 en ambos nichos y ambas plataformas.
- Cobertura geográfica: India dominante, Brasil secundaria, con representación más fina de España, Tailandia, Indonesia, México.
La escala es modesta por diseño. CommonWealth Ops captura el estado de nicho EN VIVO en lugar de un archivo multi-año. Para búsqueda multi-año, los scrapers de pago (AdSpy, Minea, Foreplay) cubren esa superficie; CommonWealth Ops cubre la superficie de delta-semanal.
En qué se distingue CommonWealth Ops de las herramientas de dato crudo
Comparado con scrapers de pago, CommonWealth Ops es un producto de señal procesada, no un producto de dato crudo. La diferencia es qué hace el operador al recibirlo:
- Scraper de pago: el operador busca, filtra, etiqueta, resume. La herramienta da anuncios crudos; el operador extrae el patrón.
- CommonWealth Ops: el operador lee el informe. La extracción de patrón pasa server-side en el generador de posts.
La herramienta correcta depende de si el operador quiere dedicar tiempo a extraer patrón (scraper de pago) o a actuar sobre patrones (CommonWealth Ops). La mayoría de operadores con los que hablamos prefiere lo segundo al punto de precio de 49 EUR/mes.
Dónde aprender más
La página de precios cubre la suscripción de 49 EUR/mes más el 20% del beneficio neto (una tarifa única, sin umbral, y 0 EUR de participación en cualquier mes sin beneficio). La guía qué-es-inteligencia-competitiva-ecommerce da el framing más amplio de la inteligencia competitiva como disciplina. La comparación TikTok-vs-Meta cubre las asimetrías plataforma-específicas en lo que expone cada biblioteca.
Preguntas frecuentes
- ¿Qué datos exactamente recolecta CommonWealth Ops?
- Para anuncios Meta: nombre de Página del anunciante, creativo del anuncio (referencia imagen/vídeo/carrusel), titular + texto principal + etiqueta CTA, fechas first-shown y last-shown, plataformas (FB/IG/Messenger/Audience) y país. Para anuncios TikTok: nombre del anunciante (cuando está disponible), URL del vídeo, fechas first-shown y last-shown, la banda de alcance categórica (0-1K hasta 10M+) y país. CommonWealth Ops NO recolecta: gasto (estructuralmente walled por ambas plataformas para anuncios comerciales), segmentación de audiencia, métricas de rendimiento, ni ningún dato privado. Todo lo capturado proviene de las superficies públicas Ad Library.
- ¿Con qué frecuencia se actualiza el dato?
- El scrape completo corre los lunes a las 23:00 UTC semanalmente. La transcripción de vídeo TikTok vía Whisper corre el mismo lunes antes de que el scraping termine. Los posts de inteligencia en /blog publican el mismo lunes. El scraping diario de la biblioteca de anuncios también corre (proceso separado a las 20:20 UTC diarias) para capturar nuevos entrantes entre publicaciones semanales. El contenido de /blog refleja el snapshot semanal; la base de datos subyacente refleja el estado diario.
- ¿Cómo garantiza precisión CommonWealth Ops?
- Tres capas. (1) El scraper lee solo superficies públicas Ad Library — sin datos privados, sin inferencia. Lo que publicamos es lo que las plataformas mismas exponen. (2) La transcripción de vídeo TikTok usa Whisper small int8 con marcador explícito '[audio_unclear]' para audio ilegible en lugar de texto fabricado. (3) Donde el dato tiene muros estructurales (gasto comercial Meta, gasto numérico TikTok), CommonWealth Ops documenta el muro en un vault doc dedicado en lugar de rellenar estimaciones. El reconocimiento de scope honesto está construido en la metodología.
- ¿En qué se diferencia CommonWealth Ops de AdSpy, Minea o Foreplay?
- Esas herramientas cachean datos de la biblioteca de anuncios y proveen interfaces de búsqueda/filtro sobre anuncios crudos. CommonWealth Ops produce un INFORME de inteligencia por nicho cada semana — observaciones de patrón, tracking de longevidad, deltas de nuevos entrantes — en lugar de solo búsqueda de anuncios cruda. Las herramientas responden 'muéstrame anuncios que matcheen X.' CommonWealth Ops responde 'cuál es el patrón accionable en tu nicho esta semana.' Productos distintos para operadores distintos; el sustrato de dato subyacente (Ad Libraries públicas) es el mismo.
Conviértete en operador
Deja de adivinar qué vender.
CommonWealth Ops convierte la actividad de tu competencia en inteligencia clasificada y respaldada por datos — y protege tu capital antes de gastar un euro en ads. 49 €/mes + 20% del profit neto. Sin prueba gratis: piel en el juego por ambas partes.
Ver acceso y precios