Growth
ARQUITECTURA DE DATOS · GROWTH · HITES

La arquitectura de datos de Growth.

Un solo lugar donde la data del ecommerce se vuelve decisión: desde el evento crudo hasta el panel que mira la gerencia. Acá está cómo se construye y por qué.

Explorar el dataset pieza por pieza
El porqué

Objetivo y estrategia.

Objetivo: centralizar en un solo dataset —growth_analytics— toda la inteligencia de datos de Growth, con la lógica de negocio resuelta una sola vez y lista para alimentar paneles y decisiones, sin depender de la disponibilidad ni de los cambios de los sistemas de origen.

Cuatro criterios deciden qué pieza vive dentro:
1
Una sola verdad

Lógica de negocio, escrita una vez

Las definiciones, joins y reglas del negocio viven acá una sola vez. Los paneles consumen el resultado, no reinventan el cálculo: nadie discute dos cifras distintas para lo mismo.

2
Rápido y barato

Pre-agregado para Looker

La data llega ya sumada al grano que el panel necesita —día, canal, departamento, SKU. Looker no escanea eventos crudos: las consultas vuelan y el costo se mantiene a raya.

3
Blindado

Desacoplado del origen

Una capa intermedia nos protege de los cambios de schema y de la latencia de los sistemas fuente. Si producción cambia, lo absorbemos acá; el panel no se entera.

4
Cruzado

Datos que no conviven en otro lugar

Cruzamos fuentes que en los sistemas corporativos jamás se tocan —GA4 con venta real, búsqueda interna con SEO— para responder preguntas que ninguna fuente sola puede.

Lo que NO hacemos: copiar tablas crudas 1:1. Una copia sin lógica solo se desincroniza con el tiempo. La disciplina es al revés: en cada métrica compartida, growth_analytics se reconcilia al peso contra la fuente.

El mapa

Tres capas, un flujo.

La data entra cruda por un lado, se vuelve inteligencia en el medio y sale como decisión por el otro.

1
Capa 1 · Fuentes

Los orígenes

GA4 (analytics_312935658), Salesforce/ERP (MODGESTION), Search Console y el buscador interno. Data cruda, tal como la generan los sistemas.

2
Capa 2 · growth_analytics

La inteligencia

Acá vive la lógica: dimensiones, tablas pre-agregadas y vistas en vivo. El corazón de la arquitectura, donde aplican los cuatro criterios.

3
Capa 3 · Consumo

La decisión

Looker Studio, los paneles Pulso y el Centro de Mando Growth. Donde la gerencia mira el dato y decide.

Las piezas

Qué vive dentro del dataset.

Cada familia resuelve un dominio del negocio. Bajo cada una, las tablas y vistas reales que la componen.

Dimensión · Producto

dim_sku

La columna vertebral. Traduce cada SKU a su jerarquía completa —área, departamento, sección, familia, marca, producto. Dimensión acumulativa alimentada por GA4: la cobertura solo sube, nunca baja.

dim_sku
Comportamiento · GA4

Funnel del ecommerce

El embudo on-site desde GA4: sesiones, vistas de producto, carros y transacciones. Pre-agregado por canal, región, departamento, marca y SKU, más vistas en tiempo real.

funnel_base · datastudio_canal / region / departamento / marca / sku _diario · 4 vistas realtime
Venta · Salesforce

Venta real (lambda)

La venta facturada desde MODGESTION —la cifra que valida la gerencia. Arquitectura lambda: histórico materializado (rápido) más hoy en vivo (vista), unidos sin costura.

sf_venta_real_diario · _departamento_diario · _seccion_diario (cada una: vista + tabla _hist)
On-site · Buscador

Buscador interno

Qué buscan los clientes dentro del sitio: términos, resultados y conversión del buscador. Señal directa de demanda e intención, antes de la compra.

search_base · datastudio_search_diario · _termino_diario · _conversion_diario (+ _hist)
Orgánico · Search Console

SEO

Posicionamiento orgánico desde Search Console: queries, páginas, clics e impresiones. Carga incremental con ventana móvil, para no reprocesar todo cada noche.

seo_query_diario · seo_pagina_diario · seo_resumen_diario
Objetivos · Metas

Metas

Las metas de cada frente, para contrastar lo real contra el objetivo dentro de los mismos paneles. El marcador del partido, junto al resultado.

metas

Nuevas piezas

La arquitectura crece. A medida que sumemos fuentes —paid media, CRM, post-venta— se documentan acá, en el mismo lugar y bajo los mismos criterios.

Por incorporar
El motor

Un job nocturno mantiene todo vivo.

Cada madrugada una consulta programada reconstruye las tablas y refresca las dimensiones. A las 06:00 de Chile el panel ya tiene los datos de ayer.

1

06:00 de Chile

El job corre todos los días en la madrugada (10:00 UTC), con la venta de ayer ya cerrada en MODGESTION.

2

dim_sku primero

El primer paso alimenta la dimensión de producto desde GA4 con un MERGE de ventana móvil (3 días), antes de materializar el resto.

3

Patrón lambda

Tablas históricas materializadas (rápidas) más vistas en vivo para hoy: la data queda completa y siempre al día.