Las 27 piezas de growth_analytics, agrupadas por dominio y explicadas en simple: qué guarda cada una, con qué grano y de qué tipo es. Toca cualquier objeto para ver su detalle.
Un solo dataset, seis dominios, 27 objetos. Así se organiza growth_analytics de izquierda a derecha: cada columna es un dominio y lista sus tablas y vistas. Desliza para recorrerlo entero.
dim_skufunnel_basedatastudio_canal_diariodatastudio_departamento_diariodatastudio_marca_diariodatastudio_region_diariodatastudio_sku_diariodatastudio_realtime_diadatastudio_realtime_ultimos_30mindatastudio_realtime_bloques_departamentodatastudio_realtime_bloques_comparativosearch_basedatastudio_search_diariodatastudio_search_diario_histdatastudio_search_termino_diariodatastudio_search_termino_diario_histdatastudio_search_conversion_diariosf_venta_real_diariosf_venta_real_diario_histsf_venta_real_departamento_diariosf_venta_real_departamento_diario_histsf_venta_real_seccion_diariosf_venta_real_seccion_diario_histseo_query_diarioseo_pagina_diarioseo_resumen_diariometasNo todo se guarda igual. Distinguir el tipo explica por qué una consulta vuela, o por qué un dato está siempre fresco.
growth_analytics agrupa las 27 piezas bajo el proyecto hi-gcp-data-com. Dentro, cada pieza es de uno de estos tres tipos.Datos guardados tal cual, en un solo bloque, sin separar por fecha. Para cosas chicas o atemporales: un catálogo o un calendario. Se leen enteras y al instante.
Guardada en “cajones” por día (PARTITION BY fecha). Al pedir un rango, BigQuery abre solo esos cajones, no toda la historia: más rápido y más barato. Muchas además van clusterizadas —ordenadas dentro del cajón por una columna como query o url— para filtrar aún más fino.
query, dentro del cajón salta directo a esa palabra.No guarda datos: es una consulta con nombre que se calcula al vuelo cada vez. La usamos para definir la lógica base (funnel_base) y para “coser” el histórico congelado con el día en vivo. Siempre devuelve lo último, sin mantención.
El nombre de cada tabla ya cuenta qué es. Dos capas: el vocabulario estándar de bodegas de datos (dim, fct, rpt…) y los prefijos propios que usamos en growth_analytics.
Cómo se nombran las piezas en cualquier data warehouse.
dim_fct_rpt_stg_Los prefijos y sufijos reales de growth_analytics.
dim_datastudio_sf_seo_search__baserealtime__diario_histEl catálogo maestro de productos y la columna vertebral del dataset. Traduce cada código de SKU a su jerarquía completa —área, departamento, sección (subdepto1), familia (subdepto2)—, su marca y su nombre. Se alimenta sola cada noche desde GA4: si un producto aparece con nueva clasificación la aprende, y si no, conserva la que ya tenía (la cobertura solo sube). departamento_fuente marca el linaje del dato.
La vista base del embudo de navegación. Cada fila es una sesión mirando un producto, con su canal de marketing, la jerarquía del producto, la región y las banderas del embudo (vio PDP, agregó al carro, login, checkout, despacho, facturación, compró). No guarda datos: se calcula al vuelo desde los eventos crudos de GA4. De aquí salen, ya sumadas, todas las tablas datastudio_* del funnel.
El embudo del sitio resumido por día y canal de marketing, con todo el funnel (sesiones, PDP, carro, login, checkout, despacho, facturación, compra) más transacciones e ingresos. Responde “¿cómo convirtió cada canal?” sin escanear eventos crudos.
El mismo embudo diario abierto por la jerarquía de producto (área, departamento, sección, familia) y región. Permite ver conversión y venta web por departamento o sección. Durante la migración de nombres convive el par viejo (subdepto1/2) con el nuevo (seccion/familia).
El embudo diario abierto por marca (dentro de cada departamento) y por región. Responde “¿qué marcas se ven y convierten más en la web?”.
El embudo diario por región de Chile, con el código ISO de cada región (region_iso) listo para pintar el mapa en Looker. Responde “¿dónde, geográficamente, navega y compra la gente?”.
El embudo diario al máximo detalle: por SKU individual, con su departamento y marca. La tabla más grande del funnel; permite ver qué productos puntuales atraen y convierten.
Vista en vivo del día en curso, hora a hora. Alimenta los medidores “Top KPIs Real Time” del tablero (sesiones, transacciones e ingresos acumulados del día). Lee los eventos intradía de GA4; se refresca cada ~15 minutos.
El pulso inmediato del sitio: sesiones, transacciones e ingresos de los últimos 30 minutos.
El día de hoy partido en bloques de 30 minutos, abierto por departamento y sección: vistas de producto, transacciones, ingresos y unidades. Muestra cómo se mueve la venta intradía por categoría.
El día en bloques de 30 minutos comparando Hoy vs Ayer vs Semana pasada vs Mes pasado, a la misma hora. Sirve para ver en vivo si el día va por sobre o bajo lo normal.
La vista base del buscador interno del sitio. Cada fila es una búsqueda: el término, si encontró resultados / redirigió a una categoría / no encontró nada, si vino de una sugerencia, más canal y región (calculados igual que en funnel_base). De aquí salen las tablas datastudio_search_*.
Resumen diario del buscador: cuántas búsquedas, sesiones que buscaron, términos únicos, y cuántas encontraron resultado / redirigieron / no encontraron nada / vinieron por sugerencia. Vista “cosida”: une el histórico (tabla _hist) con el día en vivo.
El histórico materializado del resumen diario del buscador —la parte congelada (días anteriores a hoy) que la vista datastudio_search_diario cose con el día en vivo. Existe para no recalcular sobre eventos crudos en cada consulta.
El detalle por término de búsqueda y día: cuántas veces se buscó cada palabra y con qué resultado. Es la tabla para “ver todas las búsquedas y agruparlas”. Vista cosida (histórico + hoy en vivo).
El histórico materializado del detalle por término —la parte congelada que la vista datastudio_search_termino_diario une con el día en vivo.
Compara cuánto convierten las sesiones que buscaron vs las que no. Clasifica cada sesión en “sin búsqueda”, “búsqueda con resultados” o “búsqueda sin resultados” y mide sesiones, agregados al carro, compras, transacciones e ingresos —cuantifica el costo de las búsquedas sin resultado.
La venta real diaria desde Salesforce/MODGESTION —la cifra autoritativa que valida la gerencia—. Venta con y sin despacho, despacho, y el split 1P vs Marketplace. Vista cosida: histórico materializado + lo de hoy en vivo.
El histórico congelado de la venta real diaria (todo 2025 + lo que va de 2026). La parte que la vista sf_venta_real_diario une con el día en vivo, para no depender de Salesforce en cada consulta.
La venta real por día y departamento, separando 1P de Marketplace. Usa dim_sku para traducir cada producto vendido a su departamento. Vista cosida (histórico + hoy).
El histórico congelado de la venta real por departamento. Parte de la arquitectura lambda (tabla histórica + vista en vivo).
La venta real al corte más fino: área, departamento, sección y familia. Ventas y unidades cuadran al peso con la tabla de departamento; ojo: el conteo de órdenes NO suma hacia arriba (una orden toca varias secciones) —para órdenes por departamento, usar la tabla de departamento.
El histórico congelado de la venta real por sección/familia. Tabla de la arquitectura lambda, clusterizada por departamento y sección.
El rendimiento orgánico (Search Console) por término de búsqueda en Google: impresiones, clics y posición por día, país, tipo de búsqueda y dispositivo. La tabla más grande del dataset (~54M filas). Las consultas raras que Google oculta se agrupan como “(consulta anónima)” para no perder los totales.
El rendimiento orgánico por URL del sitio: impresiones, clics y posición, más la visibilidad en Google Shopping (merchant listings y product snippets). Responde “¿qué páginas traen tráfico de Google?”. ~55M filas.
El encabezado KPI de SEO: por día y tipo de búsqueda, las impresiones, clics, CTR y posición media ponderada. La vista de cabecera para el tablero de Mahi.
El calendario de campañas y metas: cada fila es un evento comercial (Cyber, días de marca, etc.) con sus fechas, el departamento/área al que apunta, la meta de venta web y el foco digital. Sirve para marcar hitos en los gráficos y contrastar lo real contra la meta.