Mediante el muestreo, Google Analytics nos permite generar informes a partir de un subconjunto de datos, en lugar de utilizar todos los datos. De esta forma, Analytics puede calcular los datos del informe de una forma más rápida que si utilizara todos los datos para su generación.
Cuando genera un informe estándar, Google Analytics prepara los datos calculándolos previamente y organizandolos en tablas, obteniendo rápidamente estos datos sin necesidad de acudir al muestreo.
Cuando en ocasiones hemos de modificar un informe estándar, añadiendo segmentos o dimensiones secundarias, por ejemplo. o cuando creamos un informe personalizado con nuevas combinaciones de dimensiones y métricas, tanto desde la interfaz como desde las APIs de informes es cuando Analytics, tras comprobar si puede procesar dicho informe a partir de los datos que se encuentran en las tablas ya procesadas, ve que no es posible acceder a la totalidad de los mismos en tiempo real. Es entonces cuando comprueba cuántas sesiones debería incluir en dicha solicitud y genera el informe con este conjunto de sesiones.
En el caso de ser un número reducido de sesiones a partir de las cuales calcular los datos solicitados, utilizará todas estas sesiones. Pero, en el caso de ser muy elevado el número de las mismas, Google Analytics usará una muestra para generar el informe.
Por ejemplo, si creamos un informe personalizado que incluye las dimensiones ciudad y campaña y las métricas, sesiones y porcentaje de conversiones, que es una combinación de métricas y dimensiones que no está precalculada en ninguna tabla agregada, y elegimos un periodo de tiempo que incluye muchas sesiones, el informe se calculará a partir de una muestra de los datos de ese periodo, siendo el número de las sesiones utilizadas el tamaño de la muestra.
Dicho tamaño puede ajustarse mediante un control en la interfaz de informes de Google Analytics o especificando el tamaño cuando envíes solicitudes a las APIs de informes de GA. En el caso de aumentar el tamaño de la muestra, se incluirán más sesiones en el cálculo, a costa de aumentar también el tiempo de respuesta, sin embargo, al reducir el tamaño de la muestra se incluirán menos sesiones en el cálculo pero el tiempo de respuesta será menor.
Google Analytics establece un número máximo de sesiones que se incluirán para calcular los informes, (50.000 sesiones por día en Analytics estándar y 75.000 sesiones por día en Analytics Premium) en el caso de superar este número se utilizará una muestra de los datos para este cálculo.
Con el objetivo de no sobrepasar el número de sesiones, podemos utilizar periodos de tiempo más cortos a la hora de generar un informe. En el caso de Google Analytics Premium, es posible generar informes personalizados en los que no se utilice el muestreo, incluso en el caso que los datos excedan el límite total a partir del cual se aplicaría el muestreo.
En resumen el muestreo de sesiones es eficaz para disminuir la latencia a la hora de generar un informe y permite a Google Analytics procesar peticiones personalizadas de una manera eficaz. De forma que en un momento concreto puede resolver todas las dudas que puedas tener acerca de lo que está ocurriendo en tu sitio Web o en tu aplicación.