Blog Kukoa
Dirección técnica en estrategias de Márketing Digital

Como evitar SPAM en Google Analytics

Normalmente asociamos la palabra Spam a los emails, las empresas proveedoras de servicios de internet, hosting o envío de newsletters, destinan fondos, muchos fondos, para la lucha contra el Spam de correo electrónico, no es en vano, si tienes un problema de Spam, puedes terminar con un servidor en lista negra y del pozo de blacklists es muy difícil de salir.

Todos los servicios de internet son susceptibles de sufrir Spam, desde que en 1970 Monthy Python dio alas al término, los vikingos avanzan fuerte y nos los vamos encontrando en más servicios más allá del email.

Como por ejemplo en Google Analytics.... Si, si, lo has leído bien Spam en Google Analytics: Entre las métricas que analizamos conjuntamente con nuestros clientes en los seguimientos de comportamiento y posicionamiento que realizamos de forma regular, vamos viendo incremento de Spam en fuentes de campaña y nombres de hosts.

No te creas que tienes muchas visitas: tienes spam

Quizá se puede llegar a pensar, bueno, no pasa nada con las visitas que nos vienen de buttons-offer o trafficmonetizer, las desestimamos y listo… error si quieres hacer las cosas bien o si quieres mantener la estrategia de la empresa alineada con el seguimiento de usuarios, dado que es una fuente de falsos datos que puede llegar a tumbar tu estrategia en internet.

Es fundamental actuar cuanto antes y eliminar esta fuente de falsos positivos que pueden influenciar en las decisiones de estrategia digital que tomen las empresas, entre otras métricas, el spam en Google Analytics incide en:

Altas tasas de rebote y bajo promedio de tiempo medio en página.

Atributos (not set) en varias dimensiones: Ciudad, País, Nombre de Host…

No obstante, quizá el que tiene más afectación en análisis de seguimiento es el Spam en las fuentes de referencia. Mediante métodos de Spam Fantasma y Rastreadores de Referencia Spam podemos ver cómo nos van aportando confusión en las métricas que analizamos entorpeciendo el análisis de fuentes de referencia válidas.

¿Cómo combatir el Spam de Referals?

No es complicado, simplemente hay que ir revisando periódicamente y realizar ajustes pertinentes. Primero necesitamos aislar nuestro spam y actuar de forma dual mediante filtros y a nivel de .htacces:

  • Filtros por fuentes de referencias: Eliminaremos Spam Fantasma.
  • Bloqueo de acceso mediante .htaccess: Eliminaremos Rastreadores.

Hay otros métodos como incluir nombres de host válidos, pero quizá con esta metodología nos podemos pasar de bloqueo y eliminar datos de hosts que son válidos, como traductores, servicios de caché, pero sobretodo en clientes en constante creación de subdominios o páginas asociadas, dado que las referencias de páginas asociadas son datos válidos.

En Kukoa estamos obteniendo resultados filtrados de forma fiable mediante estas dos técnicas obteniendo datos objetivos y fiables.

Filtro de Referrals

Filtro por fuentes de referencia: Sólo eliminaremos registros para Spam Fantasma

Simplemente se trata de incorporar el listado de referencias spam en filtros mediante expresión regular (REGEX) de GA, de éste modo creamos un filtro de campaña excluyente para:

offer|free\-|share\|mercedes|buy|cheap|semalt|googlsucks|benz|sl500|hulfington|buttons| darodar|pistonheads|motor|money|blackhat|backlink|webrank|seo|phd| crawler|anonymous|\d{3}.*forum|porn|webmaster|flipboard|fl\.ru| mbca|ahrefs|game|\.io|web|videos

Dado que los filtros se limitan a 255 carácteres, deberemos ir construyendo múltiples filtros a medida que tengamos que incorporar más referencias.

Aqui link al archivo de Referrals Spam de Kukoa. (adaptado de ohow.co)

Filtro por htaccess: Sólo eliminaremos registros para Rastreadores.

Usando los parámetros siguientes, podemos bloquear el acceso a los rastreadores no deseados:

RewriteCond %{HTTP_REFERER} nombre-host-1\.net [NC,OR]

RewriteCond %{HTTP_REFERER} nombre-host-2\.com [NC]

RewriteRule .* - [F]

Mantenimiento de datos y limpieza constante

Es importante ir realizando mantenimiento de referencias Spam en las métricas para evitar decisiones incorrectas, para ello debemos de ir monitorizando los nuevos rastreadores y Spam fantasma que nos van apareciendo para tener limpios los registros y comprobar la correcta aplicación de las soluciones.

Estos métodos nos dan solución una vez aplicados, no obstante, de forma retroactiva para análisis de datos anteriores deberemos los filtros en los segmentos de usuarios.

google-graph

Gráfico de datos filtrados, en azul todas las sesiones, en naranja sólo sesiones válidas.

 

Tomemos por ejemplo este cliente que, una vez aplicado los segmentos tenemos cerca de 4.500 sesiones procedentes de fuentes Spam, cualquier precipitación en el seguimiento de usuarios seria incorrecta sin una limpieza de datos, pudiendo derivar en costes innecesarios para combatir datos falsos.

 google-filtre-1

google-table

Sin una limpieza de datos inválidos, las decisiones estratégicas pueden verse gravemente afectadas, hay que prestar atención a las dimensiones más afectadas como rebote, nuevas sesiones y duraciones medias.

 

Sólo analizando los datos correctos de nuestros usuarios podremos tomar las decisiones adecuadas de usabilidad e interés para realizar estrategias de comunicación y fidelización de alto impacto y relevancia incrementada.

Es por ello que en Kukoa siempre recomendamos realizar seguimientos periódicos de estadísticas de usuario no sólo para detectar comportamientos de Spam, sino también para anticiparse a los intereses de los usuarios.