Principal
/
Ayuda con Páginas Web
/
Seguridad
/
¿Cómo bloquear Crawlers y Spam falso de Google Analytics?

¿Cómo bloquear Crawlers y Spam falso de Google Analytics?

Este tutorial abarca los siguientes temas:

Una de las funciones más útiles de Google Analytics ayuda a los webmaster a rastrear las URL de referencia desde las cuales las visitas entran. Desafortunadamente, los spammers usan esta opción para promocionar sus propias páginas web o dañar la imagen de compañías no relacionadas al introducir sus propio dominios como URL de referencia en tus datos de Analytics. Existen dos tipos principales de spam que usan esta función – Ghost spam y Crawler spam.

Qué es Ghost spam y cómo filtrarlo

Los spammers que usan este método no visitan tu sitio. Lo que hacen es usar el Protocolo de Medición de análisis que permite enviar datos directamente a Google Analytics y añadir información maliciosa. Normalmente, se generan códigos de seguimiento aleatorios (UA-XXXXX-1). De esta forma dejan la información falsa en tu cuenta.

Como estos spammers fantasma no saben a qué dominio están enviando la información a Google Analytics, están usando un nombre host que no está relacionado con tu sitio, o no especifican un dominio directamente. Puedes obtener fácilmente una lista de nombres de host válidos que deberían enviar información a tu cuenta.. Normalmente es tudominio.com más todos los subdominios de tu cuenta como blog.tudominio.com o también www.tudominio.com. Para conseguir esta información, entra en Google Analytics > Network y escoge la opción de Nombre del Host como Dimensión Primaria. Después, tienes que crear una lista de los nombres de host usando una expresión regular como:

yourdomain.com|blog.yourdomain.com|www.yourdomain.com

Añade todos los nombres de host que sean de tu propiedad y guárdalos en un archivo de texto. Los necesitaremos a continuación.

Lo siguiente sería hacer clic en el enlace de Admin, seleccionar la cuenta y buscar el sitio en cuestión. Después entrar a Filtros > Añadir Filtro. De esta forma crearemos un filtro nuevo. Nombra el nuevo filtro como “Filtro de Spam Falso”, después selecciona Personalizado en tipo de filtro. Ahora selecciona Nombre del host en el menú desplegable de filtro y haz click en el botón Incluir. Finalmente, añade la lista de los dominios en la casilla de Patrón del filtro. Se recomienda hacer clic en Verificar filtro antes de activarlo. Una vez terminado, verás como la información es eliminada de tus estadísticas. Finalmente haz clic en guardar.

Cómo bloquear Crawlers Spam

Denegar el acceso a los crawlers de spam es más sencillo porque entran directamente a la web. Puedes obtener sus hostnames así como has conseguido los tuyos. Esta vez, copia los que tengan aspecto extraño o con origen desconocido. Después puedes bloquearlos usando la siguiente regla en tu .htaccess:

## STOP REFERRER SPAM
RewriteCond %{HTTP_REFERER} spammybot.com [NC,OR] RewriteCond %{HTTP_REFERER} buysomething.com [NC] RewriteRule .* - [F]

Ten en cuenta de que los archivos .htaccess son sensibles y es necesario separar los puntos con una barra lateral. Por ejemplo, si quieres bloquear spam-bot-site.net, es necesario añadirlo como spam-bot-site.net.

Comparte este artículo