Cómo funciona el tarpitting (retraso de tráfico de red)

¿Cómo funciona el tarpitting (retraso de tráfico de red)?


Inicio » BotDefender » Aquí

El tarpitting es uno de los dos métodos de protección ofrecidos por BotDefender. En pocas palabras, el tarpitting consiste en obligar a todos los visitantes (tanto humanos como bots) a descargar un pequeño archivo adicional de los servidores de BotDefender para poder ver los precios en la página en la que se originan. Esta página explica en más detalle cómo funciona el tarpitting.

Flujo de solicitudes web

Image

Cuando un cliente visita una página web, su navegador envía una solicitud (web) a la tienda en línea (1), que devuelve el HTML (3) que será representado (es decir, mostrado) del lado del cliente.

En el abordaje habitual sin protección, el HTML devuelto al cliente contiene todos los precios. Sin embargo, si el cliente no es un humano sino un robot, los precios se presentan listos para ser extraídos del HTML, un proceso conocido como extracción de datos (scraping).

Cuando BotDefender está instalado, la tienda en línea no devuelve los precios directamente. En cambio, los precios primero son reemplazados por códigos auxiliares, es decir, fragmentos de HMTL autocontenidos. Estos códigos auxiliares son solicitados (2) por la tienda en línea misma llamando a la API de BotDefender, que devuelve los códigos auxiliares.

Finalmente, cuando el cliente muestra el HTML protegido, el código auxiliar envía una pequeña solicitud web hacia los servidores de BotDefender (4) para obtener una parte de información adicional necesaria para mostrar correctamente los precios.

Identificación de robots

Siguiendo esta configuración, para poder acceder a los precios, cada visitante, humano o robot, tiene que solicitar una parte de contenido de BotDefender. Esto le da la oportunidad a BotDefender de denegar la información a visitantes abusivos.

La tecnología exacta utilizada por Lokad para distinguir a los humanos de los robots no se divulga adrede, porque esto ayudaría solo a los atacantes (es decir, a las personas que ejecutan los extractores de datos) a diseñar robots más efectivos en sus capacidades para evadir nuestra tecnología de detección.

Preguntas técnicas frecuentes

¿Afectará mi clasificación de Google? Absolutamente no. Google continúa indexando sus páginas (con excepción de los precios, que ya no son visibles para el invasor), pero este aspecto es irrelevante para la optimización para motores de búsqueda (SEO). Técnicamente, uno de nuestros primeros pasos para proteger sus precios es que el subdominio de BotDefender bdapi.lokad.com está marcado con Robots.txt, lo que deshabilita a los invasores, incluido Google, pero solo afecta un segmento muy específico de su sitio web, es decir, a los precios, y no al resto de sus páginas.

¿Hará que disminuya la velocidad de procesamiento de mi tienda? No. Si bien el esquema anterior delinea una llamada (Nro. 2) desde las tiendas en línea a BotDefender, en la práctica, el código auxiliar devuelto por BotDefender es cacheado, es decir, localmente preservado en la memoria de su servidor durante un período de tiempo relativamente prolongado; sugerimos 24 hs. Así, en la práctica, para la gran mayoría de páginas servidas por su tienda, no se realizará ninguna solicitud a BotDefender.

¿Hará que la experiencia del usuario sea más lenta? Muy poco, y no más de lo que haría un rastreador web (como Google Analytics). El código auxiliar en sí mismo más su contraparte en el servidor de BotDefender pesan menos de 1 kB, menos que una imagen pequeña.

`¿Es posible detener a un humano? Sí, PERO esto es también así para la búsqueda de Google. Simplemente intente ejecutar manualmente miles de búsquedas web en Google.com y, en pocas horas (garantizado, es un ejercicio un tanto tedioso), será bloqueado temporalmente por Google. En pocas palabras, si un visitante comienza a comportarse como un robot, termina siendo marcado como un robot. Sin embargo, con excepción de usuarios muy excéntricos, estas limitaciones jamás se disparan.