Par

Je me demandais pourquoi à des moments bien précis de la journée, mon site se faisait bombarder de recherches.. Comme ce matin à 6h19... un robot dénommé HMSE_Robot est venu parcourir à la vitesse de l'éclair une centaine de pages sur mon site de Loft Story, ralentissant par le fait même mon serveur.

Je me demandais pourquoi à des moments bien précis de la journée, mon site se faisait bombarder de recherches.. Comme ce matin à 6h19… un robot dénommé HMSE_Robot est venu parcourir à la vitesse de l’éclair une centaine de pages sur mon site de Loft Story, ralentissant par le fait même mon serveur.

Après une brève recherche, il s’avère que le robot HMSE_Robot est un robot coréen qui parcours les pages web à la recherche de contenu à dupliquer. C’est donc un robot de spam qui mérite la mention de ban. J’ai donc banni directement par l’interface de mon fournisseur web les IP suivants: 222.239.220.0 à 222.239.220.255 .

On peut aussi bloquer directement tous ces ip avec 222.239.220.*

Pour ceux qui n’ont pas d’interface bien défini pour bloquer les IP, il faut bidouiller dans le fichier .htaccess ou httpd.conf car ce robot ne respect pas les fichiers Robots.txt …. Voici la marche à suivre:

Bloquer HMSE_Robot par httpd.conf

Pour bloquer un ip directement dans le httpd.conf, ajoutez ce qui suit:

SetEnvIfNoCase User-Agent « HMSE_Robot » robot

Order Allow,Deny
Allow from all
Deny from env=robot

J’ai trouvé cette technique sur un blogue espagnol, El blog de Marcelo Ramos. Voici l’explication de sa technique:

SetEnvIfNoCase -del módulo mod_setenvif- asigna la variable « robot » si el user-agent con el cual se identifica el programa accediendo al servidor Apache es « HMSE_Robot » -no importando mayúsculas y minúsculas- y Deny niega el acceso en ése caso.

En gros, SetEnvIfNoCas assigne la variable « robot » si le user-agent avec lequel s’identifie le programme qui accède le serveur Apache est « HMSE_Robot » (les majuscules et minuscules n’importent pas), et lui refuse l’accès dans ce cas.

Bloquer un IP par le fichier .htaccess

Si la méthode précédente ne peut être utilisée, on peut s’attaquer au fichier .htaccess.

Il suffit d’ajouter les lignes qui suivent dans le fichier .htaccess du site:

RewriteCond %{REMOTE_ADDR} ^222\.239\.220\.*$ [OR]
RewriteCond %{HTTP_USER_AGENT} HMSE_Robot
RewriteRule .? – [F]

J’ai trouvé cette méthode cette fois sur un autre blogue espagnol, SigT, qui lui aussi s’est heurté au même problème.

Dans cet exemple, on bannit le HMSE_Robot par le HTTP_USER_AGENT, et on bannit aussi tous les IPs entre 222.239.220.0 et 222.239.220.255 (222.239.220.*). On peut bannir n’importe quel ip en changeant cette valeur par un le IP à bannir.

 
Foscam - FI8918W Caméra IP motorisée d...
Prix: 149,98€
En promotion: 75,00€
Vous épargnez 50%!
 Kenwood - FP250 - Robot - Multi Pro Comp...
Kenwood - FP250 - Robot - Multi Pro Comp...
Prix: 149,98€
En promotion: 69,00€
Vous épargnez 54%!
 Philips - HR7775/00 - Robot et Centrifug...
Philips - HR7775/00 - Robot et Centrifug...
Prix: 220,00€
En promotion: 143,50€
Vous épargnez 35%!
 Moulinex - QA400GB1 - Robot Masterchef G...
Moulinex - QA400GB1 - Robot Masterchef G...
Prix: 220,00€
En promotion: 172,46€
Vous épargnez 22%!

Tags: , , , , ,

Pour compléter votre lecture

Comment bannir les visiteurs qui ont FunWebProducts comme agent-utilisateur

Comment bannir les visiteurs qui ont FunWebProducts comme agent-utilisateur

Sans m'éterniser sur ce qu'est FunWebProducts, c'est un spyware qui s'installe sur l'ordinateur de ceux qui l'ont téléchargés.. il permet d'afficher des icônes et des émoticones, bref c'est de la merde... et ça nuit à la vitesse du serveur. Donc, une seule solution s'impose: bannir les utilisateurs qui ont ce spyware.

Ne perdez pas votre trafic en provenance de Google Images!

Google Images peut être un sérieux outil de référencement lorsqu'on se donne la peine de documenter ses images pour qu'elle soient disponibles sur le moteur de recherche. Malheureusement, à cause du cadre (frame) qui se retrouve en haut de la page lorsqu'on clique sur une image dans les résultats de Google Images, on perd beaucoup de visiteurs. Mais il existe quelques moyens faciles de contourner le problème.

Comment combiner des images dans un seul fichier PDF sur Windows avec Swift PDF?

Si vous utilisez Windows et que vous avez besoin de fusionner des fichiers images et créer un document PDF avec celles-ci, Swift PDF est le logiciel qu'il vous faut! Voici un tutoriel qui vous explique comment s'en servir.

How to ban FunWebProducts User-agent

How to ban FunWebProducts User-agent

FunWebProducts, is a spyware which install automatically on the computer of those who downloaded it... and it kills web server speed! So, there's only one solution: to ban the users with the user-agent FunWebProducts.

Comment convertir des .PDF complexes en format Word .DOC ?

Comment convertir des .PDF complexes en format Word .DOC ?

Voici une solution efficace qui vous permettra de convertir gratuitement des documents PDF complexes en format Word .DOC ou .RTF. Convertissez ainsi des documents PDF contenant des tableaux ou des images qui pourront être modifiés dans Word par la suite.

Laissez un commentaire





Merci de vérifier votre orthographe avant de publier votre commentaire.