Tu contenido es un bien preciado. Sea mejor o peor es tuyo y no gusta ver como otros se llevan el crédito. Pero "scrapear" o copiar contenido de otros es algo muy habitual en Internet. Se ha hecho desde siempre, se hace actualmente y se seguirá haciendo.

En lo que respecta al SEO que te copien es una faena. Ya no solo es que al Panda no le gusta ver el mismo bambu en varias páginas sino que perfectamente se puede dar el caso que tu contenido posicione mejor en el sitio web de otro.

Preocúpate por tu contenido: vigílalo, protégelo y reclámalo.

Como buscar quien te copia.

La manera mas fácil de encontrar otros sitios web que copian tu contenido es buscarlo en Google. Selecciona algún contenido tuyo que sea de bastante interés o que haya tenido mucho exito entre tus lectores y pégalo en la caja de búsqueda. Si no tienes suerte seguramente encuentres varias copias.
Busca otros sitios web relacionados con el tuyo o con el tema del contenido que crees que pueden haberte copiado y echa un vistazo. Mira en foros especializados y en Taringa. Este sitio web argentino es famoso por replicar contenido de otros; regístrate por que algunos contenidos están marcados como privados y no podrás verlos si no lo haces.

Hay herramientas que te pueden facilitar esta tarea. Por ejemplo Copyscape y Duplichecker aunque hay otras muchas.

Y un último truco: puede que en tus textos originales te hayas enlazado a ti mismo y que en la copia ese enlace permanezca. Viendo quien te enlaza puedes encontrar a quien te copia. Puedes usar Google para saber los sitios web que te enlazan. Busca link:http://www.misitio.com. También Google Webmaster Tools te muestra los enlaces externos. O puedes usar herramientas específicas como Majestic SEO y Ahrefs.

Como evitar que te copien más.

Ya sabes que han estado copiandote. Tienes que intentar que no sigan haciendolo. No es un tema fácil; si no consigues evitarlo al menos intenta ponérselo dificil.

Habrá casos en que estés siendo victima de un copiado manual, es decir, sin ayuda de herramientas; además normalmente un copiado manual no suele ser masivo.

Un copiado manual se puede dificultar pero impedirlo totalmente es complicado. Las medidas que puedes tomar, además, afectarán a la usabilidad de tu sitio. Por ejemplo:

  • desabilitar la función de botón derecho
  • deshabilitar la posibilidad de seleccionar texto.

Éstas dos medidas puede que disuadan al copiador pero son un trastorno para el lector bien intencionado. Y el que quiera copiar tu texto siempre tiene la opción que ver el código fuente de la página y limpiarlo de etiquetas HTML con herramientas como ésta.

Los copiados automatizados son más problemáticos ya que hay muchísimos modos distintos de hacerlo. Si tienes la opción de revisar los logs del servidor web puedes intentar hallar algún patrón en las conexiones y diferenciar a los visitantes legítimos de bots y scripts que vienen a por tu contenido.

Mediante el archivo .htaccess puedes bloquear el acceso a tu web desde ciertas IPs o nombres de dominio:

  • bloquear IPs:

      Order Deny,Allow
      Deny from 10.10.10.10
    
  • bloquear dominios:

      RewriteEngine on
      RewriteCond %{HTTP_REFERER} ^http(s)?://(www\.)?www.dominio.com.*$ [NC]
      RewriteRule .* - [F,L]
    
  • bloquear en robots.txt:

      User-agent: Bot-UserAgent
      Disallow: /
    

En muchos casos se aprovecha que publicas tu contenido mediante RSS para tener acceso a él de un modo muy fácil. Desactivar la publicación del RSS quizá sea un poco radical. Si podrías retrasarlo unas horas y así dar a tu sitio web la oportunidad de posicionarse primero por ese contenido. Otra opción es cambiar la URL que viene por defecto; quiza el script automático pase de largo si no encuentra donde esta el RSS.

No publiques via RSS el contenido completo, publica solo una introducción y un enlace para leer el resto.

Y exagerando al máximo, tambien se podría mediante programación hacer que el servidor web diera un contenido distinto en función del Useragent que intente acceder al RSS.

Por supuesto, algo básico que tienes que hacer, sea como sea que intenten copiarte, es configurar tu Authorship para que Google asocie automáticamente a tu web con tus contenidos. Échale un vistazo a esta guia para saber como se hace eso.

Como borrar el contenido duplicado.

Ahora que ya sabes que te copian y has tomado medidas para que no lo hagan más toca eliminar de Internet tu contenido duplicado.

Contacta con el administrador.

Ya que vas a fastidiar un poco al que te copia intenta de primeras contactar con el educadamente. Quizá se preste de buenas a retirar el contenido. Todas las web suelen tener alguna sección de contacto, si no hay siempre puedes recurrir a los comentarios o mensajes internos; incluso puedes consultar el whois y enviar un correo a la dirección de email que se usó para registar el dominio.

Pónselo facil. Mándale la URL del contenido original y la URL donde está duplicado. Explícale claramente que ese contenido fue creado por ti y que quieres que elimine la copia. Si tienes oportunidad puedes pedir a un abogado que te redacte un texto con un tono mas legal.

Contacta con Google.

Haz saber a Google quien está copiando contenido. Para ello han puesto a tu disposición la herramienta Scrapper Report.

Además puedes solicitar que se elimine de las SERPS los resultados que contengan la copia de tus contenidos. Google te indica aquí como reclamar los derechos sobre tu contenido. Después puedes comprobar el resultado de cada solicitud en el panel de control de eliminación.

Y vuelta a empezar.

Seguirán surgiendo nuevos modos de copiar y de evitar ser copiado; también habrá muchos que no conozco. Esto es una tarea sin fin.