Los principios básicos del diseño y desarrollo amigable para los motores de búsqueda.

Los motores de búsqueda están limitados en su forma de rastrear la web e interpretar el contenido. Una página web no siempre tiene el mismo aspecto que puede tener para ti o para mí que el que puede tener para un motor de búsqueda. En esta sección nos centraremos en aspectos técnicos específicos a la hora de construir (o modificar) páginas web de modo que estén estructuradas de la misma forma tanto para los motores de búsqueda como para los visitantes humanos. Este es un excelente capítulo de la guía SEO para compartir con sus programadores, arquitectos de contenido y diseñadores, de modo que todas las partes implicadas en un diseño web y la construcción de un sitio online puedan planificar y desarrollar un sitio amigable para los motores de búsqueda.

Contenido indexable

Con el fin de aparecer en los listados de los motores de búsqueda, el contenido más importante debería estar en HTML, en formato de texto. Las imágenes, los archivos Flash, los applets de Java, y cualquier otro contenido que no sea de texto, son a menudo ignorados o devaluados por las arañas de los motores de búsqueda a pesar de los avances tecnológicos en el ámbito del rastreo. La forma más sencilla de asegurarse que las palabras y las frases que muestra a sus visitantes sean visibles para los motores de búsqueda, es colocarlos en la página en texto HTML.

En cualquier caso, otros métodos más avanzados están disponibles para aquellos que requieren formatos o estilos visuales más sofisticados.

  1. A las imágenes con formato gif, jpg o png, se les puede asignar “atributos alt” en HTML, facilitando a los motores de búsqueda una descripción sobre el contenido visual.
  2. Las cajas de búsqueda pueden ser suplementadas con enlaces de navegación rastreables.
  3. Los contenidos alojados en archivos Flash o los plug-in Java pueden ser suplementados con texto en la página.
  4. Los vídeos y el audio deberían acompañarse de una transcripción si las palabras y las frases utilizadas están destinadas a ser indexadas por los buscadores.

Mirando como un motor de búsqueda

Muchos sitios web tienen problemas significativos con el contenido indexable, por lo que una doble comprobación bien merece la pena. Si utiliza herramientas como Google's cache, SEO-browser.com, o MozBar, podrá ver qué elementos de su contenido son visibles e indexables para los motores de búsqueda. ¿Ve la diferencia?

¡Vaya! ¿Así es como se nos ves?

Usando la herramienta Google cache, podremos comprobar que para un motor de búsqueda, la página de inicio de JugglingPandas.com no contiene toda esa riqueza de información que nosotros vemos. Esto hace que para los motores de búsqueda sea más difícil interpretar la relevancia.

 comparacion-de-web
Haga clic sobre la imagen para ampliarla

“¡Voy a comprobar ahora mismo mi blog a monos combatientes!”

blog-de-monos
Haga clic sobre la imagen para ampliarla

¿Tantos monos para una sola línea principal de texto?

¿Qué ha pasado con toda la diversión?

Vaya, a través de Google cache, podemos ver que la página es un desierto estéril. Ni siquiera hay texto que indique que se trata de una página sobre monos combatientes. Este sitio está completamente elaborado en Flash, pero lamentablemente, esto significa que los motores de búsqueda no pueden indexar ningún contenido de texto, o incluso los enlaces de los juegos individuales de la web. Sin ningún texto HTML, ésta página lo pasará muy mal a la hora de posicionarse en los resultados de búsqueda.

Es de sabios no solo comprobar que haya contenido de texto sino también utilizar herramientas SEO para comprobar doblemente que las páginas que está Vd. construyendo son visibles para los motores de búsqueda. Esto es aplicable a sus imágenes y, como veremos a continuación, a sus enlaces.

Estructura de enlaces rastreable

Así como los motores de búsqueda necesitan poder ver el contenido para poder listar las páginas en sus enormes índices basados en palabras clave, también necesitan poder ver los enlaces para poder encontrar el contenido. Un estructura de enlaces rastreable (una que permita a las arañas navegar por los caminos de un sitio web) es vital para poder encontrar todas las páginas de un sitio web. Cientos de miles de sitios cometen el error fatal de estructurar la navegación por su web de modo que los motores de búsqueda no pueden acceder, impidiendo así conseguir que sus páginas sean listadas en los índices de los motores de búsqueda.

A continuación ilustramos como puede ocurrir este problema.

enlaces

En el ejemplo de arriba, la araña de Google ha alcanzado la página A y ve como enlaza hacia las páginas B y E. Sin embargo, aunque las páginas C y D puedan ser páginas importantes del sitio, la araña no tiene forma de llegar a ellas (o incluso saber que existen). Esto es porque no hay enlaces directos y rastreables que apunten hacia estas páginas. En lo que concierne a Google, pueden incluso no existir. Un gran contenido, un buen uso de palabras clave o un buen marketing, no servirán de nada si las arañas de búsqueda no pueden alcanzar dichas páginas primero.

Anatomía de un enlace

enlace

Haga clic en la imagen para ampliarla

En la imagen superior, la etiqueta <a indica el comienzo de un enlace. Las etiquetas de un enlace pueden contener imágenes, texto u otros objetos, de los cuales todos proveen un área cliqueable en la página que los usuarios utilizan para desplazarse hacia otra página. Este es el elemento original de navegación en Internet (el hiperenlace). La referencia del enlace le dice al navegador (y a los motores de búsqueda) hacia donde apunta el enlace. En este ejemplo, la URL. http://www.estudiasonavegas.com está referida. Después, la parte visible para los usuarios del enlace, llamada “texto ancla” (anchor text en inglés) en el mundo SEO, describe la página a la que apunta el enlace. La página de destino trata sobre títulos náuticos y por ello utilizo el texto ancla “Títulos náuticos”. La etiqueta </a> cierra el enlace, para que los elementos posteriores de la página no tenga asignados los atributos del enlace.

Este es el formato más básico de un enlace (y resulta eminentemente comprensible para los motores de búsqueda). Las arañas saben que deberán añadir este enlace al gráfico de enlaces de la web, utilizarlo para calcularlas variables de consultas independientes (como el Page Rank de Google), y seguirlo para indexar los contenidos de la página referida.

Veamos algunos motivos habituales por los que una página puede no ser alcanzada por los motores de búsqueda.

  • Formularios requeridos
    • Si requiere a los usuarios que cumplimenten un formulario online antes de poder acceder a ciertos contenidos, tiene bastantes posibilidades de que los motores de búsqueda jamás vean las páginas protegidas. Los formularios pueden incluir una contraseña para el logueo o una encuesta en toda regla. En ambos casos generalmente las arañas de búsqueda no intentarán “enviar” formularios y, pues, cualquier contenido o enlaces que pudieran ser accesibles a través del formulario resultará invisible para los motores de búsqueda.
  • Enlaces en Javascript no analizable.
    • Si Utiliza Javascript para los enlaces, es posible que se encuentre con que los motores de búsqueda o bien no rastrean u otorgan dan muy poco peso a los enlaces incrustados. El HTML standard debería reemplazar el Javascript (o al menos acompañarlo) en cualquier página que desee que las arañas rastreen.
  • Enlaces que apuntan páginas bloqueadas por la meta etiqueta robots o el robots.txt
    • La meta etiqueta robots y el archivo robots.txt permiten al propietario de un sitio web restringir el acceso de las arañas de búsqueda en una página. Debe quedar sobre aviso y tener muy presente que muchos webmaster han utilizado estas directivas de forma no intencionada en un intento de bloquear robots piratas, con el único resultado de que los motores de búsqueda han dejado de rastrear su web.
  • Los Frames y los I-Frames
    • Técnicamente, los enlaces tanto en Frames como e I-Frames son rastreables pero ambos presentan cuestiones estructurales para los motores en términos de organización y seguimiento. A menos que sea Vd. un usuario avanzado con amplios conocimientos de cómo los motores de búsqueda indexan y siguen los enlaces en los Frames, lo mejor es que se mantenga alejado de ellos.
  • Los robots no buscan formularios.
    • Aunque esté relacionado directamente con el aviso anterior sobre formularios, es un problema tan común que merece la pena mencionarlo. Algunos webmaster creen que si colocan una caja de búsqueda en su sitio web, entonces los motores de búsqueda serán capaces de encontrar cualquier cosa que los usuarios puedan buscar. Desgraciadamente, las arañas no efectúan búsquedas para encontrar contenido y, por consiguiente, millones de páginas quedan ocultas detrás de paredes inaccesibles, condenadas al anonimato hasta que una página rastreada las enlaza.
  • Enlaces en Flash, Java, u otros plug-in.
    • Los enlaces incrustados en el enlace del Panda (ejemplo de arriba) es una perfecta ilustración de este fenómeno. Si bien docenas de pandas son listados y enlazados en la página principal del panda, ninguna araña de búsqueda puede alcanzarlos a través de la estructura de enlaces del sitio, convirtiéndolos en invisibles para los motores de búsqueda (e irrecuperables por los usuarios que hacen una consulta de búsqueda).
  • Enlaces en páginas con cientos o incluso miles de enlaces.
    • Los motores de búsqueda solo rastrearán cierto número de enlaces en una página determinada, no una infinidad de enlaces. Esta restricción es necesaria para luchar contra el spam y manipulación de rankings. Las páginas con cientos de enlaces insertados en ellas corren el riesgo de que no se rastree muchos de esos enlaces ni sean indexados.

Si Vd. evita estas trampas, tendrá un HTML limpio y rastreable que permitirá a las arañas de búsqueda acceder con facilidad al contenido de su página.

Rel=”nofollow”

Rel=”nofollow” puede ser utilizado con la siguiente sintaxis

<a href="http://www.pymenetworks.es" rel="nofollow">Diseño web</a>

Los enlaces pueden tener muchos atributos aplicados en ellos, pero los motores de búsqueda los ignoran casi todos, con la excepción importante de la etiqueta rel=”nofollow”. En el ejemplo de arriba, al añadir el atributo rel=”nofollow” a la etiqueta del enlace, le hemos dicho a los motores de búsqueda que nosotros, los propietarios de la web, no queremos que este enlace sea interpretado como el normal, “voto editorial”.

Nofollow, interpretado de forma literal, indica a los motores de búsqueda que no sigan un enlace (si bien algunos lo hacen de todas formas). La etiqueta nofollow surgió como un método para ayudar a combatir los contenidos automatizados en blogs, libros de visitas, y la inserción de enlaces spam (leer más sobre el lanzamiento de la etiqueta aquí), pero ha ido cambiando con el tiempo para convertirse en una forma de decir a los motores de búsqueda que descuente cualquier valor que el enlace hubiera podido transmitir en condiciones normales. Los enlaces etiquetados con un nofollow son interpretados de forma ligeramente diferente por cada uno de los motores de búsqueda, pero está claro que no transmiten tanto peso como los enlaces normales “follow”.

Google

Google indica que en la mayoría de los casos no siguen los enlaces nofollow, ni tampoco transmiten estos enlaces PageRank o valores de texto ancla.

Esencialmente, el uso de los enlaces nofollow, hace que quitemos los enlaces destino de nuestro gráfico total de la web. Los enlaces nofollow no transportan peso y son interpretados como texto HTML (como si el enlace no existiera). Dicho esto, mucho webmaster piensan que incluso un enlace nofollow proveniente de un sitio con mucha autoridad, como Wikipedia por ejemplo, podría interpretarse como un signo de confianza.

Bing y Yahoo!

Bing, que alimenta los resultados de búsqueda de Yahoo, tiene también establecido que no incluyen los enlaces nofollow en su gráfico de enlaces. En el pasado, también establecieron que los enlaces nofollow pueden seguir siendo usado por sus rastreadores como una forma de descubrir nuevas páginas. Así que mientras “pueden” seguir los enlaces, no los tendrán en cuenta como un factor positivo en el ranking.

¿Son malos los enlaces nofollow?

Si bien no transmiten tanto valor como sus hermanos “follow”, los enlaces nofollow son una parte natural de la diversa variedad de perfiles de enlaces. Un sitio web con gran cantidad de enlaces entrantes acumulará muchos enlaces nofollow, y no es una cosa mala. De hecho, RankingFactors de Seomoz nos muestra como sitios con ranking alto tienden a tener un porcentaje mayor de enlaces entrantes nofollow que los sitios con un ranking inferior.

Uso de las palabras clave y objetivos

Las palabras claves son fundamentales en el proceso de búsqueda; son las piedras angulares del lenguaje y de la búsqueda. De hecho, toda la ciencia de recuperación de información (incluidos los motores de búsqueda como Google) está basada en palabras clave. A medida que los motores rastrean e indexan los contenidos de las páginas en toda la web, guardan el rastro de las páginas en índices basado en palabras clave. De esta forma, en vez de guardar 25 billones de páginas web en una sola base de datos, los motores de búsqueda, tienen millones y millones de pequeñas bases de datos, cada cual centrada en una palabra clave o frase en particular. Esto hace que sea mucho más rápido para los motores recuperar los datos que necesitan en una mera fracción de segundo.

Obviamente, si quiere que su página tenga una oportunidad de posicionarse en los resultados de búsqueda por la palabra “perro”, es aconsejable asegurarse que la palabra “perro” sea parte del contenido indexable de su documento.

El dominio de las palabras clave

Las palabras clave dominan nuestras búsquedas e interacciones con los motores de búsqueda. Por ejemplo, un patrón de consulta habitual puede ser algo parecido a esto:

Cuando se realiza una búsqueda, los motores buscan coincidencias en las páginas a recuperar basadas en las palabras introducidas en la caja de búsqueda. Otros datos, como el orden de las palabras (“barcos de guerra” o “guerra de barcos”), la ortografía, la puntuación y las mayúsculas de dichas palabras clave proveen información adicional que los motores de búsqueda utilizan para recuperar correctamente las páginas adecuadas y las posiciona.


palabras-clavePara ayudar a acometer esto, los motores de búsqueda miden la forma en que las palabras son utilizadas en las páginas para ayudar a determinar la “relevancia” de ese documento en particular para una consulta. Una de las mejores maneras de “optimizar” el posicionamiento de una página es asegurarse que las palabras clave son utilizadas principalmente en los títulos, el texto y los metadatos.

Generalmente, cuando más especifique sus palabras clave, más posibilidades tendrá de posicionarse basado en una competencia menor. El mapa gráfico de la izquierda muestra la relevancia de un término tan amplio como “libro” (book) comparando con el título “cuento de dos ciudades” (Tale of Two Cities). Observe que mientras que hay muchos resultados (tamaño del país) para el término amplio, hay muchos menos resultados y, por tanto, competencia para el resultado específico.

El abuso de las palabras clave

Desde el amanecer de la búsqueda online, la gente ha abusado de las palabras clave en un intento inútil de manipular los motores de búsqueda. Esto implica el “relleno” de palabras clave en el texto, las url, las meta etiquetas y los enlaces. Desgraciadamente, esta táctica casi siempre hace daño a su sitio.

En los primeros años, los motores de búsqueda confiaron en el uso de palabras clave como la primera señal de relevancia, al margen de como las palabras clave estaban siendo utilizadas. Hoy en día, aunque los motores de búsqueda son incapaces de leer y comprender el texto tan bien como los humanos, el uso de máquinas de aprendizaje las ha ayudado a acercarse a este ideal.

La mejor práctica es utilizar sus palabras clave de forma natural y estratégicamente (hablaremos más de ello más abajo). Si su página apunta hacia la palabra clave “Torre Eiffel” entonces debería incluir contenido sobre la Torre Eiffel en sí misma, la historia de la torre, o incluso hoteles recomendados en París. Por otro lado, si se limita a espolvorear una página con la palabra clave “Torre Eiffel” con contenido irrelevante, como una página de bodas caninas, entonces sus esfuerzos por posicionar por “Torre Eiffel” le conducirán a una ardua y difícil batalla.

Optimización On-Page

Dicho esto, el uso de palabras clave y los objetivos siguen siendo parte de los algoritmos de posicionamiento de los motores de búsqueda, podemos proponer algunas “prácticas” efectivas para el uso de palabras clave en la creación de páginas y llevarlas a un punto cercano a la optimización. En SEOmoz, podemos encontrar un estudio resultado de múltiples pruebas en el que podemos ver un gran número de resultados de búsqueda y cambios basados en diferentes técnicas de uso de palabras clave. Cuando trabaje en uno de sus sitios web, este es el proceso que recomendamos:

  • Utilice la palabra clave en la etiqueta título al menos una vez. Trate de situar dicha palabra clave tan cerca del principio de la etiqueta título como le sea posible. Seguiremos hablando de la etiqueta título más adelante en este capítulo.
  • Una vez de forma destacada en la parte superior de la página.
  • Al menos dos o tres veces, incluyendo variaciones, en el cuerpo del texto de la página; en ocasiones, algunas más si el contenido del texto es grande. Puede creer obtener valor adicional utilizando más veces la palabra clave o sus variaciones, pero, según nuestra experiencia, añadir más densidad de un término o frase tiende a tener un impacto muy pequeño o nulo en el posicionamiento.
  • Al menos una vez en el atributo alt de una imagen de la página. Esto no solo ayuda a la búsqueda de la web sino también a la búsqueda de imágenes, que en ocasiones aporta tráfico de alto valor.
  • Una vez en la URL. Reglas adicionales para las URL y palabras clave serán mencionadas más adelante en este capítulo.
  • Al menos una vez en la etiqueta de meta descripción. Observe que la etiqueta de meta descripción NO es utilizada por los motores para posicionar, pero puede atraer “clics” de los usuarios en los resultados de búsqueda, si bien es el “snippet” (parte reusable del código fuente) de texto usado por los motores de búsqueda.

El mito de la densidad de las palabras clave

La densidad de las palabras clave no forma parte de los modernos algoritmos de posicionamiento como ha demostrado el Dr. Edel García.

Si dos documentos Doc1 y Doc2, consisten en 1000 términos (t = 1000) y repiten un término 20 veces (ft = 20), entonces un analizador de densidad de palabras clave le indicará que para ambos documentos la Densidad de Palabras Clave (DPC) DPC = 20 / 1000 = 0.020 (o 2%) para ese término. Se obtienen idénticos resultados si tf = 10 y t = 500. Evidentemente, un analizador de palabras clave, no establece qué documento es más relevante. Un análisis de densidad o la proporción de densidad de la palabra clave no nos dice nada sobre:

  • La distancia relativa entre palabras clave en un documento (proximidad)
  • Donde están situados los términos en el documento (distribución)
  • Frecuencia de co-citación entre los términos (co-sucesos)
  • El tema principal, el tema en particular y los temas secundarios (cuestiones en el tema) de los documentos.

Conclusión:

La densidad de las palabras clave no tiene que ver con el contenido, la calidad, la semántica y la relevancia.

¿Qué aspecto debería tener una página web con una densidad óptima? Una página optimizada para la frase “zapatillas deportivas” debería ser algo así como:

zapatillas

Etiquetas de título <title>

El elemento título de una página está llamado a ser una descripción concisa y exacta del contenido de una página. Es de suma importancia tanto para la experiencia de los usuarios como para la optimización en motores de búsqueda.

Dado que las etiquetas title son tan importante para la optimización en buscadores, el buen uso de las buenas prácticas para este atributo le reportará enormes beneficios y recogerá muchos frutos en términos SEO. Las recomendaciones de abajo cubren los aspectos críticos para optimizar las etiquetas title para los motores de búsqueda y las metas de utilidad.

Tenga en cuenta la longitud

Los motores de búsqueda muestran solo los primero 65-75 caracteres de una etiqueta title en los resultados de búsqueda. (Después de llegar a esta cifra muestran puntos suspensivos (…) para indicar que la etiqueta title ha sido cortada) Este límite también es aplicable a la mayoría de los sitios sociales así que atenerse a este límite es por lo general una buena idea. Sin embargo, si apunta hacia múltiples palabras clave (o una palabra clave especialmente larga dentro de una frase) y sabiendo que son esenciales en la etiqueta título para posicionar, puede ser aceptable sobrepasar el límite.

Ponga las palabras clave al principio

Cuanto más cerca estén las palabras clave del comienzo de la etiqueta title, más útiles serán para posicionar y más posibilidades tiene de que un usuario haga clic en ellas en los resultados de búsqueda.

Inserción de marca

En PYME Networks, nos encanta terminar cada etiqueta title con una mención de la marca ya que esto ayuda a incrementar el valor de la marca y mejorar el ratio de clics por impresión (CTR - click-through-rate) entre las personas a las que le gusta y están familiarizados con la marca. En ocasiones merece la pena colocar su marca al principio de la etiqueta title, como por ejemplo en su página principal. Si bien las palabras al principio de la etiqueta title llevan más peso, no pierda de vista aquello para lo que quiere posicionarse.

Considere la legibilidad y el impacto emocional

Las etiquetas title deben ser descriptivas y legibles. Crear una etiqueta title atractiva aumentará las visitas desde los resultados de búsqueda y puede ayudar a que los visitantes inviertan en su web. Así pues, es importante pensar solo en la optimización y en el uso de palabras clave, sino también en la experiencia del usuario. La etiqueta title es la primera interacción de un visitante nuevo con su marca y debería transmitir la mejor impresión posible.

Meta Etiquetas

Las etiquetas Meta estaban originalmente diseñadas para proveer a los proxy información sobre el contenido de una web. Muchos de las etiquetas Meta están listados más abajo, con una descripción sobre su uso.

Meta Robots

Las etiquetas Meta Robots pueden ser utilizadas para controlar la actividad de las arañas de búsqueda (para los principales motores) en un nivel de la página. Existen muchas maneras de utilizar los meta robots para controlar como los motores de búsqueda tratan una página.

  • Index/noindex dice a los motores si la página debe ser o no rastreada y guardada en los índices para la recuperación de resultados. Si opta por utilizar “noindex”, la página será excluida por los motores. Por defecto, los motores de búsqueda asumen que pueden indexar todas las páginas por lo que generalmente el uso del “index” es innecesario.
  • Follow/nofollow dice a los motores si los enlaces de la página deben ser rastreados o no. Si decide elegir el “nofollow”, los motores desecharán los enlaces de la página tanto para descubrir contenido como para términos de ranking. Por defecto, todas las páginas tienen el atributo “follow” asignado.
  • Ejemplo: <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">
  • noarchive es utilizado para impedir a los motores guardar una copia cacheada de la página. Por defecto los motores guardarán copias visibles de todas las páginas que indexen, accesibles a los buscadores a través del enlace “cacheado” en los resultados de búsqueda.
  • nosnippet informa a los motores que deben abstenerse de mostrar un bloque de texto descriptivo junto al título de la página y la URL en los resultados de búsqueda.
  • noodp/noydir son etiquetas especializadas que dicen a los motores de búsqueda de no agarrar un snippet sobre una página del Open Directory Project (DMOZ) o del Directorio de Yahoo! para emplearlo en los resultados de búsqueda mostrados.

La directiva de encabezamiento HTTP etiqueta X-Robots también cumple con estos mismo objetivos. Esta técnica funciona especialmente bien para contenido en archivos no-HTML como las imágenes.

Meta Descripción

La etiqueta meta description es una descripción corta del contenido de una página. Los motores de búsqueda no utilizan las palabras clave o las frases para los ranking pero las meta descripciones son la fuente primaria para los snippet de texto mostrados debajo del listado en los resultados de búsqueda.meta-etiquetas

La etiqueta meta description hace las funciones de anuncio, dirigiendo a los lectores hacia su sitio desde los resultados y, además, es una parte muy importante del marketing de búsqueda. Elaborar una descripción legible e irresistible utilizando palabras clave importantes (observe como Google pone en negrita las palabras clave buscadas en la descripción) puede conducir a un CTR mucho mayor en su página.

Las meta descripciones pueden tener cualquier longitud, pero los motores de búsqueda suelen cortar las cadenas superiores a 160 caracteres por lo que es aconsejable mantenerse por debajo de ese límite.

En ausencia de meta descripciones, los motores de búsqueda crearán un snippet de búsqueda con otros elementos de la página. Esta puede ser una buena táctica para las páginas que apuntan a múltiples palabras clave y temas.

Etiquetas NO tan importantes

Meta Palabras clave (Meta Keywords)

La etiqueta meta keywords tuvo cierto valor hace tiempo, pero ya no es importante para la optimización en motores de búsqueda. Para más información sobre su historia y el porqué de su caída en desuso, lea el artículo Meta Keywords Tag 101 de SearchEngineLand.

Meta refresh, meta revisit-after, meta content type, etc.

Si bien estas etiquetas pueden ser útiles para la optimización de motores de búsqueda, son menos importantes en el proceso y, por ello, dejaremos que conteste los detalles la ayuda de las Herramientas para Webmaster de Google. Meta etiquetas.

Estructura de las URL

Las URL, la dirección web para una página en particular, son de gran valor en lo que se refiere a la búsqueda. Aparecen en múltiples lugares importantes.

url1
Desde que los motores de búsqueda muestran las URL en los resultados, pueden influir en el CTR y en la visibilidad. Las URL también son utilizadas en el posicionamiento de documentos, y esas páginas cuyos nombres incluyen los términos en la consulta de búsqueda reciben alguna ventaja con el uso apropiado y descriptivo de las palabras clave.

url2

Las URL aparecen en la barra de direcciones del navegador y, aunque tiene una influencia pequeña en los motores de búsqueda, una estructura pobre de las URL puede conllevar a una experiencia negativa de los usuarios.

link

La URL de arriba es utilizada como texto ancla de un enlace hacia la página objetivo desde un blog.

Guía de construcción de URLs

Utilice la empatía

Póngase en el lugar del usuario y eche un vistazo a su URL. Si puede predecir de forma sencilla y exacta el contenido que espera encontrar en la página, sus URL son descriptivas. No necesita deletrear cada detalle de la URL pero una idea general es un buen punto de partida.

Más corta es mejor

Aunque una URL descriptiva es importante, minimizar la longitud y poner barras al final hará que su URL sea más sencilla de copiar y pegar (en mails, artículos de blogs, mensajes de texto, etc…) y será totalmente visible en los resultados de búsqueda.

El uso de palabras clave es importante (pero el abuso es peligroso)url

Si su página apunta hacia un término específico o una frase, asegúrese de incluirlo en la URL. Sin embargo no trate de inundarla de palabras clave con propósitos SEO; el abuso conllevará a una utilidad menor y puede caer en las redes de los filtros de spam.

Sea estático

Las mejores URL con aquellas que pueden leer los humanos sin montones de parámetros, números o símbolos. Utilizando tecnologías como mod_rewrite para Apache e ISAPI_rewrite para Microsoft, puede cambiar fácilmente URLs dinámicas como http://www.pymenetworks.es/blog/?id=144 a otra más comprensible como http://www.pymenetworks.es/blog/concurso-seo. Incluso los parámetros dinámicos más sencillos pueden conllevar a un ranking e indexación bajos.

Utilice los guiones para separar las palabras

No todas las aplicaciones web pueden interpretar los separadores como el guion bajo “_”, el signo más “+” o el espacio “%20”, por lo que debe utilizar el guion medio “-“ para separar las palabras en las URL como en el ejemplo superior, concurso-seo.

 

Versiones canónicas y duplicadas de contenido

El contenido duplicado es uno de los problemas más irritantes y problemáticos que cualquier página web puede afrontar. En los últimos años, los motores de búsqueda han tirado abajo contenidos duplicados a través de sanciones y rankings menores.

La canonicalización ocurre cuando dos o más versiones de una página web aparecen en diferentes URLs. Esto es muy común en los modernos gestores de contenidos (CMS) Por ejemplo, Vd. ofrece una página estándar y una versión “optimizada para impresión” con el mismo contenido. El contenido duplicado puede incluso aparecer en múltiples sitios web. Para los motores de búsqueda, esto representa un gran problema; ¿Cuál es la versión de este contenido que deberían presentar a los usuarios? En los círculos SEO, esta cuestión llamada “contenido duplicado”.

contenido-duplicadoLos motores de búsqueda son exigentes respecto a las versiones duplicadas de un solo fragmento de contenido. Para ofrecer a los usuarios una mejor experiencia, raramente muestran múltiples fragmentos duplicados de contenido y, así, se ven forzados a elegir la versión más parecida a la original. El resultado final es que TODO su contenido duplicado podría posicionarse peor de lo que debería.

contenido-identicoLa canonicalización es el mejor método para organizar su contenido de modo que cada fragmento único tiene una y solo una URL. Si deja múltiples versiones de contenido en un sitio web (o sitios web), como el de la imagen. ¿Cuál es el diamante correcto?


contenido-unico

 

En cambio, si el propietario de un sitio cogiera esas tres páginas y le aplicara una redirección 301, los motores de búsqueda solo tendrían una página, más fuerte, que mostrar en los listados de ese sitio web.

 

 

 

 Cuando múltiples páginas con un potencial de posicionamiento alto son combinadas en una sola, no solo dejan de competir entre ellas, sino que además aumentan su relevancia y popularidad individual. Esto influye positivamente en su tendencia a posicionarse mejor en los motores de búsqueda.

¡La etiqueta Canonical al rescate!

Una opción distinta de los motores de búsqueda, llamada “Canonical URL tag” es otra forma de reducir los casos de contenido duplicado en un solo sitio y canocalizar hacia una sola URL individual. Esto también puede ser utilizado en diferentes sitios web, desde una URL en un dominio hasta otra URL en otro dominio.

Utilice la etiqueta Canonical dentro de la página que contiene contenido duplicado. El objetivo de la etiqueta canonical es apuntar hacia la URL “padre” que desea posicionar.

Como funciona:

<link rel=”canonical” href=”http://www.pymentworks.es/blog/>

Esto le dice a los motores de búsqueda que la página en cuestión debería ser tratada como una copia de la URL http://www.pymenetworks.es/blog/ y que todos los valores que los motores aplican tanto a los enlaces como al contenido deben fluir hacia esa web.

canonical-tagLa etiqueta atributo Canonical es similar en muchos aspecto a las redirección 301 desde un punto de vista SEO. En esencia, le está diciendo a los motores de búsqueda que múltiples páginas deberán ser interpretadas como una sola (como lo hace un 301), sin tener que re-direccionar a los visitantes hacia una nueva URL, ahorrando a su personal de desarrollo muchos dolores de cabeza.

Para más información, sobre diferentes tipos de contenido duplicado, este artículo del Dr. Pete merece especial atención (en inglés).

Snippets enriquecidos

¿Alguna vez ha visto una puntuación de cinco estrellas en los resultados de búsqueda? Posibilidades hay de que el motor de búsqueda haya recibido esa información de snippets enriquecidos insertados en la página web. Los snippets enriquecidos son un tipo de datos estructurados que permiten a los webmaster marcar cierto contenido de forma que facilite información a los motores de búsqueda.

A pesar de que los snippets enriquecidos y los datos estructurados no son un elemento requerido para un diseño amigable para los motores de búsqueda, su cada vez mayor uso por parte de los webmaster tomando ventaja puede hacerles disfrutar de cierta ventaja en algunas circunstancias.

Añadir datos estructurados significa añadir marcas a su contenido para que los motores de búsqueda puedan identificar fácilmente el tipo de contenido del que se trata. Schema.org ofrece múltiples ejemplos de datos que pueden beneficiarse de unos marcados estructurados. Esto incluye personas, productos, reseñas, negocios, recetas y eventos.

A menudo los motores de búsqueda incluyen los datos estructurados en los resultados de búsqueda, como es el caso de reseñas (estrellas) o perfiles del autor (imagen). Existen muchos recursos online de aprendizaje para saber más sobre los snippets enriquecidos, como por ejemplo information at Schema.org y Rich Snippet Testing Tool de Google.

Ejemplo de Snippet enriquecido:

Digamos que quiere anunciar su conferencia SEO en su blog. En HTML estándar su código podría parecerse a algo como:

<div>
Conferencia SEO <br/>
Aprenda SEO de expertos en la materia.<br/>
Fecha del evento::<br/>
8 de mayo, 7:30pm
</div>

Ahora, estructurando los datos, podemos darle a los motores de búsqueda una información más específica sobre el tipo de datos. El resultado final puede ser algo así:

<div itemscope itemtype="http://www.pymenetworks.es/Evento">
<div itemprop="name">Conferencia SEO</div>
<span itemprop="description"> Aprenda SEO de expertos en la materia.</span>
Fecha del evento:
<time itemprop="startDate" datetime="2012-05-08T19:30">8 de mayo, 7:30pm</time>
</div>

Defendiendo el honor de su Web.

Como roban los Scraper sus rankings.

Desgraciadamente, la web está llena de cientos de miles (o incluso millones) de sitios web sin escrúpulos cuyo negocio y modelos de tráfico depende de copiar el contenido de otros sitios y reutilizarlos (en ocasiones modificados de forma curiosa) en sus propios dominios. Esta práctica de coger su contenido y republicarlo se llama “scraping” y los scrapers obtienen pingües beneficios desbancando de los rankings con su propio contenido y publicando anuncios (irónicamente a menudo con el programa AdSense de Google).

dueloCuando Vd. publica cualquier tipo de contenido en formato feed RSS/XML/etc… asegúrese de hacer un ping en los principales servicios de blog/rastreo (como Google, Technorati, Yahoo!, etc...). Puede encontrar información de cómo hacer los ping tanto en Google como en Technorati en sus propios sitios web o utilizar un servicio como Pingomatic para automatizar el proceso. Si su software de publicación está hecho a medida, es aconsejable para los desarrolladores incluir un ping automático en cada publicación.

Después, podrá utilizar la desidia de los scraper en su contra. La mayoría de los scraper de la web publicarán el contenido sin reeditarlo y, entonces, incluyendo enlaces hacia su sitio web y el artículo específico que Vd. ha autorizado, podrá asegurarse que los motores de búsqueda vean la mayoría de las copias enlazando hacia Vd. (indicando que su fuente probablemente sea la original). Para hacer esto, necesitará enlaces absolutos, más que relativos, en su estructura interna de enlaces. Así pues, en vez de enlazar con su página principal usaría:

<a href="/../>Inicio</a>

En su lugar usaría:

<a href="http://www.pymenetworks.es">Inicio</a>

De este modo, cuando un scraper coge y copia el contenido, el enlace sigue apuntando hacia su página web.

Hay otras formas más avanzadas de protegerse contra el scraping, pero ninguna de ellas es completamente a prueba de balas. Debería contar con que, cuanto más popular y visible sea su sitio, más a menudo encontrará su contenido “scrapeado” y republicado. A menudo, puede Vd. ignorar este problema pero si se convierte en algo grave y encuentra los scrapers restándole ranking y tráfico, podrá emprender medidas legales.

 

PDF