La programación de páginas web
La importancia de código limpio
La manera de construir una página web puede repercutir sobre la capacidad de un robot para leerla e indexar sus contenidos, y, por lo tanto, puede afectar nuestro posicionamiento en Internet. Hay que imaginar que al robot solo le interesa el texto normal de nuestra página y que cualquier complicación, como Javascript, o Flash puede impedirlo en encontrar lo que busca.
Esto no quiere decir que abandonemos la idea de tener un sitio atractivo o fácil de manejar con el empleo de, por ejemplo, una navegación de javascript. Simplemente, hay que tener en cuenta que la simplicidad para el usuario y la simplicidad para el robot a menudo van de la mano.
Puesto que el robot de un buscador lee una página de una manera parecida a una aplicación navegador, es fácil que se tropiece al encontrarse con un fallo en el código HTML. Los tag incompletos, conflictos en el código o un exceso de javascript pueden obstruir al robot a la hora de hacer su trabajo. En estos momentos lo que suele pasar es que el robot dirá adiós y efectuará su salida.
Para evitar problemas, la mejor manera de crear nuestras páginas es escribir el código "a mano". Como las funciones WYSWIG de los editores HTML como MS FrontPage™ o Macromedia Dreamweaver™ suelen añadir líneas de código propias, es mejor no utilizarlas.
Otro consejo es el uso de un validator para comprobar que el código no tenga tag abiertos o incorrectos. Hay varios validator buenos y gratuitos disponibles en el internet. Él que utilizo yo es el de W3C (http://validator.w3.org)
Crear tablas adecuadas para el posicionamiento en buscadores
Aunque los robots pueden leer los contenidos de una tabla con bastante facilidad, hay que tener en cuenta que las tablas anidadas de cierta complejidad pueden actuar como un impedimento a la hora de navegar por nuestros sitios web.
También es importante saber que los robots leen e indexan los contenidos de nuestras páginas en el orden que aparecen las tablas y no como aparece en pantalla. Por esta razón en los resultados de búsqueda hay muchas páginas que muestran como descripción los contenidos de sus barras de navegación. La mayoría de buscadores extraen de una página una frase que se pueda utilizar como descripción en los resultados de búsqueda. A veces muestran simplemente las primeras palabras de la página. Como la navegación del sitio suele aparecer a la izquierda o en la parte superior de la página, son estas palabras las que escoge el buscador.
Una de las mejores maneras de "alimentar" al robot de un buscador, en cuanto al texto descriptivo que utiliza, es colocar lo que queremos que salga en la zona cabecera de nuestra página. Mejor todavía es utilizar el HTML para nuestro logotipo o eslogan en vez de una imagen.
Hay una tendencia emergente en la utilización de posicionamiento en CSS para colocar nuestros contenidos en layers. Esto nos permite ubicar los contenidos, densos en cuanto a palabras clave en la parte superior del código HTML y a su vez posicionar los layers de una manera más tradicional con la navegación ocupando un espacio más racional en el diseño de la página web.
El posicionamiento en buscadores y las páginas con marcos (frames)
Aunque los marcos, o frames, ya no son tan populares en el diseño de páginas web como antes, existen todavía bastantes webmasters y diseñadores que emplean esta tecnología. Es importante tener en cuenta que, como los sitios que utilizan marcos HTML colocan sus contenidos más importantes en páginas que se encuentran dentro de un marco principal (o frameset), en vez de ubicarlos dentro del cuerpo de sus páginas, los robots de los buscadores tienen muchas más dificultades en leerlos y indexarlos.
Mientras los buscadores más importantes han empezado a indexar los contenidos de framesets quedan muchos robots que no pueden seguir los links incorporados en este tipo de estructura. Hasta que haya mejoras en la tecnología de los buscadores, los diseñadores que insisten en utilizar marcos van a tener que emplear unas técnicas especiales para facilitar el trabajo de los robots.
Típicamente, la programación de una página con frames aparece de la siguiente manera:
<frameset rows="*">
<frame name="principal" src="http://www.misitio.com">
<noframes>
<body>
<p>Esta página utiliza frames, pero su navegador no los soporta</p>
</body>
</noframes>
</frameset>
En cuanto a los robots capacitados para leer lo que se encuentra entre las etiquetas <frame>, los contenidos serán indexados como cualquier otra página. Sin embargo, nos enfrentamos a otro problema, ya que la dirección indexada en los resultados de búsqueda será la de la página dentro del marco y no la del mismo marco. Si los contenidos principales y la navegación se encuentran en marcos distintos, puede que los resultados que produce el buscador incluyen o bien únicamente al frame que contiene la navegación o bien únicamente al que recoge los contenidos.
Para los robots que no pueden indexar los contenidos en marcos, solo leerán la información que se encuentra entre las etiquetas <noframes>. Si no hay texto en esta parte de la programación, los robots no tendrán manera ni de indexar ni de proporcionar a esta página un ranking en buscadores.
Por esta razón es imprescindible que cualquier sitio que emplea marcos también incorpore contenidos alternativos. Dentro de los tags <noframes> se debe reemplazar la frase "Esta página utiliza frames, pero su navegador no los soporta" con algunos párrafos de texto con una alta densidad de palabras clave, además de unos links a páginas que no hacen uso de marcos (que también aportan una alta densidad de palabras clave
El posicionamiento en buscadores de páginas con Flash.
Algunos de los buscadores más importantes (aquí se destaca FAST/AlltheWeb) han registrado unos avances considerables en cuanto a la indexación de páginas Flash. Sin embargo la mayoría de robots no pueden con ellas. Los programas robot están diseñados para la lectura de texto e ignoran las imágenes. Por lo tanto, si gran parte de nuestros contenidos se ubican dentro de un archivo Flash, la mayoría de buscadores encontrarán poco para leer y será más difícil un buen posicionamiento.
La solución más sencilla es ofrecer nuestra animación o archivo Flash como un link opcional dentro de una página HTML normal, lo cual permite al robot del buscador la posibilidad de leer e indexar los contenidos de la página sin meterse con el archivo Flash.
Si es imprescindible que tengamos una página creada totalmente con tecnología Flash, una solución es incorporar el archivo dentro de un frameset (sin que haya otros marcos dentro) y optimizar unos contenidos de texto dentro de los tags <noframes>, ofreciendo de tal manera algo que los robots de los buscadores puedan leer.
En el caso de las páginas web construidas únicamente con navegación Flash, debemos tener en cuenta que los buscadores no podrán leer, y por lo tanto no podrán seguir, ninguno de los links de la navegación Flash. Esto significa que, a no ser que ofrezcamos una navegación alternativa, es muy improbable que los robots lleguen más lejos que nuestra página de inicio lo cual imposibilita un buen ranking en buscadores.
En conclusión, donde hay navegación Flash, se debe ver además una copia de la navegación en código HTML a la que pueden acceder los buscadores.
El posicionamiento en buscadores de páginas con JavaScript.
No existen pruebas para concluir definitivamente que un exceso de javascript tenga un impacto negativo sobre nuestro posicionamiento. Sin embargo hay suficientes indicios que sugieren que el uso extensivo de javascript puede ser un obstáculo para los robots de los buscadores y, como cualquier otro obstáculo, puede servir como pretexto para su salida precipitada. Por lo tanto, cuando sea apropiado, deberíamos ubicar el javascript dentro de un archivo ".js". El javascript funcionará con normalidad a la hora de ver la página el usuario, pero no será leído por los robots de los buscadores al indexarla.
Como los buscadores no pueden leer un javascript, los links dentro de sistemas de navegación creados exclusivamente en javascript tampoco pueden ser ni leídos ni indexados por los buscadores. De la misma manera, como en el caso de los sitios con navegación Flash, deben ofrecer al robot un sistema de navegación alternativa, los sitios con navegación javascript deben también ofrecer una navegación con enlaces de texto HTML normales en otra parte de la página.
Posicionar en buscadores las páginas con contenidos dinámicos.
Hay indicios por parte de los buscadores importantes de que las páginas web que incorporan contenidos dinámicos pronto podrán ser indexadas con más precisión. Sin embargo, en la actualidad sólo algunos de los buscadores se declaran capaces de indexar las páginas con contenidos creados dinámicamente y, por lo tanto, esta tecnología se considera problemática en cuanto al posicionamiento en buscadores.
De los buscadores que pueden indexar las páginas de contenidos dinámicos, los más importantes son Google, FAST/AlltheWeb y Inktomi. De estos, sólo Google pasará por un sitio dinámico e indexará los contenidos que encuentre. Para que no se meta en un bucle sin salida, el robot de FAST, seguirá un enlace desde una página estática a una página dinámica, pero no desde una página dinámica a otra. El buscador Inktomi sólo indexará a las páginas por las que hemos pagado por inclusión. En el caso de cualquier sitio con muchos contenidos dinámicos, darse de alta en Inktomi puede resultar muy costoso.
Los sitios más pequeños con una cantidad manejable de páginas dinámicas tienen una solución sencilla que consiste en crear un mapa del sitio con enlaces a cada una de estas páginas. De esta manera, se puede utilizar un sistema de gestión de contenidos para actualizar las páginas dinámicas, pero los buscadores disponen de una página estática para leer.
En el caso de sitios grandes, la mejor manera de asegurar la lectura e indexación de contenidos dinámicos es utilizar uno de los métodos de transformar la dirección dinámica para que parezca estática.
Por ejemplo:
http://www.miempresa.com/index.cfm?tipo=orujos&id_producto=24
se convierte en:
http://www.miempresa.com/tipo/orujos/id_producto/24/index.cfm
Hay varias técnicas para cambiar las direcciones de páginas dinámicas como "Apache rewrite scripts" (este página esta en inglés y únicamente para gente valiente), funciones de Cold Fusion, mod_rewrites etc.
Una alternativa es incluir los contenidos dinámicos en un archivo server side include (SSI). El archivo include se llama desde una página estática. Esta página y el contenido dinámico puede ser leído por los robots de los buscadores sin dificultades.




