Contenido basura en internet

5/5 - (8 votos)
Contenido basura en internet

Internet está lleno de contenido basura. Puede parecer una afirmación un poco dura, pero es así. Hacer una web con buena apariencia es relativamente sencillo, sobre todo si se usan CMS como WordPress, PrestaShop, Magento, Joomla!, o incluso Squarespace, Shopify o Wix, y se añaden maquetadores visuales como Elementor, WPBakery o Divi. Hacerla bien ya es otra cosa. Analicemos los problemas de sitios web creados con este método desde el punto de vista del SEO On Page.

A simple vista, puede parecer que los sitios web por los que navegamos por internet están bien hechos dado que estéticamente resultan agradables a la vista, pero en muchas ocasiones, la realidad que encontramos detrás (en las tripas de las webs) los profesionales del marketing digital al analizarlas desde el prisma del SEO es muy diferente.

Errores comunes de creación de webs:

Lorem Ipsum

Si te suena el concepto de Lorem Ipsum sáltate este párrafo, si no, te diremos que es texto falso que se utiliza como contenido demo para maquetar y diseñar cuando aún no hay texto definitivo para insertar en el diseño. De hecho, existen multitud de generadores de Lorem Ipsum en internet con temáticas de lo más diversas como Chiquito Ipsum, Zombie Ipsum o Pirate Ipsum. Si buscas por internet encontrarás muchísimo más.

Pues bien, el problema es que hay miles de webs en internet que se publican con estos textos falsos y se quedan publicados y a la vista de motores de búsqueda como Google y, ojo, a la vista también de los usuarios durante años. Si crees que exageramos, vamos a abrirte los ojos. Como agencia de marketing de Donosti que somos, vamos a ponerte el ejemplo de una búsqueda en Google como lorem ipsum donosti.

En los resultados de esta búsqueda que, obviamente puede utilizarse con cualquier otra zona geográfica, verás resultados indexados de multitud de empresas e, incluso, instituciones, que tienen algún texto falso publicado en su web a la vista de cualquiera. En concreto, Google nos da en esta búsqueda aproximadamente 91.600 resultados. Ahora sí, ya te vas haciendo una idea del panorama.

Contenido demo

Otra de las situaciones bastante habituales es la del contenido demo que no ha sido eliminado o sustituido por contenido real antes de la publicación del propio sitio web. Es muy habitual descubrir sitios web que han sido desarrollados sobre una plantilla para CMS como WordPress. Estas plantillas pueden venir vacías de contenido de serie o pueden traer contenido demo que permite trabajar sobre una base visual ya maquetada.

Evidentemente, este contenido demo que deberá ser sustituido por el contenido definitivo. Si este contenido basura no se elimina, Google podría llegar a rastrearlo e indexarlo en su motor de búsqueda para mostrarlo a los usuarios. Que lo encuentre y lo indexe es malo para la salud del sitio web pues es considerado thin content. Así mismo, mostrar este tipo de contenido en los resultados de búsqueda no traslada muy buena imagen a los posibles consumidores de tu web de marca.

Hola Mundo / Hello World

Según datos oficiales de WordPress, más del 41% de los sitios web del mundo están desarrollados con WordPress. Este CMS, trae por defecto una entrada que, obviamente, hay que eliminar antes de abrir el sitio web a usuarios y googlebot. Pues te sorprenderá, pero la búsqueda «hello world» donosti arroja 13.100 resultados y «hola mundo» donosti 79.300 resultados. Eso significa que todos esos sitios web (ojo, solo los que incluyen el término donosti), no han eliminado esa entrada.

Si ampliamos la búsqueda a nivel global, la cantidad de sitios que tienen publicada la entrada con el texto «Welcome to WordPress. This is your first post» asciende a los casi 8 millones y «Bienvenido a WordPress. Esta es tu primera entrada» cuenta con algo más de 200.000.

Sitios web en desarrollo

Repite con nosotros. Los sitios web en desarrollo no deben estar en abierto. 

Internet está lleno de basura. Bart Simpson escribiendo en una pizarra Los sitios web en desarrollo no deben estar en abierto.

Pues no te mentimos si te decimos que hay miles de sitios web en desarrollo en abierto y permitiendo su indexación por parte de Googlebot. Para muestra un botón: aquí puedes echar un vistazo a los sitios en desarrollo en el entorno de pruebas del proveedor de hosting Lucushost que permiten su indexación e indexan en Google. ¡Saludos gente de Lucushost 👋!

De hecho, una práctica muy habitual es desarrollar en entornos de staging o dev que no son más que entornos de pruebas donde poder cacharrear lo que quieras sin miedo a romper nada en tu sitio web principal. Vamos a hacer algunas búsquedas en Google:

Evidentemente, estos son solo algunos ejemplos de los dominios .com y .es con los subdominios como staging, dev, desarrollo y pruebas. Si hiciéramos todas las búsquedas de todas las variables posibles con todas las extensiones de dominios existentes… solo de pensarlo da vértigo. Pero va calando lo de que internet está lleno de basura, ¿verdad?

Contenido no relevante

La cuarta pata de este banco sería el contenido que, si bien tiene que existir, no tiene ningún sentido dejar que Google lo rastree por aquello de optimizar o aumentar el presupuesto de rastreo o crawl budget. Estamos hablando de páginas tales como las de contenido legal, paginaciones de resultados o de listados de elementos. Rankear el contenido de valor y darle prioridad y visibilidad a la hora de ser encontrado, evaluado e indexado es un ejercicio a realizar antes o después.

¿En qué afecta todo esto al posicionamiento SEO?

Hemos hablado con anterioridad de la importancia de darle a Google únicamente el contenido susceptible de ser indexado y posicionado y, este tipo de contenido basura, no lo es. Google pierde tiempo que podría invertir en descubrir contenido de calidad en nuestra web, rastreando contenido de calidad en vez de perderlo rastreando contenido basura. Con esto, se desperdicia tiempo de rastreo o crawl budget.

Además, en el caso de subdominios que tengan una copia del dominio principal para pruebas antes de implementar cambios en producción, el principal problema es el contenido duplicado.

¿Qué puedo hacer para saber si mi sitio tiene contenido basura?

Para webs ya existentes: Nuestra recomendación es que hagas una búsqueda en Google con el comando site. Buscar en google site:midominio.com (todo junto y sustituyendo midominio.com por el dominio de tu web) hará que Google te muestre todo lo que ha encontrado de tu sitio web. Repasa todos los resultados y, si encuentras alguno que habiendo leído todo lo anterior, creas que no deba estar ahí, es hora de ponerse manos a la obra.

Para sitios nuevos: lo ideal sería repasar todos los tipos de contenido: entradas, páginas, Custom Post Types como portfolios o similares y asegurarnos de que no haya nada que no deba estar ahí. Si después de analizar estos resultados crees que necesitas ayuda profesional.

Contenido basura en internet
Scroll hacia arriba