El Portal del Webmaster

Enero 29, 2008

Google y el contenido duplicado

Como blogger lo más adecuado es que tus artículos puedan ser leídos por tantas personas como sea posible, las formas de conseguir esto son mediante el posicionamiento web del artículo, enviándolo a sitios como menéame o sindicando (feeds) el contenido.

¿Qué pasa cuando tu contenido es leído en otros blogs -no controlas la imagen, ni las modificaciones- o páginas que copian tu contenido sin tu consentimiento, que incluso en algunos casos los sitios que copian tu contenido se posicionan y a ti Google no te muestra?

Según comente aquí, Google favorece la diversidad de resultados mostrados, pero actualmente NO penaliza a los portales que copian tus post, su algoritmo entiende que la razón de duplicar se debe a razones de distribución, muchos periódicos y revistas comprar artículos que han sido tratados en periódicos más grandes o viceversa.

Google muestra un solo resultado de lo que considera contenido duplicado, según ellos (Google) no debemos preocuparnos por no aparecer de primeros, mi recomendación es que si esto te está sucediendo a ti trates de realizar una buena estrategia de enlaces internos para darle más peso a ese post/artículo y que consigas algunos enlaces entrantes.

Los portales que copian contenido NO SON PENALIZADOS, el hecho de que un artículo sea duplicado no quiere decir que el mismo debe aparecer como resultado complementario.

Para que nuestro resultado sea considerado importante aún siendo contenido duplicado debe de superar los factores que hacen que el otro portal aparezca primero, normalmente cuando copian el contenido agregan la fuente de donde han sacado el post y esto le permite a Google determinar cuál es el más importante, también la fecha de publicación y la relevación en sí del dominio.

Google continua trabajando en el desarrollo de un sistema de indexación instantáneo, el cual podrá determinar cual portal ha publicado la noticia primero ya que actualmente se muestra primero el que es visitado primero por el robot.

Yo no creo que esta práctica sea válida por mucho tiempo, copiar contenido no agrega valor, pero mientras Google no luche contra temas como este que son tan importantes como la compra de enlaces y los post pagados no podremos obtener resultados mejores en el buscador, si quieres seguir leyendo más sobre el tema en ingles puedes hacer clic aquí.

Enero 16, 2008

Investigando las causas de la ‘Penalización de la sexta posición’

Archivado en: Conocimientos, Google, Noticias — admin @ 6:41 am

De vez en cuando, dentro de las páginas de resultados del buscador web de Google se producen penalizaciones en las que un notable número de páginas web descienden un mismo número de posiciones, debido a ajustes dentro de los algoritmos de relevancia.

Ahora, muchos webmasters están viendo como algunas de sus páginas, habiendo estado mucho tiempo en el primer y segundo puesto de los resultados, han descendido, automáticamente y a la vez, a la posición número 6. En este post de su blog, Lino Uruñuela intenta encontrar explicaciones a este suceso, que también se recoge en este hilo de WebMasterWorld.

Todos los webmasters aseguran que no habido cambios en estas páginas ‘penalizadas’, ni en cuanto a los links que reciben, ni en cuanto a su estructura. Por ello, Lino estima que es una modificación ‘artificial’ de los algoritmos, y baraja dos teorías, una relacionada con supuestas pruebas de Google dentro de los primeros resultados para analizar el comportamiento de los usuarios, y otra con pruebas que intentan investigar cómo varían los ingresos por publicidad a travésd e modificaciones en la posición dentro de los resultados.

Aumento del tráfico en algunos sitios web debido a la desaparición de los resultados suplementarios

Archivado en: Buscadores, Google, Noticias — admin @ 6:37 am

El pasado verano Google tomaba la decisión de eliminar los resultados suplementarios que nos encontrábamos en algunas búsquedas, debido a que se disponía ya de un índice “cada vez más profundo y continuado” (fruto del trabajo de muchos meses), que conseguía ahora que los enlaces que podrían estar menos actualizados o menos disponibles ya no fueran tan diferentes del resto.

Hace unas semanas, en este post oficial, los responsables del algoritmo del buscador web anunciaban su definitiva muerte, y se anunciaba que en breve el usuario podría ver “documentos más relevantes y una porción más profunda de la WWW, especialmente para búsquedas en idiomas diferentes del inglés”.

Enero 11, 2008

Google procesa 21 millones de Gigabytes de datos diariamente

Archivado en: Curiosidades, Google, Noticias — admin @ 4:50 pm

Durante la primera Junta de Accionistas de Google, celebrada en mayo de 2005, el Director General de la compañía aseguraba (ver diapositiva) que la información que estaba disponible en el mundo en ese momento estaba estimada en unos 5 millones de Terabytes (5.120 millones de Gigabytes), de la cual las herramientas de Google habían ‘procesado’ solamente “menos del 0.005%” (unos 256.000 Gigabytes). Se trata de información almacenada en diversos soportes, no solamente en HTML, como vídeos, audio, fotografías, libros, etc.

Ahora, comenta Nial Kennedy en su blog, los responsables del almacenamiento de los sistemas de Google han publicado un paper (que se puede descargar en versión PDF desde este enlace) en el cual aseguran que se están procesando 20 Petabytes de datos al día (’solamente’ 21 millones de Gigabytes).

Como se puede comprobar, parece que la capacidad de las herramientas de Google, a pesar de estar todavía a años luz de disponer ni siquiera de una minúscula parte de la información mundial, ha aumentado considerablemente, pasando de tener indexados 256.000 Gigabytes en total a procesar diariamente 21.000.000 Gigabytes.

El documento PDF merece la pena ser leído, y en él los creadores del famoso MapReduce que permite a Google disponer de su sistema de almacenamiento nos cuentan varios detalles sobre el mismo. Por ejemplo, afirman que para construir el clúster de servidores que lo hace posible utilizan servidores construidos con hardware de piezas clónicas, con dos procesadores Intel Xeon de 2GHz de tecnología ‘HyperThreading‘, 4 GB de memoria RAM, dos discos duros IDE de 160 GB y una conexión Ethernet de 1 gigabit.

Enero 4, 2008

Nuevos troyanos atacan los PCs para obtener ingresos de AdSense

Archivado en: Adsense, Conocimientos, Curiosidades, Noticias, Polémicas — admin @ 2:08 pm

Hace unos años, los creadores de malware instalaban los programas maliciosos en nuestros PCs para intentar hacer daño en ellos y poder conseguir así cierta notoriedad con una posible masiva propagación. Sin embargo, desde hace un tiempo, el objetivo es modificar ciertos parámetros en el PC de la víctima logrando así que ésta acceda a servicios que le proporcionen al atacante ingresos económicos.

Eso es lo que pretende hacer el troyano ‘Trojan.Qhost.WU‘, que añade una entrada en el fichero ‘etc/hosts’ de un PC con ‘MS Windows’ (es el fichero que puede determinar la dirección IP a la que se asigna un determinado dominio) para hacer que las peticiones al servidor ‘pagead2.googlesyndication.com’ (utilizado por Google para su sistema publicitario) se realicen a otro, propiedad del atacante.

El servidor ‘pagead2.googlesyndication.com’ es el que sirve el código JavaScript que insertan los webmasters afiliados a AdSense. De esta manera, con una simple modificación de una línea en un fichero (que, además, pasa inadvertido para muchos usuarios), el atacante puede hacer que la víctima esté viendo, en lugar de publicidad de AdSense, otros anuncios por los cuales va a ser él el que reciba los ingresos económicos a costa del propio Google y del webmaster de la página que la víctima del troyano está visitando.

Esta no es la primera vez que el sistema publicitario AdSense es víctima de un troyano de este tipo. En diciembre de 2005 os contábamos el caso de un programa malware que se instalaba en los navegadores web y modificaba el código generado por los servidores de Google para cambiar el código original de AdSense de cualquier página web que visitaba la víctima por el código del atacante que permitía hacerse con los ingresos de cada click.

Y en mayo de 2006 se descubrió una red de troyanos que habían conseguido instalarse en 34.000 PCs, desde los cuales hacían clicks fraudulentos a los anuncios AdSense mostrados en los sitios web de sus creadores, para de esta manera conseguir aumentar sus ingresos.

¿Habrías comprado Google por ’solamente’ un millón de dólares? Hubo quien no lo hizo

Archivado en: Conocimientos, Curiosidades, Google — admin @ 2:04 pm

¿Pagarías un millón de dólares por una compañía que en 10 años fuese a ingresar unos 5.000 millones de dólares cada trimestre y estuviese valorada en más de 210.000 millones de dólares? Esta fue la oferta que tuvieron encima de la mesa en el año 1998 Anand Rajaraman y Venky Harinarayan, dos estudiantes de doctorado en la Universidad de Stanford que habían fundado una empresa tecnológica dos años antes.

Dos compañeros de Universidad suyos, Larry Page y Sergey Brin, habían creado en 1996 el proyecto ‘BackRub’, lo habían cambiado de nombre por el de ‘Google’, y se habían dedicado durante los meses posteriores a buscar firmas de Internet interesadas en hacerse con él. Una de las cantidades que pedían por adquirir este nuevo buscador de Internet era de un millón de dólares, pero como aseguraban recientemente Rajaraman y Harinarayan en este artículo, no disponían del dinero suficiente en aquel momento, así que no pudieron comprarlo.

Google aumentaba cada día de popularidad, y eso lo sabían muy bien Rajaraman y Harinarayan, así que cuando consiguieron que su empresa tecnológica fuese adquirida por Amazon.com unos meses más tarde (en 1999), convencieron a su fundador, el famoso Jeff Bezos, para que pagase los 300 millones de dólares que ahora pedían por el nuevo buscador. Sin embargo, cuando llegaron a la reunión para acordar la adquisición por parte de Amazon, el precio de venta había aumentado: se trataba de 1.000 millones de dólares, tras lo cual no pudo haber acuerdo.

Tu portal de Posicionamiento web