Spam y Google – La patente de Matt Cutts [2003-2005]
¡Muy buenas! Hoy escribo este artículo en relación a la patente de Matt Cutts (y compañía) debido a que no he visto absolutamente nada publicado al respecto en español.
El 30 de septiembre de 2013 una patente de Google fue presentada, siendo Matt Cutts uno de los que figuran como inventores de dicha patente. Probablemente esta patente es la información pública más importante que el propio Cutts ha ofrecido. Bajo el título «Recuperación de información basada en datos históricos», la solicitud de dicha patente era 20050071741. Tuvieron que pasar cerca de 2 años para que dicha patente fuese publicada oficialmente (31 de Marzo 2005).
Esta patente se definía como:
«Un sistema que identifica un documento y obtiene uno o más tipos de datos de la historia asociados con el documento. El sistema puede generar una puntuación para el documento basado, al menos en parte, por una o más tipos de datos de historial.»
La patente completa puede verse aquí, en la sección de patentes de Google, o aquí.
¿Sobre qué se habla en esta patente?
Curiosamente, este documento sigue siendo relevante hoy en día y cubre temas tales como:
- Ajustar el ranking basado en la frecuencia con la que se hace click en una página cuando aparece en los resultados de búsqueda.
- Ajustar las posiciones basadas en el deseo percibido de contenido fresco frente a contenidos con más tiempo.
- Ajustar el ranking basándose en el tráfico de una página web.
- Basar la autoridad de un enlace en base a la relevancia de la vinculación a los documentos.
No puede saberse con exactitud qué partes exactamente fueron escritas por Matt, pero podemos hacernos una idea del tipo de pensamiento y el modo de actuación que tienen los de Google a la hora de diseñar su algoritmo, a pesar de que hayan pasado cada 10 años desde que esta patente fue publicada.
La patente fue publicada por estos autores:
Acharya, Anurag; (Campbell, CA) ; Cutts, Matt; (Mountain View, CA) ; Dean, Jeffrey; (Palo Alto, CA) ; Haahr, Paul; (San Francisco, CA) ; Henzinger, Monika;(Lausanne, CH) ; Hoelzle, Urs; (Palo Alto, CA) ; Lawrence, Steve; (Mountain View, CA) ; Pfleger, Karl; (Mountain View, CA) ; Sercinoglu, Olcan; (Mountain View, CA); Tong, Simon; (Mountain View, CA)
Explicación resumida de la patente 20050071741
Resumidamente esta patente nos verificaba que ahora Google parece tener en cuenta también factores históricos. Google registra el descubrimiento de un enlace y comprueba si el enlace cambia con el tiempo, la velocidad a la que gana un sitio muchos enlaces y la duración de la vida de los enlaces recibidos.
Posiblemente todo surgió a raíz del ataque spam que sufrieron a principios de 2004 y están decididos a erradicarlo.
Algo que hay que tener muy claro respecto a esta patente es que su existencia no significa que forme parte indiscutible del algoritmo que emplea Google para ranquear webs en su buscador, pero sí nos da bastantes pistas sobre su forma de pensar.
Increible que nadie comente este artículo(en comparación con el número de comentarios que reciben tus artículos en general). Yo creo que arroja datos interesantes que nos pueden ayudar a entender como funcionan las entrañas del «todo poderoso» Google. En este artículo podemos ver claramente cual puede ser el espíritu de Google, muy a pesar de lo que siempre diga, repita y vuelva a decir el señor Matt Cutts. Gran aporte Chuiso, y sorprendente el poco impacto que ha generado.
Muchas gracias Daniel por tu comentario, al menos así se estrenó este artículo 😛
Ah que la ostia, que ando viendo tu video de «logrando enlaces de Wikipedia y trafico residual» y veo que por fin pusiste la cita en wikipedia, te felicito, saludos chuiso! Se la metiste a Matt Cutts desde la Wiki.
Epic Win!