PageRank

PageRank

PageRank

Google ordena los resultados de la búsqueda utilizando su propio algoritmo PageRank. A cada página web se le asigna un número en función del número de enlaces de otras páginas que la apuntan, el valor de esas páginas y otros criterios no públicos.

PageRank es una marca registrada y patentada[1] por Google el 9 de enero de 1999 que ampara una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda. Sus propiedades son muy discutidas por los expertos en optimización de motores de búsqueda. El sistema PageRank es utilizado por el popular motor de búsqueda Google para ayudarle a determinar la importancia o relevancia de una página. Fue desarrollado por los fundadores de Google, Larry Page y Sergey Brin, en la Universidad de Stanford.

PageRank confía en la naturaleza democrática de la web utilizando su vasta estructura de enlaces como un indicador del valor de una página en concreto. Google interpreta un enlace de una página A a una página B como un voto, de la página A, para la página B. Pero Google mira más allá del volumen de votos, o enlaces que una página recibe; también analiza la página que emite el voto. Los votos emitidos por las páginas consideradas "importantes", es decir con un PageRank elevado, valen más, y ayudan a hacer a otras páginas "importantes". Por lo tanto, el PageRank de una página refleja la importancia de la misma en Internet.

Contenido

Algoritmo

El algoritmo inicial del PageRank lo podemos encontrar en el documento original donde sus creadores presentaron el prototipo de Google: “The Anatomy of a Large-Scale Hypertextual Web Search Engine":[2]

PR(A) = (1-d) + d  * \sum_{i=1}^n {PR(i) \over C(i)}

Donde:

  • PR(A) es el PageRank de la página A
  • d es un factor de amortiguación que tiene un valor entre 0 y 1.
  • PR(i) son los valores de PageRank que tienen cada una de las las páginas i que enlazan a A,
  • C(i) es el número total de enlaces salientes de la página i (sean o no hacia A);

Algunos expertos aseguran que el valor de la variable d suele ser 0,85.[3] Representa la probabilidad de que un navegante continúe pulsando links al navegar por Internet en vez de escribir una url directamente en la barra de direcciones o pulsar uno de sus marcadores y es un valor establecido por Google. Por lo tanto, la probabilidad de que el usuario deje de pulsar links y navegue directamente a otra web aleatoria es 1-d.[4] La introducción del factor de amortiguación en la fórmula resta algo de peso a todas las páginas de Internet y consigue que las páginas que no tienen enlaces a ninguna otra página no salgan especialmente beneficiadas. Si un usuario aterriza en una página sin enlaces, lo que hará será navegar a cualquier otra página aleatoriamente, lo que equivale a suponer que una página sin enlaces salientes tiene enlaces a todas las páginas de Internet.

El peso o importancia de una página es el resultado de una "votación" entre todas las demás páginas de la World Wide Web acerca del nivel de importancia que tiene esa página. Un hiperenlace a una página cuenta como un voto de apoyo. El PageRank de una página se define recursivamente y depende del número y PageRank de todas las páginas que la enlazan. Una página que está enlazada por muchas páginas con un PageRank alto consigue también un PageRank alto. Si no hay enlaces a una página web, no hay apoyo a esa página específica. El PageRank de la barra de Google va de 0 a 10. Diez es el máximo PageRank posible y son muy pocos los sitios que gozan de esta calificación, 1 es la calificación mínima que recibe un sitio normal, y cero significa que el sitio ha sido penalizado o aún no ha recibido una calificación de PageRank.[5] Parece ser una escala logarítmica. Los detalles exactos de esta escala son desconocidos.

Una alternativa al algoritmo PageRank propuesto por Jon Kleinberg, es el algoritmo HITS.

Manipulación

Debido a la importancia comercial que tiene aparecer entre los primeros resultados del buscador, se han diseñado métodos para manipular artificialmente el PageRank de una página. Entre estos métodos hay que destacar el spam, consistente en añadir enlaces a una cierta página web en lugares como blogs, libros de visitas, foros de Internet, etc. con la intención de incrementar el número de enlaces que apuntan a la página.

A principios del 2005 Google implementó un nuevo atributo para hiperenlaces rel="nofollow" como un intento de luchar contra el spam. De esta forma cuando se calcula el peso de una página, no se tienen en cuenta los links que tengan este atributo.

Antecedentes

PageRank ha tomado su modelo del Science Citation Index (SCI) elaborado por Eugene Garfield para el Instituto de información científica (ISI) en los Estados Unidos durante la década del 50. El Science Citation Index pretende resolver la asignación objetiva de méritos científicos suponiendo que los investigadores cuyo factor de impacto (número de publicaciones y/o referencias bibliográficas en otros trabajos científicos) es más alto, colaboran en mayor medida con el desarrollo de su área de investigación. El índice de citación es un elemento determinante para seleccionar qué investigadores reciben becas y recursos de investigación.

Últimas actualizaciones del PageRank

El PageRank no se actualiza instantaneamente, ni siquiera diariamente. Las actualizaciones del pagerank se realizan cada 2 ó 3 meses, y tarda varios días en completarse la actualización. Aquí se pueden ver las fechas de actualizaciones del Pagerank.

  • 4ª semana de octubre de 2009
  • 4ª semana de mayo de 2009
  • 4ª semana de marzo de 2009
  • 4ª semana de diciembre de 2008
  • 3ª semana de octubre de 2008
  • 4ª semana de julio de 2008
  • 4ª semana de mayo de 2008
  • 2ª semana de marzo de 2008
  • 2ª semana de enero de 2008
  • 4ª semana de octubre de 2007
  • 4ª semana de abril de 2007
  • 3ª semana de enero de 2007
  • 2ª semana de octubre de 2006
  • 2ª semana del mes de julio de 2006


Segun las ultimas opiniones leidas en internet se cuenta que pronto el pagerank externo es decir el que las paginas web podian saber y mostrar ya nos era visible...

Referencias

Bibliografía

Enlaces externos

Obtenido de "PageRank"

Wikimedia foundation. 2010.

Игры ⚽ Поможем сделать НИР

Mira otros diccionarios:

  • PageRank — is a link analysis algorithm that assigns a numerical weighting to each element of a hyperlinked set of documents, such as the World Wide Web, with the purpose of measuring its relative importance within the set. The algorithm may be applied to… …   Wikipedia

  • Pagerank — Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il fournit. De …   Wikipédia en Français

  • PageRank — es una familia de algoritmos utilizados para asignar de forma numérica la relevancia de los documentos (o páginas web) indexados por un motor de búsqueda. Sus propiedades son muy discutidas por expertos en optimización de motores de búsqueda. El… …   Enciclopedia Universal

  • PageRank — Der PageRank Algorithmus ist ein Verfahren, eine Menge verlinkter Dokumente, wie beispielsweise das World Wide Web, anhand ihrer Struktur zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht, der PageRank, aufgrund seiner… …   Deutsch Wikipedia

  • PageRank — Математический рейтинг вебстраницы (PageRank) для простой сети, выраженный в процентах (Google использует логарифмическую шкалу). Вебстраница C имеет более высокий рейтинг, чем страница E, хотя есть меньше ссылок на C чем на Е, но одна …   Википедия

  • Pagerank — Der PageRank Algorithmus ist ein Verfahren, eine Menge verlinkter Dokumente, wie beispielsweise das World Wide Web, anhand ihrer Struktur zu bewerten bzw. zu gewichten. Dabei wird jedem Element ein Gewicht, der PageRank, aufgrund seiner… …   Deutsch Wikipedia

  • PageRank — Illustration du PageRank. Le PageRank ou PR est l algorithme d analyse des liens concourant au système de classement des pages Web utilisé par le moteur de recherche Google pour déterminer l ordre dans les résultats de recherche qu il fournit. De …   Wikipédia en Français

  • PageRank — Der PageRank (abgek. PR ) ist ein von Google entwickeltes Maß der gewichteten Link Popularity für eine Webseite. Es ist jedoch kein Maß für die Relevanz eine Seite, wie häufig fäschlicherweise vermutet. Als PageRank wird der Wert bezeichnet, mit… …   SEO Wörterbuch

  • Pagerank — …   Википедия

  • Google PageRank — …   Википедия

Compartir el artículo y extractos

Link directo
Do a right-click on the link above
and select “Copy Link”