Vai ai contenuti

Azienda

Servizi

Articoli

Referenze


Google ed il Page Rank

Se Google è oggi riconosciuto come il miglior motore di ricerca per qualità e pertinenza dei risultati, ciò è in gran parte a come i propri algoritmi sul Page Rank riescono a stabilire l'importanza assoluta di un sito nel contesto di Internet.

Se andiamo a scorrere una qualsiasi categoria nella directory di Google notiamo che i siti sono ordinati sulla base del valore che compare sulla barretta verde alla sinistra di ciascun sito. Tale valore è appunto il Page Rank (PR).

Prima di proseguire specifichiamo che il PR che viene mostrato è su scala logaritmica: cioè, supponendo una base 10, un PR=2 è 10 volte tanto quanto un PR=1, un PR=3 è 10 volte tanto un PR=2 e 100 volte un PR=1, e così via. Nel seguito useremo il PR lineare, che a differenza di quello mostrato nella Google Toolbar, non è stato ancora scalato con il logaritmo.

Formula del Page Rank

Quella che segue è la prima formulazione del Page Rank. Nessuno al di fuori di Google conosce con esattezza gli esatti algoritmi di calcolo del Page Rank, ma pensiamo che possa essere istruttivo enunciare le basi matematiche del Page Rank.

Il PageRank PR[A] di un sito A viene calcolato utilizzando una formula di questo tipo:

PR[A] = (d - 1) + d ( PR[T1]/C[T1] + ... + PR[Tn]/C[Tn]

Dove:

  • PR[A] é il Page Rank del sito A che vogliamo calcolare
  • T1...Tn sono i siti che contengono almeno un link verso A
  • PR[T1] ... PR[Tn] sono i Pagerank dei siti T1 ... Tn
  • C[T1] ... C[Tn] sono i numeri di link contenuti
  • d (damp) è un fattore deciso da Google e che probabilmente vale qualcosa come 0.8 o 0.9 ed è aggiustato da Google per decidere quale importanza attribuire a questa parte dell'algoritmo

Spiegazione della formula del Page Rank

Sembra algebra, vero? In effetti lo è :-) ma è molto più semplice di quanto non appaia a prima vista. Innanzitutto parliamo di siti che linkano A, perché qui è la rivoluzione "copernicana" di Google. Google attribuisce il PageRank sulla base dei siti che linkano A. Più un sito è linkato da altri siti, più il suo PageRank è alto. Come si vede dalla formula, però, quello che conta non è solo il numero dei link ma anche il PageRank delle pagine (Ti) che linkano A ed il numero dei link contenuti in (Ti).

Facciamo un esempio. Supponiamo che la pagina A sia linkata dalle pagine T1, T2 e T3:

  • T1 ha PR = 220 e contiene 14 link
  • T2 ha PR = 100 e contiene 2 link
  • T3 ha PR = 500 e contiene 60 link

Ponendo per d un valore di 0.9 dalla formula si ottiene che il PR di A è:

PR[A] = (1-0.9) + 0.9 * (220/14 + 100/2 + 500/60) = 0.1 + 0.9 * (15.7 + 50 + 8.3) = 66.7 (da scalare logaritmicamente)

In conclusione, per avere un buon PageRank occorre:

  1. Essere linkati da altri siti;
  2. Che tali siti abbiano pagine con elevato page rank;
  3. Che la/e pagina/e in cui si è linkati non contenga molti link (in quanto nella formula il PR della pagina che ospita il link viene diviso per il numero dei link contenuti in essa).

Posizionamento su Google
Posizionamento su Virgilio
Posizionamento su Yahoo!
Posizionamento su MSN
Posizionamento su Altavista