Mettere in qualità una collezione di dati significa a grandi linee definire degli standard procedurali da applicare per la loro omogeneizzazione: in parole povere definire delle specifiche rigide ed univoche che ne consentano il prelievo, la catalogazione e l'ordinamento. Con queste premesse vorrei analizzare quelle che, allo stato dell'arte, sono le caratteristiche che consentono il calcolo del Google PageRankW (da questo momento in poi PR) di un sito web, anzi, per essere più precisi, che consentono l'attribuzione di esso ad ogni singola pagina, dato che non è semanticamente corretto assegnare al sito stesso un valore che risulta dalla media matematica dei singoli PR.
Il calcolo del PR si basa su una formula matematica relativamente semplice, basata sostanzialmente sul calcolo del numero dei link in ingresso relativi ad una determinata pagina, pesato in base al PR stesso delle pagine che li hanno prodotti. In sostanza Google calcola il PR di una pagina non solo in base alla sua "popolarità", ovvero quante citazioni ha ricevuto da altrettante fonti, ma anche in base alla sua "autorevolezza", calcolata in base al valore del PR delle fonti stesse.
Il meccanismo, quindi, è molto simile a quello della "link popularity" usato per esempio da Technorati, che lo chiama, nel caso dei blog, "reaction", ma più raffinato perchè tiene conto anche della popolarità della fonte.
A questo punto è necessario analizzare il meccanismo di selezione dei link in ingresso: se infatti si parla di fattori come "popolarità" e "autorevolezza" bisognerebbe definire delle specifiche rigorose.
Consideriamo alcuni fattori:
- Esiste una selezione nel calcolo dei backlink ? Apparentemente no: infatti vengono presi e valutati tutti allo stesso modo sia che puntino ad una pagina specifica relativa ad un dominio che al suo stesso indirizzo radice (vale a dire la home page).
- Viene fatta una distinzione o una scrematura in base al dominio di provenienza ? Anche in questo caso sembrerebbe di no: lo stesso sito può, da pagine diverse, contenere link allo stesso dominio o pagina diretta, e fornirgli quindi più link in ingresso. Se le pagine del sito in questione, hanno un PR elevato, potrebbero potenzialmente distribuire ad uno stesso sito maggiore PR.
- Esiste un controllo sulla circolarità dei backlink ? Anche qui si presenta una forte incognita, ma la risposta è molto probabilmente no. Infatti è possibile per un sito farsi linkare e linkare successivamente la sua fonte, naturalmente da pagine diverse, concorrendo quindi ad un aumento reciproco delle citazioni in ingresso.
Alla luce di ciò, forse sarebbe possibile inserire alcuni correttivi:
- Una citazione dovrebbe essere relativa sempre e solo una pagina specifica e non ad un dominio generico: indicando la pagina specifica, si puntualizzerebbe in maniera abbastanza rigorosa la preferenza per l'argomento in essa contenuto. Il link al dominio generico infatti costituisce a tutti gli effetti un'indicazione di massima e non uno specifico interesse; in ogni caso sarebbe auspicabile attribuirgli un peso minore, se non nullo.
- Se un sito riceve un backlink da un altro, automaticamente, il dominio di provenienza dovrebbe essere scartato da ulteriori possibili citazioni, anche da pagine diverse. Questo perchè la preferenza dovrebbe essere unica e non moltiplicabile (in caso contrario si avrebbe un paradosso, come se, nella vita reale, un elettore potesse esprimere più preferenze per lo stesso partito, votando in seggi differenti)
- Controllo dei link circolari: se presenti valutarli come un singolo peso da entrambe le parti.
Non è stato volutamente trattato l'argomento relativo ad un possibile utilizzo più sanzionatorio della proprietà rel="nofollow" ai link: è un meccanismo che non ho mai condiviso appieno e che, pensato principalmente per la lotta allo spammingW dei commenti, nè migliora nè peggiora il proliferare di questi ultimi.
L'analisi effettuata è solo un primo approccio. Un'esperienza più approfondita si potrebbe ottenere solo tracciando ed analizzando le migliaia di dati reali che passano nei database di Google. Compito gravoso: meglio affidarlo agli addetti ai lavori e limitarsi a commentare come semplici fruitori.
Voto: 4.6 · Votanti: 8 · Assegna il tuo voto:
- Currently 4,625/5 Stars.
- 1
- 2
- 3
- 4
- 5