12 settembre 2007  2

I blog e le statistiche di accesso

Web 2.0 

La diffusione ed il successo di un qualunque media informativo, sia esso elettronico, cartaceo o televisivo è strettamente vincolato al gradimento del bacino di utenza al quale si rivolge. Lo stesso fenomeno investe evidentemente anche il web con la macroscopica e naturale differenza relativa alle dimensioni del pubblico complessivo che potrebbe essere "virtualmente" assimilato a quello dell'intero pianeta.

Il gradimento di un sito web può essere sinteticamente correlato al numero di accessi allo stesso, ovvero a quanti utenti diversi fra loro consultano le sue pagine in un determinato intervallo temporale. In realtà questo valore non è un indice assoluto di gradimento perchè dipende da tutta una serie di parametri che delimitano il suo target di riferimento: non è corretto ad esempio paragonare gli accessi di un portale dedicato al download di software shareware o freeware con quelli di una testata giornalistica online. I target sono diversi come diversi sono i volumi di traffico; per questo motivo le statistiche di accesso devono essere interpretate in funzione ed a confronto del pubblico di riferimento che si vuole raggiungere.

Il blog

Obiettivo di questa umile analisi è di circoscrivere in maniera sintetica come andrebbero interpretate le statistiche di accesso nel caso specifico di un blog. Un blog (sostantivo dovuto alla contrazione delle due parole Web e Log) è in sintesi un elenco di notizie omogenee o eterogenene pubblicate in senso cronologico inverso. La semplicità che c'è alla base di questa tipologia di pubblicazione elettronica ne ha favorito in maniera impressionante la diffusione, facendola diventare a tutt'oggi, il mezzo preferito di comunicazione dalla gran parte degli utenti di internet, sia creatori che fruitori, ponendo le basi, assieme al crescente proliferare delle cosiddette Web Application distribuite, per quello che viene comunemente definito Web 2.0.

La struttura di questo particolare tipo di sito è estremamente singolare. Non è costituito come di consueto da una prevalenza di pagine statiche (anche se nulla toglie che ne possa avere anche un discreto numero): al contrario le sue pagine vengono generate dinamicamente a seconda dei contenuti registrati in una fonte dati esterna, che può essere un db relazionale o un insieme di file di testo semplice o codificato in xml. La home page generalmente raccoglie le ultime notizie pubblicate (dette post ) in un numero variabile a seconda della loro dimensione: se i post pubblicati sono di lunghezza ragionevole, essi vengono interamente proposti nella home page in ordine sequenziale, altrimenti ne viene pubblicato una piccola porzione (i primi uno o due paragrafi) o un breve sunto (excerpt), seguita da un collegamento ipertestuale alla pagina contenente il testo completo dell'articolo. L'autore di un blog può decidere inoltre di renderlo interattivo dando la possibilità agli utenti di registrare commenti alle notizie pubblicate. Ciò aumenta significativamente il grado di coinvolgimento del lettore che da mero fruitore di contenuti diventa personaggio attivo e collaborativo.

L'intero scenario modifica notevolmente i canoni interpretativi dei relativi dati di accesso. Anzitutto è necessario porre l'attenzione su alcune definizioni di base. Parleremo quindi di:

  • visite uniche: l'utente si collega una volta al sito nel periodo temporale considerato (la discriminazione viene effettuata per indirizzo IP di provenienza)
  • visite ricorrenti: lo stesso utente si collega più volte nel periodo temporale considerato (viene riconosciuto o tramite il suo indirizzo IP o tramite cookie tracciante o tramite una procedura di log-in)

Entrambe le categorie si possono raggruppare in:

  • visite dirette: l'utente si collega al sito direttamente tramite il suo indirizzo
  • visite da altri siti: l'utente arriva al sito tramite link da altro sito
  • visite da motori di ricerca: l'utente arriva al sito tramite interrogazione su motore di ricerca

Si passa poi alle definizioni relative alle pagine:

  • pagine lette: numero complessivo di pagine lette da tutti gli utenti nel periodo temporale considerato
  • pagine per visita: è un dato medio corrispondente al numero complessivo di pagine diviso il numero di visite
  • pagine ricaricate (reload): corrispondono alle pagine che sono state raggiunte da ogni visitatore a partire da quella di arrivo. Questo parametro può essere importante perchè corrisponde al livello di gradimento dei contenuti. Se i reload sono pari a zero significa che gli utenti hanno letto solo la pagina di arrivo sul sito e poi lo hanno abbandonato.
  • tempo medio di permanenza: ovvero il tempo medio che l'utente permane sul sito durante la sua navigazione.

Esistono inoltre tutta un'altra serie di indici derivati a partire da quelli indicati che non indico per non complicare ulteriormente l'analisi.Analizziamo ora le diverse casistiche.

Il parametro più evidente è senz'altro quello delle visite uniche: un valore alto indica che il blog ha un buon riscontro, ma va esaminato di concerto con i referenti di provenienza (referrer). Se la maggior parte delle visite uniche (diciamo l'80%) proviene da visite dirette vuol dire che il blog è molto conosciuto ed i visitatori lo raggiungono in seguito ad una scelta precisa. Se al contrario la maggior parte proviene invece da motori di ricerca o da link da altri siti, vuol dire, nel primo caso che il sito è molto ben indicizzato, mentre nel secondo che esistono molti siti che lo hanno linkato (e questo potrebbe far supporre un certa popolarità). Bisogna tener presente, però che in quest'ultimo caso, forse il sito non è giudicato interessante perchè successivamente dovrebbe aumentare il numero degli accessi diretti in sfavore di quello da link esterni. Secondo la mia esperienza è molto più importante fidelizzare l'utenza diretta: non sempre un indice di popolarità elevato indica un gradimento dei contenuti. Anche il parametro relativo alle visite ricorrenti non è da sottovalutare: esso indica inequivocabilmente un elevato interesse dell'utente ai contenuti del blog soprattutto se esso è aggiornato di frequente. E' sinonimo quindi di elevata fidelizzazione.

Per ciò che concerne le pagine, nel caso specifico dei blog non è un dato particolarmente significativo. Non dimentichiamo che la maggiorparte dei contenuti aggiornati risiedono sempre nella home page per cui non bisogna meravigliarsi se a volte questo dato è molto basso in proporzione al numero di visite. Come già accennato precedentemnte è importante il numero dei reload perchè indica che il visitatore oltre alla pagina di arrivo ha proseguito la navigazione anche in altre pagine mostrando quindi interesse anche per gli altri contenuti. Fondamentale è invece il tempo di permanenza per pagina: un valore alto indica che le pagine vengono lette e non sono abbandonate per mancanza di interesse. Purtroppo questo dato spesso è inquinato dalla navigazione impropria degli utenti: il visitatore infatti, una volta arrivato sul blog, potrebbe abbandonarlo immediatamente aprendo in una nuova finestra o scheda (a seconda del browser utilizzato) uno dei suoi link esterni e lasciando in background la pagina precedente senza consultarla. In questo modo il sistema assegnerebbe a quella sessione un lungo tempo di permanenza fino allo scadere della stessa inficiando il dato statistico medio complessivo.

I feed ed i commenti

Un parametro che spesso si tende ad associare alla popolarità di un blog è la densità dei commenti ai post. Il dato è significativo nella misura in cui si parli di fidelizzazione: è ovvio che gli autori dei commenti sono generalmente i visitatori ricorrenti. La bassa percentuale di commenti però non vuol dire che il blog non sia popolare: in realtà la percentuale di incidenza dei commenti rispetto al numero complessivo di visite nell'intervallo temporale considerato tende ad essere generalmente bassa (ma non è una regola assoluta).

Caso a parte è invece quello dei feed. I sistemi di blogging più diffusi sono dotati di procedure automatizzate che consentono di esportare in file xml, formattati secondo determinati standard, i contenuti degli ultimi post pubblicati: la generazione di questi flussi di informazioni è detta feed. Software ad hoc (feed reader) sono poi in grado di leggere e di aggregare queste informazioni senza dover necessariamente raggiungere il blog (o sito) di provenienza effettuando le cosiddette "sottoscrizioni". Risulta evidente, quindi che l'indice di gradimento di un blog è anche direttamente legato al numero di "sottoscrizioni" che ha il suo feed: questo dato indica che un certo numero di utenti è talmente interessato dai contenuti del suo sito da "abbonarsi" ad essi per poterne tenere sotto controllo costante gli aggiornamenti. Sottoscrivere un feed non vuol dire però anche leggerlo: quindi oltre alle sottoscrizioni và anche considerato il numero di letture.

Conclusioni

Le statistiche di accesso ad un blog vanno interpretate principalmente in funzione dei suoi obiettivi. Le cifre vanno interpretate sul lungo periodo: l'essenziale è che i dati di accesso siano relativamente costanti. Un andamento sinusoidale non è positivo: indica che il gradimento dei visitatori è anomalo e che c'è un notevole ricambio dovuto ad una qualità incostante dei contenuti. A mio avviso è da prediligere la fidelizzazione: riuscire a condividere idee con un bacino costante di utenza può essere di estrema soddisfazione, indipendentemente dalla sua entità.

Per maggiori informazioni sulle statistiche di accesso e come interpretarle segnalo un ottimo e completo compendio sull'argomento (anche se un pò datato) pubblicato sul sito diodati.org e concludo con una citazione tratta dal sito stesso:

La determinazione del numero di accessi è sempre una presunzione statistica, non un dato oggettivo

Esprimi il tuo giudizio

Commenti (2) -

Hiroshi
Hiroshi
06 nov 2007 alle 11:18  02
Ottima analisi.
Concordo sulla fidelizzazione.
Ho la sensazione che la difficoltà principale per il blogger sia quella di appoggiarsi a delle statistiche affidabili ed ho la sensazione che quelle free lascino molto a desiderare.
Io ho risultati enormemente differenti tra la versione free di Shinystat e le statistiche fornite dal mio hosting Aruba.
Sono interessato a capire l'affidabilità delle statistiche offerte da Aruba, che essendo il gestore del server su cui risiede il sito ritengo molto buona, ma non ho dati oggettivi o parametri di raffronto per fare una valutazione approfondita.
Cristiano
Cristiano
06 nov 2007 alle 11:37  03
@Hiroshi:
Benvenuto: presumo che tu ti riferisca al servizio di rilevamento statistiche a pagamento di ARuba. Lo conosco: è un ottimo prodotto, un pò complesso, ma completo.
Per fare un paragone ti consiglio di appoggiarti contemporanemente anche a servizi che prevedono l'inserimento di javascript come FeedFlare di FeedBurner, o LLOOGG (lascia perdere ShinyStat).
Ho già pubblicato recensioni e guide in merito: se hai bisogno di un invito per LLOOGG, lascia un commento nel post dedicato.
Un saluto.

Pingbacks and trackbacks (1)+

Aggiungi Commento

biucitecode
  • Commento
  • Anteprima
Loading


| |   |  

Codice QR

Codice QR - cristianofino.net

Ultimi Commenti