25 agosto 2008  2

Verso il web semantico: come condividere e filtrare le informazioni di proprio interesse mediante l'uso di APML

La sigla APML, acronimo di Attention Profile Markup Language, rappresenta un macrolinguaggio basato su XMLW atto a raccogliere un insieme di informazioni eterogenee finalizzate alla definizione di un cosidetto profilo di attenzione. Molto grossolanemente, un profilo di attenzione può essere considerato come un insieme di dati rappresentanti le proprie preferenze in termini di indirizzi internet, argomenti o più genericamente tassonomie relative alla propria navigazione su web.

Riuscire ad aggregare un oggetto di questo tipo, che altri non è che una struttura di tipo insiemistico, permette di creare un punto di riferimento per un filtraggio più accurato del mare magnum di informazioni che ormai caratterizza il world wide web.

Tassonomie e rilevanze

Una breve panoramica

Anche se la base di partenza per l'implementazione di un file APML è la struttura OPMLW, il suo significato semantico è ben diverso: dal semplice sistema di aggregazione di liste ordinate di elementi arbitrari (tipico dell'OPML), quali ad esempio un blogrollW, si arriva ad uno scenario più ampio in cui il nucleo originario potrebbe essere ancora un elenco di siti preferiti, arricchito però con una lista ordinata di tassonomie inerenti le proprie preferenze in termini di musica, foto, software, social media e via discorrendo.

L'utilità di un simile supporto si evidenzia in tutta la sua interezza nel momento in cui si affronta una ricerca generica di contenuti in un nuovo ambiente quale potrebbe essere un semplice blogW, un forumW, una directory o addirittura un più complesso portale orizzontale. Invece di affrontare una banale interrogazione basata su keyword, potrebbe essere sufficiente inviare od indicare l'indirizzo del proprio file APML al motore di ricerca del sito in esplorazione, per consentire al medesimo, tramite l'applicazione di un "filtro di prossimità", l'estrapolazione di tutti (o parte) dei contenuti inerenti il profilo di attenzione comunicato.

Allo stesso tempo, il proprio profilo di attenzione potrebbe essere pubblicato su web o estrapolato a partire da una sorgente di contenuti in nostro possesso (come un blog, un forum o un generico sito non statico) per consentire a servizi esterni di comunicare con noi o la nostra sorgente per la condivisione di ulteriori contenuti ad essi inerenti.

Diagramma APML

Le possibilità sono infinite e pongono le basi, utilizzando un concetto di fondo dopo tutto estremamente semplice, per un'evoluzione verso il cosiddetto "web semantico" e per una massima portabilità e circolarità delle informazioni.

Lo standard non è nè utopico, nè fantascientifico e lo dimostra il fatto che, non solo è in continua evoluzione, ma ha un livello di diffusione sempre maggiore, proprio in virtù del fatto che è di tipo "aperto" e quindi acquisibile da chiunque ne voglia sposare l'acquisizione e il supporto. Servizi come Digg, Ma.gnolia, Newsgator, Bloglines e molti altri hanno già aderito in forme diferenti all'APML Workgroup e ne sostengono la diffusione.

L'uso dell'XML come formato di interscambio dati, se da un lato costituisce una garanzia come standard interpretativo per lo scambio di messaggi tra web serviceW (infatti è universalmente riconoscibile ed manipolabile ormai da tutte le tecnologie di sviluppo disponibili), nel caso della distribuzione dei profili di attenzione, potrebbe porre degli evidenti problemi in termini di privacy per l'uso o abuso delle informazioni condivise.

L'ausilio di web service per la pubblicazione degli APML file, espone gli stessi, proprio perchè in formato aperto, all'attenzione delle società di advertising che potrebbero utilizzarli per campagne mirate sui soggetti interessati. Sotto questo aspetto è importante sottolineare che l'APML Workgroup ha stabilito delle linee guida che espongono i diritti fondamentali di ciascun proprietario di un profilo di attenzione, che ha in ogni momento il controllo assoluto sui dati generati, indipendentemente dai servizi utilizzati ai quali egli lo sottopone. Ogni "consumatore" di un profilo di attenzione, d'altra parte, deve attenersi scrupolosamente alle indicazioni contenuto in esso, relative alle modalità di trattamento dei dati condivisi.

Un esempio concreto

Il supporto ad APML si sta cominciando a diffondere anche all'interno dei sistemi di blog authoring. BlogEngine.NET, dalla release 1.4 in poi, mette a disposizione un massiccio numero di funzionalità dedicate al già citato web semantico. Tra queste sia la creazione in tempo reale di un documento APML associato ai contenuti pubblicati nel blog, sia la sua rielaborazione a partire da un documento o una fonte esterna (mediante autodiscovery) per presentare al visitatore solo quanto semanticamente ad esso compatibile.

Entrambe le funzionalità possono essere sperimentate, sia visionando il documento APML associato a questo blog che utilizzando la funzione di filtro APML (presente anche nel menù di testata) per avere una visione su quanto pubblicato in funzione di una sorgente o blog esterno.

E' importante notare come la struttura elaborata, nel caso del blog, includa sostanzialmente gli elementi del blogroll preceduti dalle tassonomie rilevate, intese come keyword estrapolate dalle categorie e tag utilizzati, e "pesate" a seconda della loro frequenza di associazione. Sorgenti differenti possono avere differenti strutture del documento APML associato.

Nel caso dei blog, lo strumento è decisamente interessante perchè, se supportato sia da quello in lettura che da quello del visitatore, permette una valutazione immediata della prossimità tra gli stessi.

Anche gli utenti di WordPress, utilizzando il plugin APML for WordPress, possono dotare il proprio blog di un  profilo di attenzione ad hoc.

Il web semantico

L'argomentazione è ovviamente ampia e, evidentemente, non si esaurisce solo con l'argomento trattato. Ogni settimana dedicherò un articolo ai nuovi servizi basati sull'utilizzo degli standard di comunicazone basati su XML che si prefiggono l'obiettivo di aumentare l'interoperabilità tra i contenuti pubblicati su web. Ogni suggerimento sarà fonte di spunto per ulteriori riflessioni in merito.

Le immagini pubblicate sono sotto licenza Creative Commons by Faraday Media

Esprimi il tuo giudizio

Commenti (2) -

Paolo Bee
Paolo Bee
25 ago 2008 alle 12:58  01
Esaustivo come sempre, ottimo post.
Forse io mi sarei dilungato un tantino in più sul discorso "tassonomia", visto che nei corsi universitari ogni professore vi si soffermava pesantemente...

Ad ogni modo, credo sia molto utile la possibilità di inserire accanto alla propria identità on-line mediante APML e aggregatori, anche quella reale, ad esempio per mezzo del Codice Fiscale per i privati o della P.I. per aziende/società, è quello che attualmente si sta pensando di fare e che, a mio avviso, darebbe un forte slancio semantico agli attuali motori di ricerca.

Le tecnologie per la realizzazione di un prosimo Web Semantico, come sottolinei, ci sono già, ora le più grandi compagnie di servizi web stanno studiando il modo per monetizzare la cosa e creare il più markettaro "Web 3.0"...
... e in quest'ottica viene coinvolta in prima persona anche la mia tanto amata SEO!!! Smile
Cristiano
Cristiano
25 ago 2008 alle 22:30  02
@ Paolo Bee:
In realtà forse non avrei proprio dovuto citare le "tassonomie" ma fare invece riferimento al modello "entità-relazione" che è maggiormente applicabile all'assegnazione e condivisione dei tag.
L'argomento però rischiava di diventare troppo di "nicchia".

L'identità (reale o virtuale) che sia si qualifica meglio utilizzando FOAF o SIOC, che saranno comunque ciascuno oggetto di prossimi articoli.

Aggiungi Commento

biucitecode
  • Commento
  • Anteprima
Loading


| |   |  

Codice QR

Codice QR - cristianofino.net

Ultimi Commenti