Recommender systems : Collaborative RS

Da Wiki Corso Web.

Indice

STATO=Libero

Definizione [Anelli Simona]

E' una delle tecniche usate da alcuni Recommender system e può essere inteso in due modi: uno generale e uno più stretto e recente.
Da un punto di vista generale possiamo intendere il Collaborative RS come un processo di filtraggio di informazioni o modelli che avviene attraverso la collaborazione di più fattori, quali punti di vista, fonti diverse... Questo tipo di filtraggio può essere applicato ad una grande quantità e varietà di dati tanto da trovare largo uso sia presso gli istituti di servizi finanziari - dove l'attenzione è ovviamente rivolta a dati finanziari, che nel commercio elettronico e nelle applicazioni del web 2.0, dove l'interesse è rivolto ai dati dell'utente.
In senso stretto, questo sistema di filtraggio serve a fare previsioni automatiche circa gli interessi di un utente attraverso la raccolta di preferenze o gusti, provenienti da molti utenti. Questo approccio si basa sull'idea che se i soggetti A e B hanno la stessa opinione su una questione, ci sono maggiori probabilità che il soggetto A abbia la stessa opinione di B su una questione X differente, piuttosto che di un'altra persona scelta a caso.

recommender

Metodi [Anelli Simona]

Questi sistemi possono assumere molte forme, ma vi sono degli elementi comuni a tutti:
1)la ricerca di utenti che abbiano lo stesso modello di rating dell'utente attivo;
2)utilizzare il rating degli utenti che hanno le stesse preferenze per calcolare una previsione per l'utente attivo.

Una delle forme che può assumere questo sistema di filtraggio è l'osservazione implicita del comportamento degli utenti normali (senza alcun comportamento artificiale imposto dal compito di rating). Si osserva quindi ciò che ha fatto l'utente, insieme agli altri, e da qui si utilizzano i dati per prevedere il comportamento futuro dell'utente: queste predizioni sono filtrate attraverso la logica del business, in modo tale da indirizzare il sistema aziendale verso le scelte maggiormente proficue.

Come funziona [Anelli Simona]

Alcuni problemi [Anelli Simona]

Questo meccanismo presenta 3 problemi fondamentali:
1)il cold start (partenza a freddo): spesso richiedono una grande quantità di dati esistenti su un utente al fine di formulare raccomandazioni precise. In alcuni RS si prova a risolvere il problema con un test iniziale;
2)la scalabilità: con la crescita del numero di utenti e di informazioni, il RS necessita di una grande potenza di calcolo per generare i suggerimenti. Talvolta questo crea rallentamenti nei tempi di risposta del sistema e una possibile soluzione è quella di delegare più calcoli possibili alla fase offline della computazione;
3)la data sparsity: a causa dell'alto numero di articoli venduti sui principali siti di commercio elettronico, gli utenti voteranno solo un piccolo sottoinsieme del database generale. Anche gli articoli più popolari avranno una votazione di pochi.


E la privacy?? [Anelli Simona]

3d key 

Dal punto di vista della privacy, la costruzione di profili utente con filtraggio collaborativo può risultare problematica. In Europa sono molti i paesi nei quali è radicata una forte cultura della riservatezza dei dati, per cui qualunque tipo di profilazione utenti -e a qualunque livello - potrebbe essere mal vista da parte dei clienti.

Questioni legate a questo tema sono ad esempio sorte intorno al set dei dati offerti da Netflix per il Netflix Prize Competition. Benchè infatti, i dati fossero stati resi anonimi per preservare la privacy dei clienti, due ricercatori dell'Università del Texas, nel 2007, sono riusciti a risalire ai singoli utenti, usando le valutazioni dei film su Internet Movie Database. Nel 2009, la Netflix è stata citata da un suo utente anonimo con l'accusa di aver rilasciato il set dei dati e aver quindi violato le leggi statunitensi sul commercio equo e il Video Privacy Protection Act. Questo ha comportato anche la cancellazione del secondo concorso Netflix nel 2010.

Collaborative Filtering Approach [Di Donato Leonardo]

Un approccio all'implementazione dei recommender systems largamente usato è il cosiddetto collaborative filtering. Lo scopo dei recommender systems, come detto, è quello di suggerire nuovi elementi o predirne la loro utilità per l'utente finale in base ai suoi collegamenti precedenti, e alle opinioni dei utenti ad esso simili.

Data una lista U di m utenti e una lista I di n elementi, ogni utente ui ha una lista Iui relativa alle opinioni dell'utente in questione. Si noti che le opinioni possono essere date tramite un rating score (social ranking esplicito), solitamente all'interno di un numero scalare, o ricavate (social ranking esplicito) dalle operazioni dell'utente (ad esempio dai suoi acquisti, dai suoi favoriti, dalle pagine che visita ecc. ecc.).

Supponendo esista un altro utente, chiamato utente attivo', ua', il task di collaborative filtering consiste nel trovare una similarità in 2 modi:

predizione
è un valore numerico (nella stessa scala con cui sono state rappresentate le opinioni dell'utente attivo) Pa, j che esprime la desierabilità (alto grado di similarità) di un elemento ij, non contenuto nell'insieme Iua.
raccomandazione
Una lista Ir di N elementi di gradimento dell'utenti attivo ua. Si noti che tale lista non deve comprendere elementi già sottoposti a ranking (per esempio acquistati) da parte dell'utente in questione. Perciò l'insieme Ir deve essere disgiunto dall'insieme I.

CF.gif

L'agoritmo di collaborative filtering rappresenta la matrice m x n dei rating presente in figura, detta anche matrice utente-elemento: essa rappresenta il grado di preferenza degli utenti di determinati elementi.





Whos here now:   Members 0   Guests 0   Bots & Crawlers 1
 
Strumenti personali
Namespace
Varianti
Azioni
Forum Menu
Wikibook
Autori
Istruzioni
Widget e Social Media
Strumenti
Modifiche