p2p e privacy in rete con OneSwarm
Pubblico qui l’introduzione del progetto OneSwarm, un progetto software a cui ho collaborato recentemente traducendolo in italiano. Il software è disponibile qui. – Jan Reister
Privacy-preserving P2P data sharing with OneSwarm – Tomas Isdal, Michael Piatek, Arvind Krishnamurthy, Thomas Anderson – Technical report, UW-CSE. 2009. (PDF)
La privacy – la protezione delle informazioni dagli accessi non autorizzati – è sempre più rara in Internet, eppure sta diventando sempre più importante nel momento in cui ciascuno di noi è diventato sia fruitore, sia produttore di contenuti.
La mancanza di privacy è particolarmente evidente per i programmi di condivisione dati peer-to-peer più diffusi, in cui i meccanismi di rendezvous pubblico e la partecipazione dinamica rendono molto facile sorvegliare il comportamento degli utenti.
In questo saggio presentiamo la progettazione, la realizzazione e l’esperienza pratica di OneSwarm, un nuovo sistema di scambio dati P2P che fornisce agli utilizzatori un controllo esplicito e flessibile sui loro dati: è possibile condividere i dati pubblicamente oppure in modo anonimo, con tutti i propri amici, solo con alcuni amici e non con altri, oppure solo tra i propri computer personali.
OneSwarm è disponibile al pubblico ed è stato scaricato da centinaia di migliaia di utenti nei mesi trascorsi dalla sua nascita. Uno degli obiettivi principali è ridurre il costo della privacy in termini di prestazioni; le nostre misurazioni sul sistema dal vivo hanno infatti dimostrato che i trasferimenti anonimi di dati hanno prestazioni competitive rispetto al traffico non anonimo. Le nuove tecniche di ricerca e trasferimento in OneSwarm offrono velocità di trasferimento oltre un ordine di grandezza più veloci rispetto a Tor, un altro diffuso sistema di anonimato.
1 Introduzione
La privacy – la protezione delle informazioni dall’accesso non autorizzato – è un obiettivo costante nella progettazione di sistemi informatici. La privacy è diventata particolarmente impellente con la trasformazione degli utenti da consumatori passivi in autori di contenuti, condivisori di materiali e di interessi con differenti e sovrapposti gruppi di persone.
Tecnicamente la privacy sarebbe facile da ottenere nei sistemi centralizzati. Se i dati degli utenti sono conservati in un server all’interno di un data center, è semplice applicare le direttive degli utenti sulla diffusione dei dati, e si può limitare attentamente, o a richiesta disabilitare, ogni informazione sugli interessi e sui comportamenti degli utenti stessi. Tuttavia la realtà è assai diversa. Molti famosi servizi web esigono che gli utenti rinuncino ai loro diritti di proprietà e privacy come condizione per usufruire dei servizi; molti siti in questo modo raccolgono, conservano e trasmettono grandi quantità di informazioni personali sui loro utilizzatori, anche se la maggioranza degli utenti è contraria a questi comportamenti. Anche per semplici collegamenti ad Internet, gli ISP divulgano regolarmente informazioni personali sui loro utenti a praticamente chiunque lo richieda. Con la centralizzazione è anche più facile applicare la censura, come difatti accade in molti paesi del mondo.
I sistemi di scambio dati peer-to-peer (P2P) possono offrire scalabilità e privacy senza ricorrere alla centralizzazione. Con il P2P non vi è alcun bisogno intrinseco di sacrificare la privacy, perché le risorse sono fornite dagli utenti stessi. Tuttavia i sistemi P2P più diffusi sacrificano la privacy alla facilità d’uso, senza offrire quindi alternative pratiche ai sistemi di cloud computing centralizzati.
Da un lato, i sistemi come BitTorrent sono robusti ed hanno alte prestazioni, ma le attività di tutti sono visibili a chiunque abbia voglia di osservarli. (Il nostro gruppo di ricerca, con una dozzina di computer all’Università di Washington, ha sorvegliato decine di milioni di utenti BitTorrent in tutto il mondo.) D’altro lato, sistemi anonimi come Tor e Freenet enfatizzano la privacy a costo di prestazioni limitate e di fragilità, in parte causati da incentivi divergenti e da scelte inefficienti di protocollo, come il routing su singolo circuito. Ad esempio, nella nostra valutazione delle prestazioni, OneSwarm ha fornito velocità di trasferimento oltre un ordine di grandezza superiori rispetto a Tor.
In questo saggio descriviamo il progetto, la realizzazione ed esperienza di un servizio di scambio dati rispettoso della privacy, detto OneSwarm, che cerca di ridurre il “costo” della privacy concentrandosi su obiettivi di usabilità: facilità di installazione, supporto per differenti modelli di condivisione e fiducia, interoperabilità con gli utenti degli altri sistemi pubblici di scambio dati, alta efficienza e robustezza. In OneSwarm, i dati vengono individuati e trasferiti attraverso una rete mista di nodi (peer) fidati e non-fidati, appartenenti alle reti sociali degli utenti. Riteniamo che la combinazione mista di nodi fidati e non-fidati offra più privacy e robustezza rispetto al loro uso separato. La ricerca ed il trasferimento di contenuti sono anonimi, in grado di gestire congestioni, avvengono su percorsi multipli ed offrono buone prestazioni ad un costo computazionale ragionevole anche per oggetti rari e diversa larghezza di banda tra nodi.
OneSwarm fa parte di un più vasto movimento per realizzare un’alternativa al cloud computing che non dipenda da un sistema di fiducia centralizzato, e comprenda servizi di rendezvous, ricerca, storage a lungo termine, calcolo remoto e simili. Ci occupiamo della privacy come prima cosa, perché è gestita molto male nei sistemi P2P attualmente più usati, pur essendo ai nostri occhi una delle caratteristiche più importanti che questi sistemi dovrebbero avere. Vogliamo sottolineare che la privacy ha un grande valore per molti legittimi motivi. C’è chi dice: “chi non ha nulla da nascondere, non ha nulla da temere”, ma noi non siamo d’accordo. Ad esempio, molti contenuti di Youtube sono liberamente distribuibili e l’uso di tecniche P2P permetterebbe a Youtube di risparmiare milioni di dollari l’anno: è probabile tuttavia che gli utenti non accetterebbero una simile scelta se ciò permettesse a terze parti di sorvegliare con poco sforzo ogni loro attività in Youtube.
OneSwarm è stato scaricato da centinaia di migliaia di persone ed ha gruppi di utilizzatori attivi in molti paesi, confutando così l’idea che “a nessuno interessa la privacy”. Noi utilizziamo questa base per le nostre valutazioni raccogliendo statistiche d’uso volontarie dagli utenti e misurazioni di particolari client OneSwarm su PlanetLab. Dato che le nostre misurazioni dal vivo sono limitate dalle esigenze di privacy dei nostri utenti, completiamo il nostro studio con simulazioni di OneSwarm su una traccia di schemi di condivisione oggetti e di relazioni sociali di oltre un milione di utenti del servizio musicale last.fm .
Il resto del saggio è così organizzato: La sezione 2 descrive il modello di scambio dati e carico di lavoro di OneSwarm. Descriviamo come gestiamo le identità e la fiducia nella sezione 3, e gli algoritmi congestion-aware di ricerca dati e trasferimento nella sezione 4. Nella sezione 5 effettuiamo una breve analisi di sicurezza e nella sezione 6 valutiamo le prestazioni del sistema. L’esperienza nella realizzazione è discussa nella sezione 7, presentiamo altri lavori collegati nella sezione 8 e le conclusioni nella sezione 9.
Traduzione italiana di Jan Reister 2009 – Gnu Free Documentation License 1.2
http://oneswarm.cs.washington.edu/
Se ti interessa, puoi leggere il seguito del paper in inglese qui: Privacy-preserving P2P data sharing with OneSwarm (PDF).
Se invece preferisci provare di persona, puoi scaricarlo ed installarlo sul tuo computer: è scritto in java e funziona su Windows, Mac OSX e Linux.
p2p? f2f?
No. Propongo l’h2h (hand to hand).
due amici si scambiano materiale a mano: risolto il problema!
*sbonk* O_o
In effetti lo scambio a mano tra amici è la cosa più normale e naturale. Hei presente quando prestavi i dischi LP e registravi le cassette?
scusa jan, ma dov’è la novità? e’ peggio di freenet/darknet in tutto e per tutto. se devo scambiare file solo con gente che conosco va bene qualsiasi programma, perfino un client irc criptato fatto in casa. Il punto di forza di ants/freenet ecc e’ lo scambio sicuro fra SCONOSCIUTI…
ps:h2h è (anche) il passamano che effettuavamo dopo ogni furto…
…sono un nostalgico ^__^
mar asma, se ti va leggi il paper, e poi ne riparliamo :-)
Ci sono alcune differenze con freenet (sitata per nome nel saggio), e non si tratta di una darknet in senso stretto.
[…] In questo saggio presentiamo la progettazione, la realizzazione e l’esperienza pratica di OneSwarm, un nuovo sistema di scambio dati P2P che fornisce agli utilizzatori un controllo esplicito e flessibile sui loro dati: è possibile condividere i dati pubblicamente oppure in modo anonimo, con tutti i propri amici, solo con alcuni amici e non con altri, oppure solo tra i propri computer personali. Leggi il seguito su Nazione Indiana» […]