Paparazzi, ovvero, dal mashup al data scraping

Scraping
is
such an
unkind word…
Mentre non mancano nuove analisi piuttosto superficiali del fenomeno, e nonostante la segnalazione sia già stata oggetto della rubrica Avvistamenti (nella colonna qui a fianco in home page), vale la pena di ricordare che in apertura di Wired spiccava fino a poche ore fa un brillante articolo sulle nuove frontiere del mashup, che configurerebbero un fenomeno per il quale è stata coniata la nuova espressione di data-scraping: fino a che punto è moralmente ammissibile e giuridicamente lecito appropriarsi dei contenuti di un’applicazione web 2.0 per creare servizi alternativi, magari servendosi di strumenti liberamente disponibili online che facilitano il rimescolamento e la diversa combinazione dei flussi di dati originari? Nel descrivere diversi casi di nuove aziende statunitensi citate in giudizio per avere assunto un atteggiamento eccessivamente disinvolto nell’accesso, la manipolazione e la riedizione dei contenuti di servizi di nanopublishing e altre web-app di successo, la famosa testata sembra assumere una posizione piuttosto assolutoria. Lo fa appellandosi alla tendenza attuale alla condivisione implicita nel paradigma del social web ma anche ai precedenti forniti da giganti quali Google e Yahoo, che propendono verso un atteggiamento permissivo nei confronti dei loro epigoni, grazie anche all’aumento del traffico in ingresso reso in definitiva possibile dal fenomeno.

The Internet these days is supposed to be all about sharing. Thanks to a common commitment to open access and cooperation, the data mashups that have defined the Web2.0 phenomenon have exploded.

Analizzando gli aspetti tecnici che rendono possibile l’importazione dei dati da parte delle startup della rete, pare emergere tuttavia una distinzione abbastanza chiara. L’uso intensivo di bot, ovvero programmi appositamente compilati che copiano dati in automatico a partire da un server remoto o da un computer, sottopone i server del sito che rappresenta la fonte dei contenuti a ripetute richieste di accesso che possono notevolmente rallentarne il funzionamento, rappresentando una minaccia per l’affidabilità e l’usabilità del servizio bersagliato. Nonostante questo, non mancano realtà che arrivano a giustificare e persino gradire l’anomalia in vista dell’aumento di visibilità comunque derivante ai propri contenuti e, in definitiva, alla propria immagine. Le stesse misure pensate per scoraggiare il data-scraping finiscono inoltre, spesso, per introdurre nuovi livelli di artificiosità nella user experience dell’utente del sito originario.

D’altra parte, la scarsa chiarezza che spesso sottende l’impiego dei propri dati utilizzati dai nuovi servizi, ovvero la dispersione dei propri contenuti, induce le maggiori aziende a incoraggiare l’accesso ai dati stessi, e quindi la loro manipolazione per la creazione di nuovi tool e servizi. Tramite le famigerate API (Application Protocol Interfaces), esse non solo offrono a chiunque uno strumento alternativo a bot potenzialmente fraudolenti per la rielaborazione dei contenuti originali, ma soprattutto dispongono di uno strumento sicuro per il monitoraggio e il controllo anche statistico dell’uso dei propri dati e informazioni, tramite chiavi di codice predefinite su cui consentire l’innesto di una eventuale nuova programmazione complementare e personalizzata da parte degli sviluppatori. Le API forniscono ad una relazione commerciale tra fornitore e sviluppatore di contenuti altrimenti, spesso, del tutto indefinita o evanescente, una "chiave software" per la formalizzazione del rapporto che, pur riducendone la libertà, è utile anche agli stessi sviluppatori, che difficilmente vedranno sparire improvvisamente dalle proprie creazioni le componenti importate da servizi preesistenti a causa di sovraccarichi di richieste di accesso ai relativi server, precedentemente causati da bot troppo solerti.

Le conclusioni di Wired riguardo al fenomeno del data scraping sembrano coincidere con quelle, certo meno imparziali, del CEO e fondatore di LinkedIn Reid Hoffman: sono gli utenti a rimetterci quando le grandi compagnie decidono di adottare politiche troppo restrittive in materia di trattamento dei propri contenuti.

And in the process, the world is getting a better Internet, one where bright ideas become great services almost instantly and where information is easy to discover and use.

Il giudizio pare assumere ulteriore spessore se il prodotto finale è arricchito da una presentazione editoriale e da un mood che davvero rappresentano un’alternativa rispetto al punto di partenza, arrivando a favorire l’affermarsi di nuovi e proficui stili comunicativi legati ad una scala eventualmente locale e più raccolta, a tutto vantaggio dell’utente di cui sopra.
[ Technorati Tags: , , , ]

Diritti

Questo blog e' pubblicato con una Licenza Creative Commons.
Alcuni diritti riservati.

WordPress database error: [Table 'Sql103193_1.wp_comments' doesn't exist]
SELECT * FROM wp_comments WHERE comment_post_ID = '676' AND comment_approved = '1' ORDER BY comment_date

0 commenti a “Paparazzi, ovvero, dal mashup al data scraping”


  1. Nessun commento

Scrivi un commento

WordPress database error: [Table 'Sql103193_1.wp_comments' doesn't exist]
DESC wp_comments

WordPress database error: [Table 'Sql103193_1.wp_comments' doesn't exist]
ALTER TABLE wp_comments ADD COLUMN comment_subscribe enum('Y','N') NOT NULL default 'N'




Foto "recenti"

www.flickr.com
Questo è un badge Flickr che mostra le foto pubbliche di Slowfinger. Crea il tuo badge qui.

Pietatis causa

LinkLift

Proudly with

2000 blogger italiani
slow.quid

Technorati stuff

Add to Technorati Favorites!

Diritti

Creative Commons License

Contenuti ridistribuibili con
Licenza Creative Commons 2.5.