lunedì 2 maggio 2011

Le 70 banche dati online che definiscono il nostro pianeta


Se si vuole simulare la Terra, avrete bisogno di dati su clima, salute, finanza, economia, traffico e molto altro ancora. Ecco dove trovarlo.

L'idea è quella di sfruttare l'enorme quantità di dati generati dai mercati finanziari, le cartelle cliniche, i social media e il clima di monitoraggio per il modello climatico del pianeta, società ed economia. La visione è che un sistema come questo può aiutare a comprendere e prevedere le crisi prima che si verifichino in modo che i governi possono adottare misure appropriate in anticipo.


Si scopre che ci sono già numerose fonti di dati che potrebbero fornire il combustibile necessario per alimentare Helbing's Earth Simulator. "In passato, la raccolta dei dati di attività umana è stata ampiamente ostacolata da questioni fifinancial, tecnologiche ed etiche", dicono Helbing e Balietti. Questo non è più il caso.
Mentre i buoni dati da esperimenti di scienze sociali è stato difficile da trovare nel passato, i ricercatori sono attualmente sommersi da essa grazie a una nuova generazione di esperimenti di laboratorio, esperimenti web e lo studio del massiccio multi-player on-line di giochi.

 
Internet e le istantanee storiche 
Internet Archive / Wayback machine
L'Internet Archive offre un accesso permanente per i ricercatori, storici, studiosi, persone con disabilità, e al pubblico di collezioni storiche che esistono in formato digitale. Fondata nel 1996, oggi l'Internet Archive comprende testi, audio, immagini in movimento, e software, nonché archivio
Wikipedia
Wikipedia è l'enciclopedia più famosa cooperativa modificato. Dal momento che ogni modifica viene memorizzata, la storia di pagine Web 'in grado di offrire una panoramica dettagliata soggetto-base dei riferimenti più importanti del passato.
I centri di conoscenza
Una raccolta di link ad altre risorse per trovare pagine Web da utilizzare sul passato.
Whenago
Whenago fornisce accesso rapido a informazioni storiche su ciò che è accaduto in passato in un dato giorno.
World Digital Library
La World Digital Library (WDL), rende disponibile su Internet, gratuitamente e in formato multilingue, signifificant materie prime provenienti da paesi e culture di tutto il mondo.

Recupero di informazioni motori 
Freebase
Freebase è un dialogo aperto, sotto licenza Creative Commons repository di dati strutturati di oltre 12 milioni di soggetti. Fornisce strumenti di collaborazione per collegare le entità insieme e tenerli aggiornati.
Wolfram Alpha Computational Knowledge Engine
Un tentativo di calcolare tutto ciò che può essere calcolato su niente. Esso mira a fornire una sola fonte che può essere fatta valere da tutti per le risposte alle domande defifinitive di fatto.
text mining sul Web
Google Trends
Google Trends mostra le statistiche visiva su come spesso le parole chiave sono stati cercati su Google nel tempo. Google Trends mostra anche la frequenza con cui gli argomenti sono apparsi su Google News, e in cui le regioni geografiche persone hanno cercato per la maggior parte di loro.
Google Flu Trends
Google Flu Trends usa dati aggregati di ricerca di Google per stimare l'attività influenzale. disponibile per il download anche di dati.
Il Observatorium
Il progetto si concentra sulle dinamiche Observatorium complessa rete in Internet, proponendo per monitorare la sua evoluzione nel tempo reale, con l'obiettivo generale di una migliore comprensione dei processi di generazione della conoscenza e delle dinamiche parere.
We Feel Fine
Un database di diversi milioni di sentimenti umani, raccolte di blog e pagine sociale nel web. Utilizzando una serie di interfacce ludiche, i sentimenti possono essere ricercati e ordinati in un certo numero di fette demografica. Web API disponibili pure.
CyberEmotions
Il progetto CyberEmotions si concentra sul ruolo delle emozioni collettive nella creazione, formazione e ecommunities disgregazione. Si rende disponibile per il download tre set di dati che contiene notizie e commenti dal forum BBC News, Digg e MySpace, solo per la ricerca accademica e solo dopo la presentazione di un modulo di domanda.
Social condivisione dei dati
Linked Data
Linked Data tratta di utilizzare il Web per collegare i dati correlati che non era legato in precedenza, o usando il web per abbassare le barriere per il collegamento dati attualmente collegati con altri metodi.
Dataverse Network Project
La rete Dataverse è un'applicazione per pubblicare, condividere, di riferimento, estrarre e analizzare dati di ricerca. Facilita rendendo i dati disponibili agli altri, e permette di replicare il lavoro degli altri. I ricercatori e gli autori dei dati ottenere credito, editori e distributori di ottenere credito, enti affiliati ottenere credito.
Data360
Data360 è un sito open-source, in collaborazione e Web gratuito. Il sito ospita una banca dati comune e condivisa, che qualsiasi persona o organizzazione, impegnata a neutralità e non partigianeria (che significa lasciare che i dati parlano), possono utilizzare per presentazioni e visualizzazioni.
Girevole
Swivel è un sito web dove le persone condividono i rapporti di tabelle e numeri. E 'gratuito per i dati pubblici, e un costo mensile per chi vuole usarlo in privato.
Molti occhi
Una iniziativa di IBM, che consente agli utenti di caricare i propri set di dati e utilizzare una collezione di strumenti per ottenere effetti grafici significativi da loro. Ogni visualizzazione è pubblicamente memorizzati su una pagina dedicata, dove gli utenti possono commentare, votare e tag. Riutilizzo dei dati è possibile e incoraggiata.
Conflitto di dati 
I dati sui conflitti armati CSCW
CSCW e Uppsala Conflict dati del programma (UCDP) presso il Dipartimento di Pace e conflitti di Ricerca, Università di Uppsala, hanno collaborato alla produzione di un set di dati di conflitti armati, sia interne che esterne, nel periodo 1946 ad oggi. Attualmente, probabilmente il set di dati più ampia repository disponibili, in particolare per i dati storici.
WarViews
L'obiettivo del progetto WarViews è quello di creare un facile da usare front-end per l'esplorazione di dati GIS in conflitto. Esso può essere eseguito su un browser Web oppure può essere visualizzato utilizzando Google Earth.
Di seguito sono riportati i dataset guerra civile specifific con ulteriori informazioni empiriche:
Gruppo etnico dataset posizione
potenza etnica saldi dataset
Raccolta di set di dati aggiornati e codebooks dal conflitto Uppsala dati del programma (UCDP) .
ACL scaduto
In parte contenuta nel set di dati PRIO, ACL scaduto (conflitti armati Location ed eventi Dataset) è progettato per l'analisi disaggregata dei conflitti e la mappatura delle crisi. Questo dataset codici la posizione di tutti gli eventi segnalati conflitto in 50 paesi nel mondo in via di sviluppo. I dati sono attualmente in fase di programmazione 1997-2009 e il progetto continua a retrodatare le informazioni sui conflitti degli stati africani per l'anno di indipendenza.
CERAC
Il conflitto Analysis Resource Center ospita diversi cross country dati conflitto insiemi e un set di dati di alcuni paesi in particolare. Repository anche set di dati di instabilità politica e conflitto.
Il Cross-National Time-Series Data Archive
Il Cross-National Time-Series Data Archive offre dati annuali per una serie di paesi dal 1815 ad oggi. Frequentemente citato, è uno dei \ dataset principale sulla violenza politica ", secondo Robert Bates all'Università di Harvard. E '\ forse il dataset evento più usato", secondo Henrik Urdal, International Peace Research Institute, Oslo (PRIO).
specifific repository Paese: Iraq , Afghanistan
Collezione di dataset di atti terroristici .
I dati in economia e fifinanceBloomberg
Internazionali in tempo reale provider di dati per i decisori in fifinance, imprese e governo.
Maddison dati
statistiche storiche sul PIL e sulla popolazione.
UNCTAD Statistiche
Il Manuale di Statistica UNCTAD on-line offre di serie storiche di dati economici e indicatori di sviluppo, in alcuni casi risalenti fino a 1950; i prezzi delle materie prime statistiche di database, il TRENI UNCTAD-su Internet (Trade Analysis and Information System) per la commercio misure di controllo, nonché i flussi di importazioni per provenienza da oltre 130 paesi, il database di investimenti esteri diretti (IDE).
Le statistiche OCSE Portal
Ampia raccolta di set di dati riguardanti l'economia, la demografia. Le estrazioni sono liberamente disponibili, l'accesso completo richiede una sottoscrizione.
EUROSTAT
Statistiche dettagliate sui paesi dell'UE e dei paesi candidati, e varie pubblicazioni statistiche in vendita.
Where's George?
sistema di tracciamento del territorio per i dollari statunitensi e canadesi.
EuroBillTracker
sistema di tracciamento del territorio per le banconote.

Scientifific collaborazione sui datiISI Web of Knowledge
fonte completa di informazioni nel campo delle scienze, scienze sociali, arti e scienze umane. Essa comprende varie serie di dati, tra cui i seguenti sono forse i più degni di nota:
Journal Citation Report. Esso permette di valutare e confrontare riviste utilizzando dati citazioni tratte da oltre 7500 riviste scientifiche e tecniche;
Web of Science. Si compone di sette banche dati contenenti informazioni raccolte da migliaia di riviste accademiche, libri, collane di libri, relazioni, conferenze e altro ancora.
Google Scholar
Google Scholar è motore di ricerca specializzato in letteratura accademica. E gli indici di fonti diverse (articoli, libri, abstract, tesi, ecc) da diverse discipline e le ordina in base al numero di citazioni, l'autore e l'impatto fattore giornale.
Scholarometer
Scholarometer è uno strumento sociale per facilitare l'analisi citazione e aiutare a valutare l'impatto delle pubblicazioni di un autore. Funziona come un plug-in per il browser Firefox.
Scopus
Scopus è un database molto grande astratto e citazione della letteratura di ricerca. E 'disponibile solo per utenti registrati.
Vivere Scienza
Vivere La scienza è un tempo reale osservatorio scienza globale, basato sulle pubblicazioni presentate arXiv.org. Esso copre in tempo reale (ogni giorno) presentazione di pubblicazioni in settori diversi come fisica, astronomia, Informatica, Matematica e Quantitative Biology. Attualmente, i contenuti vengono aggiornati dinamicamente ogni giorno. Vivere La scienza è un potente strumento di analisi per individuare l'entità e l'impatto del lavoro scientifific in tutto il mondo.

Scienze socialiICPSR dell'Università del Michigan
ICPSR offre più di 500.000 fifiles digitale contenente i dati di ricerca sociale della scienza. Discipline rappresentate sono la scienza politica, sociologia, demografia, economia, storia, gerontologia, la giustizia penale, la salute pubblica, politica estera, terrorismo, della salute e alle cure mediche, educazione, istruzione, minoranze razziali ed etniche, la psicologia, diritto, l'abuso di sostanze e mentale salute e altro ancora.
UK Data Center della University of Essex
la più grande collezione del Regno Unito di dati di ricerca digitale nel campo delle scienze umane e sociali.
Archivio DATI UC Berkeley
UC DATA aziende i dati sono principalmente nei settori della politica, Scienze Sociali e della Salute.
Il Servizio economico e sociale dei dati (ESD)
Il Comitato economico e sociale Data Service (ESD) è un servizio dati nazionale che fornisce l'accesso e il supporto per una vasta gamma di dati economici e sociali, sia quantitativi che qualitativi, che coprono molte discipline e temi. Esso contiene una mappa di set di dati aggiuntivi provenienti da diversi paesi europei.
CESSDA
raccolte di dati Wide comprese le indagini sociologiche, studi elettorali, studi longitudinali, sondaggi e dati di censimento. Tra i materiali sono dati internazionali ed europee, quali il sociale europea, i sondaggi Eurobarometro, e l'International Social Survey Programme.
Gapminder dati
Gapminder è una tecnologia e di applicazioni Web per cross-visualizzazione delle tendenze per serie temporali di dati. Si apre anche un archivio di più set di dati su diversi indicatori socio-economici.
World Value Survey
Il World Value Survey fornisce i dati circa i valori ei cambiamenti culturali nelle società di tutto il mondo.
Urban datiGlobal Urban Observatory database
Il Global Urban Observatory (GUO) offre indicatori urbani orientata alla politica, statistiche e altre informazioni urbano.
Urban Observatory
dataset degli Stati Uniti basato sulla ricchezza, l'innovazione e la criminalità in città.
Il traffico datiNGSIM
La simulazione Next Generation (NGSIM) il programma è stato avviato dagli Stati Uniti Department of Transportation (DOT USA). Il programma sviluppato un nucleo aperto di algoritmi comportamentali a sostegno di simulazione del traffico, e raccolti Trac di alta qualità primarie e dati traiettoria destinata a sostenere la ricerca e la sperimentazione di nuovi algoritmi.
Ufficio federale delle strade USTRA
L'Ufficio federale delle strade offre una panoramica completa sui flussi di traffico in Svizzera. I dati sono raccolti da permanenti del traffico di conteggio automatico le stazioni e completato da controllo manuale regolari dal 1961.
TrafficData
Lo scopo del traffico internazionale di Database (ITDb) del progetto è quello di fornire dati di traffico a vari gruppi (ricercatori, professionisti, enti pubblici) in un formato in base alle loro particolari esigenze, che vanno dai dati di misurazione prime analisi statistica. ITDb promuove un flessibile del traffico dei dati forniti, formato sulla base delle esigenze degli utenti e abitudini standard.
Camera di compensazione per i dati di Trasporto
La Clearing House per il trasporto dati in il Centro Aerospaziale Tedesco fifirst è il punto di contatto per una rapida panoramica dei dati disponibili. L'iniziativa è rivolta a entrambe le organizzazioni che raccolgono dati relativi ai trasporti e coloro che desiderano utilizzare i risultati di tale ricerca. L'informazione offerta comprende la preparazione dei metadati dettagliate sul set di dati, così come le note sui possibili usi e fonti.
Desweiteren das Delft Regiolab
L'iniziativa regiolab-Delft iniziata poco dopo il 2000 come un progetto congiunto condotto da TU Delft in collaborazione con il Comune di Delft, la scuola di ricerca TRAIL, la Provincia di South Holland, il Ministero dei Trasporti e diversi partner industriali. Il set di dati archiviati è costituito da oltre 6 anni di 1 minuto e la velocità media di flusso di dati aggregati da densamente spaziati loop induttivi sulla rete autostradale in provincia di South Holland e altri dati da controller di intersezione, piastra licenza di rilevamento e molto altro ancora.
RITA
La ricerca e l'Innovative Technology Administration (RITA) del Dipartimento dei Trasporti statunitense offre varie serie di dati circa marittima, noli, la compagnia aerea, i passeggeri, le statistiche sul traffico ecc.
ETH Travel Data Archive (ETHTDA)
L'ETH Travel Data Archive (ETHTDA) è una piattaforma virtuale che permette agli utenti finali di sfogliare i dati di viaggio archiviati tramite il Web e consentendo semplice analisi statistica.
Metropolitan Travel Survey Archivio
Il Metropolitan Travel Survey Archive per archiviare, conservare e rendere disponibili al pubblico, tramite Internet, i sondaggi di viaggio condotto da aree metropolitane, gli stati e località.
Infoblu
Infoblu è una società privata che fornisce in tempo reale servizi di monitoraggio del traffico per l'Italia. Tutti i servizi sono disponibili a pagamento.
Apri le mappeGoogle Maps
Mappa del servizio di fama mondiale. Esso offre una serie di servizi aggiuntivi come: Street View, i contenuti caricati dagli utenti (foto, commenti e voti) e sovrapposizioni personalizzate attraverso le API del servizio.
OpenStreetMap
OpenStreetMap (dal UCL) è una mappa modificabile gratuitamente di tutto il mondo. OpenStreetMap permette di visualizzare, modificare e utilizzare i dati geografici in maniera collaborativa da qualsiasi punto della Terra.
Tracksource Brasil
Tracksource è un progetto di collaborazione finalizzato alla realizzazione e distribuzione di mappe gratuite del Brasile.
Logistica dei datiNational Household Survey di viaggio
Il National Household Travel Survey (NHTS) raccogliere dati su entrambi i viaggi a lunga distanza e locali da parte del pubblico americano. L'articolazione del sondaggio raccoglie i dati di viaggio-correlati, come mezzo di trasporto, la durata, la distanza e lo scopo del viaggio. Essa raccoglie anche dati demografici, geografici, economici e per fini di analisi. Fa parte di RITA.
Commodity Flow Survey
Il flusso delle merci Survey (CFS) è la principale fonte di dati nazionali e di livello statale sulle spedizioni di merci interno da istituti americani nel settore minerario, manifatturiero, commercio all'ingrosso, gli ausiliari, e selezionati commercio al dettaglio. I dati sono forniti i tipi, le origini e le destinazioni, i valori, i pesi, le modalità di trasporto, la distanza spediti, e ton-km di merci spedite. Fa parte di Rita e viene condotta ogni anno fifive (campionamento da ultimo il 2007).
Clima datiJulich
dati climatici da Julich Research Center.
Google.org
Google introduce i suoi progetti di data-driven filantropiche, tra le quali due osservatori satellite ambientale:
la Terra del motore: per seguire l'evoluzione della deforestazione mondiale;
la risposta alla crisi: per il monitoraggio della fuoriuscita di petrolio dalla piattaforma Horizon Deep affondò.
Reality miningReality Mining
dati comportamentali raccolti da 100 cellulari in 9 mesi. Include sia di prossimità e le statistiche di utilizzo del telefono. Due set di dati anonimi disponibili: singolo utente (MySQL) e globale (Matlab).
Altre iniziative di dati apertoData.gov
Ricca collezione di dataset pubblico statunitense per la ricerca.
Data.gov.uk
Ricca collezione di set di dati pubblici del Regno Unito per la ricerca.
Scavando nei dati
Lanciato dalla National Science Foundation (NSF), offre una raccolta di diversi archivi di dati.
Data Guardian Blog
iniziativa giornalismo dati che l'interesse pubblico posti (principalmente Regno Unito pertinente) dataset con le loro analisi. Un paio di collaborazioni con artisti di visualizzazione dei dati sono presenti pure.
Google pubblica i dati
Google offre molti grandi serie di dati sugli indicatori variegato mondo socio-economico e fornisce gli strumenti per una visualizzazione semplice.