Nadomestilo Za Znamenje Zodiaka
Znanalnosti Snovi C.

Ugotovite Združljivost Z Znakom Zodiaka

Kako lahko novinarji uporabljajo Geocommons za ustvarjanje interaktivnih zemljevidov

Drugo

Pred nekaj meseci je John Keefe napisal Poynter.org How To o uporabi oblikovnih datotek. Moč shapefile, je zapisal, je sposobnost sklicevanja na regije namesto na točke.

Kaj pa, če vaši podatki vsebujejo točke (na primer naslove) in želite preslikati regije? Recimo, da imate na primer naslove okoljskih kršitev in želite pokazati, v katerih kongresnih okrožjih je največ kršitev. Najti morate način, kako te točke povezati v oblike. V tej vadnici bom razložil, kako to storiti.

Uporabimo primer organizacije, za katero delam, Sunlight Foundation. Imamo spletno stran z imenom Podatki o preglednosti , kjer lahko uporabniki prenesejo podatke, med katerimi so nekateri naslovi. Eden takšnih naborov podatkov so podatki o kršitvah EPA. Pojdite na Podatki o preglednosti, kliknite zavihek »EPA« in nato poiščite kršitve med 1. julijem 2011 in 31. decembrom 2011. Podatki o preglednosti bodo vrnili približno 1300 zapisov. Kliknite ogromen gumb »Prenesi podatke«, da shranite zapise v računalnik.

Ko prenesemo te podatke, jih bomo odprli v preglednici. Videli boste, da eden od stolpcev vključuje naslov kršitve. (Upoštevajte, da nekatere celice v tem stolpcu vključujejo več naslovov, druge pa sploh nimajo naslovov. Za naše namene bomo odstranili vse zapise z več naslovi ali tiste brez naslovov. Lahko se sklicujete na to prejšnjo zgodbo, »Kako lahko novinarji uporabljajo Excel za organiziranje podatkov za zgodbe«, če potrebujete pomoč pri tem.)

Prav tako bi morali naslov ločiti na njegove sestavne dele. Ustvaril bom nove stolpce za mesto, državo in ZIP.

(Za pomoč pri tem se lahko obrnete na enega od mojih prejšnjih navodil – »Kako lahko novinarji uporabljajo regularne izraze za ujemanje nizov besedila«. Namig, moje iskanje/zamenjavo je bilo iskanje:

|_+_|

in zamenjaj z:

|_+_|

To bo pustilo nekaj napak (kot so številke apartmajev v polju mesta), ki jih bomo odpravili z iskanjem:

|_+_|

in nadomesti z:

|_+_|

Ko so podatki očiščeni, jih bomo vrnili v našo preglednico. Nato bomo to preglednico izvozili kot .csv ali besedilno datoteko z vrednostjo, ločeno z vejico. datoteko, ki izgleda takole .)

Zdaj, da bomo te naslove združili s kongresnimi okrožji, bomo uporabili eno mojih najljubših orodij: GeoCommons . Ta postopek bomo začeli z izvozom zgornje preglednice kot besedilno datoteko CSV ali »vrednosti, ločene z vejico«. Tukaj sem objavil primer datoteke . Nato bomo ta CSV naložili neposredno v GeoCommons.

Po nalaganju v GeoCommons bomo sledili navodilom, dokler nas storitev ne bo pozvala, da »pomagamo pri geolociranju« podatkov. Na voljo sta nam dve možnosti. Najprej lahko podatke povežemo ali združimo z mejnim naborom podatkov. Če bi izbrali to možnost, bi potrebovali mejne podatke v preglednici. Takšni podatki lahko vključujejo imena okrožij ali kode FIPS, kode kongresnih okrožij, popisne liste in podobno. V naših podatkih teh polj nimamo.

Druga možnost, »geokodiranje na podlagi naslova ali imena kraja«, vzame informacije o lokaciji, kot je naslov ulice, in jih pretvori v zemljepisno dolžino in širino. To je možnost, ki jo želimo izbrati.

Glede na glavo v vaši datoteki lahko GeoCommons samodejno zazna nekatera polja za lokacijo. V nasprotnem primeru bomo morali GeoCommons pomagati določiti, katera polja sestavljajo naslov. Če želite to narediti, se bomo pomaknili navzdol do »naslov lokacije« in izbrali »uredi«. Tam bomo izbrali »ulični naslov«. Podobno bomo storili za mesto, državo in poštno številko. Nato kliknite »Nadaljuj«. (Opomba, GeoCommons lahko geokodira samo do 5000 naslovov na datoteko.) Če želite ali morate, lahko prilagodite tudi druge vrste podatkov polj.

Storitev bo potrebovala nekaj časa, da dekodira naslove in jih pretvori v točke zemljepisne širine in dolžine. Na koncu tega postopka nam bo GeoCommons sporočil, kako dobro je lahko geolociral naslove. V mojem testu je geokodiranje trajalo približno 10 minut. (Če ne želite čakati na geokodiranje vaše datoteke, lahko uporabite kopijo mojih podatkov, ki je na voljo tukaj .) Seveda lahko uporabite tudi druge storitve za geokodiranje podatkov v zemljepisno širino in dolžino in nato naložite CSV, ki vsebuje ta polja – poleg vseh ostalih – v GeoCommons.

Nato bomo izkoristili eno najboljših lastnosti GeoCommonsa: sposobnost analize podatkov. Če gremo v naš na novo geokodirani nabor podatkov, lahko do teh funkcij dostopamo s klikom na gumb »analiziraj« v zgornjem desnem kotu strani.

To odpira vrsto možnosti. Nekaj ​​časa bi morali porabiti za igranje s temi orodji, toda za to vadnico bomo izbrali drugo, »Združevanje«. V nastalem pogovornem oknu moramo izbrati nabor meja. Pojavilo se bo okno in poiskali bomo »111. kongresna okrožja«. Tam bomo izbrali okrožja, ki sem jih naložil. Ta okrožja so v obliki oblikovnih datotek, ki je vektorsko zasnovana metoda opisovanja območij.

Preklical sem izbiro »Ohrani prazne meje«, saj ne želim prikazati okrožij, ki nimajo nobenih kršitev.

GeoCommons bo zdaj opravil svojo analizo, ki je v mojem primeru trajala približno 20 minut. Nastala datoteka se nahaja tukaj .

Čeprav lahko nastali nabor podatkov preslikate v GeoCommons, menim, da so zemljevidi storitve preveč omejujoči. Na primer, nimate popolnega nadzora nad tem, kako so oblikovane informacije v opisih orodij zemljevida.

Iz tega razloga rad izvozim zemljevid iz GeoCommons s funkcijo »Prenesi kot KML«. Datoteka KML, ki jo izvozi GeoCommons, vsebuje vse podatke, pa tudi informacije o mejah. S to datoteko se lahko obrnem na Google Fusion Tables, uvozim KML in imam popoln nadzor nad oblikovanjem, senčenjem, oknom z informacijami in drugim. John Keefe je to že obravnaval v svojem uvodu v oblikovne datoteke, zato ne bom obravnaval istega podlage.

Čeprav za končni zemljevid običajno ne uporabljam Geocommons, je to neprecenljivo orodje za ustvarjanje informativnih in privlačnih zemljevidov, zlasti pri obravnavi meja ali območij.

Zabavajte se pri raziskovanju in delite svoje izkušnje z GeoCommons in kartiranjem v razdelku za komentarje. Če imate druge teme, ki bi jih želeli obravnavati v tej seriji, nam to sporočite.

Ta zgodba je del Poynterja Haki/hekerji serija, ki vključuje Kako ki se osredotočajo na to, kaj se novinarji lahko naučijo iz nastajajočih trendov v tehnologiji in novih tehnoloških orodij.