Guardian Datablog’un Arka Planı

0
126

1.Veri Gazeteciliği El Kitabı’ndan Çevrilmiştir!

Datablog’u açtığımızda ham veri, istatistik ve görselleştirmelere kimlerin ilgi duyabileceği konusunda bir fikrimiz yoktu. Ofisimden üst düzey sayılabilecek birinin dediği gibi “birisi neden böyle bir şey istesindi ki?”

Editörlüğünü yaptığım Guardian Datablog (https://www.theguardian.com/data), haber hikayelerimizi oluşturan tüm veri setlerini paylaşacağımız küçük bir blog olacaktı. Halbuki şu anda ana sayfa (http://guardian.co.uk/data) dünya hükümetleri ve küresel kalkınma verileri, Guardian’ın grafik sanatçılarının ve webdeki diğerlerinin veri görselleştirmeleri ve kamu harcamalarını araştırma araçlarını barındırıyor. Her gün çalışmalarımızın ardındaki verilerin tümünü paylaşmak için Google tabloları kullanıyoruz, verileri analiz ediyor, görselleştiriyor, sonrasında da gazete ve web sitesi için haber üretiminde kullanıyoruz.

Grafiklerle çalışan bir haber editörü ve gazeteci olarak, yeni veri setlerini toplamak ve onları düzenleyerek içlerinden günlük haber hikayeleri çıkarmak halihazırda yaptığım işin mantıksal bir uzantısıydı.

Bana sorulan soru bizim için yanıtlanmış oldu. Kamuya açık veri adına harika bir kaç yıl geçirdik. Obama ilk kanuni tasarrufuyla ABD hükümetinin veri kasalarını halka açtı ve onun oluşturduğu örnek kısa zamanda Avustralya, Yeni Zelanda ve Britanya hükümetinin data.gov.uk sitesi gibi diğer hükümet veri siteleri tarafından takip edildi.

Britanya’nın en beklenmedik veri gazeteciliği örneği, parlamenterlerin harcama skandalı oldu ve bunun sonucu da Westminster’ın artık her yıl dev boyutlarda veri yayınlama taahhüdü altına girmesi oldu.

Ana siyasi partilerin her birinin kendi veri kasalarımızı tüm dünyaya açmak konusunda veri şeffaflığı taahhüdünde bulunduğu bir genel seçim yaşadık. Gazetelerin o değerli sütun alanlarını Hazinenin COINS veritabanının açıklamalarına ayırdığını gördük.

Aynı zamanda Web sürekli daha fazla bilgi pompaladıkça , dünyanın çeşitli yerlerindeki okuyucular haberlerimizin ardındaki ham bilgiyle daha fazla ilgilenir oldular. Datablog’u başlattığımız zaman, kullanıcılarımız uygulama üreten geliştiriciler olur sanmıştık. Oysa karbon salınımları, Doğu Avrupa göçleri, Afganistan’daki ölümlerin analizi ve hatta Beatles’ın şarkılarında kaç kere “aşk” sözcüğünü kullandığını öğrenmek isteyen insanlar onlar (613).

Figure 17. The Guardian Datablog production process visualized (The Guardian)

Guardian Datablog yapım sürecinin görselleştirilmesi (the Guardian)

Datablog’daki çalışmalar, adım adım, önümüze çıkan hikayeleri yansıtmaya ve onlara katkı yapmaya başladı. Parlamenterlerin harcamalarına dair 458.000 dokümanı kitle-kaynaklama yoluyla bir araya getirdik ve hangi parlamenterlerin ne talep ettiğine dair ayrıntılı veriyi analiz ettik. Kullanıcılarımızın detaylı Hazine harcamaları veritabanlarını incelemesine yardım ettik ve haberin arkasındaki verileri yayınladık.

Ancak veri gazeteciliğinin çehresini değiştiren şey, 2010’un baharında gerçekleşti. İlk aşama, her biri Afganistan’daki bir askeri olayın ayrıntılı dökümünü içeren 92.201 satırlık bir elektronik tablo ile başladı. Söz konusu olan WikiLeaks savaş günlükleriydi. Yani ilk kısım. Daha sonra iki kısım daha gelecekti: Irak savaş günlükleri ve diplomatik yazışmalar. İlk iki kısım için kullanılan resmi terim SIGACTS idi: Amerikan Askeri Mühim Eylemler Veritabanı.

Haber kuruluşlarının bütün olayı, coğrafya ve haber masasına yakınlıktır. Eğer yakındaysanız ortaya hikayeler atmak ve sürecin bir parçası olmak kolaydır ve öte yandan gözden ırak olan gerçek anlamda gönülden de uzaktır. WikiLeaks’ten önce biz grafikçilerle beraber ayrı bir katta çalışıyorduk. WikiLeaks’ten bu yana, haber masasının yanında onlarla aynı katta çalışıyoruz. Bu da bizim haber masasına fikir önermemizin ve haber merkezindeki muhabirlerin hikayeleri için bizden yardım istemeyi düşünmelerinin kolaylaşması anlamına geliyor.

Bundan çok da uzun olmayan bir süreye kadar gazeteciler resmi verilerin bekçisi idi. Rakamlarla ilgili hikayeler yazar ve bunları ham istatistiklerle ilgilenmeyen kamuoyuna sunardık. Ham bilginin gazetelerde yer almasına izin vermek aforoz sebebiydi.

Şimdi bu dinamik tarif edilemez şekilde değişti. Rolümüz daha çok yorumculuk haline gelmeye başladı. İnsanların verileri anlamasına yardım ediyoruz ve hatta kendi başına ilginç olduğu için sadece veri yayınlıyoruz.

Ancak analiz olmadan sayılar sadece sayıdır ve biz bu noktada devreye giriyoruz. Britanya başbakanı Ağustos 2011’deki ayaklanmaların yoksullukla ilgisi olmadığını iddia ettiğinde, ayaklananların adreslerini yoksulluk göstergeleri ile birlikte haritalandırarak bu iddianın arkasındaki hakikati gösterebildik.

Bütün veri gazeteciliği hikayelerimizin ardında bir süreç var ve biz yeni araçlar ve teknikler kullandıkça değişiyor. Bazı insanlar çözümün bir çeşit süper hackera dönüşmek, kod yazmak ve kendini SQL’e gömmek olduğunu düşünüyor. Bu yaklaşımı seçebilirsiniz. Ancak yaptığımız işin büyük bir kısmı sadece Excel’de.

İlk olarak, veriyi tespit ediyoruz veya onu, son dakika haberleri, hükümet verileri, gazetecilerin araştırmaları gibi farklı kaynaklardan alıyoruz. Daha sonra o veriyle neler yapabileceğimize bakıyoruz. Onu başka veri setleri ile bütünleştirmek gerekiyor mu? Zaman içindeki değişimleri nasıl gösterebiliriz? O elektronik tablolar çoğu zaman çok ciddi bir düzenleme çalışması gerektiriyor. Bütün o ikincil sütunlar ve garip şekillerde birleştirilmiş hücreler hiçbir işe yaramıyor. Ve tabii bütün bunlar söz konusu belgenin insan türünün bildiği en kötü veri formatı olan PDF olmaması varsayımıyla.

Çoğu zaman resmi veri içinde resmi kodlar ile geliyor. Her okul, hastane, bölge ve yerel yönetimin kendine özgü bir kimlik kodu oluyor.

Ülkelerin de kodları var (Birleşik Krallık için bu GB örneğin). Bunlar kullanışlı oluyor çünkü veri setlerini birleştirmek isteyebilirsiniz ve bunu yaparken ne kadar çok sayıda farklı yazım ve sözcük düzenlemesinin size engel olduğuna inanamazsınız. Burma ve Myanmar var örneğin veya Amerika’daki Fayette County (Georgia’dan Batı Virginia’ya kadar eyaletlerde ondan 11 tane var). Kodlar eş olanları karşılaştırabilmemizi sağlıyor.

Sürecin sonunda bir çıktı var. Bu bir hikaye mi olacak, bir grafik mi yoksa bir görselleştirme mi ve hangi araçları kullanacağız? En çok kullandığımız araçlar çabucak bir şeyler üretebildiğimiz ücretsiz araçlar. Daha ileri düzey grafikler, geliştirici ekibimiz tarafından üretiliyor.

Bu da demek oluyor ki küçük çaplı, çizgi ve dilim grafikler için sıklıkla Google grafikleri ya da hızla ve kolayca haritalar üretebilmek için Google Füzyon tablolarını kullanıyoruz.

Bu yeni bir şey gibi görünebilir, ama aslında değil.

Manchester Guardian’ın ilk sayısında (5 Mayıs 1821’in Cumartesi gününde), o zamanın bütün gazetelerinde olduğu gibi haberler arka sayfadaydı. Ön sayfadaki ilk parça, kayıp bir Labrador için verilmiş bir ilandı.

Öyküler ve şiirlerden seçmeler arasında, o arka sayfanın üçte biri, işte, olgusal gerçeklerle dolduruluyor. “NH”, bölgedeki okulların masraflarına dair etraflı tabloların daha önce hiçbir zaman “kamuoyunun önüne serilmediğini” yazıyor.

NH, verisinin yayınlanmasını istedi çünkü aksi halde gerçekler eğitimsiz papazlar tarafından rapor edilmeye terk edilmiş olacaktı. Motivasyonu şuydu “Böyle bir bilgi içerdikleri açısından değerlidir çünkü eğitimin hangi noktaya kadar başarılı olacağı bilinmeden, toplumun durumu ve gelecekteki ilerlemesine dair oluşturulabilecek en iyi fikirler bile yanlış olacaktır.” Diğer bir deyişle, eğer insanlar neler olup bittiğini bilmezse toplum nasıl daha iyiye gider?

Şu anda yapmaya çalıştığımız şey için daha iyi bir izah düşünemiyorum. Şimdi artık bir zamanlar arka sayfa hikayesi olan bir şey ön sayfa haberi olabiliyor.

* Simon Rogers, The Guardian