Arjantin’deki Otobüs Ödenekleri

 Angelica Peralta Ramos /La Nación (Argentina)

2002’den beri Arjantin’de otobüs ulaşım sistemi için verilen ödenekler her yıl yeni bir rekor kırarak, katlanarak büyüdü. Fakat 2011’de seçimleri kazandıktan sonra Arjantin’in yeni yönetimi, aynı yılın Kasım ayından başlayarak kamu hizmeti desteklerinde kesinti yapacağını açıkladı. Aynı zamanda ulusal yönetim, yerel otobüs hatları ve metro hatlarının idaresini Buenos Aires şehrinin yönetimine transfer etmeye karar verdi. Desteklerin, bu yerel yönetime transferi henüz açıklığa kavuşmadığı ve ulaşım sisteminin güvenliğini garanti edecek kadar yerel fon olmadığı için Buenos Aires yönetimi bu kararı reddetti.

Bunlar olurken, ben ve La Nacion’daki meslektaşlarım kendi veri gazeteciliği faaliyetimize nasıl başlayacağımızı tartışmak için ilk kez toplanıyorduk. Finansal Bölüm Editörümüz, http://www.transporte.gov.ar/[Secretaría de Transporte] (Finans Bölümü) tarafından yayınlanan ödenek verilerinin, başlangıç için güzel zorlu bir mücadele olduğunu ileri sürdü çünkü boyut ve terminoloji yüzünden anlamlandırmak oldukça zordu.

Toplu ulaşım sisteminin kötü koşulları her gün 5,800,000 yolcudan daha fazlasının hayatını etkiliyor. Gecikmeler, arızalar ve hatta kazalar sıklıkla meydana geliyor. Bu yüzden toplu ulaşım sistemi ödeneklerinin nereye gittiğine bakmaya ve şu anda yapım aşamasında olan “Ulaşım Ödenekleri Gezgini” aracılığıyla bu veriye bütün Arjantinli vatandaşların kolayca erişmesini sağlamaya karar verdik.

Ulaşım Ödenekleri Gezgini (La Nacion)

Otobüs şirketlerinin hükumetten her ay ne kadar aldığını hesaplayarak işe başladık. Bunu yapmak için de 2006 yılından beri 1.300’den fazla şirkete yapılan aylık peşin ödemeleri içeren 400’den fazla PDF’in yayınlandığı http://www.transporte.gov.ar/content/subsidios-sistau/[Ulaşım Departmanının sitesi] veriyi inceledik.

Ödenek verilen ulaşım şirketlerinin sıralaması (La Nación)

Düzenli indirmeyi ve bu PDF’lerin Excel ve veri tabanı dosyalarına dönüşümünü otomatikleştirmek üzere bir kazıyıcı geliştirmek için üst düzey bir programcı ile birlikte çalıştık. Araştırmalarımız ve görselleştirmelerimiz için hem basılı hem çevrim içi 285,000 kayıttan oluşan veri tabanını kullanıyoruz. Ek olarak, bu veriyi her Arjantinlinin yeniden kullanabilmesi ve paylaşabilmesi için makinece okunabilir boyuta uygun hale getiriyoruz.

Bir sonraki adım bir toplu taşıma aracının bakımının hükumete ortalama ne kadara mal olduğunu tespit etmekti. Bunu bulmak için devletin bir başka web sitesi olan Arjantin’deki ulaştırmayı düzenlemekle yükümlü http://www.cnrt.gov.ar/index2.htm[Comisión Nacional de Regulación del Transporte] (CNRT, ya da Ulusal Ulaşım Regülasyon Komisyonu ) ‘na baktık. Bu web sitesinde tamamı 9000 araca sahip olan şirketlerin listesini bulduk. Otobüs şirketi isimlerini ve çapraz referans iki veri setini bağdaştırmak için bir normalleştirici geliştirdik.

İlerlemek için her aracın kayıt numarasına ihtiyacımız vardı. CNRT’nin web sitesinde her şirketin her otobüs hattındaki araç listesini araç plakalarıyla birlikte bulduk. Arjantin’de araç kayıt numaraları aracın yaşına karşılık gelen harf ve rakamlardan oluşuyor. Örneğin benim aracımın kayıt numarası IDF234 ve “I” Mart-Nisan 2011 yılına karşılık geliyor. Her şirkete ne kadar para gittiğini göstermek ve araçların ortalama yaşına dayalı miktarları karşılaştırmak adına her şirketteki otobüslerin ortalama yaşını bulmak için listelenen bütün şirketlere ait otobüslerin araç plakasını tersine tasarladık.

Filoların yaşını, yönetimden aldıkları para miktarıyla karşılaştırmak (La Nación)

Bu sürecin ortasında, ihtiyacımız olan veriyi içeren, yönetim tarafından yayınlanan PDF’lerin içeriği gizemli bir şekilde değişti ama URL’ler ve dosya isimleri aynı kaldı. Bazı PDF’ler artık düşey “toplamları” atlıyor, bütünüyle araştırılan 2002-2011 zaman periyotunda toplamların sağlamasını yapmayı imkansız hale getiriyordu.

Bu olayı, Matt Perry’nin “PDF ajanı” dediğimiz şeyi oluşturduğu Hackler/Hackerlar tarafından Boston’da düzenlenen hackaton’a taşıdık. Bu uygulama etkinlikte “En Etkileyici” kategorisinde ödüllendirildi. http://gristlabs.com/2011/09/24/pdfspy/[PDF ajanı] , PDF’lerle dolu bir web sitesini işaret ediyor ve PDF’lerin içeriğinin değişip değişmediğini kontrol ediyor. Matt Perry “Bir daha asla ‘devlet şeffaflığı’ tarafından kandırılmayın” diye yazıyor.

Projede kim çalıştı?

7 gazeteci, programcı ve bir interaktif tasarımcıdan oluşan ekip 13 aydır bu araştırma üzerinde çalışıyordu.

Bu proje için ihtiyacımız olan yetenekler:

* Toplu ulaşım ödeneklerinin nasıl işlediğini ve risklerin neler olduğunu, otobüs işletmeleri piyasasını bilen gazeteciler. Web’den kazıma, ayrıştırma yapabilen ve veriyi normalleştirebilen ve veriyi PDF’lerden Excel tablolarına aktarabilen bir programcı
* Veri analizini ve farklı hesaplamaları idare etmek için bir istatik uzmanı
* İnteraktif veri görselleri oluşturmak için bir tasarımcı

Hangi araçları kullandık?

Uygulamalar için VBasic, Excel Macros, Tableau Public, ve Junar Açık Veri Platformu’nun yanı sıra Ödenek Gezgini için Ruby on Rails, Google charts API ve Mysql kul

Proje harika bir etki yarattı. On binlerce görüş aldık ve araştırma La Nacion’un basılı edisyonun ön sayfasında yer aldı.

Bu ilk veri gazeteciliği projesinin başarısı, şirketimizde araştırmacı gazeteciliği kapsayacak ve halka hizmet sağlayacak bir veri faaliyeti oluşturmak için yardım etti. Bu, kamu yararına birçok konuda bilgisayarca okunabilir boyutta veri yayınladığımız bir platform olan Data.lanacion.com.ar ile sonuçlandı.