Veri gazeteciliği, giderek dijitalleşen toplumlarda meydana gelen ya da yaşanması muhtemel olay ve durumları bir takım teknik beceriler aracılığıyla aktarmayı sağlayan bir pratik olarak karşımıza çıkar. Veri gazeteciliği alanının kökenlerinde infografik haberler, bilimsel gazetecilik ve bilgisayar destekli habercilik gibi yaklaşımlar yer alır.
2010’lu yıllarla birlikte WikiLeaks, Panama Belgeleri gibi ciddi miktarda veri barındıran içeriklerin haberleştirme süreçleri The Guardian Datablog, FiveThirtyEight gibi öncü girişimler pratiğe olan ilgiyi giderek artırdı. Bugüne geldiğimizde ise finansal yapısı nispeten güçlü medya kuruluşlarında birçok veri gazetecisi istihdamına ve veri haber odalarının oluşturulduğuna tanık oluyoruz.
Veri gazeteciliğinin uygulanması sırasında programlama, kullanıcı deneyimi, bilgisayar bilimi, veri analizi, tasarım, istatistik ve en önemlisi araştırmacı gazetecilik gibi birtakım becerilere başvuruluyor. Teknik bilginin yoğun olarak kullanılması, alanla ilgilenmek isteyen gazeteciler için zaman zaman önyargılar oluşturabiliyor. Elbette biraz teknik bilginin kimseye zararı dokunmaz fakat pratiğin temelinde gazetecilik güdüleri ve becerilerinin yer aldığını da ısrarla vurgulamak gerekiyor. Örneğin büyük projelerde ya da günümüz gazetelerinde oluşturulan veri haber odalarında, haberler teknik uzmanların da yer aldığı ekip çalışmalarıyla yürütülebiliyor. Bu sebeple, gazetecilerin teknik beceriler üzerinden kaygı problemlerine girmeden alanla ilgilenmesinin de önemli olduğunu belirtmek uygun olacaktır.
Günümüz toplumlarında otomasyonların gelişmesi, sensörler, gözetim mekanizmaları, dijitalleşme, tüketici davranışlarının analizi gibi süreçler verinin konumunu ve veriyi elinde tutanları güçlendirirken gazeteciler için de çeşitli fırsatlar sunuyor ve engeller oluşturuyor. Veri gazetecilerinin bu engin veri denizinde okuyucular için seçimler yapması, seçimlerinin ardından verileri toplaması, analiz etmesi ve görselleştirmesi bekleniyor. Ayrıca verilerin okuyucuların hayatına dokunması bununla birlikte günümüz gazetecilik anlayışına da etkileşim, yöntem paylaşımı, açık kaynak ve hipermetin özelliklerinin kullanılmasıyla öncülük yapması düşünülüyor. Tüm aşamaların gerçekleştirilmesi ve haberlerin verilerle sunulması objektifliğin inşasında etkili bir yöntem olarak görülüyor. Bununla birlikte süreçte haberin gündemde iken oluşturulması mesleki dille ifade edecek olursak haberin “soğutulmaması” da önemli bir eşik olarak karşımıza çıkıyor. Tüm bu aşamalar sırasında haber üretim sürecinde bize yardımcı olabilecek kaynak ve araçları tanımak ve kullanmak, süreci özümsemek veri gazeteciliği pratiğini uygulamak için önemli adımlar olarak vurgulanabilir.
Veriler Neler Anlatır?
Veri, TDK’da “sonuç çıkarmak, çıkarsama yapmak, ya da bir incelemeyi sürdürmek için gerekli olaylara, ilişkilere ve sayısal ham bilgilere verilen ad” olarak tanımlanır. Literatürde veri ile ilgili yapılan tanımlarda sıkça tekrarlanan ifadeler arasında yargı ve yorumlama içermemesi, nesnel bir gerçekler kümesini göstermesi yer alır. Erken dönem veri gazeteciliği akademik çalışmalarında; artan veri miktarından haberler çıkarmak, yani açık olan ve elimize ulaşan mevcut verileri anlamlı bir içeriğe dönüştürmek üzerine odaklanılmaktaydı. Bugün ise habere dönüştürmeyi amaçladığımız bir durum hakkında veri arayışına da girebileceğimiz bir veri potansiyeline sahibiz.
Her iki amaçta da verilerle nasıl karşılaşacağımızı, karşılaştığımızda hangi soruları sormamız gerektiğini ayrıntılandıralım.
Veri gazetecilerinde genellikle açık veri aktivizmi eğilimlerine rastlanır. Günümüzde kurumlar ve kuruluşların verilerini yayımlaması denetim ve şeffaflığın önünü açıyor ve ortaya çıkan veriler ayrıca alanla ilgilenen gazeteciler için de takip edilebilir oluyor. Bu sebeple gazeteciler aynı zamanda açık veriyi tanımlayan özelliklere de sahip olan tam, işlenebilir, adil, tescilsiz, lisanssız ve zamanında paylaşılabilen veri setlerini talep ediyorlar. Özellikle Türkiye’de kurumların paylaştığı verilerde bu özelliklerden bir ya da birkaçı eksik olabiliyor. Bu bağlamda verinin niteliğinin gazeteciler tarafından tespit edilebilmesi sürecin ilk adımlarını oluşturuyor. Wikileaks, Panama ve Paradise belgelerinde veri setlerinin sızıntılar aracılığıyla gazetecilere ulaştırılması belli bir yöntemi işaret ediyor. Ve bu süreçte ileri düzeyde uzmanlık gerekebiliyor. Biz, bu profesyonellik sürecini erteleyerek öncelikle Türkiye’de verileri edinme yöntemlerine odaklanmalıyız.
Verilere ulaşmak için Türkiye’de öncelikle verilerini açan kurumları mercek altına almalıyız. TÜİK gibi resmi istatistikleri paylaşan; Strateji ve Bütçe Başkanlığı, Merkez Bankası, Dergi Park, Türkiye Bankalar Birliği, Sağlık Bakanlığı gibi birçok resmi verilerin sağlanabileceği kurumlara dikkat etmemiz gerekir. Son dönemlerde İstanbul ve İzmir olmak üzere Büyükşehir belediyelerinde de veri paylaşımı hususunda adımlar atıldığından bu portalları da ziyaret etmek faydalı olabilir. Bu kurumlar dışında sosyolojik araştırmalar yapan vakıflar, akademik çalışma raporları da veri sağlama konusunda yardımcı olabilir. Son olarak internet, veri kaynaklarına ulaşmak için bize çeşitli kolaylıklar sağlayabilir bu nedenle arama motorlarını etkin kullanmanın yöntemlerini de incelemeliyiz.
Verilerin niteliği kadar hangi soruları sorduğumuz ve veriye yaklaşımlarımız da çıktımızı etkileyen bir aşamadır. İçinde bulunduğumuz pandemi süreci ile ilgili soruları düşündüğümüzde incelememiz gereken yerler de açığa çıkacaktır. Mesela karantinada bulunmak doğum oranlarını etkiledi mi ya da internet kullanım alışkanlıklarında değişiklik oldu mu? Koronavirüs’ün geçmiş dönem salgınları ile arasındaki fark nelerdir veya hava kirliliğinde, su kullanımında ne durumdayız? Farklı gruplar ve kimliklerde bireylerin ölüm oranları arasında farklar nelerdir? Bu örnekler ve benzer sorular bizlere önemli bir haberi oluşturmanın kapısını aralayabilir.
Verileri Ortaya Çıkarmak
Çeşitli kaynaklardan edindiğimiz veri setlerinde zaman zaman eksik, bağlamının dışında, doğruluğu şüpheli, tekrara düşen verilerle karşılaşabiliriz. Bu durum hem hazırladığımız içeriğin doğruluğunu zedeleyecek hem de bizlerin yanlış sonuçlara ulaşmasına sebep olabilecektir. Bu bağlamda veri temizleme süreçlerini etkin bir şekilde geliştirmek sözdizimi hatalarını düzeltmek, veri setlerinin standardizasyonunu sağlamak, boş ve eksik alanları gözden geçirmek gerecektir. Örneğin bir veri setinde karşılaştığımız “0” ve kayıp veriler (veri setlerinde “NA” olarak yer alır) birbirinden farklıdır. Veri setinde yer alan “0” değeri anlamsız olarak gözükse de, gözlemin kayda değer bir verisi olmadığını ifade eden anlam taşır. “NA” ise kayıp veriyi ifade eder yani boşluktur. Bu ve benzeri ayrıntılara dikkat etmek analizimizin sağlanması için önemli bir eşiktir.
Veri setlerimiz hazır duruma geldiğinde, elimizdeki verilerin bizlere neler anlattığını analiz etmemiz gerekir. Öncelikle değişkenlere odaklanarak yaş, cinsiyet, gelir, kimlik, ülke gibi herkes tarafından kolay anlaşılabilecek bariz durumlar açığa çıkarılabilir. Daha sonra veri setleri arasındaki örüntüleri ele almak direkt ya da dolaylı bir biçimde düğümlenen yapılar varsa onları keşfetmek analizimizi derinleştirecektir. Son olarak ise mevcut analizlerimiz üzerinden genel bir düşünceye ulaşmaya çalışmak, veri setlerimizin temsil sınırlarını zorlamak bizleri büyük bir hikâyeye götürebilir.
Verileri Görselleştirerek Sunmak
Düzenlenmiş veri setlerini görselleştirerek sunmak; ilk adımda analizini yaptığınız çalışmaya kuşbakışı bakmanızı ve ilişkileri daha derin görmenizi sağlar daha sonra ise yoğun veri setlerinin okuyucu tarafından dikkat çekici ve anlaşır olmasına yardımcı olur. Ayrıca Web’in bizlere sunduğu ve günümüz gazetecilik anlayışına da uygun bir şekilde görsel çalışmalar ile etkileşimli içerikler oluşturulabilir.
Veri görselleştirme çalışmalarında uzmanlığınıza göre programlama dillerine ya da kullanımı oldukça basitleştirilmiş ücretsiz uzantılara başvurabilirsiniz. Veri kataloglarından veri setinize en uygun grafik, şema, zaman tünelleri ve harita görselleştirme örneklerine bakabilirsiniz. Ayrıca Carto, Datawrapper, Flourish, Gephi, Google Data Studio, Infogram, Mapbox ve Tableau gibi popüler görselleştirme uzantılarını deneyebilirsiniz.
Görselleştirme çalışmalarında dikkat edilmesi gereken en önemli unsur kullandığınız yöntemin veriyi çarpıtmaması olacaktır. Eğer etkileşimli bir görsel hazırladıysanız da ilişkilendirilen değişkenlerin analizinin sağlanmış olması önemlidir. Son olarak veri görselleştirme çalışmalarında yapılan en yaygın hataların başında; gereksiz görsel kullanımı, verilerin doğru şekilde aktarılmaması, yanlış renk ve sembollerin seçilmesi geldiğinin bilinmesi gerekir.
Veri Hikâyeleri Oluşturmak
Dijitalleşen toplumlardan, verinin giderek artığından ve bu verileri analiz etmenin de birçok araç tarafından kolaylıkla sağlanabildiği bir durumdan söz ettik. Bu araçlar bizlere sayıları ve grafikleri; gerekli olan materyali sağlıyor fakat bizim bunları okuyuculara bir hikâye ile sunmamız gerekiyor. Veriler bizlere neler olduğunu anlatsa da bizim gazetecilik güdüsünün yardımı ile bu bilgileri 5N1K tekniğini kullanarak ve belli bir olay örgüsü içerisinde işlememiz ve habere dönüştürmemiz bekleniyor.
Bu süreci bir örnekle tamamlamak istiyorum. İçinde bulunduğumuz pandemi sürecinde ölüm verilerine ve Sağlık Bakanlığı’nın paylaşımlarının haberleştirilmesine sıkça maruz kaldık. Bu durum artık bizim verilere aşina olmamıza, ölümleri kanıksamamıza hatta bu haberlerin değerini yitirmesine bile neden oldu. Elbette olayları verilerle okumak, denetlemek ve eksiklikleri açığa çıkarmak önemli ancak bu verileri, insanların yiten hayatları ve yaşadıkları süreçlerle birlikte harmanlayarak anlatmak ve duyguları düşünebilmek, tamamlanmış bir çalışma olarak anılacak ve okunacaktır.
Sedat Erol