2001 yılında, “veri bilimi” terimi ilk olarak William Cleveland tarafından bir yayında kullanıldı. 2012’ye geldiğimizde Harvard Business Review veri bilimini “21. yüzyılın en seksi işi” olarak ele aldı.
Bugüne geldiğimizde ise her işletme veri bilimcileri istihdam etmek ister. Veri bilimi denen bu şey nedir, nereden geldi ve neden bu kadar popüler? Fizik ve veri biliminin uyumluluğu nedir?
Veri Biliminin Kapsamı Nedir?
Bir veri bilimcinin ne yaptığının tek satırlık tanımını yapmak çok zor bir şeydir. Ne olduğunu kafamızda canlandırabilmek için öncelikle iş kapsamından bahsedebiliriz. İş kapsamı ise aşağıdaki konuları kapsayacak kadar büyüktür:
- Trendlerin analizi,
- Grafik çizmek,
- Bilişim,
- Makine öğrenimi,
- Yapay zekâ,
- Sayısal analiz,
- Kelime analizi,
- İş analitiği,
- Bir web sitesi analizine yapılan tıklamalar.
Veri Bilimi Nedir?
Veri bilimi, farklı rollerde farklı şeyler ifade edebilir. Tek satırlık bir tanım yerine, kısa bir tartışma ile daha çok düşünmeye çalışalım.
Veri bilimi, genellikle tek bir veri kümesinden elde edilemeyen bilgiler olan verilerden bilgi ve öngörüleri çıkarır. Veri biliminin kökleri bilimsel yöntem ve algoritmalardır. Bunlar titizlikle kullanılır. Çıktının mantıklı olduğu doğrulanmalıdır. Çoğu veri bilimcisi, zamanlarının çoğunu verileri kullanmadan önce temizlemekle harcar. Bu, yanlış ve kısmi verileri kaldırmak içindir. Çok disiplinli ve çoğu zaman iş birliğine dayalı iyi bir veri bilimcisi olmak için bazı alanları anlamamız gerekir. Bunlar:
- Fizik,
- İstatistik,
- Matematik,
- Bilgisayar bilimi,
- Kodlama,
- Büyük veridir.
Fizik ve Veri Biliminin Uyumluluğu
Veri bilimi; matematik, programlama ve alan bilgisini içeren çok disiplinli bir alandır ve bilgisayar bilimi öğrencileri için en uygun olduğuna inanılmaktadır. Peki, yukarıda belirttiğimiz gibi gerçekten fizik ile uyumlu mu? Cevap büyük bir “EVET”. Bir fizikçinin tipik günlük işlerine bir göz atalım ve bunu bir veri bilimcisi ile karşılaştıralım. Ardından ise veri biliminin köklerine inerek bu konuyu kafamızda iyice oturtalım.
Fizikçi | Veri Bilimcisi |
Deneyler yaparak veri toplamak | Veri kaynaklarından veri toplamak |
Toplanan verileri analiz etmek | Toplanan verileri analiz etmek |
Gözlemlenen verileri açıklamak ve gelecek verileri tahmin etmek için modeller oluşturmak | Gözlemlenen verileri açıklamak ve gelecek verileri tahmin etmek için modeller oluşturmak |
Bulguları profesörlere sunmak | Bulguları müdürlere sunmak |
Tablo 1. Fizikçi ve veri bilimcinin yaptığı günlük işlerin benzetilmesi
Tablo 1.’de gördüğünüz gibi bu iki meslek sahibi insanların arasındaki tek fark, farklı veri setleriyle çalışmalarıdır. Dolayısıyla, fizik araştırmanızı doğru yapıyorsanız bir veri bilimcisi olmak için gereken becerilere zaten sahipsiniz denebilir.
Veri Biliminin Kökleri: Fizik ve Astronomi
Veri biliminin kökleri, büyük veri setlerinin ilk toplandığı ve bilimsel olarak analiz edildiği fizik ve astronomi alanlarına kadar uzanmaktadır. Fizik dünyasında veri biliminin birçok güzel örneği vardır. Bunlardan biri Tycho Brahe ve Johannas Kepler’in çalışmasıdır. Tycho, gözle son derece hassas astronomik gözlemler yapmıştır. Bu olay, 16. yüzyılda teleskoplardan önce yaşanmıştır. Ölçüleri, çağdaşlarından beş kat daha hassastır. Doğru ve temiz bir veri kümesi oluşturmuştur.
Tycho, Kepler ile iş birliği yapmıştır ve sayısal titizlik kullanarak gözlemler bilimsel keşiflere dönüştürülmüştür. Kepler, gezegensel hareket yasalarını geliştirmek için Tycho’nun gözlemlerini, bilimsel yöntemlerini ve algoritmalarını kullanmıştır.
Güneşe Olan Mesafeyi Ölçmek
Bir başka güzel örnek ise dünyadan güneşe olan mesafeyi ölçmektir. Günümüzde bu, nispeten basit bir iştir. MÖ 3. yüzyılda ölçümler ilk kez Arşimet tarafından yapılmaya başladığında durum böyle değildi.
Simon Newcome 1895’te ortaya çıkana kadar, bu mesafe ciddiyetle ölçülmeye devam edildi ve çok çeşitli sonuçlar elde edildi. Newcome, oldukça sınırlı kaynaklarla inanılmaz derecede doğru bir yanıt almak için veri bilimi tekniklerini uyguladı. Newcome’ın yaklaşımındaki temel fark, birden çok veri seti kullanmaktı. Yanıt almak için sadece Venüs’ün popüler geçişini kullanmadı. Ayrıca sapmayı, ışık hızını ve Gauss yer çekimi sabitini kullandı.
Newcome, birlikte çalıştığı veri setlerinin temiz olmasını sağladı ve çalışmalarında uygun bilimsel titizliği sağlamak için diğer bilim insanlarıyla iş birliği yaptı. Tüm bunlar oldukça doğru hesaplanmış 0.9994AU değeriyle karşılığını verdi. Doğru cevaba yaklaşmamız 50 yıl daha alacaktı.
Fizik dalının veri bilimine ne kadar yakın olduğunu ve fizikçilerin de bu alanda çalışabileceğini anlamaya çalıştık. Yeni bir şey öğrenmek asla kolay değildir. Güven, tutku ve sıkı çalışmayla fizikçiler de veri bilimcisi olabilir. Ben, bunu gönülden isteyen insanların kesinlikle yapabileceğine inanıyorum.
Yelda GÜNDEĞER
Kaynaklar
“Data Science in Industry”, APS Physics
“Data science can be an attractive career for physicists”, Physics Today