BÜYÜK VERİ-BİG DATA

Aydan Dağlar

Alışveriş sitelerinde neden hep ihtiyacım olan ürünlerin reklamı çıkıyor?

Yine kalmam gerekenden daha çok zaman harcadım sitede.

Bu uygulama ücretli değil ama girişte bazı bilgiler istiyor.

big data ile ilgili görsel sonucu

Sokakta,metro duraklarında,kahve sohbetlerinde böyle cümleler duyuyor ve hatta kuruyorsanız mutlaka “Büyük Veri” kavramını yakından incelemelisiniz.

Veri en sade anlamıyla bir araştırmada, bir tartışmada, bir akıl yürütmede sonuca ulaşabilmek için gereken ilk bilgi olarak tanımlanır.Günümüzün bir bilgi çağı olduğu düşünülünce bu verilere sahip olmak ve bu verileri işlemek rekabetin en çok gözle göründüğü yer dersek abartmış olmayız. Bu rekabeti ve  unsurlarını hayatın her alanında- cebimizde,evimizde ve iş yerlerimizde bize eşlik eden akıllı telefon ve sistemler ile her yerde-görmek mümkündür.

Fakat bilgiyi gözle görmemiz bu verilerin teknoloji ile toparlanıp yorumlanarak karşımıza çıkması ile olmuştur. Bilgiye ulaşmanın ve paylaşmanın ivmeli hızına telefonlarımız,bilgisayarlarımız ve internet teknolojileri ile tanıklık ediyoruz.Niceliksel değişiklik beraberinde niteliksel değişikliği de getirmiştir.Verinin manalı bir bütün oluşturacak şekilde toplanması ilk önce astronomi ve genetik alanında gerçekleşmiştir. Büyük veri kavramı da ilk olarak bu alanlarda kullanılmış daha sonra bu kavram her alan için kullanılmaya başlanmıştır.Büyük veri artık hayatımızın her alanında kendini göstermeye başlanmıştır. Örneğin; Ínternet arama motoru Google’dan hastalıkların teşhis ve tedavisi, İnternet üzerinden alışverişlere kadar her alanda büyük veri karşımıza çıkmaktadır.

Büyük veri; toplumsal medya paylaşımları, ağ günlükleri ,bloglar, fotoğraf, video, log dosyaları gibi değişik kaynaklardan toparlanan tüm verinin, anlamlı ve işlenebilir biçime dönüştürülmüş biçimine denir. Olageldiği gibi, ilişkisel veri tabanlarında tutulan yapısal verinin dışında kalan, son dönemlere dek çok da kullanılmayan, yapısal olmayan veri yığınıdır. Artık yıkılmış olan yaygın bilişimci inanışına göre, yapısal olmayan veri, değersizdi, ama büyük veri bize bir şey gösterdi o da günümüzdeki bilgi çöplüğü diye adlandırılan olgudan muazzam derecede önemli, kullanılabilir, yararlı yani çöplükten hazine çıkmasına neden olan yegane sistemdir.Büyük veri; web sunucularının logları, İnternet istatistikleri, sosyal medya yayınları, bloglar, mikrobloglar, iklim algılayıcıları ve benzer sensörlerden gelen bilgiler, GSM operatörlerinden elde edilen arama kayıtları gibi büyük sayıda bilgiden oluşuyor.

Büyük veri, doğru analiz metotları ile yorumlandığında şirketlerin stratejik kararlarını doğru bir biçimde almalarına, risklerini daha iyi yönetmelerine ve innovasyon yapmalarına imkân sağlayabiliyor.

Yeni oluşan işletme sahiplerinden  büyük cirolu holding patronlarına kadar birçok yönetici halen konvansiyonel veri ambarı ve veri madenciliği yöntemleriyle elde ettikleri datalardan yola çıkarak, karar almaya devam ediyorlar. Ancak, tüketici eğilimlerini dinamik şekilde öngörebilmek, büyük veriyi analiz edebilmekten ve bu analizlere göre hareket edebilmekten geçiyor.Büyük veri, geleneksel veritabanı araçları ve algoritmaları ile işlemesi zor olan bu büyük verinin oluşturulması, saklanması, akışı, analiz edilmesi gibi birçok konuyu içeren bir terim olarak karşımıza çıkmaktadır. Veriler klasik veritabanlarının kaldıramayacağı büyüklükte olduğu gibi verinin büyüme hızı da bir bilgisayar veya bir veri depolama ünitesini aşmaktadır. 2012 rakamları ile dünyada günlük 2.5 Kentirilyon byte veri üretilmektedir. Bu çapta büyük veriyi işleme, transfer etme gibi işlerin tümüne Büyük veri (Big Data) adı verilmektedir.

Büyük Veri Bileşenleri:

                       Kaynak:onurarslan.org

Big data için birçok tanım olsa da, büyük verilerin genellikle “3 V’s” (Volume Variety Velocity) olarak bilinen kavramını içerir:

Volume (Hacim): Terabayttan petabaytlara kadar olan veri aralıkları.

Variety (Çeşitlilik): Çok çeşitli kaynaklardan ve biçimlerden veri içerir (ör; Web günlükleri, sosyal medya etkileşimleri, e-ticaret ve çevrimiçi işlemler, finansal işlemler, vb.)

Velocity (Hız): Giderek artan bir şekilde, işletmelerin zaman verilerinin üretilmesinden, kullanıcılara uygulanabilecek zamana kadar içgörüler sunulmaktadır. Bu nedenle, verilerin nispeten kısa pencerelerde toplanması, saklanması, işlenmesi ve analiz edilmesi gerekir – günlükten gerçek zamana kadar.

BÜYÜK VERİNİN TARİHSEL GELİŞİMİ

Büyük veri kavramı ilk olarak 1997’de bir makalede yer almıştır. 2000’li yılların başında bu kavram önemli bir ivme kazanamamıştır. 2009 yılında  domuz gribi olarak adlandırılan salgının (H1N1 virüsü) 1918 yılındaki İspanyol gribi salgınının korkunç hatıralarından dolayı dünya kamuoyunda ciddi bir endişe yarattığı dönemlerde Google bilimsel dergi Nature’da önemli bir araştırma yayımladı. Araştırmanın temeli insanların İnternet üzerinde yaptıkları aramalara dayanan matematiksel modeller ile gribin ABD’de hangi bölgelere ve hangi yoğunlukta yayıldığını tespit etmekti. İnsanların grip belirtileri başladıktan birkaç gün sonra doktora gitmeleri konuyla ilgilenen sağlık kurumlarının ellerindeki verilerin sağlıklı olmaması gibi bir sonuç doğurmaktaydı. Google elindeki muazzam veri tabanı ve veri işleme kapasitesiyle Amerikan sağlık otoritelerinden daha etkili bir şekilde hastalığın yayılmasıyla ilgili bilgilere ulaşabilmekte idi. Bunun için 450 milyon farklı matematiksel model kullanıldı ve arama terimleri  CDC’de 2007 ve 2008 yılındaki gerçek grip vak’aları ile karşılaştırıldı. Sonuç olarak 45 arama terimi ile resmi yayılma oranları arasında çok güçlü bir korelasyon olduğu tespit edildi. Büyük veri iş dünyasında önemli yeniliklerin ortaya çıkmasına neden olmuştu. . Asıl çıkışını 2012 yılından itibaren yapmıştır. Bu çıkışın sebebi ise 2012 yılında yapılan Davos Zirvesi’nde verinin artık ekonomik bir değer haline dönüştüğünün açıklanmış olmasıdır.  Uçak biletlerini alınması büyük veri kullanımına güzel bir örnek olmaktadır. Google tarafından ortaya konulan araştırma İnternetin bu zamana kadar kamu sağlığı kapsamda kullanılmayan önemli bir yönünü ortaya koymaktaydı. Günümüz veritabanları bu çapta büyüyen verileri tutmakta yeterli değildir. İlişkisel veritabanları gigabyte seviyesinde veri tutabilirken, büyük data ile petabyte seviyelerinde veriler saklayabiliriz. Ancak büyük data sadece yığın işleme(Batch) işlemleri için uygundur. Transactions gibi gelişmiş veritabanlarında kritik öneme sahip özellikler yoktur. Veritabanları okuma, yazma güncelleme gibi işlemleri transactionlar aracılığı ile yapabildiği için bu işlemler atomik olarak kabul edilir ve çeşitli kilitleme mekanizmaları ile verinin birden fazla işlem tarafından değiştirilerek tutarsızlaşması engellenir. Büyük veri bir kere yazılıp defalarca okuma işlemi yapıldığı duruımlarda kullanılması gerekir. Çünkü veriler birden fazla yerde paralel olarak işlenir.Bu büyüklükte veri RFID sensörlerinden, sosyal medyaya, hastanelere kadar birçok alanda üretilmektedir. DNA dizilişlerinin analizi, hava durumu sensörlerinden gelen veriler başta olmak üzere verileme işlemlerinin yapıldığı birçok alanda büyük veri bir ihtiyaç olarak karşımıza çıkmaktadır.İnternet arama motoru devinin elindeki veri insanlık için çok kıymetli yenilikçi mal ve hizmetlerin ortaya çıkmasına sebep olmaktaydıSon yıllarda büyük veri Google, Amazon, SAP, Oracle, IBM, Facebook, Microsoft, Apple, Twitter gibi büyük teknoloji şirketleri tarafında ciddi bir biçimde kullanılır hale gelmiştir.

Kaynaklar:

tr.wikipedia.org/wiki

onurarslan.org

https://duzce.edu.tr/yonetim-bilisim-sistemleri

medium.com