İçeriğe geç →

VERİ GÜRÜLTÜSÜ

Last updated on 10/05/2021

Big data ya da Türkçesi ile büyük veri.

Yapay zeka!

Nesnelerin interneti.

Blokchain.

Hepsi kulağa kadar karizmatik ve teknolojik geliyor değil mi?

Peki ya yeni medya?

Yeni medya hala yeni mi? Çoktan eskidi bile, bugün “yeni” olan her neyse pek uzun süre yeni kalamıyor, Levent Erden’in de dediği gibi “sürekli yeni” çağındayız.

Telefonumuzdaki her uygulama, girdiğimiz web siteleri, yaptığımız bankacılık işlemleri, her an her yerde hareketlerimiz veri olarak kaydediliyor ve bu veriler kullanılarak yeni hizmetler üretiliyor. Bugün nasıl ki bir restorana gittiğinizde sizin İnstagram sayfalarınızı beğenmenizi ümit ediyorlar pek uzak olmayan bir gelecekte sizin bırakacağınız verilerin peşinde olacaklar.

Kitapçıdan kitap alırken neden telefonunuzu istiyor ve sizin kişiler verilerinizi topluyor? Bir ceket alırken de ayakkabı alırken de aynı durum, sizin alışkanlıklarınızı veriler üzerinden anlamlandırmaya çalışıyorlar.

Eskiden bu kadar bilgi, veri yoktu, veri toplama araçları geliştikçe ve kullanımı arttıkça toplanan veri de artıyor. Veri arttıkça bunları doğru filtrelemek ve tasnif etmek gerekiyor daha doğrusu doğru tasnif edilmeye uygun şekilde planlı bir süreç içerisinde bu verileri toplamak gerekiyor, işte burada noisy data konusu gündeme geliyor yani gürültülü veri.

Gürültülü veri nedir diye soracak olursanız kısaca; veriler toplanırken oluşan hataların sonucudur diyebiliriz. Bu duruma rassal hata ya da değişen varyans da diyebiliriz.

Makine öğrenimine  bir katkı sunamayan bu gereksiz bilgiler algoritmaların da verimliliğini azaltarak hatalar oluşmasına neden olmaktadır. Veri gürültüsü temizlenmezse yanlış analizlerin oluşması engellenemez.

Tekrar ediyorum, internet üzerinden ayakkabı satıyorsunuz ve Facebook sayfanıza önem veriyorsunuz ama kısa bir süre sonra veri toplamak daha önemli hale gelecek ve en büyük sorununuz “Facebook’umu kaç kişi beğendi?” değil “gürültülü veriden nasıl kurtulacağım?” olacak.

Veri gürültüsünü engellemek için dış referanslar kullanılabilir, kutulama yönetimi ya da manuel kontroller yapılabilir ama o konu uzmanlık alanıma girmediği için konuyu burada sonlandırıyorum.

Yıl 2021 aylardan Mayıs. Bugün nasıl ki herkes Bitcoin peşinde koşuyor yakında herkes veri peşinde koşacak. Binamıza kaç kişi girdi, bizim sokaktan geçen kaç kişinin şapkası vardı? Hepsi para edecek, kim önce toplarsa ve satabilirse onlar yeni “veri zenginleri” olacak.

Müşteri velinimetimizdir sözünün yerini müşteri “veri”nimetimizdir alacak…

Kategori: Bilişim

Yorumlar

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir