Temiz ve muteber datalar olmadan, bilgi tahlili mümkün değildir. İlgili ve gerçek data olmadan tahlil yapmak ve süreçler hakkında çıkarımlarda bulunmak neredeyse imkansızdır. Hatta kullanılan bilgiler eski yahut yanlışsa data tahlili, faydadan çok ziyan veren bir sürece dönüşür. Bilgi teknolojileri alanında faaliyet gösteren Mindtree’nin strateji lideri Suman Nambiar, pak bilgiye nasıl ulaşılacağı konusunda tavsiyelerde bulunuyor.
Kirli data, kirli kararlar
2017 tarihli Harvard Business Review araştırmasında yapılan bir ankette, şirketlerin sadece yüzde 3’lük bir kısmının bilgi kalitesi standartlarını karşıladığı sonucuna ulaşıldı.
Nambiar’a nazaran, birçok işletme fikir odaklı kuruluşlar olmaya çalışıyor. Lakin bunu yapmak için farklı analitik teknikleri kullanmak gerekiyor. Bilhassa data depolama sürecinde kirli, yanlış ve geçerliliği olmayan bilgileri kaldırmak, kullanılacak bilgi setinden ayırmak gerekiyor.
Temiz data için birkaç adım
Nambiar, çalışılacak bilginin erişilebilir ve şeffaf olmasının ‘temiz veri’ için birinci adım olduğunu söylüyor. Daha sonra ise standart haline getirilmiş kurallar ile bir data altyapısı oluşturulması gerekiyor. Bu kademe, bilgilerin nereden geldiği ve bilgilerde rastgele bir sapma olup olmadığını anlamada kritik bir kıymete sahip.
Son devirde kuruluşlar, yapay zeka ve makine öğrenmesi ile datalara erişme, dataları eşleştirme ve temizleme süreçlerini otomatik olarak yapabiliyor. Böylece süreçler daha süratli bir biçimde gerçekleştirilebiliyor ve insan kaynaklı yanlışların önüne geçiliyor. Hatta bunun için Apache Griffin üzere açık kaynaklı yazılımlar da kullanılabiliyor.
Nambiar, son olarak ise datanın daima artan bir yığın olduğunun unutulmaması gerektiğini, daima denetimin gerekliliğini vurguluyor, bilgi kalitesi ölçümünün daima yapılması gerektiğini söylüyor.
Burak KESAYAK
Twitter: @BurakKesayak