Veri Madenciliği Nedir ve Nasıl Yapılır?

 

Teknolojinin gelişmesi ve yaygınlaşması, beraberinde alışkanlıklarımızı da değiştirdi. Daha önce fiziksel olarak yaptığımız birçok işi ve işlemi

artık bilgisayardan, cep telefonundan ya da tabletten yapıyoruz. Banka ödemeleri, alışveriş, hastane randevusu alma ve daha birçok işi,

telefonun birkaç tuşuna basarak gerçekleştirebiliyoruz. Telefonumuzla ya da bilgisayarımızla internet üzerinden yaptığımız her işlem

sonucunda, karşı tarafta bazı verilerin birikmesini sağlıyoruz. İşletmelerin sunucularında biriken bu verilerin toplanması, analiz edilmesi ve aralarından “İşe yarar” olanların ayıklanması işine “Veri madenciliği” diyoruz. GTech olarak bu yazımızda, veri madenciliği ve nasıl yapıldığı konusunda merak edilen konulara açıklık getirdik.

Veriler Nasıl Toplanır?

Veri toplamanın 2 temel yolu vardır. Bu yollardan ilki, sizden izin alınarak yapılan ve girmiş olduğunuz bilgiler ya da site içerisindeki davranışlarınıza dayalı olan “Açık veri toplama” yöntemidir. Diğer yöntem ise “Kapalı veri toplama” olarak adlandırılır ve genellikle sosyal ağlar, arama motorları gibi sitelerde toplanan verilerdir. Bu tür veri toplama yönteminin amacı, o site içerisindeki tüm davranışları takip edip, kullanıcının ilgi alanlarını belirlemek ve bunlara uygun pazarlama faaliyetleri yürütmektir.

Veri Madenciliği Süreçleri Nelerdir?

  • Veri Filtreleme: Madencilikte kullanılacak verilerin belirlenme aşamasıdır.
  • Veri Temizliği: Toplanmış olan verinin içerisinden gereksiz, tutarsız ya da gürültülü olanların ayıklanması adımıdır.
  • Veri Birleştirme: Farklı kaynaklardan elde edilen ve benzer niteliklere sahip ya da ilişkili veriler bu adımda birleştirilir.
  • Veri Seçme: Temizlenmiş ve birleştirilmiş verilerden, analize uygun olanların seçilme işlemi bu adımda gerçekleştirilir.
  • Ver Dönüştürme: Eldeki verilerin madencilik için uygun biçime dönüştürülmesi aşamasıdır.
  • Madencilik Çalışması: Bu aşamada, daha önceden hazırlanmış olan veriler üzerinde, amaca uygun veri madenciliği algoritmaları uygulanır.
  • Yorumlama ve Doğrulama: Veri madenciliği uygulaması gerçekleştirildikten sonra, elde edilen sonuçlar yorumlanır ve bu sonuçların doğrulukları ile ilgili araştırma yapılır. Doğrulama işlemi, farklı uygulamalardan elde edilen sonuçların karşılaştırılması ile gerçekleştirilir.

Veri Madenciliği Yöntemleri Nelerdir?

  • Sınıflama: Veri madenciliğinde en yaygın kullanılan yöntemlerden biri, sınıflama yöntemidir. Bu yöntemde, eldeki verinin niteliklerini inceleyip, daha önceden belirlenmiş olan sınıflardan uygun olanına aktarmaktır.
  • Birliktelik Kuralları: Veri madenciliğinde yaygın olarak kullanılan yöntemlerden bir diğeridir. Bu yöntem, büyük boyutlardaki veri tabanlarında yer alan ve birbirleriyle bağlantılı verileri ve aralarındaki bağlantıları belirlemeyi amaçlar.
  • Kümeleme: Bu veri madenciliği yönteminde amaç, verilerin kendi aralarındaki ilişkilere göre alt sınıflara ayrılmalarını sağlamaktır.
  • Tahminleme: Bir veri seti içerisinde eksik durumda olan sayısal verilerin tahmin edilmesine dayanan veri madenciliği yöntemidir.
  • Aykırılık Analizi: Veriler içerisinde aşırı sapma olanların tespit edilmesi yöntemidir. Bu yöntemle, kredi kartlarından gerçekleştirilen olağandışı harcamalar tespit edilmektedir.

Veri Madenciliği Hangi Alanlarda Kullanılır?

Veri madenciliğinin kullanım alanları ile ilgili herhangi bir sınırlama yoktur ve verinin biriktiği her yerde veri madenciliği yapılabilir. Günümüzde veri madenciliğinin en yaygın olarak kullanıldığı alanlara bakacak olursak;

  • Bankacılık:
    • Kredi kartı kullanım alışkanlıklarına göre müşterilerin belirlenmesi.
    • Kredi taleplerine ilişkin değerlendirmelerin yapılması.
  • Pazarlama:
    • Bireylerin satın alma alışkanlıklarının belirlenmesi.
    • Satış tahmini.
    • Pazar sepeti analizi
  • CRM:
    • Müşteri sadakatinin artırılması.
    • Pazarlama kampanyalarından en yüksek seviyede yarar sağlama çalışmalarının yapılması.
  • E-Ticaret:
    • Sunuculara yapılan saldırıların tespit edilmesi.
    • Web sitesinde gezinen kullanıcıların davranışlarının belirlenmesi.
  • Sigortacılık
    • Sigorta risk gruplarının belirlenmesi.

GTech, kurumların verilerini analiz ederek stratejik kararlar almalarına olanak sağlayacak Veri Ambarı ve İş Zekası çözümlerinin uygulanması ve veri odaklı modern karar destek sistemlerinin hayata geçirilmesinde müşterilerine uçtan uca hizmet vermektedir.

GTech’in sunduğu ürünler ve hizmetler ile ilgili daha detaylı bilgiye ulaşmak ve aklınızdaki sorulara yanıt bulmak için web sitemizde yer alan Bize Ulaşın sayfasını kullanabilirsiniz.