OpenSource BI Tool’u: Apache Superset

OpenSource BI Tool’u: Apache Superset
24 Tem 2023

Şirketlerin veri analizi, raporlama, görselleştirme ve rekabet avantajı elde etmesinde büyük rolü bulunan iş zekası (BI) araçlarının günümüzde yeni bir boyutu olarak açık kaynak kodlu (open source) geliştirilmesiyle yeni iş zekası aracı seçenekleri arasında yer almaya başlayan açık kaynak iş zekası ürünleri ortaya çıkmıştır. 

Açık kaynak iş zekası (BI) araçları; esnek yapılarıyla, şirketlerin ihtiyaçlarına göre özelleştirilebilir olmalarıyla, geniş topluluk desteğiyle sürekli geliştirilmeleriyle ve düşük maliyet/yüksek etkinlik özellikleriyle ön plana çıkmaktadır. Yeni başlayan şirketler veya küçük-orta büyüklükteki işletmeler açık kaynak sayesinde lisans ücreti olmaksızın iş zekası (BI) ile güçlenebilmektedir.

Açık kaynak (open source) iş zekası (BI) araçlarından biri olan Apache Superset’in kullanımı dünya çapında her geçen gün artmaktadır. 

  1. Apache Superset Nedir? 

Airbnb şirketi tarafından Python’da Flask kütüphanesi ile geliştirilen Apache Superset gelişmiş veri görselleştirmesi (data visualization) ve geniş veri kaynağı desteği ile güçlü bir iş zekası web uygulamasıdır.

  1. Apache Superset Genel Özellikleri

 Apache Superset özellikleri aşağıdaki gibi sıralanabilir:  

Veri Kaynakları ile Entegrasyon: Apache Superset geniş bir veri tabanı uyumluluğuna sahiptir. SQLAlchemy sayesinde; Oracle, SQL Server, Elasticsearch, Clickhouse, IBM Db2, Teradata, Exasol, PostgreSQL, Presto, MySQL, SQLite ve daha fazlasını desteklemektedir. 

Görselleştirme Seçenekleri: Apache Superset’in sunduğu görselleştirme seçenekleriyle dinamik bir dashboard ve raporlar hazırlanabilir. Kurulum ile sunulan örnek World Bank’s dataset ve dashboard’u aşağıda incelenebilir.  

pastedGraphic.png

 

Ayrıca başka ihtiyaçlara göre kullanılabilecek birçok veri görselleştirme seçenekleri de mevcuttur.

pastedGraphic_1.png  

  1. Apache Superset’in Avantajları 

SQL Labs: Superset, SQL Labs özelliği ile kullanıcılara SQL sorgularını doğrudan Superset arayüzünde çalıştırma imkanı sunmaktadır. Kullanıcılar, SQL Labs kullanarak SQL sorgularını yazabilir ve sonuçlarını görselleştirme için kullanabilir. 

No Code Veri Görselleştirme: Superset, veri görselleştirme sürecini kod yazmadan gerçekleştirmeyi sağlar. Kullanıcılar, kullanıcı dostu bir arayüz üzerinden veri kaynaklarını bağlayabilir, sorgular oluşturabilir ve çeşitli görsel öğeleri sürükle-bırak yöntemiyle düzenleyebilir. Bu, kullanıcıların hızlı ve etkileşimli bir şekilde veri görselleştirmeleri oluşturmasını sağlar.      

 Paylaşma ve İş birliği: Superset, basit bir şekilde raporları ve panoları paylaşmak için bağlantılar, gömülü kodlar (css ile başka dashboardlarda kullanılabilir görseller) veya Excel, CSV, PDF formatında indirme gibi çeşitli seçenekler sunmaktadır.                                                            

Veri Güvenliği: Superset, kullanıcıların platforma erişimini kontrol etmek için kimlik doğrulama ve yetkilendirme mekanizmaları sağlamaktadır. Kimlik doğrulama süreci, güvenli bir kullanıcı adı ve parola kombinasyonu veya dış kimlik sağlayıcıları (OAuth, LDAP, SSO vb.) aracılığıyla gerçekleştirilebilir. Ayrıca, kullanıcıların belirli veri kaynaklarına erişim yetkilerini yönetmek için rol ve izin (row level security) mekanizmaları sunar.

  1. Superset’in Dezavantajları

Karmaşık Kurulum ve Yapılandırma: Superset’in kurulumu ve ayarlanması teknik uzmanlık gerektirebilir. Birden fazla veri kaynağına erişim sağlamak veya ileri düzey yapılandırmalar yapmak istendiğinde, ek teknik bilgiye ihtiyaç duyulabilir.

Dokümantasyon Eksikliği: Superset’in bazı alanlarda eksik veya yetersiz dokümantasyon sebebiyle bazı sorunlar topluluk sayfalarında da bulunamayabilir. Dolayısıyla bir problem karşısında teknik uzmanlık ve çaba gerekebilir. 

Performans Sorunları: Superset’in büyük veri setleriyle çalışırken performans sorunları yaşayabilme potansiyeli vardır. Özellikle çok sayıda kullanıcının eş zamanlı olarak Superset’i kullanması veya karmaşık sorguların çalıştırılması durumunda performans düşebilir. Bu durum büyük ölçekli verileri olan şirketler için bir dezavantaj olabilir.

Apache Superset’in kurumlara sağlayacağı avantajlar hakkında daha fazla bilgi almak için GTech Veri Ambarı ve İş Zekası uzmanlarımıza ulaşabilirsiniz. 

Kaynakça

  1. https://rahmabayhatun.wordpress.com/2020/08/10/apache-superset/
  2. https://censius.ai/blogs/apache-superset-review
  3. https://medium.com/dlt-labs-publication/exploring-apache-superset-18c7b5344daf
  4. https://docs.kanaries.net/articles/apache-superset-vs-tableau
  5. https://hevodata.com/learn/apache-superset/
  6. https://en.data4tech.com/post/apache-superset-installation-centos-7
  7. https://www.startdataengineering.com/post/apache-superset-tutorial/#apache-superset-architecture
  8. https://censius.ai/blogs/apache-superset-tutorial
  9. https://www.influxdata.com/blog/introduction-apache-superset/

 

Yazar : Furkan Şükrü Kütük, GTech Veri Ambarı ve İş Zekası Danışmanı