Mehmet Emre Toktay
Resume & CV Pardus Blog
TR | EN

24/09/2023 • Mehmet Emre Toktay

Veri Görselleştirme ve Dash

Veri görselleştirme, günümüzün veri merkezli dünyasında hayati bir beceri haline gelmiştir. Dash ile ilk tanışmamda " It combines the simplicity and versatility of Python with the flexibility and interactivity of modern web technologies like HTML, CSS, and JavaScript." mesajı benim gerçekten ilgimi çekmiş ve bizzat deneyimlemek için sabırsızlanıyordum. Ancak, proje üzerinde çalışmaya başladığımda bu heyecan biraz söndü. Çünkü temel Python bilgisinin ötesinde, web geliştirme, kullanıcı deneyimi (UX) ve CSS hakkında ek bilgi her türlü gerekiyordu.

Örnek GIF

Dash

Dash, Python için interaktif, web tabanlı uygulamalar oluşturmayı kolaylaştıran bir framework'tür. Plotly tarafından geliştirilen Dash, kullanıcılar için dinamik görselleştirmeler ve analitik uygulamalar hazırlamayı mümkün kılar.

Etkileşimli bir dashboard oluşturma fikri ve bunu Python üzerinden yapabilme yeteneği, teoride oldukça cazip gelmişti. Ancak pratikte, bu yaklaşım tıklama tabanlı veri görselleştirme araçları tarafından sunulan pratiklik ve hızdan yoksun gibi görünüyor. Çoğu bilgiye sahip olmama rağmen, Dash üzerinden bir gösterge tablosu oluştururken en çok zamanı görselleştirme sürecine harcadım. İşte Dash vs Popüler veri görselleştirme envanterleri hakkında:

Kullanıcı Dostu Arayüz

Veri görselleştirme araçları: Tıklama tabanlı görselleştirme araçları (örneğin, Tableau veya Power BI), kullanıcı dostu grafik arayüzleri sayesinde verileri sürükleyip bırakarak hızlı ve kolay bir şekilde görselleştirme olanağı sunar.
Dash: Dash ile uygulamalar oluştururken, her şeyi Python kodu ile yazmanız gerekir. Bu, kodlama bilgisi gerektirir ve tıklama tabanlı araçlara göre daha az sezgiseldir.

Özelleştirilebilirlik

Veri görselleştirme araçları: Genellikle daha az özelleştirilebilirler ve önceden tanımlanmış görselleştirme türleri ve şablonları sunarlar.
Dash: Dash, geniş bir özelleştirme yelpazesi sunar. Özelleştirilmiş bileşenler ve görselleştirmeler oluşturma kabiliyeti, Dash'in Python programlama dili ile birlikte gelir, bu da size neredeyse sınırsız özelleştirme imkanı sunar.

Veri Güvenliği

Veri görselleştirme araçları: Tıklama tabanlı görselleştirme araçları genellikle güçlü veri güvenliği protokollerine sahiptir.
Dash: Veri güvenliği, Dash uygulamanızı nasıl yapılandırdığınıza ve barındırdığınıza bağlı olarak değişir. Özel veri güvenliği gereksinimlerini karşılamak için ek çalışma ve konfigürasyon gerekebilir.

Geliştirme Hızı ve Maliyet

Veri görselleştirme araçları: Hızlı prototipler ve görselleştirmeler oluşturmayı mümkün kılar, ancak lisans maliyetleri olabilir.
Dash: Geliştirme süresi daha uzun olabilir, ancak Dash açık kaynaklıdır ve bu nedenle maliyet açısından etkili bir seçenektir.

Sonuç

Sonuç olarak Dash'i veri görselleştirmek için düşünecek olursak, kurumsal veya geniş bir kitle ile paylaşılacak gösterge tablolarında tıklama tabanlı programlar çok daha verimli olacaktır. Ancak, üst düzey yöneticiler veya belirli kontrol noktalarını bilen bireyler için, haftalarca filtrelerden veri çıkararak kontrol etmek yerine Dash üzerinden çözüm sunulabilir. Dash üzerinden bir gösterge tablosu oluşturmak kesinlikle daha emek yoğun bir yöntem, ancak özel durumlar için çok daha kullanışlı ve işlevsel olabilir.

Benim kişisel görüşme ise, Dash'in veri görselleştirme süreçlerinin ötesinde çok daha verimli kullanılabilecek alanlar olduğu yönünde. Dash, veri görselleştirme platformlarına, örneğin Power BI'ye, datalar gönderilmeden önce ara bir geçiş toolu olarak konumlandırılabilir. Bu bağlamda Dash, verileri istatistiksel olarak inceleyebilir ve talep edilen formatta export edilebilir hale getirebilir. Dash, veri filtreleme, temizleme, ön işleme (pre-processing), outlier tespiti, eksik veri imputasyonu ve dönüşümler gibi kritik veri hazırlık görevlerini başarıyla gerçekleştirecektir. Ayrıca görmek istediğiniz tüm istatiksel yöntemleri de python üzerinden uygulayabilirsiniz.

Bu yaklaşım, sistematik şekilde uygulandığında, firmaların daha organize ve yapılandırılmış bir data yapısına sahip olmalarını; veri analizi ve görselleştirme süreçlerini daha verimli bir şekilde yönetmelerini sağlama olasılığı gerçekten yüksek. Ayrıca veri hazırlık aşamalarını otomatik ve yeniden üretilebilir hale getirerek, manuel hataların ve zaman alıcı veri hazırlık görevlerinin önüne geçilmesine yardımcı olacaktır.

Bu görüşümü destekleyecek olan müşteri kümeleme analizi için hazırladığım dashboardu inceleyerek karar verebilirsiniz. Bu Dash otomatik müşteri kümeleme işlemi yapıp interaktif bir şekilde ilerleyebiliyor ve analiz sonucu belirlenen kümeleri data setine ekleyip export edebiliyorsunuz.

Banka Müşteri Segmentasyonu: K-Means, DBscan ve OPTICS ile Analiz Dashboard temel olarak bu analizi otomatize etmek için hazırlandı.

Plotly & Dash Dashboard Analizin makine öğrenimi kısmı tamamlanmış, interaktif dash.

Mehmet Emre Toktay

  • emre.toktay@pardus.tech
  • EmreToktay
  • tnazburka
  • memretoktay

Mehmet Emre Toktay is an analyst with deep knowledge in customer relations. He has worked as a customer experience and business intelligence specialist and is now eager to transition into a data scientist role. Enthusiastic about data, statistics, and continuous improvement. He has a passion for uncovering insights and solving complex problems.