Twitter Duygu Analizi Çalışması | Biontech ve Sinovac Hakkındaki Düşünceler

Twitter Duygu Analizi Çalışması | Biontech ve Sinovac Hakkındaki Düşünceler
19 Oca 2022

GTech Büyük Veri ve Analitik Departmanı olarak Twitter verileri üzerinden Covid-19 aşıları hakkında insanların düşüncelerini ve olası kaygılarını ölçtük. İleri analitik uzmanlığımız ile hazırladığımız Twitter Duygu Analizi çalışmamızda, Doğal Dil İşleme (NLP) Yöntemleri kullanılmıştır. Doğal dil işleme yöntemleri metin dosyalarını derin öğrenme modelleri kullanarak matematiksel veriye çevirir ve çeşitli analizlere imkân sağlar. Çalışmamızda bu veri dönüşümü kullanılarak insanların belli bir konuda negatif mi pozitif mi yoksa nötr mü düşündükleri üzerine modelleme yapılmıştır.

Twitter API’ı üzerinden toplanan tweetler Python üzerinden doğal dil işleme modeli yardımıyla skorlanmıştır. Skorlama sonucu ilgili tweetin Negatif (-1), Nötr (0) ya da Pozitif (1) düşünce içerdiğine bağlı olarak etiketlenmiştir. Elde edilen bu etiketlerden hareket edilerek kişilerin; coğrafi konumu, kullanılan cihaz türü, tweet’in atılma tarihi, beğeni sayısı gibi ek bilgiler kullanılarak profilleri çıkartılmıştır. Çalışmada, aşılar hakkında negatif düşünceler içeren tweetler incelenerek insanların hangi sebeplerden aşılara olumsuz baktığı incelenmiştir. Son olarak da aşılama periyodlarındaki duygu değişimleri gözlemlenmiştir.

Çalışmada Haziran – Ekim 2021 arasında atılan tweetler kullanılmıştır. Çalışma içerisinde kullanılan veri, #biontech ve #sinovac hashtagi içeren tweetlerden oluşmaktadır. Twitter API’ı üzerinden haftalık olarak çekilmiştir. Twitter API’ndan gelen veriyi temizlemek ve modellemeye hazır hale getirebilmek için farklı ön hazırlık işlemleri uygulanmıştır.

  • Konum bilgileri şehir düzeyine taşındı.
  • Link içeren Tweetlerdeki linkler kaldırıldı.
  • Büyük harfler küçük harfe çevrildi.
  • Stopwords kelimeleri analizden çıkartıldı.
  • Noktalama işaretleri kaldırıldı.

Toplamda 12267 Tweetten oluşan veri setinde API gelen bilgiler üzerinden aşağıdaki bilgi alanları seçilip analizde kullanılmıştır.

  • Konum Bilgisi
  • Tarih Bilgisi
  • Beğeni Toplamı
  • Hashtagleri
  • Tweet’in Atıldığı Cihaz
  • Tweet ID’si
  • Tweet Metni
Tablo 1 Twitter Veri Seti

Modelleme

Modelleme kısmında hazır hale getirilmiş tweetler, Bert-Based-Turkish-Sentiment-Cased isimli modele sokulmuştur. BERT (Bidirectional Encoder Representations from Transformers) modelleri yapısal olarak kullanılan kelimeler arasında çift taraflı model eğitimine imkân sağlanan derin öğrenme modelleridir. Turkish NLP Topluluğu tarafından eğitilen bert-based-turkish-sentiment-cased modeli Turkish OSCAR corpus kelime sözlüğü kullanılarak eğitilmiştir. Bu kelime sözlüğü kısaca Wikipedia sitesinde bulunan her kelimeyi içermektedir. Kelime sözlüğünün final hali yaklaşık 35 GB yer kaplamaktadır.  Model, çıktı olarak her tweet için negatif (-1), nötr (0) ve pozitif (1) şeklinde etiketleme işlemi gerçekleştirmiştir.

Tablo 2 Skorlanmış Veri Seti
Şekil 1 Word Cloud

Sıklıkla kullanılan kelimelere baktığımızda insanların genel olarak aşı olduklarını ilan etmeyi sevdiklerini, yan etkilerden çekindikleri ve pandemi gelişmelerini yakından takip ettikleri gözlemlenmiştir.

Grafik 1 Total Tweetlerin Cihaz Dağılımı

Çalışmada kullanılan tweetlerin atıldığı cihaz dağılımına baktığımızda kullanıcıların yüksek oranda Android cihaz kullandıkları gözlemlenmiştir.

Grafik 2 Total Tweetlerin Şehir Dağılımı

Çalışmada kullanılan tweetlerin atıldığı şehir dağılımına baktığımızda kullanıcıların yüksek oranda İstanbul’dan, İstanbul harici de genellikle büyükşehirlerden tweet attıkları gözlemlenmiştir.

Biontech

Türkiye geneline bakıldığında çalışma kapsamında toplanan tweetlerin yarısında Biontech aşısı hakkında olumlu tweet attığını gözlemlenmiştir.

Grafik 3 Biontech Aşısı Genel Duygu Dağılımları

Biontech hakkında atılan tweetlerin aldığı beğenme sayıları incelendiğinde pozitif tweetlerin toplamda 3000’den fazla beğeni aldığı gözlemlenirken, negatif tweetlerin 2500 beğeni barajını aşamadığını gözlemlemekteyiz. Bu durum insanların Biontech aşısı özelinde olumlu görüşleri daha çok desteklediğini göstermektedir.

Grafik 4 Biontech Aşısı Dağılımlarının Beğeni Toplamları

Üç büyük şehrimize baktığımızda, özellikle pandeminin ilk aylarını yüksek vaka sayılarıyla geçiren Ankara’da %62 gibi yüksek bir oranla Biontech aşısı hakkında destekleyici tweetler atıldığını gözlemlemekteyiz. Aynı oran İstanbul’da %52,5’ken, İzmir kentinde pozitif tweet oranlarının yüzde ellinin altına düştüğünü ve diğer kentlere oranla en yüksek oranda nötr tweet atıldığı görülmektedir. İzmir’deki twitter kullanıcılarının diğer şehirlerde yaşayan kullanıcılara oranla aşı ve aşılama çalışmalarına daha şüpheci yaklaştığı çıkarımına bu verilerden varılabilir.

Grafik 5 Biontech Aşısı Ankara Özelinde Duygu Dağılımları
Grafik 6 Biontech Aşısı İstanbul Özelinde Duygu Dağılımları
Grafik 7 Biontech Aşısı İzmir Özelinde Duygu Dağılımları

Biontech aşısı hakkında atılan negatif tweetler incelendiğinde, insanların şikayetçi olduğu konularda ortak başlıklar gözlemlenmiştir. İnsanların yaklaşık %15’i geçirdiği yan etkilerden şikayetçi olurken, %11’lik bir küme aşı olmasına rağmen covid-19 hastalığına yakalandığından şikâyet etmektedir.

Grafik 8 Biontech Aşısı Negatif Tweetlerin Alt Dağılımları

İnsanların özellikle yan etkilerden şikayetçi olduğu Biontech aşılama çalışmaları kapsamında, Temmuz’un ortasına denk gelen nüfusun büyük çoğunluğunun 2. doz aşılamalarının yapıldığı tarihlere göz atıldığında, 15 Temmuz sonrasında, Biontech aşısı hakkındaki olumlu düşüncelerin 4 puan azalarak %50’ye gerilediği görülmektedir.

Grafik 9 Biontech Aşısı 15 Temmuz 2021 Öncesi Duygu Dağılımları
Grafik 10 Biontech Aşısı 15 Temmuz 2021 Sonrası Duygu Dağılımları

Sinovac

Türkiye geneline bakıldığında çalışma kapsamında toplanan tweetlerin yarısından fazlasında Sinovac aşısı hakkında olumlu tweet attığını gözlemlenmiştir.

Grafik 11 Sinovac Aşısı Genel Duygu Dağılımları

Sinovac hakkında atılan tweetlerin aldığı beğenme sayıları incelendiğinde pozitif tweetlerin toplamda 1000’den fazla beğeni aldığı gözlemlenirken, negatif tweetlerin 800 beğeni barajını aşamadığını gözlemlemekteyiz. Bu durum insanların Sinovac aşısı özelinde olumlu görüşleri daha çok desteklediğini göstermekle birlikte, Sinovac aşısının Biontech aşısı kadar kullanıcıların ilgisini çekemediğini göstermektedir.

Grafik 12 Sinovac Aşısı Dağılımlarının Beğeni Toplamları

Üç büyük şehrimize baktığımızda; İstanbul’da ikamet eden kullanıcıların %57’sinin, Ankaralı kullanıcıların da yarısının Sinovac aşısı hakkında olumlu düşüncelere sahip olduğu gözlemlenmektedir. Ancak İzmirli kullanıcıların olumlu ve olumsuz tweetlerinin arasında sadece %4’lük bir fark gözlemlenip olumlu tweetlerin oranı %50’nin altına düşmüştür. Bu durum da İzmirli kullanıcıların Sinovac aşısına Biontech aşısına oranla daha da şüpheci yaklaştığını göstermektedir.

Grafik 13 Sinovac Aşısı Ankara Özelinde Duygu Dağılımları
Grafik 14 Sinovac Aşısı İstanbul Özelinde Duygu Dağılımları
Grafik 15 Sinovac Aşısı İzmir Özelinde Duygu Dağılımları

Temmuz ortasına tekrar dönüldüğünde Sinovac aşısının 15 Temmuz’dan sonra tıpkı Biontech aşısında olduğu gibi güven kaybettiği ve pozitif tweet oranının tam 7 puan düştüğü gözlemlenerek %57’ye gerilediği gözlemlenmiştir.

Grafik 16 Sinovac Aşısı 15 Temmuz 2020 Öncesi Duygu Dağılımları
Grafik 17 Sinovac Aşısı 15 Temmuz 2020 Sonrası Duygu Dağılımları

Sonuç olarak, çalışma kapsamında insanların genel olarak aşılara daha olumlu baktığı ve olumlu bakış açılarının daha geniş kitlelerce desteklendiği gözlemlenmiştir. Pozitif tweet paylaşan kullanıcıların büyük çoğunluğu diğer insanları da aşı olmaya davet edip toplumsal bilinç oluşturmaya çalıştığı görülmüştür. Negatif tweetlerde özellikle aşıların virüse karşı etkisini sorgulanması ve yan etkileri konularının ciddi oranda etkili olduğu görülmüştür. Aşılanma çalışmalarının yoğunlaştığı dönemlerde de genel düşüncenin negatif yönde bir hareket sergilediği gözlemlenmiştir.

GTech Büyük Veri ve Analitik Departmanı’mızın uzmanlık alanlarından biri olan Doğal Dil İşleme (NLP) yöntemleriyle siz de şirketinizin herhangi bir sosyal medyada aldığı geri dönüşleri takip edebilir, farklı zamanlardaki duygu ve düşünce değişimlerini monitor edebilirsiniz. Detaylı bilgi için bize ulaşabilirsiniz.

Çalışmayı Hazırlayanlar:

Selami Tunç Ergene, GTech Veri Bilimci

Celal Akçelik, GTech Büyük Veri Danışmanı

Mert Musaoğlu, GTech Veri Bilimci