“Dijital Teknolojileri Kullanarak Nefret Söylemi ve Ayrımcılıkla Mücadele” projesi kapsamında, dilbilim, bilgisayar bilimleri, sosyal bilimler, bilişim sektörü ve sivil toplum gibi farklı alanlardan uzmanların işbirliğiyle tasarlanan pari, yapay zekâ teknolojisi kullanılarak Türkçe ve Arapça metinlerde çevrimiçi nefret söylemi tespitini mümkün kılan açık kaynaklı bir araçtır.

pari’nin anlamları
pari ismi, birçok dilde farklı ama birbirini tamamlayan anlamlar taşır:

Latince: "Eşit", yani eşitlik ve adalet değerlerimizi vurgular.
Ermenice: "İyi", yani iyi niyetli, yapıcı bir iletişimi teşvik eder.

Bu çok katmanlı anlamlar, pari’nin kapsayıcı ve çoğulcu yaklaşımını yansıtır ve hem dilde hem de dijital alanlarda bir arada yaşama kültürünün güçlenmesine katkı sunma niyetimizi temsil eder.

Metin analizi
pari az sayıda metinden büyük çaplı veri setlerine kadar farklı ölçeklerde söylem analizi yapabilir. Kullanıcılar metinleri yükleyerek, içinde nefret söylemi veya ayrımcı dil olup olmadığını kolayca öğrenebilir. İki tür analiz seçeneği sunulmaktadır:

Tekil Metin Analizi: Standart üyelik ile, kullanıcılar metinleri arama alanına girerek tekil metinler üzerinde nefret söylemi analizi yapabilirler.
Toplu Metin Analizi: Yalnızca ‘Profesyonel Üyelik’ ile sunulan bu özellik, kullanıcıların .xlsx formatındaki Excel dosyalarını yükleyerek çok sayıda metni aynı anda analiz etmesine olanak tanır.

Veri tabanlı yaklaşım
Araç, dil analizine dayalı çıktılarla kullanıcıların nefret söylemini anlamasına ve tanımlamasına yardımcı olur. Ayrıca veri analizi ile bu tür söylemleri yapısal olarak inceleme imkânı sunar.

Kimler kullanabilir?
pari’yi nefret söylemi ve ayrımcı söylemi tespit etmek isteyen herkes kullanabilir. pari aynı zamanda, profesyonel üyelik seçeneğiyle nefret söylemi izleme çalışmalarını kısmen otomatize etmeyi ve hızlandırmayı hedefler.

  • Bireysel kullanıcılar
  • Akademisyenler ve araştırmacılar
  • Sivil toplum ve medya profesyonelleri

Nefret söylemiyle mücadele
Dil, ayrımcılığın hem taşıyıcısı hem de önleyicisi olabilir. pari, araştırmacıların dili daha derinlemesine analiz etmesine olanak tanır ve dil yoluyla ayrımcılıkla mücadelede bir araç sunar.
Siz de pari’yi denemek istiyorsanız buradan ulaşabilirsiniz.

Metodoloji
pari, nefret söylemi tespiti için makine öğrenmesi tabanlı bir yapay zekâ modeli olarak geliştirildi. Modelin eğitimi için Hrant Dink Vakfı’nın 10 yıllık yazılı basının taranmasıyla arşivlenen geniş haber verisine ek olarak X platformundan elde edilen tweetler kullanıldı. Yüksek kaliteli bir veri seti oluşturmak amacıyla, interdisipliner bir ekip, detaylı etiketleme yönergeleri geliştirerek belirsizlikleri gidermeyi ve kapsayıcılığı sağlamayı amaçladı. Bu yönergenin rehberliğinde, nefret söylemi dört kategoriye ayrılarak şiddet seviyesi 0’dan 10’a kadar bir ölçekle değerlendirildi.

Abartma/Yükleme/Çarpıtma/Genelleme: Bir kişi ya da olaydan yola çıkarak bir topluluğa yönelik olumsuz genelleme, çarpıtma, abartma, olumsuz atıf içeren söylemler.

Küfür/Hakaret/Aşağılama/İnsandışılaştırma:
Bir topluluk hakkında doğrudan küfür, aşağılama, hakaret içeren söylemler.

Düşmanlık/Savaş söylemi:
Bir topluluk hakkında düşmanca, savaşı çağrıştıran ifadelerin yer aldığı söylemler.

Simgeleştirme:
Doğal bir kimlik öğesinin nefret, aşağılama unsuru olarak kullanıldığı, simgeleştirildiği söylemler.
Tweetler, nefret söylemi kategorilerinin yanı sıra ayrımcı söylem açısından da etiketlendi.

Ayrımcı söylem:
Bir grubun tamamının ya da grubun bazı üyelerinin, kimlikleri sebebiyle topluma dahil olma, hak ve özgürlüklerden faydalanma gibi alanlarda baskın gruptan olumsuz şekilde farklı görüldüğü söylemler.
Etiketleme sürecinde, farklı alanlardan gelen ve çoğunluğunu üniversite öğrencilerinin oluşturduğu etiketleyiciler, tweetleri etiketlemeden önce kapsamlı bir eğitim aldı. Tweetlerin etiketlenme doğruluğunu sağlamak için her tweet üç farklı kişi tarafından etiketlendi.
Nefret söyleminin dinamik doğası, kültürel referanslar, bağlam eksikliği ve dilsel belirsizlik (örn. ironi) otomatik nefret söylemi sınıflandırmasındaki zorluklar arasında bulunuyor. Modeli bu değişimlere uyacak şekilde adapte etmek ve doğruluğu korumak, düzenli veri güncellemeleri ve yeniden eğitim gerektiriyor. Bu nedenle, düzenli olarak daha fazla veri ekleyerek pari’yi geliştirmeyi amaçlıyoruz. pari, Türkçe’de %85, Arapça’da ise %80 doğruluk oranıyla çalışır. Türkçe için 2189 test verisi üzerinde yapılan değerlendirmede, pari %17 oranında yanlış pozitif (False Positive – FP) ve %15 oranında yanlış negatif (False Negative – FN) sonuç verdi. Arapça için ise, 499 test verisi üzerinde yapılan incelemede, pari %6 oranında yanlış pozitif (FP) ve %27 oranında yanlış negatif (FN) sonuç verdi. (Doğruluk oranları hakkında daha detaylı bilgi için “Nefret Söylemiyle Mücadelede Yapay Zekâ: Etiketleme, Sınıflandırma ve Tespit Kılavuzu” kaynağına bakabilirsiniz).

 

 

Bu proje Avrupa Birliği tarafından finanse edilmektedir.