Hrant Dink Vakfı tarafından, Avrupa Birliği ve Friedrich Naumann Vakfı'nın finansal desteğiyle, Sabancı Üniversitesi ve Boğaziçi Üniversitesi ortaklığıyla yürütülen ‘Dijital Teknolojileri Kullanarak Nefret Söylemi ve Ayrımcılıkla Mücadele’ başlıklı proje kapsamında yapılacak olan ‘The 18th Conference of the European Chapter of the Association for Computational Linguistics’ (EACL 2024) isimli konferans dahilinde düzenlenen ‘Türkçe ve Arapça Tweetlerde Nefret Söylemi Tespiti’ isimli yarışmaya davetlisiniz. 

 

Türkçe ve Arapça Tweetlerde Nefret Söylemi Tespiti

 

Kimler Katılabilir?

  • Akademisyenler, uzmanlar, öğrenciler ve sivil toplum çalışanları.
  • Yarışmaya kayıt için 5 Ocak 2024’e kadar bu formu doldurabilirsiniz.
  • Başvuru ve yarışmayla ilgili detaylı bilgi için bu sayfayı inceleyebilir, sorularınız için Bu e-Posta adresi istenmeyen posta engelleyicileri tarafından korunuyor. Görüntülemek için JavaScript etkinleştirilmelidir. adresine ulaşabilirsiniz.


Yarışma ve atölye takvimi:

  • Kayıt Son Tarihi: 5 Ocak 2024
  • Eğitim Datası Yayın Tarihi (Problem A): 23 Aralık 2023
  • Eğitim Datası Yayın Tarihi (Problem B): 26 Aralık 2023
  • Test Aşaması: 14-16 Ocak 2024
  • Makale Gönderim Son Tarihi: 23 Ocak 2024
  • Yazar Bildirimi: 29 Ocak 2024
  • Son Makale Gönderimi: 2 Şubat 2024
  • Atölye Tarihleri: [Duyurulacak]

İki farklı problem üzerinden değerlendirme yapılacaktır.

A) Farklı Bağlamlarda Türkçede Nefret Söylemi Algılama

Türkçe sosyal medya metinlerinde nefret söylemini algılayabilen bir model geliştirmek amacıyla katılımcılar tweetlerin nefret söylemi içerip içermediğini belirlemeye yönelik ikili sınıflandırma görevlerine katılacaklar. Veri seti nefret söylemi var ya da yok şeklinde etiketlenen çeşitli Türkçe tweetleri içermektedir. Hem eğitim hem de test seti, İsrail-Filistin Çatışması'na, mültecilere ve Yunanlara yönelik söylemlerle ilgili tweetleri içeriyor. Değerlendirme aşamasında gönderilen modelin performansı üç konuya dair nefret söylemi içeren veriler üzerinden değerlendirilecektir.

B) Sınırlı Veri ile Arapçada Nefret Söylemi Algılama

Kısıtlı veriyle Arapça dilinde nefret söylemini tespit edebilecek bir model geliştirmek amacıyla oluşturulan ve yaklaşık 1000 Arapça tweetten oluşan bu veri seti, mültecilere yönelik söylemlere odaklanmaktadır. Model performansı, mültecilere karşı nefret söylemi içeren tweetlerin bulunduğu test verisiyle değerlendirilecektir.

Veri Seti

Twitter'ın Kurallar ve Politikaları gereği, tweet metinleri kamuya açık olarak paylaşılamaz. Yarışmaya katılımınızı kolaylaştırmak için gerekli veri setini sizlere e-posta aracılığıyla dağıtacağız. Tweet ID'leri dışında herhangi bir veriyi paylaşmak veya yayınlamak kesinlikle yasaktır. İzin almadan veri seti paylaşılmamalı veya yayınlanmamalıdır.

Değerlendirme Kriterleri

Geliştirilen yöntemler bağımsız test kümeleriyle Kaggle platformu üzerinden değerlendirilecek ve farklı yaklaşımların başarıları uygun metriklerle karşılaştırılacaktır. Her alt görev için takım başına birden fazla, ancak sınırlı sayıda gönderime izin verilecektir. Sıralamalar, takım başına en iyi performansa göre belirlenecektir. Tüm alt görevler için değerlendirme metriği, test verilerinden elde edilen F1 puanı olacaktır. Test aşamasında iki farklı skor tablosu uygulanacaktır. Katılımcıların kodlarını kısa bir model açıklamasıyla (150-250 kelime) birlikte sunmaları gerekmektedir.

Her görev için, performanslarına bağlı olarak her görevde en üst sıralarda yer alan başvurulara dağıtılacak bir ödül vardır. Yarışmanın tamamı için toplam ödül miktarı brüt 7000 Euro'dur. Toplam ödül miktarı uygun başvuruların performansına göre değerlendirme komitesinin takdirine göre dağıtılacaktır.

 

 

Bu proje Avrupa Birliği tarafından finanse edilmektedir.