Google Crowdsource Irak ve Irak Kürdistan Bölgesi Kurucusu: Tüm Kürtlerin başarısıdır ve daha çok işimiz var!
Google Crowdsource Topluluğu’nun Irak ve Kürdistan Bölgesi Kurucusu Bokan Jaff (Caf) , “Google çeviriye eklenen Kürtçenin Sorani lehçesi, yedi yıllık bir çalışmanın ürünüdür. Bu çalışmamız vatansever Kürtlere adanmıştır” dedi.
Google Translate Yazılım Mühendisi Isaac Caswell, dijital çeviri “Google Translate” hizmetine, Kürtçenin Sorani lehçesi dahil olmak üzere 24 yeni dil eklediğini, şu sözlerle duyurdu:
- Google Çeviri, yıllardır dil engellerini ortadan kaldırmaya ve dünyanın her yerindeki toplulukları birbirine bağlamaya yardımcı oldu. Bunu özellikle dilleri çoğu dijitalde temsil edilmeyen daha fazla insan için mümkün kılmak istiyoruz. Bu nedenle, bugün ‘Çeviri’ye 24 dil ekledik ve şu anda dünya genelinde kullanılan toplam 133 dili destekliyoruz.
Caswell’in bu duyurusu, Ortadoğu ülkelerinde Türkiye ve İran başta olmak üzere Kürtçenin, zaman zaman “halen özgürce konuşulmadığı”, “yargılandığı” ve “anadil eğitim hakkının tartışıldığı?” bir dönemde dikkatler yine Kürtçeye ve Kürtlere yönelik çalışmalara çevrildi.
“Sorani lehçesini 8 milyon Kürt kullanıyor”
Google Çeviri’nin son eklediği diller arasında yer alan Kürtçenin Sorani lehçesi; Irak Kürdistan Bölgesi (IKB) ve İran’ın kuzeybatısında, Irak ile Türkiye sınır bölgelerinde yer alan, Kürtlerin yoğun olarak yaşadığı, Kürdistan Eyaletini de kapsayan ve “Rojhilat” nitelendirilen bölgeler olmak üzere resmi olmayan kaynaklara göre yaklaşık 8 milyon kişi tarafından konuşuluyor.
İki ülkedeki birçok Kürt’ün ana dili olan Kürtçe’nin Sorani lehçesi, aynı zamanda IKB’de aralarında Türkmen, Arap, Aşuri, Hristiyan, Kakei, Bahai ve Zerdeştlerin olduğu bileşenler tarafından da konuşuluyor.
Kürtçenin en çok konuşulan lehçesi Kurmanci ise, Türkiye ve Suriye Kürtlerinin yanı sıra, IKB’nin özellikle Duhok, Zaho ile Rojhilat’ın Urmiye bölgesi olmak üzere en az 20 milyon kişi tarafından konuşuluyor.
Sorani alfabesi Arap alfabesinden, Kurmanci de Latin alfabesinden uyarlananıyor.
Google Çeviri’nin Sorani lehçesi kullanıcılara açılmasından birkaç gün sonra “Tradukka” web sitesine de eklendi.
“Biri koordinatör 7 bin gönüllü Kürt çalıştı”
Google, gönüllü kullanıcıların yardımıyla birçok hizmetinin yapay zeka algoritmalarını iyileştirmek için geliştirilen bir platform olan Google Crowdsource, bünyesinde Kürtçenin Sorani lehçesini sisteme konulması için yaklaşık 7 bin gönüllü Kürt çalıştı.
“Google teknik servisiyle iletişimi ABD’nin Irak Büyükelçiliği sağladı”
Crowdsource Topluluğu’nun Irak ve IKB’deki Kurucusu Halepçeli Bokan Caf (Jaff), Sorani lehçesinin Google Çeviri’ye ekleme sürecini Independent Türkçe‘ye anlattı.
“Bu projeyi Amerika’nın Irak Büyükelçisine sundum. Büyükelçi bana bu konuda Google’nin teknik ekibiyle iletişim kurabilmemiz için yardım edebileceklerini söyledi” diyen Bokan Caf, sözlerine şöyle devam etti:
- Şükürler olsun ki bu görüşmemizden bir süre sonra, Google teknik servisiyle iletişim kurduk. Sonraki aşamada teknik servisinden bazı görevlilerle günlük olarak iletişim halinde olmaya başladık. Bana Sorani lehçesinden verileri Google Çeviri eklemememizi söylediler. 2019 yılında Sorani, Google Crowdsource Topluluğu bünyesine girdi. Bir hafta sonra da Google yönetimi Irak’ta Crowdsource topluluğunu oluşturmamızı talep ettiler. Bende Google denetiminde bu topluluğun temsilcisi olarak seçildim. Oluşturduğumuz topluluk bünyesinde de çalışmalarımızı, Kürtçe kelimeleri çevirme ve birtakım genel işleri yapmaya başladık.
- Kovid-19’un çıkmasıyla Google toplantılarımız online yapıldı. Bu süreçte yönetimle yaklaşık 24 genel toplantı yapıldı. Aynı yıl sosyal medyada Facebook başta olmak üzere bir grup oluşturuldu. Bu grup aracılığıyla da çok sayıda gönüllüye ihtiyacımız olduğunu duyurduk. Sonuç olarak 11 aylık test sürecinden -ki bu süreçte bir milyon 500 veri sisteme konuldu ve denetlendi- sonra da bu yılın 11 Mayıs’ında Google çeviri resmi olarak Kürtçenin Sorani lehçesini listesinde yer verdi.
Kürtçe Sorani verilerin şimdiden 127 dili geride bırakarak 2 milyon 380 bin 500 veri yüklendiğine dikkat çeken Jaff, çalışmayı yürüten ekibe dair, şunları söyledi:
- Google şirketi yaptığı resmi açıklamada, kurucu olarak şahsımı Bokan Jaff, Medya Ghazizadeh (Midya Gezizade), Roshna Omer Abdulrahman (Roşna Ömer), Saman Vaisipour (Saman Vesipur) ve Sarchia Khursheed’de (Serçia Hurşid) yer vererek, çalışmalarımızdan dolayı teşekkür etti. Ancak sosyal medyada oluşturduğumuz grupta yaklaşık 7 bin gönüllü çalıştı. Bu 7 binden elbette hepsi çeviri yapmadı ancak tekniki ve edit gibi alanlarda katkı sundu. Yani bu projede çok sayıda kişinin emeği var.
Bokan Jaff, “Google Çeviri’ye eklenen Kürtçenin Sorani lehçesi, yedi yıllık bir çalışmanın ürünüdür. Bu çalışmamız vatansever Kürtlere adanmıştır” dedi.
“Dijital ortamda Kurmanci lehçesinden kaynak daha fazladır”
“Bilindiği gibi Kürtçenin Kurmanci lehçesi 2016 yılında Google Çeviri de yer verildi. Peki Sorani lehçesini veri tabanına aktarmada nasıl sorunlarla karşılaştınız?” sorusuna, Jaff, şu yanıtı verdi:
- Evet 2016’da Google, Kurmanci lehçesini Google Çeviri de yer verdiğinde çok daha kolay oldu aslında. Çünkü klavye Latince idi. Bununla birlikte internette Kurmanci yeterli veri kaynakları da bulunuyordu. Yani daha fazla yazı ve makaleler yazılmıştı ve daha fazla kelime sisteme girmişti. Dolayısıyla bu Google için çok daha kolay oldu.
Soranicenin veri kaynağı eksikliği; klavye eksikliği, standart alfabe ve oturmayan imlâ sorunları vardı. Bu sorunlar geç hizmete sunulmasına da neden oldu.
“10 yıldır Arapça gibi bir dil Google Çeviri kullanıcılarına sunulmasına rağmen halen yanlışları var”
“Uygulama kullanıma geçilmesinin ardından sosyal medyada kullanıcıların birçoğu projede başta siz olmak üzere emeği geçenlere teşekkür etmeyle birlikte, eksik ve yanlış çevirilerin olduğunu da paylaştı. Bu konuda ne düşünüyorsunuz?” sorusuna da Jaff, şu yanıtı verdi:
- Evet, sizin de bildiğiniz gibi Sorani lehçesi dijital veri tabanlarında yeni oturmaya başlıyor. Bazı kelimeleri doğru yazımı konusunda sorun olabiliyor. Bu da çok doğaldır. Zamanla bu sorunun da çözüleceğini düşünüyoruz. Gerek alternatif kelimeler gerek doğru kelimelerin yazımı ve gerekse imla düzenlemeleri çalışmalarımız ciddiyetle sürüyor. Nitekim Google şirketi sistemlerine son eklediği 24 dilin de kelimelerin doğru çeviri oranını, ne kadar verimli çevirdiğini büyük bir ciddiyetle denetliyor. Yani bu konunun üzerinde daha çok durulması ve yanlışların düzeltilmesi gerekiyor.
Dediğim gibi çalışmalarımızı ciddiyetle sürdürmeye devam ediyoruz. Unutmayalım, yaklaşık 10 yıldır Arapça gibi bir dil Google Çeviri kullanıcılarına sunulmasına rağmen halen bazı yanlış ve eksiklikleriyle karşılaşabiliyoruz. Çünkü sistem bir robot yani bir algoritma. Orada karşınıza tam olarak sürekli cevap veren bir insan yok. Bu nedenle başlangıçta bu tür yanlışların ve eksikliklerin olması çok doğaldır. Şu anda amacımız hem bu eksiklikleri kapatmak hem gerek sesli gerek doküman çevirisi olsun özellikleri artırmaya çalışıyoruz.
“Neçirvan Barzani: Bu çalışma Kürdistan Bölgesi ve diğer Kürt gençlerin de yararına”
Bokan Jaff, IKB Başkanı Neçirvan Barzani’nin daveti üzerine 18 Mayıs’ta gerçekleştirdikleri ziyaret dair şu bilgileri verdi:
- Sayın Barzani görüşmede, yaptığım çalışmaları takdirle karşılayarak teşekkür etti. Bize Soranicenin gelişmesine yönelik gereken tüm olanakları ve her türlü desteği sunacağı sözü verdi. Başkan Barzani ayrıca bu çalışmanın sadece Kürdistan Bölgesi’ndeki gençleri değil, diğer bölgedeki Kürt gençleri için de büyük yarar sağlayacağını vurguladı. Bu yüzden projemizin çok önemli olduğunu ve bu konudaki çalışmalarımıza desteği birkaç kez vurguladı.
Bokan Jaff’ın IKB Başkanı Neçirvan Barzani ile görüşmesinden kare / Fotoğraf: IKB Başkanlık Ofisi
Jaff, son olarak, geleceğe yönelik çalışmalarını şöyle anlattı:
- Özellikle Google Çeviri’de sesli çeviri bölümünün aktif olması için çalışmalarımıza yoğunluk vereceğiz. Şimdiye kadar ne Kurmanci ne de Sorani lehçelerinin sesli çevirisi aktif olamadı. Bu çok meşakkatli ve yorucu bir iş, hedefimiz hem Kürdistan Bölgesi halkının hem de diğer halkların yararına olacak sesli sistemi aktifleştirmektir. Kürtçe oldukça zengin bir dil ve bunu kullanıcılara sunmak için çabalarımız sürüyor…
ABD’nin Bağdat Büyükelçiliğinden tebrik!
Google Çeviri’ye Kürtçenin Sorani lehçesine yer verilmesine dair, ABD’nin Erbil Konsolosluğu da,12 Mayıs’ta mesaj yayımladı.
Mesajda; “Kürtçenin Sorani lehçesinin Google Çeviri’ye eklenmesi memnuniyetle karşılıyoruz, IKB ve dünyada Soranice konuşan bu büyük topluluğu içtenlikle tebrik ediyoruz. Ayrıca, bu projedeki kilit işbirlikçilerden biri olan Halepçeli genç Bokan Jaff’ı, Kürt dilini dünya sahnesine taşıyarak, önemli bir dönüm noktasını getirme konusundaki kararlılığı ve sıkı çalışması için özellikle tebrik etmek istiyoruz. Büyükelçi Palladino mart ayında Halepçe’ye yaptığı ziyarette, Bokan ile bir araya geldi ve Google’daki bu etkinlik hakkında bilgi aldı. Google Çeviri’deki mühendislerle bağlantı kurmasına yardımcı olduğu için Erbil’deki ABD Başkonsolosluğu’na minnettarlığını ve projede çalışan diğer çalışkanlara bravo!” ifadelerine yer verildi.
Bokan Jaff ile ABD’nin Erbil Başkansolosu Robert Palladino
IKB Başbakanı Mesrur Barzani de, Twitter hesabında Google’in haberini paylaşarak, Soranice “Çok teşekkür ederim Google” tweetini attı.
Kürdistan bayraklı emoji çalışmaları sürüyor
Microsoft’un Kürtçenin Kurmanci ve Sorani lehçeleri, 20 Ağustos’ta Microsoft Translotor Blogu’na eklendi.
Bu arada IKB Başbakan Yardımcısı Kubad Talabani, bu yılın mart ayında “Kürdistan bayrağı” emojisinin iPhone, Android ve diğer cihazlarda kullanılabilmesi için ciddi çalışmalar yürüttüklerini ve yakın zaman da hayata geçirileceğini açıkladı.