Yazar: Bengisu Gülüm Sert
Editör: Çağıl Zehni
Bazı çevirmenlerin işlerini elinden alacağını düşündüğü, bazı çevirmenlerin de sık sık kullandığı makine çevirisi (MT), ücretsiz çevrimiçi çeviri araçlarından; daha net ve uygun sonuçlar üreten müşteriye veya alana özgü verilerden oluşan, sektöre özel olarak üretilen çeviri motorlarına kadar farklı kapasitelerde çeviri araçlarını nitelendirmek için kullanılır.
Makine çevirisi motorlarında daha önce çevrilmiş cümleleri, paragrafları veya metin bölümlerini depolayan çeviri belleği ve terminoloji veri tabanları bulunur. Bu veri tabanları içerik çevrildikçe güncellenebilir ve MT sistemlerinin performansını daha da artırmak için ilerleyen çalışmalarda kullanılabilir. Günümüzde neredeyse her alanda kullanılan yapay zekanın etkisiyle makineler, insana ihtiyaç duymadan gelişmiş çevirilere imza atabiliyor.
Pekala günümüze gelene kadar makine çevirisi hangi aşamalardan geçmiş ve çeviri yapan insanlar dururken makinelere ilk kez ne zaman ihtiyaç duyulmuş hiç merak ettiniz mi? İşte meraklılar için makine çevirisi!
Makine Çevirisinin Tarihi
Mucitler, bir dili hızlıca çözümleyebilen ve çevirebilen bir bilgisayarın hayalini kurdu ve üretmenin yollarını aradı.
Hikâye 1933 yılında, Sovyet bilim insanı Peter Troyanskii’nin, SSCB Bilim Akademisi’ne “bir dilden diğerine çeviri yaparken kelimelerin seçilmesi ve basımı” için kullanılabilecek makineyi tanıtmasıyla başladı.
Troyanskii’nin buluşu çok sadeydi, dört farklı dilde kartlar, bir daktilo ve eski bir kameradan oluşuyordu.
Teknisyen metindeki ilk kelimeyi aldı, diğer dilde o kelimeye karşılık gelen kartı buldu, fotoğraf çekti ve kelimenin halini (ad, çoğul, tamlayan) daktiloya yazdı. Teyp ve kamera filmi kelimeler ve hallerinden oluşan bir dizgi oluşturmak için eşzamanlı olarak kullanıldı. Ancak buluş, SSCB’de sık sık olduğu gibi, “işe yaramaz” olarak kabul edildi. Troyanskii, 20 yıl boyunca buluşunu bitirmeye çalıştıktan sonra Stenocardia’dan öldü.
1956’da iki Sovyet bilim insanı buluşunun patentini bulana kadar dünyada kimse makineden haberdar değildi.
1954: Georgetown-IBM Deneyi
Soğuk Savaş’ın başlangıcında, 7 Ocak 1954’te, IBM New York genel merkezinde, IBM 701 bilgisayarı otomatik olarak Rusçadan İngilizceye 600 cümle çevirdi. Tarihte ilk kez bir bilgisayar, saniyede 2,5 satır çeviri yapabiliyordu.
Ancak, çevrilen örnekler dikkatle seçilmiş ve test edilmişti. Sistem günlük kullanımdan ziyade basit bir konuşma kılavuzuna daha uygundu. Buna rağmen, bu sistemin duyulması ABD, Almanya, Fransa ve Japonya gibi ülkeler arasında makine çevirisi üzerine bir yarış başlamasına sebep oldu.
Makine Çevirisini geliştirme mücadelesi altmış yıl sürdü ve Kural Tabanlı Makine Çevirisinden (RBMT) Nöral Makine Çevirisine (NMT) kadar farklı modellerin üretilmesiyle sonuçlandı.
Kural Tabanlı Makine Çevirisi (RBMT)
Bilim insanları, tercümanların çalışmalarını incelediler ve son derece ağır çalışan bilgisayarlarla tercümanların yaptıklarını tekrarlamaya çalıştılar. Çift dilli sözlük ve dil bilgisi kuralları bileşenlerinden oluşan sistem isim listeleri, yazım denetleyici ve başka dilin alfabesiyle yazma gibi özelliklerle de desteklenebilirdi. Bu sistemin en bilinen örnekleri PROMPT ve Systran olarak verilebilir.
Doğrudan Makine Çevirisi
Doğrudan makine çevirisi en basit makine çevirisi türüdür. Metni kelimelere böler, çevirir, morfolojiyi düzeltir ve söz dizimini her şeyin düzgün görünmesi için daha uyumlu hale getirir. Bu adımlardan sonra eğitimli dilbilimciler her kelimenin kurallarını yazar. Sonuç bir çeşit çeviriye dönüşür.
Transfer Tabanlı Makine Çevirisi
Transfer tabanlı makine çevirisinde ilk olarak cümlenin dil bilgisel yapısı belirlenir, daha sonra kelimeler değil cümlenin yapısı değiştirilir. Bu uygulama teoride, çeviride doğru kelime sırası elde etmeye yardımcı olur. Uygulamada karşılaşılan durum ise, kelimesi kelimesine çeviri ve yorgun dilbilimcilerdir. Bir açıdan, basitleştirilmiş genel dilbilgisi kuralları elde edilmiş olsa da cümlelerin sayısının artmasıyla çeviri daha karmaşık hale gelmiştir.
Diller Arası Makine Çevirisi
Genellikle hava raporu çevirisi gibi belirli alanlarda kullanılan bu yöntemde ilk olarak kaynak metinden ortalama bir taslak elde edildikten sonra mümkün olduğunca çok sayıda dünya dilinin sözcük dağarcığına uyumlu olabilmesi (interlingua) için taslaklar birleştirilir. Interlingua, Descartes’ın hayalini kurduğu evrensel kurallara uyan ve çeviriyi basit bir “öncesi sonrası” hale dönüştüren bir meta-dildir. Daha sonra, interlingua herhangi bir hedef dile dönüştürülür ve teklik elde edilir. Dönüşüm nedeniyle, interlingua genellikle transfer tabanlı sistemlerle karıştırılsa da aradaki fark, dil çiftleri değil, her dile ve interlingua’ya özgü dil kurallarıdır. Bu da interlingua sistemine üçüncü bir dil eklenebileceği ve her üçü arasında çeviri yapılabileceği anlamına gelir.
Kulağa mükemmel gelse de birçok bilim insanı bu amaç uğruna hayatları boyunca çalışmış ancak evrensel bir interlingua oluşturmak oldukça zor olduğu için sonuç alamamışlardır. Bilim insanları uzun çalışmalarına rağmen evrensel interlinguayı oluşturamasalar da morfolojik, sözdizimsel ve anlamsal taslaklar oluşturabilmişlerdir.
Örnek Tabanlı Makine Çevirisi (EBMT)
Soğuk Savaş olmasa da ülkede çok az kişi İngilizce bildiği ve kurulması planlanan küreselleşme partisi için dil bariyerini ortadan kaldırmak istediği için Japonya, makine çevirisi için yapılan mücadeleyle yakından ilgiliydi ve işe yarar bir makine çevirisi yöntemi bulmak için arılar gibi çalışıyordu.
Kural tabanlı İngilizce-Japonca çeviri son derece karmaşıktı. Dil yapısının tamamen farklı olmasının yanı sıra hemen hemen tüm kelimelerin yeniden düzenlenmesi ve yanına yenilerinin eklenmesi gerekiyor. 1984 yılında Kyoto Üniversitesi’nden Makoto Nagao, tekrarlanan çeviri yerine daha önce çevrilmiş ifadeleri kullanma fikrini ortaya atmıştır. Örneğin “Sinemaya gidiyorum” ve Tiyatroya gidiyorum” cümlelerini çevirirken tek ihtiyacımız olan iki cümle arasındaki farkı çözmek ve eksik kelimeyi çevirmek. Bu da bilim insanlarına makinenin, mevcut çevirilerle desteklenebileceğini ayrıca kurallar ve istisnalar oluşturmak için uzun süre çalışmak gerekmediğini gösterdi.
Kelime Tabanlı İstatistiksel Makine Çevirisi
Başlangıçta, istatistiksel çeviri sistemleri basit ve mantıklı olduğu için cümleyi kelimelere bölerek çalışırdı. IBM’de kullanılan ilk modelde kelimelere bölme ve istatistikleri hesaplama yöntemi kullanıldı. Bu yöntemde kelime sırası hesaba katılmadı. Yöntemin tek esprisi bir kelimenin diğer dilde birçok karşılığını bulmaktı. Bazı durumlarda çok önem arz eden dillerin kelime sırası hakkındaki bilgi eksikliği, Model 1 için bir sorun haline geldi. Model 2’de bu soruna çözüm bulundu: Makine, kelimenin kaynak metinde genelde nerede kullanıldığını öğrendi ve taslak metnin daha doğal bir dille yazılabilmesi için kelime sırasını karıştırdı. Böylece biraz daha iyi bir çeviri elde edilse de hâlâ sorunlar vardı. Çeviride Almancadaki ön ekler gibi pek çok yeni kelime ortaya çıktı.
Bununla başa çıkmak için Model 3’e iki adım daha eklendi:
- Makinenin hesapları sonucu yeni bir kelime gerekirse NULL işareti konulur ve
- Her işaret-kelime hizalaması için doğru bilgisi kuralı veya kelime seçilir.
Model 2 ise, kelime hizalamayı hesaba katıyordu ancak yeniden sıralama hakkında hiçbir veriye sahip değildi. Örneğin cümlede sıfatlarla isimlerin yeri bazı durumlarda değişebilir bu yüzden kelime sırası ezberlense de sonuç istenildiği gibi olmayabilir. Bu pürüzü ortadan kaldırmak için Model 4, “göreceli sıra” olarak adlandırılan, çeviri yaparken cümlede yan yana geldiklerinde her zaman yer değiştiren kelime çiftlerini hesaba katması için programlandı.
Model 5, daha fazla parametreyle çalıştı ve yeri karıştırılan kelimelerle ilgili sorun giderildi. Yenilikçi yapısına rağmen, kelime tabanlı sistemler hâlâ ismin halleri, cinsiyet ve eş anlamlı kelimeleri de başarısız oldu.
Makine, bağlamı hesaba katmadan her kelimeyi aynı şekilde çevirdi. Bu tür sistemlerin yerini daha gelişmiş cümle tabanlı yöntemler aldı.
Günümüzde nöral makine çevirisine kadar uzanan bu soluksuz yolculukta, çeviriye ihtiyaç duyulan alanlar ve çevirmenin etkisi de zaman içinde değişmiştir. İlerisi bize ne getirir bilinmez ama günümüzde makinelerin hâlâ bize ihtiyacı var gibi görünüyor…
GEÇİD’in tüm sayılarına ve dergideki diğer yazılara Genç Çevirmenler Platformu‘nun internet sitesi üzerinden, “Projelerimiz” sekmesiyle ulaşabilirsiniz!