Özgür Yazılım Yerelleştirme Çalışmalarında Microsoft Türkçesi Rüzgarları
KDE Türkçe Yerelleştirme listelerinde konuştuğumuz konulardan biri de Lokalize içinden kullanılabilecek bir sözlüğe sahip olmak için neler yapabileceğimiz. Dün de konu tekrar gündeme gelince biraz araştırma yaptım. Öğrendiklerimi de sadece kendime saklamamak ve ileride de kendimin hatırlamasını kolaylaştırmak için kısaca bir yazı yazmak istedim.
Lokalize öntanımlı olarak bir sözlük aracıyla birlikte geliyor. Bu araca Araçlar > Sözlük yoluyla ulaşılabiliyor. Açılan iletişim penceresinden sözlüğe girdiler eklenebiliyor. Arama kutusuna bir ifade yazılarak karşılığına bakılabiliyor. Çeviri yapılırken de sözlükte yer alan ifadeler gösterilerek kısayollarla çeviriye kolayca eklenebiliyor:
Ne yazık ki Lokalize'deki terimler sözlüğünün kendisi hakkında pek bir bilgi yok. Nasıl kullanabileceğinizi öğrenmek konusunda KDE listelerine sormaktan veya kendi başınızı arama motorlarını aşındırmaktan başka pek bir seçeneğiniz yok.
Biraz uğraşla Lokalize'nin aracını kullanarak basit bir Türkçe terimler sözlüğü oluşturdum. Bu dosyadaki ipuçlarından yola çıkarak da diğer KDE yerelleştirme takımlarının oluşturduğu terimler sözlüğüne ulaştım.
Bundan sonra yapmamız gereken aşağı yukarı belli olmuştu: GNU-TR projesi kapsamında Nilgün Belma Bugüner'in oluşturduğu sözlükten ve varsa başka benzer sözlüklerden yararlanarak ve gerekli eklemeleri yaparak günümüz uygulamalarının yerelleştirilmesi için yeterli bir sözlük oluşturmak ve bunu Lokalize'nin kullanabileceği TBX (TermBase eXchange) biçimine dönüştürmek.
Bunun için ilk denemeyi Bugüner'in derlediği sözlüğü LibreOffice'de csv biçimine çevirerek, sonra da csv dosyasını csv2tbx aracıyla tbx biçimine çevirmeye çalıştım ama başarılı olamadım. Lokalize'deki araçla tek tek girdi eklemek hem biraz uzun süreceğinden hem de bu araçta bazı sorunlar olduğundan tbx dosyaları üzerinde çalışabileceğim başka araçlar aradım. Aşağıdaki uygulamaları bulsam da pek işime yaramadılar:
Bu araçlardan da vazgeçtim böylece. Bu sırada Microsoft Language Portal ile karşılaştım. Burada Microsoft'un yerelleştirme çalışmaları için sundukları arasında bir de Microsoft Terminology Collection isimli terminoloji sözlüğü bulunuyordu. Tam aradığım şey demek ancak bu kadar uygun olabilirdi.
Bu sözlükte küçük bazı düzenlemeler yaparak Lokalize için uygun hale getirdim. Henüz lisansını incelemediğim için üzerinde değişiklik yaptığım halini dağıtma hakkımın olup olmadığını bilmiyorum. Bu yüzden dosyayı paylaşmak yerine asıl dosya üzerinde yapmanız gereken işlemleri anlatacağım.
İndirilen dosya çok uzun bir tek satır olduğu için ilk önce biçimini düzeltmemiz gerekiyor. Bunun için aşağıdaki komutu kullanabilirsiniz:
$ xmllint -format MicrosoftTermCollection.tbx -output terms.tbx
Dosya boyutu biraz arttı ama artık dosyayı Kate gibi metin düzenleyiciler ile açılabilirsiniz. Önceki halini açmaya çalışırsanız bunda başarılı olamayacağınızı görebilirsiniz.
Şimdi terms.tbx dosyasını Kate ile açarak martifHeader bölümünü de kapsayan üst kısımları silmeniz ve şuradakileri yapıştırmanız gerekiyor. Saçma bir cümle oldu ama anlatmanın en kısa yolu bu. Daha sonra da belgedeki Türkçe için atanmış olan tüm tr-tr ifadelerini tr olarak değiştirin.
Belgeyi kaydettikten sonra Lokalize'de üzerinde çalıştığının projenin ana dizinine kopyalayın. Tam olarak hangi dizinden bahsettiğimi anlamadıysanız şuradaki belgeye bakabilirsiniz.
Yukarıdaki işlemlerden sonra Lokalize'de çeviri yaparken Microsoft Türkçesi terimler sözlüğüne sahip olabilirsiniz:
Belki ileride biz de Türkiye'deki farklı özgür yazılımları yerelleştiren takımlar olarak bir araya gelip bir terminoloji sözlüğü oluştururuz. O zamana kadar böyle kişisel geçici çözümlerle baş başayız.
Lokalize öntanımlı olarak bir sözlük aracıyla birlikte geliyor. Bu araca Araçlar > Sözlük yoluyla ulaşılabiliyor. Açılan iletişim penceresinden sözlüğe girdiler eklenebiliyor. Arama kutusuna bir ifade yazılarak karşılığına bakılabiliyor. Çeviri yapılırken de sözlükte yer alan ifadeler gösterilerek kısayollarla çeviriye kolayca eklenebiliyor:
Ne yazık ki Lokalize'deki terimler sözlüğünün kendisi hakkında pek bir bilgi yok. Nasıl kullanabileceğinizi öğrenmek konusunda KDE listelerine sormaktan veya kendi başınızı arama motorlarını aşındırmaktan başka pek bir seçeneğiniz yok.
Biraz uğraşla Lokalize'nin aracını kullanarak basit bir Türkçe terimler sözlüğü oluşturdum. Bu dosyadaki ipuçlarından yola çıkarak da diğer KDE yerelleştirme takımlarının oluşturduğu terimler sözlüğüne ulaştım.
Bundan sonra yapmamız gereken aşağı yukarı belli olmuştu: GNU-TR projesi kapsamında Nilgün Belma Bugüner'in oluşturduğu sözlükten ve varsa başka benzer sözlüklerden yararlanarak ve gerekli eklemeleri yaparak günümüz uygulamalarının yerelleştirilmesi için yeterli bir sözlük oluşturmak ve bunu Lokalize'nin kullanabileceği TBX (TermBase eXchange) biçimine dönüştürmek.
Bunun için ilk denemeyi Bugüner'in derlediği sözlüğü LibreOffice'de csv biçimine çevirerek, sonra da csv dosyasını csv2tbx aracıyla tbx biçimine çevirmeye çalıştım ama başarılı olamadım. Lokalize'deki araçla tek tek girdi eklemek hem biraz uzun süreceğinden hem de bu araçta bazı sorunlar olduğundan tbx dosyaları üzerinde çalışabileceğim başka araçlar aradım. Aşağıdaki uygulamaları bulsam da pek işime yaramadılar:
Bu araçlardan da vazgeçtim böylece. Bu sırada Microsoft Language Portal ile karşılaştım. Burada Microsoft'un yerelleştirme çalışmaları için sundukları arasında bir de Microsoft Terminology Collection isimli terminoloji sözlüğü bulunuyordu. Tam aradığım şey demek ancak bu kadar uygun olabilirdi.
Bu sözlükte küçük bazı düzenlemeler yaparak Lokalize için uygun hale getirdim. Henüz lisansını incelemediğim için üzerinde değişiklik yaptığım halini dağıtma hakkımın olup olmadığını bilmiyorum. Bu yüzden dosyayı paylaşmak yerine asıl dosya üzerinde yapmanız gereken işlemleri anlatacağım.
İndirilen dosya çok uzun bir tek satır olduğu için ilk önce biçimini düzeltmemiz gerekiyor. Bunun için aşağıdaki komutu kullanabilirsiniz:
$ xmllint -format MicrosoftTermCollection.tbx -output terms.tbx
Dosya boyutu biraz arttı ama artık dosyayı Kate gibi metin düzenleyiciler ile açılabilirsiniz. Önceki halini açmaya çalışırsanız bunda başarılı olamayacağınızı görebilirsiniz.
Şimdi terms.tbx dosyasını Kate ile açarak martifHeader bölümünü de kapsayan üst kısımları silmeniz ve şuradakileri yapıştırmanız gerekiyor. Saçma bir cümle oldu ama anlatmanın en kısa yolu bu. Daha sonra da belgedeki Türkçe için atanmış olan tüm tr-tr ifadelerini tr olarak değiştirin.
Belgeyi kaydettikten sonra Lokalize'de üzerinde çalıştığının projenin ana dizinine kopyalayın. Tam olarak hangi dizinden bahsettiğimi anlamadıysanız şuradaki belgeye bakabilirsiniz.
Yukarıdaki işlemlerden sonra Lokalize'de çeviri yaparken Microsoft Türkçesi terimler sözlüğüne sahip olabilirsiniz:
Belki ileride biz de Türkiye'deki farklı özgür yazılımları yerelleştiren takımlar olarak bir araya gelip bir terminoloji sözlüğü oluştururuz. O zamana kadar böyle kişisel geçici çözümlerle baş başayız.
Bizim de bir terminoloji sözlüğümüz var. Fakat elden geçmesi gerek biraz. Şimdilik 1073 kelime.
YanıtlaSilpo dosyasında biraz çalışıp geliştirebiliriz.
https://translations.documentfoundation.org/tr/terminology/
Bunu öğrendiğim iyi oldu. Özgür yazılım projelerinin çeviri dosyalarından yararlanarak tüm çeviri projelerinde yararlanılabilecek genel bir terminoloji sözlüğünün ortaya çıkarılıp çıkarılamayacağını merak ediyorum. Tabii tek merak ettiğim bu olmadığı için ne zamana kadar somut bir şeyler çıkar bilmiyorum ortaya :)
YanıtlaSilBu da Haiku'nun terminoloji sözlüğü:
http://i18n.haiku-os.org/pootle/tr/haiku/pootle-terminology.catkeys
http://i18n.haiku-os.org/pootle/tr/haiku/pootle-terminology.catkeys/translate/
Sil