Hunspell
Hunspell, aslen Macarca için tasarlanmış, bununla birlikte zengin morfolojiye sahip, karmaşık kelime birleştirmeli ve karakter kodlamalı diğer diller için de uygun bir yazım denetleyicisi ve biçimsel çözümleyicidir. László Németh tarafından geliştirilmeye başlanmıştır.
Hunspell, MySpell tabanlıdır ve MySpell sözlükleri için geriye doğru uyumludur. MySpell tek baytlık karakter kodlaması kullanırken, Hunspell Unicode UTF-8 kodlu sözlükleri kullanabiliyor.
Hunspell'in şu anki ana sponsoru FSF.hu Vakfı. Projeye ayrıca 2003 - 2005 yılları arasında Budapeşte Teknik Üniversitesi Medya Araştırma Merkezi (BME MOKK) ve 2008'de IMEDIA Medya Takip sponsor olmuş. Zemberek'e sponsor veya destek olan hangi kurum ve kuruluşlar var merak ediyorum açıkçası veya böyle yerler var mı ki?
Hunspell Kullanan Yazılımlar
Hunspell yazım denetleyicisinin kullanıldığı yazılımlardan bazıları aşağıda listelenmiştir:
Hunspell'in Özellikleri
GPL, LGPL ve MPL lisanslarıyla dağıtılan özgür yazılım Hunspell'in başlıca özellikleriyse aşağıdaki gibidir:
Hunspell Türkçe Desteği
Hunspell'in pek çok dil için sözlüğü bulunmaktadır. Hunspell uyumlu Türkçe yazım denetimi dosyalarının ürütimini amaçlayan tr-spell projesi sayesinde bu diller arasında Türkçe de yer almaktadır. Bu projenin çıktıları doğrudan veya üzerinde bazı değişiklikler yapılarak Firefox Türkçe yazım denetimi eklentisi, Google Chrome tarayıcısı ve benzeri uygulamalarda kullanılmaktadır.
tr-spell'deki imla denetim mekanizması Zemberek kütüphanesini ya da algoritmalarını kullanmaz, basit kelime listesi ve otomatik olarak yapay ek bilgilerini üretir. Bu yazım denetim mekanizmasının başarımı yapısal çözümleme tabanlı Zemberek'e göre daha düşüktür.
tr-spell hakkında daha detaylı bilgi için Zemberek proje günlüğündeki ilgili yazılara bakabilirsiniz.
Kaynaklar
Hunspell, MySpell tabanlıdır ve MySpell sözlükleri için geriye doğru uyumludur. MySpell tek baytlık karakter kodlaması kullanırken, Hunspell Unicode UTF-8 kodlu sözlükleri kullanabiliyor.
Hunspell'in şu anki ana sponsoru FSF.hu Vakfı. Projeye ayrıca 2003 - 2005 yılları arasında Budapeşte Teknik Üniversitesi Medya Araştırma Merkezi (BME MOKK) ve 2008'de IMEDIA Medya Takip sponsor olmuş. Zemberek'e sponsor veya destek olan hangi kurum ve kuruluşlar var merak ediyorum açıkçası veya böyle yerler var mı ki?
Hunspell Kullanan Yazılımlar
Hunspell yazım denetleyicisinin kullanıldığı yazılımlardan bazıları aşağıda listelenmiştir:
- Apple'ın Mac OS X 10.6 Snow Leopard işletim sistemi ve sonraki sürümleri
- Apache Solr 3.5 ve sonraki sürümleri
- Eclipse, Hunspell4Eclipse kullanarak
- Google Chrome
- InDesign, Adobe'nin sayfa yerleşimi yazılımı, CS5.5 sürümü itibarıyla
- LibreOffice ve OpenOffice.org, 2.0.2 sürümünden başlayarak
- LyX, bir belge işleme yazılımı
- Mozilla yazılımları: Firefox ve Thunderbird (ikisi de 3. sürümleriyle kullanmaya başladı), ve SeaMonkey (2. sürümüyle kullanmaya başladı)
- Novell Groupwise, 2012 sürümü itabarıyla kullanmaya başladı
- SDL Trados Studio, SDL tarafından geliştirilen popüler bilgisayar destekli çeviri yazılımı
- OmegaT, açık kaynak bilgisayar destekli çeviri aracı
- Opera 10+
- SoftMaker Office, çok platformlu ofis paketi, (dahili yazım denetleyicisine ek olarak)
- Speckie, Bir Internet Explorer eklentisi
- Squiggly, Flash ve Flex için bir Adobe ActionScript 3 yazım denetleyicisi kütüphanesi (şu an için Adobe Labs üzerinde önizleme sürümü olarak bulunuyor)
- The Bat!, RITLABS S.R.L.'in geliştirdiği e-posta istemcisi, 4.0 sürümü itabarıyla kullanmaya başladı
- WinShell, Windows üzerinde çalışan TeX ve LaTeX tümleşik geliştirme ortamı
- XTuple, çok platformlu kurumsal kaynak planlama uygulaması
- Yudit, X Pencere Sistemi için Unicode metin düzenleyici
Hunspell'in Özellikleri
GPL, LGPL ve MPL lisanslarıyla dağıtılan özgür yazılım Hunspell'in başlıca özellikleriyse aşağıdaki gibidir:
- Dillerdeki alışılmamış özellikler için geliştirilmiş destek. Unicode karakter kodlama, bileşik ve karmaşık morfoloji.
- n-gram benzerliği, kural ve sözlük tabanlı telaffuz verileri kullanılarak iyileştirilmiş öneriler.
- Morfolojik analiz, sıkılama ve üretim.
- C++ kütüphanesi
- Pek çok arayüz ve farklı dile aktarım: Enchant (Abiword'ün genel yazım kütüphanesi), XSpell, Delphi, Java (JNA, JNI), Perl, .NET, Python, Ruby, UNO
Hunspell Türkçe Desteği
Hunspell'in pek çok dil için sözlüğü bulunmaktadır. Hunspell uyumlu Türkçe yazım denetimi dosyalarının ürütimini amaçlayan tr-spell projesi sayesinde bu diller arasında Türkçe de yer almaktadır. Bu projenin çıktıları doğrudan veya üzerinde bazı değişiklikler yapılarak Firefox Türkçe yazım denetimi eklentisi, Google Chrome tarayıcısı ve benzeri uygulamalarda kullanılmaktadır.
tr-spell'deki imla denetim mekanizması Zemberek kütüphanesini ya da algoritmalarını kullanmaz, basit kelime listesi ve otomatik olarak yapay ek bilgilerini üretir. Bu yazım denetim mekanizmasının başarımı yapısal çözümleme tabanlı Zemberek'e göre daha düşüktür.
tr-spell hakkında daha detaylı bilgi için Zemberek proje günlüğündeki ilgili yazılara bakabilirsiniz.
Kaynaklar
Zemberek için TÜBİTAK bünyesinde geliştiriliyor diyebiliriz.
YanıtlaSilZeki kaynak nedir? Zemberek'in geliştiricilerinden Ahmet A. Akın şu an TÜBİTAK'ta ama projeyle boş zamanlarında mı yoksa TÜBİTAK bünyesinde mi ilgileniyor bilmiyorum.
YanıtlaSilBilmeyen epey kimse de var sanırım benden başka da :)
https://twitter.com/bahadirdmrcglu/status/291847144363683841
Eğer TÜBİTAK, Zemberek'e destek veriyorsa bazen güzel şeyler de yaptıklarını görmek güzel.