PDF'den MOBI'ye Dönüşüm: XML -> HTML
Aslında XML'ye dönüşüm yapmadan doğrudan HTML'ye dönüşüm yapabilirdik. Ama şuradan detaylarını görebileceğiniz nedenlerle XML'ye de dönüşüm yapıyoruz. pdftohtml ürettiği HTML dosyalarında olabildiğince üzerinde işlem yapılan PDF'nin yerleşimine sadık kalmaya çalışıyor. PDF'deki her satırın sonuna <br> ekleyerek bölüyor ve her sayfanın sonuna da <hr> koyuyor. Bu da PDF'nin aslına bağlı kalınmasını sağlasa da sonuçta ortaya akış (flow) yoksunu ve e-kitap okuyucularında okuması zevksiz bir metin çıkıyor. Bu durumu tersine çevirmek istediğimizde devreye giren isimse pdfreflow oluyor.
pdfreflow
pdfreflow, pdftohtml'nin ürettiği XML çıktıları üzerinde işlem yaparak metinleri paragraflı yapıya çeviriyor. Aynı zamanda tirelemeleri, sayfa numaralarını, sayfa başlıklarını ve altbaşlıkları da kaldırabilmektedir.
pdfreflow'un kullanımı aşağıdaki gibi:
pdfreflow [seçenekler] [girdidosyası]
pdfreflow'u biraz daha yakından tanımak için parametrelerine bakalım:
Yanlış bir şeyler söylememek için -c ve -s parametreleri için yaptığım çevirileri sildim, bunlar hakkında bilgisi olanlar yorum olarak ekleyebilir isterse. -b ve -t parametreleriyle sayfanın üstünde ve altında bulunan ve e-kitap okuyucuda işimize yaramayacak her sayfadaki sayfa numarası, yazar ismi, kitap ismi, bölüm ismi gibi bölümleri kırpabilirsiniz. Henüz denemediğim için nasıl kullanıldığını bilmiyorum ama birkaç denemeye çözülebilir. Son olarak bahsetmek istediğim parametre de -d, bu parametreyle önsöze kadarki ilk sayfalarda işlem yapılmamasını ve özgün biçiminin korunmasını sağlayabilirsiniz.
Burada kullanacağımız komutsa:
pdfreflow kitap.xml
Bu arada Pardus'ta pdfreflow'u yüklemek için aşağıdaki komutları kullanabilirsiniz:
sudo pisi bi https://svn.pardus.org.tr/pardus/playground/maidis/2011/office/misc/pdfreflow/pspec.xml -d
sudo pisi it pdfreflow*.pisi
rm pdfreflow*.pisi
Kaynaklar
pdfreflow
pdfreflow, pdftohtml'nin ürettiği XML çıktıları üzerinde işlem yaparak metinleri paragraflı yapıya çeviriyor. Aynı zamanda tirelemeleri, sayfa numaralarını, sayfa başlıklarını ve altbaşlıkları da kaldırabilmektedir.
pdfreflow'un kullanımı aşağıdaki gibi:
pdfreflow [seçenekler] [girdidosyası]
pdfreflow'u biraz daha yakından tanımak için parametrelerine bakalım:
--absolute | Yazı tipi boyutları asıl belge ile aynı (öntanımlı değil) öntanımlı yazı tiplerini göreceli boyutlarla eşleştirir |
-b, --bottom=MAKSTEPE | Üst bölümü MAKSTEPE'ye eşit veya ondan daha büyük olan metinleri kırp |
-c, --center=ÖZELLİK | - |
-d, --dontreflow=SAYFALAR | Belirtilen sayfa aralıklarında işlem yapma, örneğin: "1,2,4-9,100" |
-f, --first=İLKSAYFA | Başlangıç sayfası (öntanımlı 1) |
-l, --last=SONSAYFA | Bitiş sayfası (öntanımlı belgenin son sayfasıdır) |
--nonfiction | Alıntı öbeği ile paragraf girintisinde aynı biçimi kullanan kitaplar için |
-r, --ragright | Metin solda düzenli, iki yana yaslama (öntanımlı iki yana yaslanır) |
-s, --shortlines | - |
-t, --top=MINTEPE | Üst bölümü MINTEPE'ye eşit veya ondan daha küçük olan metinleri kırp |
--showdebug | Hata ayıklama seçeneklerini göster |
-v, --version | Kullanılan sürümü göster |
-?, --help | Yardımı göster |
Yanlış bir şeyler söylememek için -c ve -s parametreleri için yaptığım çevirileri sildim, bunlar hakkında bilgisi olanlar yorum olarak ekleyebilir isterse. -b ve -t parametreleriyle sayfanın üstünde ve altında bulunan ve e-kitap okuyucuda işimize yaramayacak her sayfadaki sayfa numarası, yazar ismi, kitap ismi, bölüm ismi gibi bölümleri kırpabilirsiniz. Henüz denemediğim için nasıl kullanıldığını bilmiyorum ama birkaç denemeye çözülebilir. Son olarak bahsetmek istediğim parametre de -d, bu parametreyle önsöze kadarki ilk sayfalarda işlem yapılmamasını ve özgün biçiminin korunmasını sağlayabilirsiniz.
Burada kullanacağımız komutsa:
pdfreflow kitap.xml
Bu arada Pardus'ta pdfreflow'u yüklemek için aşağıdaki komutları kullanabilirsiniz:
sudo pisi bi https://svn.pardus.org.tr/pardus/playground/maidis/2011/office/misc/pdfreflow/pspec.xml -d
sudo pisi it pdfreflow*.pisi
rm pdfreflow*.pisi
Kaynaklar
Yorumlar
Yorum Gönder
sen de yaz yaz yaz buraya yaz bütün sözlerini