Previous |  Up |  Next

Article

Summary:
Babel poskytuje jednotné rozhrani pro tvorbu vícejazyčných dokumentů. V současné době není bohužel podporován žádný z indických jazyků. Sazba v indických jazycích je založena na specializovaných balíčcích. Nejpokročilejším z nich je Velthuis Devanīagarī for TeX, protože již obsahuje hindské nadpisy i makro pro tisk data v evropském stylu. Definiční soubor pro začlenění hindštiny do babelu byl tedy v sooučasné době vyvinut. Druhá část článku vysvětluje rozdíl mezi UNICODE a Velthuisovou transliterací. To je důležité pro pochopení nástroje sloužícího ke konverzi hindských a sanskrtských dokumentů z MS Wordu a OpenOffice.org do TeXu pomocí procesoru XSLT 2.0 a perlovského skriptu, jakož i metody, jak lze vytvořit prohledávatelný PDF soubor. Závěrem článek diskutuje možnosti dalšího vývoje, zejména možnosti, jež nabízí XeTeX a integrace jazyka LUA do pdfTeXu. Práce byla prezentována na konferenci TUG 2006 v Marrákéši a zveřejněna v angličtině v TUGboatu. Český překlad je publikován se souhlasem organizátorů konference i redakce TUGboatu.
Summary:
Babel provides unified interface for creation of multilingual documents. Unfortunately none of Indic languages is currently supported. Typesetting in Indic languages is based on specialised packages. The most advanced from them is Velthuis Devanīagarī for TeX because it already provides Hindi captions as well as a macro for a Europian style date. A language definition file for plugging Hindi into babel has therefore been recently developed. The second part of the paper explains differences between UNICODE and Velthuis transliteration. This is important for understanding the tool that can convert Hindi and Sanskrit documents from MS Word and OpenOffice.org into TeX via an XSLT 2.0 processor and a Perl script as well as a method of making the PDF files searchable. Finally the paper discusses some possibilities of further development, mainly the advantages offered by XeTeX and by forthcoming integration of LUA into pdfTeX.
References:
[1] Pandey, Anshuman: Devanāgarī for TeX. http://devnag.sarovar.org/
[2] Aliprand, Joan: The Unicode Standard. chapter South Asian Scripts. The Unicode Consortium, 2003. http://www.unicode.org/faq/indic.html#5
[3] Hagen, Hans: LuaTeX: Howling to the moon. TUGboat, 26(2):152–157, 2005. http://www.tug.org/TUGboat/Contents/contents26-2.html
[4] International components for Unicode. http://icu.sourceforge.net/
[5] Kay, Michael: SAXON: The XSLT and XQuery Processor. http://saxon.sourceforge.net/
[6] Olšák, Petr: encTeX. http://www.olsak.net/enctex.html
[9] Píška, Karel: Indic Type 1 fonts for TeX. CTAN:fonts/ps-type1/indic.
[11] Wagner, Zdeněk: Můj volně šiřitelný software. http://icebearsoft.euweb.cz/sw.php
[12] Wagner, Zdeněk: Prohledávatelné pdf s dévanágarskými texty. http://icebearsoft.euweb.cz/dvngpdf/
[13] Wagner, Zdeněk: Babel speaks Hindi. TUGboat, 27(2):176–180, 2006.
[14] The XeTeX typesetting system. http://scripts.sil.org/xetex
Partner of
EuDML logo