Упраўленне ідыш тэкстаў пад кіраваннем аперацыйнай сістэмы Unix

Упраўленне ідыш тэкстаў пад кіраваннем аперацыйнай сістэмы Unix


* Source text URL: http://www.cs.engr.uky.edu/~raphael/yiddish/unix.html

Translated by FractionBot

Аўтар: Рафаэль Фінкель. email (без падкрэслівання), web. 

Змест: Выбар | Пытанні | Шрыфты | xkb | Xterm | Yudit | Vim | AbiWord | mule | Emacs | KDE | Рэзюмэ | Спіс літаратуры | 


Выбар

Каб пісаць на мове ідыш у Unix, у вас ёсць выбар: 


1. Стварыць у YIVO транслітарацыі і не навернуцца, калі вы хочаце, каб некаторыя іншыя формы рабіліся з дапамогай shraybmashinke. 


2. Стварыць непасрэдна ў Unicode захоўванне вашых файлаў у фармаце UTF-8. 

У сапраўднай запісцы асноўная ўвага надаецца апошняму спосабу. Вы сапраўды можаце выкарыстоўваць Unicode у доўгатэрміновай перспектыве, таму што ён дазваляе аб’яднаць некалькі моў у адным дакуменце, і ён вызначае фармат прэзентацыі, у прыватнасці, двунаправленнага макета.


Пытанні 

На якім узроўні праграмнага забеспячэння пераўтварэнне націску клавішы павінна адлюстраваць дасягнутае ўяўленне?

  • У Unix “кансольным рэжыме”, драйвер прылады робіць адлюстраванне. 
  • У Unix “X-вакно ўводу”, сервер X мае раскладку табліцы для пераўтварэння падзеі кода клявішаў (ключ- націск падзей) у keysyms. Існуе спіс keysyms у include/X11/keysymdef.h, які пастаўляецца з размеркавання X, ён вызначае арабскія, тайскія, іўрыт і іншыя keysyms. У спісе на іўрыце адсутнічаюць спецыяльныя ідыш знакі. Я не рэкамендую вам гуляць з іўрыту ці ідыш keysyms; keysym значэння X-Windows канкрэтныя і не адпавядаюць Unicode. Аднак, некаторыя прыкладанні (такія, як Xterm) зразумеюць keysym выгляду 0x100XXXX, як Unicode UCS-2 знакі XXXX. 
  • Вы можаце ўключыць клавіятуры пашырэння X (XKB), каб вам пераключацца паміж раскладкамі клавіятуры і інтэрпрэтаваць націск клавіш, як ідыш у адпаведным макеце.
  • Вы можаце ўвесці метад X уваходу (XIM). Некаторыя X-Windows праграмы могуць выкарыстоўваць гэтую тэхніку. 
  • Вы можаце ўвесці метад уводу ў GTK+ бібліятэкі. Такі метад можа быць уключаны ў любы GNOME прыкладанні, такія як class="program">Gedit. Метады ўводу дазваляюць кантэксты, залежныя ад некалькіх ключавых перакладаў. 
  • Такія прыкладання, як Yudit і Vim могуць прымяняць свае ўласныя адлюстраванні.

Можа карыстальнік наладзіць адлюстраванне? У Unix “X- вакно ўводу” Xmodmap праграма можа змяняць раскладку табліцы. Xkeycaps праграма дапаможа вам наладзіць канфігурацыю Xmodmap у інтэрактыўным рэжыме. Аналагічным чынам, некаторыя X-рэсурсы прыкладання X, у прыватнасці Xterm (эмулятар тэрмінала), могуць быць настроены на пераклад прыватнасці ключоў у любым модзе. У многіх выпадках, аднак, патрэбны спецыяльныя дазволы на змяненне канфігурацыйных файлаў. 

Можа карыстальнік лёгка пераключацца з аднаго адлюстравання на іншы? У Unix Xmodmap можа змяніць раскладку стол на лета (уздзеянне на ўсім дадатку). Канкрэтныя паказваемыя X-прыкладанні звычайна загружаюцца толькі пры запуску прыкладання. Аднак, Xterm дазваляе ключ, які будзе супастаўлены з функцыяй, такой як “пераключыцца на іншую загружаную карту”. Xkb дазваляе ўсталяваць ключ ці ключавую групу, што дазваляе пераключаць раскладкі. Yudit робіць сваё ўласнае адлюстраванне, і аднім націскам клавішы пераключае ад аднаго да іншага. Vim робіць сваё ўласнае адлюстраванне, а простыя каманды (якія могуць быць супастаўленыя з націскам клавішы) пераходзяць ад аднаго да іншага.

У адлюстравання дазваляюцца некалькі ключавых перакладаў? Калі я друкую ідыш, я хацеў бы, каб "w" была галёнкай, але я таксама хачу, каб і "sh" быў галёнкай, таму што мая родная мова англійская. Я хачу “N”, каб была ў мяне канчатковая nun і коска. У Unix некалькіх ключавых перакладаў, не даступныя ў ядры або ў X-Windows узроўні (наколькі я ведаю), але яны магчымыя ў GTK+ ўваходных модуляў і ў некаторых дадаткаў, у прыватнасці, Yudit і Vim. 

Ёсць Unicode (UTF-8) фармат для захоўвання дадзеных? Гэта пытанне, як правіла, залежныць ад дадаткаў. У Unix Yudit толькі выкарыстоўвае Unicode, і Vim можа быць наладжаны на выкарыстанне Unicode (і пераклад да яго з іншых кадовак). У варыянце Linux з Unix у “рэжыме кансолі” дадаткі атрымліваюць Unicode сімвалы (я думаю). 

Існуюць шрыфты, якія правільна адлюстроўваюць Unicode, у прыватнасці, ідыш канкрэтных літар, такіх як pasekh-tsvey-yudn? З 2000 года адказ становіцца ўсё больш пазітыўны для ўсіх платформ. Глядзіце шрыфты ніжэй. 

На дысплеі рухавікі і рэдактары правільна апрацоўваюць складанне знакаў? У Unix X-Windows Server, відаць, не мае такой падтрымкі, але некаторыя прыкладанні (такія, як Xterm і Yudit) дысплей эквівалентна папярэдне набірае знакі ў выпадках наяўнасці і выкарыстання простых суперпазіцый у адваротным выпадку. Gvim (графічная версія Vim, які абыходзіць Xterm) выкарыстоўвае толькі суперпазіцыі. Vim разумее 0-шырыню знакаў складу (гаворка ідзе пра монашырынны шрыфт толькі, і таму вертыкальнае выраўноўванне важна). 

На дысплеі сістэмы апрацоўваюць двунаправленна? Ёсць некалькі узроўняў здольнасці: () няма падтрымкі, (б) усё вакно можна ўсталяваць уручную ў RTL, (с) фрагмент тэксту ў вакне можна ўсталяваць уручную ў RTL, (D) увесь тэкст аўтаматычна адлюстроўваецца ў адпаведнасці з паўнавартасным двунаправленным (BIDI) алгарытмам. Звычайна дысплейныя рухавікі з’яўляюцца часткай дадатку верхняга ўзроўню (гэта значыць у Unix, калі я выкарыстоўваю Vim праз Xterm, праз X-Windows, праз АС, Vim вырашае, як выкласці знакі. Ніжнія ўзроўні не прапаноўваюць падтрымку). Бягучым станам (2003) у Unix з’яўляецца тое, што Vim выкарыстоўвае метад (б), Yudit і AbiWord метад (D). 

Ці можна непасрэдна ўвесці значэнне Unicode? Некаторыя прыкладанні маюць гэтую здольнасць, Vim (уводзіць <ctr-V> u05d7 і атрымлівае khes) і Yudit (пераключэнні на “Unicode” раскладку і тып u05d7). Ён не падтрымліваецца на больш нізкіх узроўнях (пакуль).

Ці ёсць незалежныя ад прыкладанняў інтэрфейсныя працэсары, якія могуць пераўтварыць націск клавіш у сімвалы Unicode, на якіх-небудзь працоўных прыкладаннях? У X-Windows такі працэсар называецца X Input Method (XIM). Шматлікія прыкладанні, у тым ліку Gvim, AbiWord і Yudit, могуць быць далучаныя да XIM; Yudit можа пераключацца паміж некалькімі XIMs падчас сесіі. Я пабудаваў ідыш XIM, але гэта ўдаецца толькі ў зносінах з AbiWord. 

Ці можна зрабіць інтэрнацыяналізацыю прыкладанняў, то есць, мець паведамленні аб памылках, экраны з дапамогай і надпісы на кнопках на вашай любімай мове? У Unix праграмы, скампіляваныя з libintl, можна інтэрнацыяналізаваць. Я напісаў неабходныя пераклады Yudit (скрыншот) і для AbiWord. 

Ці можна праверыць правапіс устаўкай наладжвальнага спісу правапісу? У Vim і AbiWord так, як і ў латынізаваным Unicode ідышу. Я пабудаваў гэтыя напісанне спісаў.


Шрыфты 

У Unix вы будзеце выкарыстоўваць X-Windows. Я рэкамендую вам атрымаць шрыфты Маркуса Куна, калі вы яшчэ не маеце іх у сваім X-Windows размеркаванні. Яны прысутнічаюць у X11R6.4. -misc-fixed-medium-r-normal–20-200-75-75-c-100-iso10646-1 – шрыфт з маімі змяненнямі, якія робяць яго поўным і разборлівым на ідыш.


XKB 

Замест выкарыстання X-Windows раскладкі, вы можаце выкарыстоўваць клавіятуру пашырэння X, вядомага як XKB. Гэты сродак дазваляе ўсталяваць некалькі раскладак клавіятуры і пераключацца паміж імі. Гэты аб’ект не залежыць ад усіх X-Windows прыкладанняў. Гэта не дае вам некалькі ключоў перакладаў. Ніжэй прыведзены інструкцыі па Ubuntu Linux.

1. Пераканайцеся, што ў вас няма XKB_DISABLE набору ў асяроддзі зменнай. 


2. Як корань, дадайце ў/usr/share/X11/xkb/symbols/us утрыманне гэтага файла. 


3. У/usr/share/X11/xkb/rules змясціце наступны радок у канцы: (каля лініі 269) абедзвюх yiddish us: Yiddish 

4. У/usr/share/X11/xkb/rules змясціце наступны радок у "us" <layout>, у variantList пасля рускага фанетычнага варыянту, у абедзвюх base.xml і evdev.xm::


<variant>


<configItem>


<name>yiddish</name>


<description>Yiddish</description>


<languageList><iso639Id>yid</iso639Id></languageList>


</configItem>


</variant>


5. Выканайце setxkbmap us


6. Выкарыстайце gnome-keyboard-properties на ўкладцы "Layouts": 


Дадайце макет: Мова> ідыш > ЗША ідыш 


Усталюйце параметры макета, каб вы ведалі клавішы, каб змяніць макет. Вы можаце выкарыстоўваць клавіятуру LED для таго, каб паказаць альтэрнатыўную раскладку клавіятуры. 


7. Выканаць setxkbmap -option grp:switch,grp:alts_toggle


8. Цяпер вы можаце выкарыстоўваць (1) усё, што вы стварылі на папярэднім кроку, каб перайсці да макетаў, (2) зрух для пераключэння узроўняў і (3) правы Alt для пераключэння груп (некалькі ключоў другой групы знакаў). Клавіятура выглядае як гэты файл PDF. Калі вам неабходна ўвесці без папярэдне надрукаваных літараў, адлучаючы alef ад pasekh, напрыклад, выкарыстоўваць галосныя, размешчаныя на ключавых Q, ці групы з двума сімваламі на розных іншых ключах.


Xterm 

Версіі Xterm з 2000 года разумеюць UTF-8. Вы можаце атрымаць Xterm і скампіляваць яго самастойна, калі вам трэба, але вы павінны прадугледзць./configure –enable-wide-chars. Абмежаванні і памылкі: у Xterm няма падтрымкі BIDI. Ён складае сімвалы простым накладаннем, калі ён можа знайсці складовы знак. Гэта ставіць папярэдне надрукаваныя знакі ў разрэз буфера, а не пасля скаладюцца, як і павінна. Падтрымка файлаў: вы можаце дадаць гэтую інфармацыю ў ваш ~/.Xdefaults файл падтрымкі (1) добры шрыфт Unicode (“сярэдні” памер), і (2) клавіятуры кадоўкі для ідышу (уключыць/адключыць з ключавымі Mode_switch).


Yudit 

Yudit рэдактар Гаспара Сінай дазваляе рэдагаваць тэкст UTF-8. Вось скрыншот. Я пабудаваў раскладкі клавіятуры для яго, якія з’яўляюцца часткай дыстрыбутыву. Гэта адлюстраванне мае некалькі ключоў інтэрфейснага працэсара, так што вы можаце ўвесці “sh”, калі вы хочаце галёнкі. Ідыш адлюстраванне таксама ўстаўляе shtumer alef пасля прастору перад вызначанымі галоснымі. Yudit таксама працуе з маім XIM. Yudit мае свой уласны дысплей TrueType – шрыфт рухавіка, так што вам не абавязкова мець яго ў вашым X11. Yudit мае інтэрнацыяналізацыю, так што вы можаце мець усе рэдактары паведамленняў, прадстаўленых у ідыш. Yudit робіць сапраўдны дысплей BIDI. Вам трэба будзе наладзіць файл ~/. Yudit/yudit.properties, каб атрымаліся лініі нешта накшталт гэтага:

yudit.default.language=yi


yudit.editor.font=iso10646


yudit.editor.fonts=arial,cyberbit,iso10646,caslr


yudit.editor.fontsize=20 |


yudit.editor.fontsizes=10,12,14,16,20,24


yudit.editor.input=Yiddish


yudit.editor.inputs=straight,unicode,Yiddish,Russian,German


yudit.font.arial=arial__h.ttf,cyberbit.ttf


yudit.font.caslr=caslr.ttf


yudit.font.cyberbit=cyberbit.ttf,CyberBitMods.ttf


yudit.font.iso10646=-misc-fixed-medium-r-normal–20-200-75-75-c-100-iso10646-1


yudit.editor.fonts=arial,cyberbit,iso10646,caslr

Магчыма, вы захочаце шрыфт Cyberbit. У ім адсутнічае некалькі знакаў, але іх вы можаце атрымаць, дадаўшы CyberBitMods на шляху да шрыфтоў. Вы таксама можаце карыстацца caslr шрыфтам, хоць гэта і не так добра для ідыш. Yudit здольны генерыраваць PostScript выснову. Існуе версія Yudit, якая працуе на платформах Win32, яе вы можаце знайсці тут. Кароткія інструкцыі па ўстаноўцы Win32: (1) Запусціце выкананы файл загрузкі для ўстаноўкі праграмы (яго імя адпавядае гэтаму шаблону: Yudit *. EXE, (2) Устанавіць растравыя шрыфты, запусціўшы праграму, якая адпавядае гэтаму шаблону: bitmap_fonts *. EXE, (3) з дапамогай любога тэкставага рэдактара змяніць Program Files Yudit Config yudit.properties наступным чынам:

yudit.datapath=C:Program FilesYuditdata


yudit.fontpath=C:WINNTFONTS [for Win2000]


yudit.fontpath=C:WINDOESFONTS [for Win98] 



Vim 

Vim рэдактар Брама Мооленаара з’яўляецца бясплатнай версіяй калісьці папулярнага VI рэдактару, ён выдатна працуе на абедзвюх – Unix і Win32. Пачынаючы з версіі 6.0, ён мае вельмі добрую падтрымку Unicode Yiddish. Выкарыстоўвайце яго разам з Xterm (гл. вышэй) або ў рэжыме Gvim (абыходзячы Xterm), каб атрымаць поўную выгаду. Вось скрыншот з Gvim інтэрфейсу. Вам не трэба спецыяльнага матэрыялу для адлюстравання сімвалаў Xterm, замест выкарыстоўвайце раскладку Vim. Змясціце гэтыя каманды ў ~/vimrc.:

setfileencodings=cp1255,utf-8 guifont=8x13bold encoding=utf-8


filetype plugin on


syntax on

Вы можаце ведаць аб наступных камандах:

:set rl sets mode in current window to RTL


:set norl sets mode in current window to LTR


:set keymap=yi switches to the Yiddish keymap


:set encoding=utf-8 allows Vim to output well to your UTF-8 enabled xterm


<control-^> toggles foreign-language input mode.

Калі вы плануеце сумесі моў, я прапаную вам выкарыстоўваць некалькі вокнаў, адно з уключаным RTL, іншыя без. Абмежаванні і памылкі: Vim не маюць ніякай падтрымкі BIDI і наўрад ці атрымаюць іншыя. Падтрымка файлаў: атрымайце гэты файл і распакуйце яго ў свой хатні каталог. Ён уключае ў сябе праверку арфаграфіі для латынізаваных і Unicode Yiddish і клавіятурныя макрасы (поўны працэсар франтальны) для Unicode Yiddish. Ён патрабуе версі. 6.0 па крайняй меры. Чытайце файл README (ён мае інструкцыі для Unix і для Win32).


AbiWord 

AbiWord з’яўляецца поўнафункцыянальным (у выніку) тэкставым працэсарам, а не толькі тэкставым рэдактарам. Ён выкарыстоўвае XML у якасці пераважнага фармата файла, але ён можа імпартаваць і экспартаваць файлы ў фармаце і тэкставых файлаў Unicode. Самыя апошнія версія AbiWord – дэскрыптар тэкставага працэсара BIDI. Яна таксама можа зрабіць Габрэйскае фарміраванне літары, што азначае, што канчатковыя літары генеруюцца аўтаматычна, але атрыманы файл будзе змяшчаць медыяльныя, не канчатковыя літары, адключыце гэтую функцыю. AbiWord мае версіі для Unix, MacOS і Win32, ва ўсіх ёсць падобны стыль. Вось скрыншот. 

Многае з наступнага састарэла; AbiWord з’яўляецца хутка рухомай мэтай. Гэта складана -наладзіць шрыфты ў AbiWord для Unix/X-Windows. 


1. У яго каталогу шрыфтоў (звычайна/usr/share/AbiSuite/fonts), неабходна пабудаваць падкаталог UTF-8. 


2. Пакладзіце копію або спасылку на разумныя True-Type шрыфты, такія, як arial.ttf. 


3. Выканайце ttmkfdir у гэтым каталогу (знайдзіце ttmkfdir тут). Гэта праграма здабывае імёны шрыфтоў з файлаў TTF і будуе fonts.scale. 


4. У выніку файл fonts.scale зробіць адну новую лінію для кожнага шрыфта (там, хутчэй за ўсё, ужо некалькі са злёгку рознымі кадаваннямі назваў). На гэтай новай лініі мноства кадавання, якое з’яўляецца ISO-суфіксам, гавораць ISO10646-1. Гэты суфікс кажа: “Я Unicode шрыфт”. 


5. Запусціце mkfontdir у гэтым каталогу. Гэтая праграма грунтуецца fonts.dir, у якім X-Windows неабходна зразумець змест. 


6.У AbiWord бен каталог, як правіла,/usr/share/AbiSuite/bin, запусціце ttfadmin.sh/usr/share/AbiSuite/fonts/utf-8 ISO-10646-1. Гэтая праграма ўсталёўвае дапаможныя файлы *. u2g і *.t42 для кожнага шрыфта. AbiWord патрэбны гэтыя дапаможныя файлы, каб зразумець шрыфты. 


7. Ваш X Windows сервер павінен разумець, якія тыпы шрыфтоў звычайна выкарыстоўваюцца AbiWord, а таксама шрыфты True Type, таму што толькі Arial True Type шрыфт, наколькі я ведаю, шырока даступны, і падтрымліваецца Yiddish. Вам патрэбна, па крайняй меры, версія 4.1.0 ад X-Windows. У яго файле канфігурацыі (звычайна/etc/XF86Config), вы павінны мець

Load "type1"


Load "xtt"

у частцы “Модуль”. Калі ў вас даданыя гэтыя радкі, вам неабходна перазагрузіць X-Windows, каб змяненні ўступілі ў сілу.


8. Кожны раз пры запуску AbiWord, спачатку вы павінны ўсталяваць пераменную асяроддзя LANG для yi.utf-8. Частка UTF-8 паказвае, які набор шрыфтоў выкарыстоўваецца. Першая частка кажа: “Я аддаю перавагу ўсяму Yiddish”. 


9. Калі вы чытаеце ў UTF-8 тэкставы файл, чытайце яго, як тып закадаванага тэксту, а затым выберыце кадаванне UTF-8 у дыялогавым акне. 


10. Я не ведаю, добры спосаб адлюстравання клавіятуры. Я выкарыстоўваю Xmodmap і пераключаюся паміж ангельскай і Yiddish. Аднак гэты метад патрабуе выкарыстанне некалькіх націскаў клявішаў для атрымання галосных на alef або вышэй лініі beys, або любы іншы сімвал multiple-utf8. Я магу даць вам неабходныя файлы Xmodmap і невялікую tk праграму, што дазволіць вам мець альтэрнатыву паміж імі. 


11. Пры выхадзе AbiWord вам трэба скінуць зменную LANG, а таксама выдаліць дадатковыя каталогі з FontPath вашага AbiWord, што часам пакідаецца валяцца:

xset fp-/usr/share/AbiSuite/fonts/and


xset fp-/usr/share/AbiSuite/fonts/utf-8/. 

Я працую па арфаграфіі для AbiWord/Yiddish. У мяне ёсць праверка арфаграфіі файлаў; спытайцеся мяне для дэталяў. Наступныя праблемы існуюць у цяперашні час: 


1. Як AbiWord зразумее арфаграфію для моў, як Yiddish, якія не ў яго цяперашнім спісе. Я проста называю іх фінскімі файламі і ўсталёўваю фінскую мову. 


3. Інтэрактыўнае меню, калі памылка друку знаходзіцца, выкарыстоўвае не utf-8 шрыфт, таму ўсё, што вы бачыце, трызненне.


mule

mule 2,3 з’яўляецца пашырэннем рэдактара GNU Emacs 19.28. Ён не падтрымлівае Unicode, але ён падтрымлівае розныя канкрэтныя мовы кодавых старонак. Ён выкарыстоўвае свой уласны своеасаблівы фармат файла “Junet” для шматмоўных файлаў. Я раю вам гэтага пазбегнуць.


Emacs 

Існуе эксперыментальная (10/2003) версія Emacs, якая апрацоўвае UTF-8 і, па паведамленнях дэскрыптара BIDI, дастаткова добра, гэта на http://www.m17n.org/emacs-bidi/. Emacs з’яўляецца поўнафункцыянальным рэдактарам, але гэта патрабуе шмат намаганняў, каб пазнаць яго. Абнаўленне (7/2008): у той час BiDi падтрымкі яшчэ не было даступна для Emacs (за выключэннем эксперыментальнай, якая працуе на Emacs-СЗ (без графікі) у BiDi-здольных эмулятараў тэрмінала), вы можаце скарыстацца poor-mans-bidi.el, які выконвае інструменты каманднага радка fribidi або bidiv як подпрацэс, каб пераўтварыць лагічны ўвод у візуальную выснову ў люстрана адлюстраваным буферы. Існуе таксама метад уводу для Yiddish на Emacs, які апрацоўвае YIVO, як уваход, у прыватнасці, напісаны Нільсам Giesen. Па стане на жнівень 2010 года развіццё філіяла Emacsпадтрымлівае двунакіраваны дысплей і адмяняе poor-mans-bidi.


KDE 

KDE 3, “навакольнае асяроддзе”, у тым ліку менеджэр вокнаў і многіх прыкладанняў. Яго дадатак апрацоўкі тэкстаў называецца KOffice. KOffice падтрымлівае BIDI і розныя кадоўкі, у тым ліку Unicode. 


Рэзюмэ

Product 

BIDI 

keyboard mappings 

editor level

xterm none 

none

single key

no editing

Vim

manual by buffer; only affects display

multiple-key; good YIVO transcription

full editing (use my spelling-checker plugin for Romanized or Unicode Yiddish); plain text only; monospace display only

Yudit

automatic; only affects display

multiple-key; good YIVO transcription

acceptible editing; plain text only; allows True Type and non-monospace fonts; generates PostScript.

KOffice

?

?

full "word processing"; inserts format codes; can output plain text or XML or some other forms.

AbiWord

automatic; only affects display

no

full "word processing"; inserts format codes; can output plain text or XML or some other forms.


Спіс літаратуры 

UTF-8 і Unicode FAQ для Unix 


Разуменне Yiddish апрацоўкі – інфармацыя ў цэлым.