7. Fintičky so slovenčinou

7.1. Zad�vanie slovensk�ch znakov vo Vim

http://www.kotelna.sk/keso/unix/vim.html

Ak nem�žete, alebo nechcete použï¿½vať rozloženie kl�ves pre slovenčinu, ale potrebujete zadať p�r našich znakov vo Vim, d� sa to urobiť pomocou pr�kazu imap. Jeho form�t je
	:imap {lhs} {rhs}
      

{lhs} je postupnosť znakov, po ktor�ch zadan� (v kr�tkom časovom intervale) sa vyp�še {rhs}.

Pre slovenčinu by sa dali využiť imap defin�cie znakov typu
:imap =a �
:imap +c č
      

Ako vidno, je to niečo podobn� ako compose sekvencie z kapitoly o kl�vesnici na konzole. Po zadan� t�chto pr�kazov m�žete aj so štandardn�m rozložen�m kl�ves zad�vať vo vim znaky s diakritikou. Tu je kompletn� zoznam imap defin�ci� pre slovensk� diakritiku. Uložte ho do s�boru napr�klad sk.vim a vo Vim ho nač�tate pr�kazom
:source sk.vim
      

imap =a �
imap =A �
imap +a �
imap +A �
imap +c č
imap +C Č
imap +d ď
imap +D Ď
imap =e �
imap +e ě
imap =E �
imap +E Ě
imap =i �
imap =I �
imap =l ĺ
imap =L Ĺ
imap +l ľ
imap +L Ľ
imap +n ň
imap +N Ň
imap =o �
imap =O �
imap +o �
imap +O �
imap "o �
imap "O �
imap =r ŕ
imap =R Ŕ
imap +r ř
imap +R Ř
imap +s š
imap +S Š
imap +t ť
imap +T Ť
imap =u �
imap =U �
imap +u ů
imap +U Ů
imap "u �
imap "U �
imap =y �
imap =Y �
imap +z ž
imap +Z Ž
      

7.2. Odstr�nenie alebo nahradenie diakritiky v textov�ch s�boroch

7.2.1. sed

J�n 'judas' Tomka,

V pr�pade, že potrebujete z textov�ho s�boru odstr�niť diakritick� znamienka, m�žete použiť program sed, pomocou ktor�ho nahrad�te v�skyt znaku s diakritikou jeho ekvivalentom bez nej.

Ak chcete odstr�niť diakritiku �plne, mus�te nahradiť v�skyt všetk�ch znakov s diakritikou. Ak ale chcete len to, aby sa s�bor zobrazoval spr�vne pri prezeran� bez zaveden�ho fontu latin 2, stač� nahradiť len tie znaky, ktor� sa nezobrazuj� spr�vne pre štandardn� font (spravidla latin 1).

Toto je pr�kaz, ktor� možno použiť pri vytv�ran� verzie s�boru �plne bez diakritiky:
sed -e "s:�:a:g" -e "s:�:A:g" -e "s:�:a:g" -e "s:�:A:g" \
    -e "s:č:c:g" -e "s:Č:C:g" -e "s:ď:d:g" -e "s:Ď:D:g" \
    -e "s:�:e:g" -e "s:�:E:g" -e "s:ě:e:g" -e "s:Ě:E:g" \
    -e "s:�:i:g" -e "s:�:I:g" -e "s:ĺ:l:g" -e "s:Ĺ:L:g" \
    -e "s:ľ:l:g" -e "s:Ľ:L:g" -e "s:ň:n:g" -e "s:Ň:N:g" \
    -e "s:�:o:g" -e "s:�:O:g" -e "s:�:o:g" -e "s:�:O:g" \
    -e "s:�:o:g" -e "s:�:O:g" -e "s:ŕ:r:g" -e "s:Ŕ:R:g" \
    -e "s:ř:r:g" -e "s:Ř:R:g" -e "s:š:s:g" -e "s:Š:S:g" \
    -e "s:ť:t:g" -e "s:Ť:T:g" -e "s:�:u:g" -e "s:�:U:g" \
    -e "s:ů:u:g" -e "s:Ů:U:g" -e "s:�:u:g" -e "s:�:U:g" \
    -e "s:�:y:g" -e "s:�:Y:g" -e "s:ž:z:g" -e "s:Ž:Z:g" \
    "Slovak-HOWTO.sgml" > "Slovak-HOWTO-nodiac.sgml"
	

7.2.2. cstocs

Braňo Katreniak

Keď sa zmieňujete o tom, ako sa d� odstr�niť slovenčina z dokumentu, zd� sa mi vhodn� spomen�ť aj program cstocs. Je to mil� utilitka štandardne dod�van� s TeXom. Umožňuje konverziu s�borov prakticky všetk�ch možn�ch k�dov�ch str�nok medzi sebou navz�jom, pričom jedna z možnost� je aj odstr�nenie diakritiky. Pričom sa mi to zd� pohodlnejšie ako sed.

7.2.3. recode

J�n 'judas' Tomka,

Existuje aj program recode, ktor� pravdepodobne tiež sl�ži na zmeny v k�dovan� s�borov. Určite ho použijete na tento cieľ, ak sa predt�m nestane niektor� z nasleduj�cich vec�:

  1. Pr�dete o oči pri č�tan� man str�nky, info manu�lu a všetk�ho čo je o tomto -- inak určite užitočnom programe -- pop�san�.

  2. Pr�dete o nervy pri sk�šan� všetk�ch možn�ch kombin�ci� parametrov, volieb či argumentov pre tento nesmierne užitočn� program.

  3. Pr�dete o poč�tač, keďže ho vyhod�te z okna po dvoch t�ždňoch psychick�ho utrpenia, ktor� zažijete pri pokusoch s t�mto extr�mne užitočn�m programom.

Podľa všetk�ho by mal stačiť nasledovn� pr�kaz:
recode l2 subor.txt
	
ale zd� sa, že to stačiť nebude. Latka na titul „Linuxov� Guru“ sa posunula do z�vratn�ch v�šok, pretože -- aby ste sa stali jeho nositeľom -- mus�te vedieť pomocou tohto programu previesť dokument v latin2 na latin1 alebo dokonca ASCII (a to už je pekn� Saigon...)