Транслитерация

Предложение за транслитерация
(за български език)

     Има два различни вида транслитерации, между които трябва да правим разлика. В единия случай говорим за транслитериране, което е предназначено за чужденци (например имената ни в личните карти и географските наименования, изписани на карти, улични табели и пътни знаци). Във втория случай говорим за транслитериране, предназначено за българи (например когато пишем e-mail на български на друг българин, но поради технически проблеми не можем да използваме кирилицата и ни се налага да кодираме на латиница).
     За да различи двете понятия, професор Владимир Успенски използва термина транскрипция, когато се касае за транслитериране за чужденци. Професор Любомир Иванов смята, че е по-правилно да се използва терминът транслитерация и в двата случая, но във втория той говори за обратима транслитерация, предназначена за технически цели.
     Двата вида транслитерация не могат да бъдат обединени в една транслитерационна схема, защото изискванията към тях са коренно различни и дори противоречиви. Когато транслитерираме за чужденци, ние трябва да го направим звукоподражателно, като при това трябва да изберем определен чужд език и да се съобразим с правилата му. Когато транслитерираме за българи не е нужно да търсим звукоподражателност, защото нашите читатели знаят как да прочетат думите и дори знаят как тези думи се пишат на кирилица. Нужно е само да кодираме кирилския текст на латиница по някаква проста система, която е желателно да бъде обратима, за да може лесно и дори автоматично да може да се възстанови кирилският текст от кодираното на латиница.

За транслитерацията, предназначена за чужденци, смятаме, че трябва да се използва следната транслитерационна схема:

а - a е - e к - k п - p ф - f щ - sht

б - b ж - zh л - l р - r х - h ъ - a

в - v з - z м - m с - s ц - ts ь - y

г - g и - i н - n т - t ч - ch ю - yu

д - d й - y о - o у - u ш - sh я - ya

Горната таблицата е въведена през 1995 г. в Toponymic Guidelines for Antarctica. По-късно тази таблица е узаконена от постановления на МС 61/02.04.1999 и 10/11.02.2000 и се използва от паспортните служби. Също така, тази таблица е включена в българския правописен речник, който е издание на Института за български език към БАН. Ако искате да научите повече за основанията за въвеждането на тази транслитерационна таблица, ви препоръчваме да прочетете статията на професор Любомир Иванов - "On the Romanization of Bulgarian and English". Вижте също така предложенията направени от професор Иванов за обтекаемата транслитерация на руски, украински, белоруски, македонски и сръбски езици.

     За обратима транслитерация, предназначена за технически цели, предлагаме да се кодират 30-те букви на кирилицата чрез 26-те букви на латиницата, като всяка буква си има съответствие на латиница, с изключение на двойните (Ю, Я и Щ) и на Ь. Тези четири букви да се кодират като ЙУ, ЙА, ШТ и Й.
     Как ще се кодират останалите 26 букви? За 20 е ясно - както в таблицата от въпросника. Остават 6, а именно: Й, Ц, Ъ, Ш, Ч, Ж. Предлагаме буквите Й, Ц и Ъ да се кодират като J, C и Y, защото звучат сходно, защото така се изписват в славянските езици, използващи латиница и защото така е в съществуващата фонетична подредба на клавиатурата.
     Остава да се кодират Ш, Ч, Ж. Неизползваните до момента букви от латиницата са w, q, x и предлагаме да се кодират в този ред, заради леката графична прилика.

Така полученият вариант на кодиране може да се види в таблицата, която следва, но е по-лесно да се оцени, ако се натисне жълтата стрелка и се погледне вторият вариант на въпросника, който е кодиран по този начин.

а - a е - e к - k п - p ф - f щ - wt

б - b ж - x л - l р - r х - h ъ - y

в - v з - z м - m с - s ц - c ь - j

г - g и - i н - n т - t ч - q ю - ju

д - d й - j о - o у - u ш - w я - ja

Предимствата на предложения вариант са три:

Първо, той е сравнително лесен за научаване, защото кодирането на почти всички букви е логично, с изключение на три, при които е съвсем нелогично. Тоест, научаването се свежда до запомняне на кодирането на три букви (Ш, Ч, Ж).

Второто предимство е краткостта. Повечето български букви се предават с една латинска. Изключение правят само 3 букви.

Третото и най-важно предимство е, че декодирането е много лесно. Причината за това е, че почти всички букви съответстват едно към едно. Грешка може да се получи само при двойните букви и при Ь. Например Щека може да се декодира като Штека, което е грешка, но не така ужасна, каквато е декодирането на Схема като Шема (тоест Щека и Штека се пишат различно, но се произнасят почти еднакво). Дори такива грешки трудно биха се допуснали, защото двойните букви винаги ще се декодират слято. Грешка може да се допусне и от това, че Й, Ь и И ударено се кодират с една и съща буква J, но правилата са прости. Когато е отделна дума, е И ударено, когато е следвано от О и пред него има съгласна, е Ь, а в останалите случай е Й.

Дотук стандартът е прост и на практика е обратим за текстове без правописни грешки. Ще добавим още четири правила, които ще позволят в текста да има включени думи на латиница и ще направят кодирането 100% обратимо за произволен текст (дори ако е с правописни грешки). Тези четири допълнителни правила ще усложнят стандарта, но можем да предполагаме, че хората няма да ги учат и няма да ги ползват, а само компютърните програми ще ги прилагат.

     1. Допълнителното правило за текст, включващ думи на латиница, е тези думи да се заграждат в апострофи. Ако в текста има апостроф, то той трябва да се замени с два апострофа. (При декодирането няма да се прави разлика между символа апостроф и символите отварящ и затварящ апостроф, защото някои текстови редактори автоматично заменят този символ с отварящи и затварящи апострофи. Затова петте отварящи и затварящи апострофи (‘ ’ ‚ ‹ ›) също ще се удвояват. Unicode номерата на тези символи са U+2018, U+2019, U+201A, U+2039, U+203A.)
     2. Допълнително правило за разделяне на двойни букви е да се пише между тях символа / (наклонена черта). Например пустошта ще се кодира като pustow/ta, а името Майа ще се кодира като Maj/a (има такова име и то е различно от Мая). Ако пишещият на латиница не знае това правило и напише пустошта като pustowta, то при декодирането ще се получи пустоща вместо пустошта. Това не е голям проблем, защото членуваната форма на българската дума пустош е на практика единствената дума, която се кодира чрез това правило.
     3. Допълнително правило за различаване на буквите Й, Ь и И ударено е да се пишат знаците #, & и * пред J. Разбира се, те ще се пишат само ако съответната буква е използвана не по правилата на правописа. Например изречението: "Й и Ь са букви" ще се кодира така: "#J i &J sa bukvi". (Правилата на правописа казват, че когато J е отделна дума, то тогава трябва да се декодира като И ударено. Когато J е в началото на дума или след гласна, то тогава трябва да се декодира като Й. В останалите случаи J трябва да се декодира като Ь. Тези правила са за случая, в който не е изрично отбелязано правилното декодиране чрез някой от символите #, & или *.)
     4. Допълнително правило за кодирането на символите /, #, & и *. Тези символи се заграждат в апострофи, когато в противен случай може да се получи колизия с правилата 2 и 3. Например последователностите от символи ш/т и т#ьо се кодират съответно w'/'t и t'#'&jo.

За обратната транслитерация (кодиране чрез кирилица на дума, написана на латиница) ще препоръчаме да се използва същата таблица и думата да се огражда с апострофи. Например изречението: "Аз си инсталирах Windows 98" ще се кодира така: "Аз си инсталирах 'Шиндошс' 98". Разбира се, че думата Windows, написана по този начин, може да се познае само от хора, които знаят стандарта. Ако не държим на спелинга, а на начина, по който думите се произнасят, то ще е по-добре да кодираме звукоподражателно. Например Windows ще изглежда като 'Уиндолс'. Звукоподражателното кодиране е особено подходящо, когато българин трябва да прочете реч на чужд език, който не владее.

Назад към първата страница на инициативата

а - a	е - e	к - k	п - p	ф - f	щ - sht
б - b	ж - zh	л - l	р - r	х - h	ъ - a
в - v	з - z	м - m	с - s	ц - ts	ь - y
г - g	и - i	н - n	т - t	ч - ch	ю - yu
д - d	й - y	о - o	у - u	ш - sh	я - ya