Metodii.com
Предложение за транслитерация

     За кодиране на български език на латиница има две възможности. Първата е да се ползва стандартът за кодиране на имена, приет от Министерския съвет, макар този стандарт да не отговаря на изискванията за краткост и обратимост. Втората възможност е кодирането, прието от МС, да остане валидно само за кодиране на имена, а за комуникация между българи да се приеме втори, по-кратък и обратим стандарт.

     За втори, по-кратък и обратим стандарт предлагаме да се кодират 30-те букви на кирилицата чрез 26-те букви на латиницата, като всяка буква си има съответствие на латиница, с изключение на двойните (Ю, Я и Щ) и на Ь. Тези четири букви да се кодират като ЙУ, ЙА, ШТ и Й.
     Как ще се кодират останалите 26 букви? За 20 е ясно - както в таблицата от въпросника. Остават 6, а именно: Й, Ц, Ъ, Ш, Ч, Ж. Предлагаме буквите Й, Ц и Ъ да се кодират като J, C и Y, защото звучат сходно, защото така се изписват в славянските езици, използващи латиница и защото така е в съществуващата фонетична подредба на клавиатурата.
     Остава да се кодират Ш, Ч, Ж. Неизползваните до момента букви от латиницата са w, q, x и предлагаме да се кодират в този ред, заради леката графична прилика.

Така полученият вариант на кодиране може да се види в таблицата, която следва, но е по-лесно да се оцени, ако се натисне жълтата стрелка Metodii.com и се погледне вторият вариант на въпросника, който е кодиран по този начин.
 
 
а - a е - e к - k п - p ф - f щ - wt
б - b ж - x л - l р - r х - h ъ - y
в - v з - z м - m с - s ц - c ь - j
г - g и - i н - n т - t ч - q ю - ju
д - d й - j о - o у - u ш - w я - ja

     Предимствата на предложения вариант са три:

Първо, той е сравнително лесен за научаване, защото кодирането на почти всички букви е логично с изключение на три, при които е съвсем нелогично. Тоест, научаването се свежда до запомняне на кодирането на три букви (Ш, Ч, Ж).

Второто предимство е, че повечето български букви се предават с една латинска. Изключение правят само 3 букви.

Третото и най-важно предимство е, че декодирането е много лесно. Причината за това е, че почти всички букви съответстват едно към едно. Грешка може да се получи само при двойните букви и при Ь. Например Щека може да се декодира като Штека, което е грешка, но не така ужасна, каквато е декодирането на Схема като Шема (тоест Щека и Штека се пишат различно, но се произнасят почти еднакво). Дори такива грешки трудно биха се допуснали, защото двойните букви ще се декодират слято с изключение само на думите: пустошта, нашта, вашта, нашто, вашто. Грешка може да се допусне и от това, че Й, Ь и И ударено се кодират с една и съща буква J, но правилата са прости. Когато е отделна дума, е И ударено, когато е следвано от О и пред него има съгласна, е Ь, а в останалите случай е Й.

     Дотук стандартът е прост и е обратим за текст без правописни грешки. Ще добавим още правила, които ще позволят в текста да има включени думи на латиница и ще направят кодирането 100% обратимо за произволен текст (дори ако е с правописни грешки). Тези допълнителни правила ще усложнят стандарта, но можем да предполагаме, че хората няма да ги учат, а само компютърната програма ще ги знае.
     Допълнителното правило за текст, включващ думи на латиница, е тези думи да се заграждат в апострофи. Ако в текста има апостроф, то той трябва да се замени с два апострофа.
     Допълнително правило за разделяне на двойни букви е да се пише | между тях. Например името Майа ще се кодира така: Maj|a (има такова име и то е различно от Мая). Допълнително правило за сливане на двойни букви е да се пише ^ между тях. Например пустоща ще се кодира така: pustow^ta (това е правописна грешка, но ние може да пишем и грешно, ако поискаме).
     Допълнително правило за различаване на буквите Й, Ь и И ударено е да се пишат знаците #, & и * след J. Разбира се, те ще се пишат само ако съответната буква е използвана не по правилата на правописа. Например изречението: "Й и Ь са букви" ще се кодира така: "J# i J& sa bukvi".
     За обратната транслитерация (кодиране чрез кирилица на дума, написана на латиница) ще препоръчаме да се използва същата таблица и думата да се огражда с апострофи. Например изречението: "Аз си инсталирах Windows 98" ще се кодира така: "Аз си инсталирах 'Шиндошс' 98". Разбира се, че думата Windows, написана по този начин, може да се познае само от хора, които знаят стандарта. Ако не държим на спелинга, а на начина, по който думите се произнасят, то ще е по-добре да кодираме звукоподражателно. Например Windows ще изглежда като 'Уиндолс'. Звукоподражателното кодиране е особено подходящо, когато българин трябва да прочете реч на чужд език, който не владее.
 
 

Назад към първата страница на инициативата