Сайт посвящен транслиту и его новой версии 2.0
Все мы знаем проблемы с кривыми русификаторами и иногда жаль что у нас не латинские буквы. Кодировок много всяких. Почта до сих пор юзает древний КОИ8, пытаются перейти на юникод/utf-8 но старые проги не понимают его, и из-за того что 2 симв. означают один, то при вставках бывает двойное кодирование и вместо текста каракули. Если стоит utf-8 а в скриптах коменты на рус 1251/866/KOI то они дальше не работают!
Другая проблема шрифты, если не те, то ромбики или каракули и ничего не понятно совсем. Недавно у меня убунта слетела, в рекавери полез, а там типа по русски и шрифт грузится даже, но вместо рамки @, вместо стрелок квадратики, а следующее меню полностью нечитабильно - одни квадратики. И что делать? Если каракули можно снять камерой телефона/планшета и перевести что там все таки написано, то квадратики никак и ничем! Лучше бы на английском было, или транслитом. С базами данных тоже проблема, они ищут дольше, сортировка глючит, итд.
Много русских живет за границей и пишут транслитом - нет рус клавы или наклейки не знают где купить.. или может телефон насквозь китайский и рус. букв там нет.
Многим читать транслит неприятно, на форумах обычно такие посты пропускают, и не читают, а если смесь рус. и англ слов/сокращений, то непонятно что где. Например "cat"- это кат или кошка?
Еще проблема, многие даже не знают как пишется ЖЩЙ на транслите, кто как пишет. тверд знака вобще нет. мягк знак - кавычка, а она может нужна по тексту выделить 'text' или запрещена в именах файлов.
Еще на загран-паспортах раньше был транслит другой, типа французский, сейчас на паспортах кодируют лат.буквами-цифрами, но не читабельно.
Также если закодировать текст в транслит, то обратно уже НЕЛЬЗЯ, нет однозначности "sh" толи "ш" толи "сх"
а в вордпрессе страницы названы транслитом и что там неясно и для поиска плохо!
Подводя итог, делаем выводы, что нынешний транслит никуда не годен и нужен новый.
Предлагаю новый формат -Транслит 2.0
Преимущества:- -Основан на похожести и легко-запоминаемости
- -однозначное декодирование туда-сюда
- -отделение транслита от англ. слов
- -возможная замена UTF-8/ юникоду и всех старых кодировок.
- -читабельность без декодера
- -только лат буквы и цифры (можно имена файлов)
- -декодер на всех платформах/ОС/языках
- -шрифты не нужны (не обязательны)
Правила:
ё=е ь=Ь ъ=Ъ. нет слов начинающихся с ЬЪ. ё устарела. и лучше не использовать,
во всех кодировках она находится не по порядку и сортировка с ней кошмар,
если учитывать все эти особенности, то алгоритм поиска медленее в 5 раз.
` начало транслита2 - до конца текста или строки
` конец транслита2 для переключ на англ. слова или цифры.
йцукенгшщзхъфывапролджэячсмитьбю
jcukengw7zh5fyvaproldx394smit6bu
------------
Это на 90% старый транслит, но заменены:
й=j это очевидно, а не "ж" java= ява а не жава.
ь мягкий знак (') на 6 - похожа. заглавн буква тоже 6 (шестЬ)
ъ твердый знак (?) на 5 - похож - верхний хвост в др. сторону (пятЪ)
ж = (j/zh) на x -похож если в середину верт. палку вставить, и (x=h)
ш = (sh) на w -похож почти и (в=v)
щ = (?/sch) на 7 - сост из 7 палочек 1_1_1_\ (Щтирлиц- наш агент007) 1-заглавная Щ - на 7 похожа немного.
э= (?/e) на 3 (з=z) похожа. 0-заглавная (похожа на перечеркн 0 без левого бока)
ю= (?u) (у=u) на q (кЮ) если повернуть Q на 90гр то чем то похоже: О с хвостом.
ч= (ch) на 4 (многие так пишут) (Четыре) 8-заглавная-в 2раза больше.
я= (ja/ya) на 9 -почти похожа нижнюю палку вставить, 2-заглавная Я - похожа меньше.
Итого: ьъ=65 ш=w щ=7 ж=x ю=q э=3 ч=4 я=9
запомнить только щ/ю, остальные похожи и запомнить легко.
(на самом деле Ёё это (~), но использовать не рекомендуется)
Read more
Comments