Translit-2.0

новый формат транслита!

Сайт посвящен транслиту и его новой версии 2.0

Все мы знаем проблемы с кривыми русификаторами и иногда жаль что у нас не латинские буквы. Кодировок много всяких. Почта до сих пор юзает древний КОИ8, пытаются перейти на юникод/utf-8 но старые проги не понимают его, и из-за того что 2 симв. означают один, то при вставках бывает двойное кодирование и вместо текста каракули. Если стоит utf-8 а в скриптах коменты на рус 1251/866/KOI то они дальше не работают!

Другая проблема шрифты, если не те, то ромбики или каракули и ничего не понятно совсем. Недавно у меня убунта слетела, в рекавери полез, а там типа по русски и шрифт грузится даже, но вместо рамки @, вместо стрелок квадратики, а следующее меню полностью нечитабильно - одни квадратики. И что делать? Если каракули можно снять камерой телефона/планшета и перевести что там все таки написано, то квадратики никак и ничем! Лучше бы на английском было, или транслитом. С базами данных тоже проблема, они ищут дольше, сортировка глючит, итд.

Много русских живет за границей и пишут транслитом - нет рус клавы или наклейки не знают где купить.. или может телефон насквозь китайский и рус. букв там нет. Многим читать транслит неприятно, на форумах обычно такие посты пропускают, и не читают, а если смесь рус. и англ слов/сокращений, то непонятно что где. Например "cat"- это кат или кошка?
Еще проблема, многие даже не знают как пишется ЖЩЙ на транслите, кто как пишет. тверд знака вобще нет. мягк знак - кавычка, а она может нужна по тексту выделить 'text' или запрещена в именах файлов. Еще на загран-паспортах раньше был транслит другой, типа французский, сейчас на паспортах кодируют лат.буквами-цифрами, но не читабельно. Также если закодировать текст в транслит, то обратно уже НЕЛЬЗЯ, нет однозначности "sh" толи "ш" толи "сх" а в вордпрессе страницы названы транслитом и что там неясно и для поиска плохо!
Подводя итог, делаем выводы, что нынешний транслит никуда не годен и нужен новый.

Предлагаю новый формат -Транслит 2.0

Преимущества:
  • -Основан на похожести и легко-запоминаемости
  • -однозначное декодирование туда-сюда
  • -отделение транслита от англ. слов
  • -возможная замена UTF-8/ юникоду и всех старых кодировок.
  • -читабельность без декодера
  • -только лат буквы и цифры (можно имена файлов)
  • -декодер на всех платформах/ОС/языках
  • -шрифты не нужны (не обязательны)

Правила:

ё=е ь=Ь ъ=Ъ. нет слов начинающихся с ЬЪ. ё устарела. и лучше не использовать, во всех кодировках она находится не по порядку и сортировка с ней кошмар, если учитывать все эти особенности, то алгоритм поиска медленее в 5 раз.
` начало транслита2 - до конца текста или строки
` конец транслита2 для переключ на англ. слова или цифры.
йцукенгшщзхъфывапролджэячсмитьбю
jcukengw7zh5fyvaproldx394smit6bu
------------
Это на 90% старый транслит, но заменены:
й=j это очевидно, а не "ж" java= ява а не жава.
ь мягкий знак (') на 6 - похожа. заглавн буква тоже 6 (шестЬ)
ъ твердый знак (?) на 5 - похож - верхний хвост в др. сторону (пятЪ)
ж = (j/zh) на x -похож если в середину верт. палку вставить, и (x=h)
ш = (sh) на w -похож почти и (в=v)
щ = (?/sch) на 7 - сост из 7 палочек 1_1_1_\ (Щтирлиц- наш агент007) 1-заглавная Щ - на 7 похожа немного.
э= (?/e) на 3 (з=z) похожа. 0-заглавная (похожа на перечеркн 0 без левого бока)
ю= (?u) (у=u) на q (кЮ) если повернуть Q на 90гр то чем то похоже: О с хвостом.
ч= (ch) на 4 (многие так пишут) (Четыре) 8-заглавная-в 2раза больше.
я= (ja/ya) на 9 -почти похожа нижнюю палку вставить, 2-заглавная Я - похожа меньше.
Итого: ьъ=65 ш=w щ=7 ж=x ю=q э=3 ч=4 я=9
запомнить только щ/ю, остальные похожи и запомнить легко.
(на самом деле Ёё это (~), но использовать не рекомендуется)
Read more Comments

Про буквы итд

Так как заглавные буквы используются очень редко, то запоминать их особо не надо. Декодер после точки в конце предложения АВТОМАТИЧЕСКИ сделает след. букву заглавной. (точка+пробелы+маленькая)=> (точка+пробелы+заглавная). Архиватор текстов мой (самый крутой в мире) тоже так делает. плюс заменяет е на ё по словарю где нет синонимов с двойным написанием. (Елка=> Ёлка) плюс нормализует составные слова (автобанк=> АвтоБанк) и исправляет слова с ошибками и альтернативной граматикой на классический русский язык. (програмист=> программист) Сокращенные слова типа (след. буква) надо будет писать (след* буква) или (след- буква) или (след_ буква) чтобы было понятно что это сокращение, а не слово и конец предложения, да и так читать и понимать легче, т.к точку видно хуже.. а там где окончание влияет на смысл писать (след-я точка)

Про Это :)

И запомните, если люди пишут с ошибками и их много, то значит не людей надо менять, а правила рус. языка подправить - типа альтернативная граматика. Если смысл не меняется, то писать двойные мм-нн итд не обязательно, и как слышится так и пишется. Некоторые намеренно с ошибками пишут-чтобы люди возмущались и запоминали лучше, или скопипастят с теми же ошибками и сразу видно что спёр, или сдублировал может, что собственно не преступление, знаниями делиться надо и ссылки умирают со временем, лучше к себе скопировать и просто написать откуда взято.

Read more Comments