Mover: Информация - энергия

9 октября 2006 г.

Периодическая таблица для языка

В китайском языке почти каждый смысловой термин имеет несколько значений, которые можно менять в зависимости от обстоятельств. И только образованные люди догадаются о чем первоначально шла речь. Если письменный язык сам по себе не излучает эмоций и оттенков, то их выносят за письмо - в интонацию, антураж и т.д. Те же вьетнаммцы могут только тональностью слов передавать другие их значения (на один иероглиф несколько переводов). В принципе и в русском языке таких амонимов (многозначных слов) есть несколько. Но не так много, как в восточных языках. Там процесс образования письменности (языка) шел по принципу выдачи каждому целосному явлению отдельного понятия (а не разбития на буквы и слова). Из-за этого так много иероглифов и так мало буковок. =) Было бы интересно посмотреть на букву "падающий снег", "старый мудрый человек" и тд.
У меня давно зреет мысль о том, чтобы сделать "периодическую таблицу" языка. Сложность в том, что информация в отличии от материи изначально идет в бесконечность. Если химические элементы можно разделить на атомы, электроны и вычислить их металлические свойства, то с языком, словами и понятиями бороться труднее. Для начала нужно определить сколько есть основных значений (базовых понятий). Например, допустим что их 7 (по количеству цветов). Расположим по порядку изменения свойств (от физических или материальных к духовным или информационным):
1. Природа - красный
2. Человек - оранжевый
3. Общество - желтый
4. Бизнес - зеленый
5. Государство - голубой
6. Наука - синий
7. Духовность - фиолетовый
Для каждого основного понятия будет соответствующая волна ("до"..."си"). Свойства будут меняться в зависимости от сложности, которую можно задать оттенком (яркостью), чем выше сложность - тем светлее, чем ниже - темнее. Тоесть для каждого свойства значения делятся на 3 подгруппы = 2 противоположности и 1 среднее (а каждая подгруппа снова на 3 и так далее рекурсивно) примерно, так как я не делал глубокого анализа:
1. Природа -> Микромир/Мир/Макромир
2. Человек -> Тело/Разум/Душа
3. Общество -> Семья/Взаимоотношения/Народ
4. Бизнес -> Производство/Предпринимательство/Экономика
5. Государство -> Территория/Власть/Право
6. Наука -> Пространство/Время/Информация
7. Духовность -> Культура/Творчество/Религия
Еще есть возможность регулировать понятия по интенсивности (использованию данного термина во всех массе документов), задавая таким образом разноцветную картину языка. Вот если бы провести такое исследование с научной точки зрения и увидить "разности температур" как и в случае с реликтовым излучением космоса, то мы смогли бы собрав нужную статистику водить пользователя по цветной картине поиска с учетом гармонии композиции (визуального тезауруса).
Тогда не только языки можно было измерять, но и проводить анализ культурной (информационной) среды. Добавив эксперта - получим эксперную поисковую систему, настраивающуюся по алгоритмам (понятиям), а не просто по находению каких-то слов, их форм и близости в тексте.