Полезные заметки/Установление родства языков

Материал из Викитропов
Перейти к навигации Перейти к поиску

Введение

Научному сравнительно-историческому языкознанию — области лингвистики, занимающейся установлением родства языков, немногим более двухсот лет. Нет, мы не утверждаем, что ранее этот вопрос не поднимался и каких-либо наблюдений в этой связи не отмечено. Классической ситуацией было считать, что лишь вашим предкам боги дали правильный язык, а прочим — неразборчиво звучащее бормотание «Вар! Вар!». С изобретением письменности и литературной традиции долгое время куда более актуальным было дать более-менее научное описание своего собственного языка, который с веками становился языком предков, а иногда и вовсе вымирал. Если вам повезло (не повезло) иметь идеографическое письмо, то бывает очень сложно заметить, что произношение слова, обозначаемого одним и тем же знаком, сильно изменилось. А вот культуры, использующие фонетические алфавиты, через энное количество столетий замечали, что не всегда получается понять слова из старинных надписей, даже зная значение каждого знака по отдельности. То есть изначально требовалось установить вообще сам факт изменения своего собственного языка со временем! Если на нём были записаны законы либо священные тексты, то требовалось либо переводить их на современный язык, либо изучать язык древний. Древние римляне замечали определённое сходство латыни с древнегреческим языком и хоть истолковывали это как доказательство родства, но считали, что все изменения чисто случайны и установленный факт просто считался набором парадоксов. Греки же считали, что латынь происходит от эолийского диалекта древнегреческого языка, искажённого варварским влиянием. Юлий Цезарь в «Записках о Галльской Войне» писал, что пусть галльский и латынь не слишком несхожи, но галлы столь быстро и легко учатся разбирать латынь устную и даже письменную[1], что самые ответственные документы и поручения он приказал писать на древнегреческом. В раннем Средневековье обращали внимание на отдельные сходства старославянского и древнегерманских языков с латынью и древнегреческим. Но эти факты забалтывали теориями о якобы повальном заимствовании варварами слов из латыни и об остаточном сходстве после «вавилонского смешения языков». Поэтому открытие Уильямом Джонсом (точнее, полноценное научное описание) для европейцев санскрита в XVIII было подобно удару молота по голове — полуостров Индостан не имел никаких тесных контактов с античной цивилизацией, и одной только вавилонской башней огромное количество системных сходств лексики и грамматики с европейскими языками объяснить было никак нельзя. И многих молодых учёных смежных с лингвистикой специальностей увлекла романтика поиска — в их числе были, в частности, историк Расмус Раск, фольклорист Якоб Гримм, школьный учитель Франц Бопп, которые и считаются первопроходцами и основателями научного сравнительно-исторического языкознания.

Исходные данные

Как уже говорилось, самый первый этап — это просто сбор сведений о сравниваемых языках. Укажем, что это не так просто, как кажется, и первопроходцы часто делали одни и те же ошибки, самоуверенно полагая, что имеют исчерпывающие описания сравниваемых языков. Например, церковнославянский язык XV—XVII века полагали равнозначным языку Кирилла и Мефодия, равно же брали исключительно классическую латынь и древнегреческое койнэ, нередкими были ситуации, когда устоявшиеся за века представления об орфографии и фонетике древних языков были просто ошибочны. Для целей образовательных либо религиозных не особо важно, как именно произносился дифтонг, не имели особого значения долгота-краткость гласного или правильное ударение. А вот при сравнении с другими языками это зачастую весьма принципиально. Сравнительно-историческое языкознание волей-неволей опирается на достижения лингвистов и историков смежных специальностей, а также археологов и реставраторов. Предположим, вам попалась рукопись века этак десятого — зря раскатали губки, чаще всего она будет в совершенно нечитаемом состоянии, и сначала требуется долгий труд реставраторов… Чтобы только узнать, что вы этот долбаный унциал так просто и сходу не можете прочесть. Есть лингвисты, специализирующиеся на изучении именно шрифтов определённых эпох, и надо либо учиться этому у них, либо ждать, пока эту рукопись издадут в понятном вам формате. Отдельный момент — нормализация и изученность языка. Всё прекрасно, если вам достался прекрасно нормализованный и с относительно небольшим посторонним влиянием язык типа санскрита. И вот вам достался албанский язык — казалось бы, носителей уйма, изучай не хочу! Да вся проблема в том, что более половины лексики в нём замещены латино-греко-славянизмами, и даже арабо-туреччиной, и нужен был долгий и тяжкий труд по вычленению исконной лексики; вдобавок он и сейчас паршиво нормализован, а до этого всякие Энверы Ходжи ходили по этой хрупкой метафизической субстанции грязными сапожищами. В кои-то веки тяжкий почти вековой труд к концу XX столетия дал прекрасный результат — в его исконной лексике удалось найти прекрасные артефакты ещё общеиндоевропейского состояния, и лингвисты сравнивают его нормальное научное описание даже с открытием хеттского языка. Очень ценны для лингвистов разные трактаты по стихосложению, пению и поэтической речи, ведь в них дается актуальное произношение и ударения, например труд Данте Алигьери De vulgari eloquentia «О народном красноречии», в котором он дал хорошее описание произношения и грамматики современных ему итальянских диалектов и сравнил их с соседними языками. В трактате он отнюдь не восторгается этим самым «народным красноречием», указывая на большие различия разных диалектов даже внутри его родной Тосканы, не щадя и говор своей родной Флоренции и даже критикуя собственное творчество, так как «его стиль несовершен ввиду скудости и грубости самого наречия» его родного говора и сокрушается, что многие итальянские поэты мало того что подражают «незрелому стилю и необработанному языку» его же поэтического сборника La Vita Nuova, так еще и делают грубые ошибки употребляя неродной для них тосканский говор. Сам он считал куда более благозвучным и обработанным неаполитанский говор, но сокрушался что большинство итальянцев его плохо понимают.

Методика

Лексика и фонетика

Лексикология и фонетика — самые интуитивно понятные для сравнения разделы лингвистики. Похожие слова можно найти и в заведомо неродственных языках, достаточно вспомнить, как арабщина широко разошлась в языках народов, находившихся под влиянием исламской культуры, а оттуда — вторичными рикошетами по другим языкам: «адмирал» и «алхимия», «алкоголь» и «азимут», «горизонт» и «надир», «эликсир» и «сироп». Китайский язык оказал крайне глубокое влияние на языки народов юго-восточной Азии, и доля китаизмов во многих текстах на японском или корейском может даже превышать количество исконных слов. Поэтому лингвисты пришли к следующим основным принципам:

  • Сравнивается не вся наличная лексика языков, особенно узкоспециализированная терминология, а сначала самые употребительные слова, а к ним относятся: числительные, местоимения, глаголы движения и самых ходовых действий, названия цветов, названия самых распространенных животных, имена родства[2].
  • Необходимо не просто установить «похожесть» звучания слов, а установить регулярность их звуковых соответствий. Если кратко — научиться прогнозировать звучание слова в конкретном родственном языке.

В родстве славянских языков никогда и никаких сомнений не было, так как распад общеславянского языка произошёл уже в историческое время и до самого конца первого тысячелетия нашей эры языки отдельных племён и народов не имели особых названий[3], собственно, тот факт, что Священное Писание перевода Кирилла и Мефодия не потребовалось переводить ни для западных (оно впервые было принесено в Великую Моравию, для которой и переводилось) ни для восточных (на Руси), а само по себе вообще было создано на основе рандомного южнославянского говора окрестностей родных для братьев Салоник — но потом это создало лингвистам проблемы, так как он и сам легко менялся, и глубоко влиял на на языки народов, которые его употребляли. Весь XIX-й век лингвисты потратили на то, чтобы восстановить его в изначальном виде, а также установить более-менее оригинальное звучание; на письме он зафиксирован практически сразу после распада общеславянского языка. Поэтому в большинстве отношений он крайне близок к нему, но уже имеет и черты южнославянских языков, и свои оригинальные особенности. Это крайне помогло в восстановлении общеславянского языка, но всё равно потребовались уточнения и данные, полученные при изучении других славянских языков.

Латинский язык — это всеобщий язык бывшей Римской империи в целом и большинства христианских церквей в частности. Университетская и церковная латынь сами по себе имеют отличия от классического латинского языка рубежа эр, но, по счастью, было немало древних греков, заинтересованных в изучении латинского языка, а для образованного римлянина было просто позором не владеть древнегреческим, не говоря уже о том чтобы цитировать модных философов или хотя бы «Илиаду» на языке оригинала. Патриции просто нанимали философа либо даже покупали его на рынке, а интеллектуалы победнее сами штудировали труды грамматиков. Например, сохранилось сочинение жившего во втором веке нашей эры Теренциана Мавра «О буквах, слогах, стихотворных размерах», в котором он постарался дать подробное описание произношения латинского языка классической эпохи, приводя обширные ссылки на предшественников с описанием современного им произношения. Вдобавок италийцы и греки многие слова, имена, топонимы, и термины соседей писали на своём языке, причём фонетически и такие пересылки помогают уточнять актуальное произношение. Римляне же классической эпохи вообще старались передавать греческие слова и заимствования максимально близко к оригиналу, даже показывая придыхания буквой h (сами греки их часто никак не обозначали) и ввели в алфавит две буквы y, z специально для отображения особых греческих звуков. В Сенате, как минимум в эпоху Юлия Цезаря, разрешалось выступать на греческом. Кроме этого отметим, что благодаря работе археологов, историков, источниковедов и реставраторов есть информация не только о классической латыни и койнэ, но и об архаичной латыни (примерно с VI века до н. э.), и архаических диалектах Эллады (примерно с XV века до н. э.), и о родственных латыни италийских языках, и о диалектах древнегреческого, отличных от аттического.

Попробуем сравнить в лоб числительные «от одного до десяти»[4] русского и французского языков:

  • Французский: un (ён), deux (дё), trois (труа), quatre (катр), cinq (сэнк), six (сис), sept (сэт), huit (вит), neuf (нёф), dix (дис).
  • Русский: один, два, три, четыре, пять, шесть, семь, восемь, девять, десять.
    • Проблемы начались уже с традиционной орфографии французского языка, и, если бы он был нам известен только в письменном виде, то началось бы увлекательное шоу… Сравнения русских звуков и непроизносимых букв французского языка; бывают случаи, когда традиционное написание «этимологическое», но далеко не всегда — и требуется сначала это доказать хотя бы из сравнения с родственными языками; возьмём итальянский:
  • Итальянский: uno, due, tre, quattro (кватро), cinque (чинкве), sei, sette, otto, nove, dieci (дьечи).
    • Часть звуков, что во французском только пишутся, в итальянском и правда произносятся. Можно оценить масштаб изменений языка за примерно 2000 лет или примерно 80 поколений, а также сравнить со старославянским:
  • Латынь: ūnus, duo (дwо), trēs, quattuor, quīnque (kʷиːнkʷэ), sex, septem, octō, novem, decem (дэкэм).
  • Старославянский: едьнъ, дъва, триѥ, четꙑре, пѧть, шесть, седмь, осмь, де́вѧть, де́сѧть.
    • Видно, насколько ближе друг к другу примеры, взятые из более древних языков, но даже в таком виде остались вопросы о том, что «один» и «девять» («десять-без-одного»[5], IX) кажутся несводимыми друг к другу. Вдобавок нужно учитывать, что при распаде праязыка и развитии его потомков слова меняются не только фонетически, и даже самые архаичные его потомки имеют собственную специфику. В сравнении с латынью, тем не менее, видно следующее:
  • Носовая гласная ѧ стоит не где попало, а соответствует сочетанию «-e(i)+n(m)-». В двух случаях (восемь и десять) старославянскому «с» соответствовало «к» (ср. окто-, дека-). Очень интересно, что во французском языке обнаруживается три конвергентно сходных результата фонетического развития: huit (вит) как и в русском получило протетическое «в» в начале слова «восемь», на месте сочетания (i + n) тоже развился носовой гласный, и на месте исторического «к» в dix тоже получилось «с». Поэтому изучение живых языков может и должно помогать при изучении древних, ведь количество воспроизводимых речевым аппаратом звуков довольно ограничено и их изменения часто происходят по довольно сходным сценариям, определяемым в конечном счёте допустимыми амплитудами движения языка, губ, голосовых связок. Распад единого латинского языка и его развитие в романские дало обширный материал для наблюдения. По этой причине обратили внимание на cinque (получившееся из quīnque) и quattro. В двух случаях из трёх из qu получилось кв, а в третьем — ч. На первый взгляд логика отсутствует, но специалисты по романским языкам вам объяснят, что ихние гласные имеют такую характеристику, как «открытость-закрытость»[6], первые произошли от кратких гласных латыни, а вторые возникли на месте долгих[7]. Закрытые гласные произносятся более «напряжённо», иногда перед ними даже возникает «й-образный» призвук, однозначно влияющий на согласные перед ними. Отсюда и возникло предположение, что в слове «четыре» первый звук изначально совпадал с латинским, а так как закрытое «а» нетипично для древних индоевропейских языков[8], то возникло предположение, что в латинском гласный после qu- изначально был е (й-э), собственно и вызвавший в протославянском переход kw- в ч (kw- + йч). Но потом возвращаемся к quīnque и задаёмся вопросом, почему в славянских языках первый гласный также не отобразился как ч, а звучит как «п»: так-то переход kw- в «п» вполне возможен, но более реалистичное обоснование — потому что в латинском первое qu неэтимологично и славянские языки являют более верное произношение.
    • Выше мы показали, что даже сравнение данных живых и довольно далеко разошедшихся языков небезнадёжно для реконструкции не зафиксированного письменно звучания слов, но обычно получается сначала целая вереница теорий, как и было на первых этапах развития индоевропеистики. Открытие и описание древних и архаичных языков позволяло что-то опровергнуть, а что-то подтвердить. А вот когда имеете дело с младописьменными языками без какого-либо древнеписьменного родича, то приходится пользоваться методом «перекрёстного» сравнения и привлекать примеры развития других языков с похожей фонетикой. Тем интереснее, как отобразились числительные в литовском, санскрите и древнегреческом:
  • Литовский: vienas, du, trys, keturi, penki, šeši, septyni, aštuoni, devyni, dešimt.
  • Др.-греческий: εἷς, δύο, τρεῖς, τέτταρες, πέντε, ἕξ, ἑπτά, ὀκτώ, ἐννέα, δέκα.
  • Санскрит: eka, dva, tri, čatur, pañča, ṣaṣ, saptan, aṣṭa, navan, daśa.
    • В литовском латинскому kw- чётко соответствует k, кроме начального звука в слове «пять» (см. выше), а в древнегреческом там же т. Санскрит, так же, как славянские языки, реализует его через ч. Санскрит и литовский имеют ш в позициях, где греческий и латынь показывают «к», а старославянский с/ш: шесть, восемь, десять. Вдобавок старославянский являет окончания чисел на -ть, начиная с «пять»; давно предполагалось, что их затащили туда из порядковых числительных: третий — три, четвёртый — четыре. Примеры из литовского показывают, что в этом протославянский был не одинок — ихние septyni, aštuoni, devyni явно имеют «лишнее» окончание -ni, а dešimt то же самое -t. Вдобавок литовский разделяет «отклонение» старославянского в отношении начальной согласной в «девять»[9]. Даже необычное старославянское седмь находит отклик в древнегреческом порядковом ἕβδομος (хебдомос) «седьмой» при ἑπτά (хепта) «семь», если оно из *себдмь. Вдобавок непонятное «в» в порядковом четвьртъ оказывается объяснимо при сравнении с литовском keturi, čatur из санскрита, quattuor из латыни. Тем более оказывается удивительным, что даже древние индоевропейские языки дают разнобой в отношении числительного «один» и порядковых «первый» и «второй».

А если попытаться сравнить имена родства ?

  • Старославянский: отьць, мати, братръ, сестра, сꙑнъ, дочь, деверь, сноха, тесть
  • Литовский: tėvas, mótė, brólis, sūnus, sesuo,
  • Латинский: pater, māter, frāter, soror, filius, filia, levir, nurus, socer
  • Др.-греческий: πατήρ, μήτηρ, φρᾱ́τηρ, ἔορ, υἱύς
  • Санскрит: pitā́(pitṛ), mā́tṛ(mā́tā), bhrā́tṛ, sūnú, svásṛ(svásā)

Санскрит, др.-греческий, латынь совпадают в форме слова «отец», но обращает внимание, что санскрит, повально и долгое и краткое гласное «е» и «о» переводящий в «а», тут даёт неожиданное «i»[10]. В греческом на примере слова «мать» видим, что долгое «а» там позиционно может отображаться и как долгое «е», но гомеровский язык и дорический диалект плюют на это уклонение, знают только долгое «а», и поэтому, очень вероятно, исходно было μᾱ́τηρ. В греческом и санскрите мы обнаруживаем придыхательный звук в начале слова «брат»[11], в латинском там обнаруживается ф, а в старославянском и литовском — «б». На наличие «о» в словах в «мать» и «брат» вместо «а» литовском можно не обращать внимания, так как там этот переход был уже в историческое время и достоверно зафиксирован, в латышском и прусском там везде «а», вдобавок прусское Brati свидетельствует о том, что балты исходную форму слова «брат» также знали. Обращаем внимание, что в санскрите как бы даётся на выбор: либо «р», либо долгое «ā́», «р» там не простая, а с «точкой», то есть, долгая и плавная на грани вокализации… Санскрит же немного «искусственный» язык, и древние граммар-наци немного перебарщивали с «нормализацией» и не только «затащили» туда «р» из косвенных падежей, но и дали ему долготу, чтобы оставить слог долгим. А вот со словом «сестра» всё не так просто: в архаическом латинском оно было не soror, a sezor, и в IV—III веке до н. э. все s и z между гласными перешли в r, это явление зовётся ротацизм; а в славянских языках звук «т» в этом слове не исконный, а, как в словах «острый» или «струя», вставной. В древнегреческом языке, брат/сестра обозначаются словами ἀδελφός/ἀδελφή, и ἔορ (хэор) значит «двоюродная сестра», но на примере ἕξ «шесть» мы видели, что у протогреков были сложные отношения со звуком «с» и аналогично υἱύς, где начального «с» мы не видим, но имеем придыхание, и правильное чтение буквы «ипсилон» в классическое время было как у немецкого «ü», а в гомеровскую эпоху — обычное у. Поэтому мы предлагаем восстановить транскрипцию υἱύς самостоятельно.

Морфология

Существительное

Как известно, в индоевропейских языках существительные и прилагательные склоняются по родам и падежам, но не имеют единых и универсальных падежных окончаний. В русском языке эта парадигма искусственно, точнее, как в результате естественного развития языка, так и в методических целях, сведена в три типа склонения, но в прочих славянских языках ситуация сложнее: от куда более разнообразной парадигмы чешского и некоторых диалектов словенского и до полной утраты склонений в современном болгарском. Схожая система склонения в балтских языках, но там дело осложняется тем, что в «архаичных и наиболее близких к санскриту современных» языках утрачены средний род и некоторые исходные типы склонения. В латинском языке аж пять типов склонения существительных, в санскрите — де-факто более десятка. Как и в русском языке, почти везде тип склонения можно определить по окончанию в именительном падеже, но в отдельных случаях этого недостаточно и приходится их просто-напросто запоминать; очень показательно, что во всех более-менее архаических индоевропейских языках можно найти хотя бы их следы.

  • Из второго склонения русского языка интересны слова мужского рода вроде «волк» и среднего вроде «иго» как имеющие аналоги в древних индоевропейских языках. «Волку» соответствуют лат. lupus, др.-греч. λύκος, литовское vilkas, санскритское vrkah, старославянское вълкъ. «Игу» — лат. iugum, санскр. yugam, хеттское iúkan, древнегреческое ζυγόν (дзюхон). Несходства в первом случае только кажущиеся: в родственных латыни окско-умбрских языках латинское -qu- отображалось как -p-, и оттуда некоторое количество этих слов попало в латынь (таки самниты были не только в мифах), и в архаичных граффити попадалось luqos: luquos, а у греков были проблемы даже со слоговым -w-, как мы уже видели; также древние индийцы не различали звуки «р» и «л», везде отображая их как «р».

Вроде бы очевидно, что исходно существительные этого типа склонения имели в именительном падеже окончание -os в мужском роде, а в среднем -om/-on, НО из данных самих славянских языков и даже в сравнении с балтскими это не следовало. Но славянские языки демонстрируют отклонение: краткое -о- не должно было переходить в ъ (сравни «дом», при domus-namas-Δομος), а -om должно было отображаться как носовой гласный. Сразу укажем — причины неясны, и однозначного объяснения, почему оно так, до сих пор нет. Что интересно, в латыни и древнегреческом к основам этого типа, на первый взгляд, принадлежит и некоторое количество слов женского рода, например pōpulus «тополь»[12] или tribus «триба». Но всё же в огромном большинстве случаев во всех индоевропейских языках к ним относятся именно слова мужского и среднего рода; из сравнения классического древнегреческого языка с архаичными диалектами видно, что там некоторое число девиантов женского рода либо перевели в мужской, либо оставили в женском, присвоив им более типичные окончания -ā и -is. По конечной гласной -o- именительного падежа данные существительные принято в индоевропеистике звать «основами на о». Но как мы уже видели, визуально это «о» удаётся наблюдать не всегда, где-то оно просто исчезло: волк или wolf, а где фонетически изменилось: lupus или vilkas, поэтому часто приходится обращаться к данным родственных языков или сравнивать всю парадигму склонения.

  • Весьма внешне схожа с данными существительными группа слов мужского рода вроде «сын», «лёд», «мёд». Сейчас их парадигма почти не отличается от обычных основ на о. Но вот даже в старославянском отличия были весьма существенными, из основ среднего рода типа «ведро» или «место» окончание множественного именительного -а проникло в слова типа «дом», а в слове «сыны» бывшее окончание двойственного числа вытеснило правильное множественное -ове, в слове «меда» окончание перешло под «дома», а в «сыновья» сложилась гибридная на основе старого окончания и добавочного -а. В литовском языке эти слова имеют вид sūnus, ledus, medus. В разных индоевропейских языках оно либо среднего рода (санскрит madhu, гомеровское μέθῠ «хмельной мёд, сыта», кельтское medwos)[13] либо мужского (балто-славянские, др.-англ. meadu), в случае мужского рода обычно окончание -us, среднего -u, что соблюдается даже для хетто-лувийских языков, где одушевлённый род противопоставляется неодушевлённому — pankus «собрание, сбор, сход» и genu «колено»[14]. Опять-таки данных только балтских и славянских языков для этого недостаточно, отметим что в готском языке изначальная структура слова (корень + (суффикс) + гласная основы + окончание) в основах на -u- вполне прозрачна: dau-þ-u-s или þor-n-us, а в древнеанглийском уже только death и þorn, да ещё часто с переводом в другие типы склонения.
  • Основы на -i- в русском примечательны тем, что с одной стороны в них сохранился реликт старого окончания в виде смягчения конечной согласной; таковы ночь или зверь[15], и это подтверждается аналогами в литовском: noktis и žvėrìs (жверис). На русской почве их склонение совпало со словами вроде конь или мать, второй случай проще — в косвенных падежах восстанавливается исконное окончание -r-. Для понимания инаковости «коня» и «зверя» достаточно сравнить их склонение в старославянском языке с аналогами:
им.звѣрь — род. звѣри — вин. звѣрь
им.ночь — род. ночи — вин. ночь
им.мать — род. матере — вин. матерь
  • «Долгие» основы женского рода. В русском языке слова женского рода чаще имеют окончания -а, -ья, ия. Собственно исконное «а» в славянских языках возникает исключительно на месте прежних долгих «о» или «а», а краткие «о» и «а» всегда отображаются, как «о». Уже в отдельных славянских языках ударные редуцированные давали и другие гласные, поэтому для сравнения с другими индоевропейскими языками обязательно надо проверять написание слова в старославянском, либо в сохранившихся ранних текстах:
    • «Простые» лексемы «корень + окончание» вроде рука или жена. Обычно им соответствуют слова женского рода с окончанием на долгий гласный вроде др.-греч. Γγνη «женщина», готского qinō. В литовском есть только rankā. В латинском им соотвествуют слова т. н. «первого склонения» с окончанием на -ā в именительном падеже[16] — via «дорога» (классическое чтение wi-(j)ā) или fabā «боб». Как и основы на -о-, они встречаются во всех древних индоевропейских языках и являются одними из самых многочисленных основ существительных. Исключение составляют лишь хетто-лувийские языки, где нет разделения на мужской и женский рода, вместо них общий одушевлённый. Отдельно отметим, что слова мужского рода с окончанием на -а вроде «староста» или «воевода» и собирательные женского рода вроде «беднота» исторически не принадлежали к основам на -ā, а принадлежали собирательным существительным с окончанием -еН и изначально не имели грамматического рода, в общеславянском же окончания -oH и -еН совпали в -ā и бывшие собирательные в основном перешли в женский род, а суффикс исходного отглаголенного собирательного -ot-eH даже стал продуктивным и начал широко употребляться для образования отвлечённых существительных вроде «красота» или «работа».
    • А вот долгие основы на ū исторически были весьма многочисленны, но мало в каких, даже в древних индоевропейских языках, они встречаются в чистом и неискажённом виде. Для начала привлечём славянские языки: слова женского рода вроде «буква» или «морковь» в современном русском маскируются под исторические основы на -а- или -i- (вроде «соль» или «кость»), но в старославянском языке их именительный падеж выглядел как бꙋкꙑ и цьркꙑ. Собственно «буки» в слове «азбука» оно и есть. Из сравнения слов вроде «мышь» с латинским mus или греческим μῦς, сын с готским и литовским sunus, можно практически не сомневаться, что звук «ы» произошёл от исторического «у-долгого». Прямые аналоги можно увидеть только в индо-иранских языках: санскр. «bhrū» — бровь, śvaśrū́ — свекровь. В латинском и древнегреческом они обильно смешались с обычными краткими основами на -u-, и выделить их былое существование можно только по данным косвенных падежей. В латинском языке они обычно имеют окончание на -us (выше уже было populus «тополь», другие примеры: spinus «колючка», tribus «племя», socrus «свекровь», manus «рука») и смешиваются с историческими основами мужского рода на -o-. Для вычленения исторического гласного основы бери родительный падеж множественного числа и не ошибёшься: manus «рука» — manuum «рук», сравни с locus «место» — locorum «мест». Изначально в латинском основы мужского рода на -u- имели в номинативе окончание -us (lacus «озеро»), женского — -ū, а среднего — -u (cornu «рог»); но после временного отпадения окончаний в номинативе в IV—V веках до н. э. были неверно восстановлены, а потом ещё и -os перешло в -us, что и породило мучения для многих поколений изучающих латынь. Только сравнение с родственными языками: санскритом, старославянским и частично кельтскими (галльским и древнеирландским) — позволяет понять эту нелогичную саму по себе ситуацию.
    • Основы существительных на -ī самые редкие, и уже в большинстве древних индоевропейских языков остались лишь их рудименты. Более-менее они сохранились лишь в индо-арийских языках и частично в галльском языке, например, санскр. rājnī и галльское rīganī — «королева, царица». Даже в старославянском в чистом виде зафиксировано всего несколько таких слов: ладии «лодка» (тут именно единственное число! Множественное — «ладиѭ»), а также свати, крабии «короб», богыни. В современном русском им дано окончание -(ь)я, то есть: сватья, ладья, богиня, гостья. Так что они совпали с исконными основами на -а вроде семья.

Долгота гласных основ женского рода была подмечена лингвистами ещё на заре индоевропеистики: замечено, что сами-то гласные сходны с основами мужского рода. Данный факт заставлял предполагать у слов женского рода наличие некоего исторически утраченного окончания, исчезнувшего, но вызвавшего удлинение предшествующего гласного; это и подозрительный статус многих долгих гласных в древних языках привело к созданию ларингальной теории. Таким образом «долгие» основы исторически оказываются новообразованием самого позднего общеиндоевропейского языка; основа на «ā» оказывается полученной из *o + «ларингал» и родственной основам мужского и среднего рода на «о».

Также накапливались данные, что исконно в общеиндоевропейском языке не было отдельных гласных «i» и «u», как и дифтонгов с этим элементом, и они были неслоговыми полугласными звуками «у» и «w». По этой причине их стали рассматривать как отдельный суффиксальный элемент, слившийся с «родовыми» окончаниями «-s» и «h₂». На примере основ на «u» эта система видна в довольно явном виде, а вот с основами на «i» эта система даже в самых древних языках подверглась размыву, и лишь данные хеттского, санскрита и древнеиранских языков подтверждают то, что изначально и там было аналогично — в хеттском языке у основ среднего рода всегда окончание -i (отдельных мужского и женского рода там нет, у общего окончание -is, но в нескольких словах предполагаются реликты былого -ī), а в индоиранских языках у основ мужского рода окончание исключительно *-is (долгие основы на -ī там есть, но основы среднего рода -i практически отсутствуют, перейдя в мужской или женский рода). В огромном большинстве даже древних индоевропейских языков у основ на «-i-» окончание -is стало возможным во всех родах, особенно в прилагательных, порождая сложности и путаницу.

Но гласными основами многообразие индоевропейских языков не ограничивается и в первую очередь основы на -r. В первую очередь к ним относятся слова обозначающие родство: мать-матери, дочь-дочери, сестра, брат (старослав.братръ). В огромном большинстве индоевропейских языков им легко можно найти аналоги. Предполагается что это одни из самых древних основ в языке-предке и не имели родовых окончаний и «гласных» суффиксов из-за предельной ясности значения и рода.

С ними сближается малочисленная уже в древних языках группа слов, для которых предполагается исконное отсутствие каких-либо гласных или согласных основы, например, латинские rex, lex, vox, nox, pes. Такие основы принято называть атематическими.

Очень частотны для индоевропейских языков основы существительных среднего рода с основообразующей согласной -n-, очень часто усложнённой слиянием с иными суффиксами. В русском языке их обычно можно опознать по окончаниям для среднего рода -мя (семя = лат. sēmen), и для мужского -нь (камень, корень или пень). Последние считаются исконными основами среднего рода переведенными в мужской уже на славянской почве (сравните «плетение» и «плетень», сплетённый из прутьев забор).

Очень интересна группа слов во многих древних индоевропейских языках с чередующимся в именительном-косвеным падежах согласным основы. В третьем латинском склонении есть слова iter «дорога, путешествие», iecur «икра», femur «бедро» с неожиданными окончаниями косвенных падежей (род. itinis, iecinis, feminis), пусть и вытесняемые уже к классическому периоду более «логичными» (itineris, iecinoris, femoris). Слово iecur неслучайно похоже на русское «икра» или греческое ἧπαρ, но в первом случае никаких девиаций в склонении нет, а вот греческое слово в косвенных падежах вместо -r- принимает неожиданное -to- ἥπᾰτος (род. «икры»), далее уже и в санскрите yakt — yaknaḥ. А вот это уже заставило обратить внимание на прочие греческие девианты вроде ῠ̔́δωρ-ῠ̔́δᾰτος (который подтверждается санскритом: vār-udan). Вот тут-то всплыл известный уже из ранней германистики разнобой в обозначении слова «вода» — для западногерманских языков типично окончание -er (water/wasser), а для скандинавских -n (vatn) — и он получил более-менее приемлемое объяснение. Таким образом была установлена реальность чередующихся основ -r-/-n-, для которых в индоевропеистике принято обозначение гетероклитических. В открытом позже хеттском языке это самое чередование не только было в ясном виде, но его имело куда больше слов и оно было продуктивным, и точно так же все без исключения слова с этим чередованием относились к среднему (неодушевлённому) роду. В подавляющем большинстве прочих языков эти чередования уже были малопонятными и нелогичными и за редкими исключениями по аналогии переводились в более понятные склонения; с большой вероятностью в праславянском к ним принадлежали сор (др.-греч. σκῶρ-σκᾰτός и санскрит. śakṛt-śaknaḥ) или перо. Следами такого чередования в индоевропеистике стали считаться внешне далёкие слова в разных языках вроде лат. manus «рука» и др.-греч. μαρη «рука».

То есть мы как бы имеем дело с основами среднего рода на -n-, которым в именительном падеже присваивают основу -r-, как именам родства. И это наряду с «чистыми» основами на -r, словами с «гласными» основами и чистыми основами на -n-, а также атематическими. Собственно маркировка основ прямых и косвенных падежей разными суффиксами, на которые наслаиваются прочие падежные окончания, для лингвистики не уникально и вполне норма для финно-угорских языков (например, в эрзянском им. падеж на -сь- и косвенные на -т-), в них они прозрачно этимологизируются из притяжательно-указательных местоимений. Во многих языках мира существует деление существительных на классы (по активности-пассивности: река течёт — камень лежит; одушевлённости — неодушевлённости) и разные системы склонения и согласования с глаголами. Собственно даже в современных индоевропейских языках сохранились реликты былого языкового состояния (например, различия местоимений кто? — что? или who? — what? или существование переходных-непереходных глаголов). Если сильно упрощать вопрос, то предполагается, что изначально в древнем индоевропейском языке было как бы две параллельные системы склонения/спряжения для одушевлённых и неодушевлённых вещей и было всего два падежа, но с совершенно иной маркировкой, чем в нынешних И-Е языках, — не современные абстрактные объект-субъект, а конкретные агенс-пациенс (действующий-принимающий), да ещё вдобавок переплетённые с понятиями одушевлённости-неодушевлённости. Предполагается, что -r маркировал актанта, а -n- — пациента… Что вполне логично объясняет и гетероклитическое склонение, и причину перехода -n--форманта в существительные среднего рода. То есть по логике первобытного скотовода: огонь горит и разжигать огонь — разные состояния, требующие разных маркеров, и он меняет их по разным поводам; камень — он всегда будет лежать, даже если его кинут или его скатило — -r ему не видать; мать или отец — они живые, а не истуканы, и поэтому нельзя сказать «иду к отцу», а только «отец, к нему я иду».

Из этой линии выбиваются существительные на гласные основы. Немного проливают свет на обстоятельства их появления данные морфологии древних индоевропейских языков — хеттского или индо-арийских и в меньшей степени латинского и древнегреческого — в них родительный падеж намного более употребителен, чем в современных индоевропейских языках и иногда даже употребляется в качестве подлежащего. Например, известное латинское amōr patris значит не только «любовь отца», но и «любовь к отцу». Фраза из Авесты «Kat tapaθa frayan pasvam va staoram va narinam» переводится буквально как «Которым путём прошли бы крупного скота, мелкого скота и людей», такие фразы надо понимать, как указание на избранность (партативность), и переводить: «этим путём пройдёт кто-нибудь из скота или людей». Хеттский язык шёл ещё дальше, там от существительного среднего рода образовывались слова общего рода просто-напросто переводом в родительный падеж. Например, из wastul «грех» получали wastulas «грешник, грешница». Иногда даже можно наблюдать все стадии перехода прямо на одной табличке; например, сначала «wastulas nara» (букв. «греха человек»), а дальше уже просто «wastulas».

Вообще давно обращали внимание на то, что окончание родительного падежа для большинства типов склонения можно свести к -os : -es и на сходство с частотным окончанием именительного падежа. Выше уже писали о тесной связи именительного и родительного падежа и его уникальной партативной функции. Поэтому возникло предположение, что изначально это окончание не было падежным, но позднее разделилось на отдельные родительный и именительный падежи. Предполагается, что окончание партатива стали использовать либо для образования новых слов (см. хеттский выше), либо вместо агенса тех слов, которым его «не полагалось». Если это так, то различные гласные основы — всего-навсего слившиеся с окончанием -es : -os конечные суффиксы слов (окончания могли быть только агенс-пациенс), и наиболее частотными были -o, -w, -y и, возможно, -e. Напоминаем, что категории рода изначально не было, и поэтому никаких отдельных родовых окончаний не требовалось; очень вероятно, что отдельные окончания женского рода появились весьма поздно и, возможно, окончательно закрепились уже в отдельных языках — и с этой точки зрения хетто-лувийские языки архаичны. Возможно, что очень многим словам гласные основы «присваивались» уже по аналогии, и только на самом позднем этапе И-Е языка:

  • Во многих языках сохранился целый подкласс девиантных основ на -es- (небо-небеса, чудо-чудеса). Часто интерпретируются, как слова, появившиеся на самом позднем этапе распада активного строя, только успевшие получить аугмент -es-, но не успевшие его «усвоить» и по аналогии «нарощенные» на следующем этапе уже ставшим привычным окончанием -os, но до установления его как «родового». Др.-греч. νέφος (néphos) и санскрит nábhas — слова среднего рода, несмотря на окончание.
  • Слова вроде русского «деверь» или латинского vir «муж, мужчина» явно по семантике и окончанию относятся к именам родства на -r, но склоняются по типу гласных основ (род. падеж от vir не *viris — как в pater-patris — а virī). Все имена родства изначально имели ровно один агенс и окончание -r, и лишь при установлении субъектно-объектных отношений в синтаксисе и распада активного строя они получили настоящие падежные окончания, а многие слова — ещё и гласные основы.
  • Есть как бы «составные» основы; в русском языке исторически к ним относятся слова вроде «ручей», «вдова», «статья», «свинья». Они исторически получены присоединением обычных окончаний -os или -ā к словам с исконными суффиксами на -w или -y, которые при других обстоятельствах стали бы основами на -i- или -u-. Иногда это толкуется как свидетельство того, что, возможно, не для всех основ изначально были возможны мужской и женский род, либо даже то, что основы на -i- или -u- ещё не были выделены — исходно они не были гласными и воспринимались, как аналоги позднейших атематических основ. А после были оформлены по образцу основ на -о-. В индоевропеистике их считают вариантами основ на -о- и -ā и называют основа на -jo-, -jā-, -wo-, -wā. Очень часто эти добавочные -j- и реже -w- провоцировали фонетические изменения в языках потомках: *rowkyos → *roukjos → *rukь+jь → *ručьjь, то есть изначально тут было прилагательное типа «волк-волчий», сравни с меч из meHkyos. Корень тот же, что и в «рык» (из *rewkos → *reukos → *rūkos → *rykъ) и «реветь» (из *rew-eH-te-i)[17] — быстротекущие ручьи и реки и правда часто шумят. Аналогично отношениям слух/слышно и чуть менее явно в пух/пышный. В германских языках языках сравним англ. bridge, нем. Brücke, нид. Brügge (тут классическая для германских языков перегласовка на i): данные немецкого языка говорят, что тут был изначально женский род, а значит, оно из *brugjō и сравнивается с галльским brīwā «мост», а оба последних из *bhr-H-y-ā и *bhr-eH-w-ā, сравни с *bhr-w-H (предок слова «бровь») или *bher-g-H-os (предок слова «берег»); увязать казалось бы эту путаницу помогают хеттский и тохарские языки, где этот корень употребляется в глаголах со значением «подниматься», «забираться», «возвышаться» — в этом смысле связь слов «бровь», «берег» и «мост» становится яснее, как и меткость древних индоевропейцев в словообразовании.

Выводы можно сделать банальные выводы о том, что языки-потомки редко наследуют систему праязыка «как есть», но в рассмотренной системе склонения увидели, что вполне можно обнаружить артефакты древнего состояния праязыка, но только при комплексном рассмотрении его потомков. Очень часто это помогает прояснить темные места в эволюции уже отдельных языков.

Глагол

Укажем сразу, что исходное глагольное спряжение в индоевропейских языках cохранилось в живых языках, куда хуже чем именное склонение и вдобавок хуже подается восстановлению, так как имеет не только визуально наблюдаемые окончания, но и синтаксические связи и роли, для уточнения правильности восстановления которых критически необходимы связные тексты. Современный русский и огромное большинство славянских очень сильно отличаются системами глагольного спряжения уже от старославянского языка.

1. В русском языке система спряжения характеризуется нерегулярностью, например отсутствует единообразный способ выражения вида, чаще всего для этого используются приставки, но разные и не для всех глаголов вообще возможно образовать оба вида. Есть группа глаголов с «неправильными» личными окончаниями (Глагол быть их не имеет; у глагола есть окончание первого лица ем не совпадает с привычным -у(ю) большинства глаголов; глагол дать имеет уникальные формы будущего времени 1 и 3 лица: дам,дадим,дадут.).
2. В отдельных случаях иррегулярность спряжения глаголов доходит до супплетевизма, тоесть образования видов и времен глагола от разных корней: брал-взял, есть-был, идти-шёл-ходил, ловил-поймал, клал-положил…
3. Уникальное спряжение глагола в прошедшем времени с отсутствием изменения по лицам, но наличием родов.
4. Наличие безличной формы глагола, не изменяющейся по времени — инфинитива.
5. Для освежения памяти и усвоения некоторой терминологии, вполне может быть нелишне почитать о спряжении глагола в русском[1] и древнерусском[2] языках.

Если напрямую сравнивать глагольное спряжение, например русского или английского языка, то на первый взгляд не будет каких-либо значимых сходств. В английском спряжение глагола в основном аналитическое на базе парадигмы вспомогательных глаголов to be и «to have» с минимумом окончаний, в русском абсолютно преобладает синтетическое с обилием аффиксов. Но ключевой факт — глагол to be сохранил изменение по лицам и уникальную систему спряжения.

Примечания

  1. Даже французы своих предков изображают обычными варварами в полосатых и клетчатых штанах, но тот же Цезарь упоминает о переписях населения у гельветов и даже об особом галльском варианте письма, основанного на древнегреческом алфавите.
  2. См. тж. Список Сводеша, Список Долгопольского, Список Лейпциг-Джакарта.
  3. Крупный славист и индоевропеист Антуан Мейе писал, что огромные сходства славянских языков (он считал, что даже в 20-м веке их различия не превосходят уровня наиболее отличных друг от друга диалектов немецкого или французского языка) даже создают огромные проблемы при их изучении, так как приходится тратить огромные усилия на разделение их влияния друг на друга и отделение параллелизмов в их развитии от реального сходства.
  4. См. тж. Числительное в праиндоевропейском языке.
  5. Что заставляло рыдать многие поколения студентов, ибо в латинском 97 — «septem et nonaginta», а 99 — «un de centum», буквально «7 (добавить) к 90» и «1 (вычесть) из 100». Собственно, поэтому полагается, что слова для чисел 8 и 9 возникли позже остальных.
  6. Те, кто учил французский, тут вздрогнут, ибо в нём уйма омонимов только этим и отличаются, а научиться её различать (и произносить) посложнее, чем даже долготу-краткость.
  7. В самом латинском языке это не имело никакого отражения в произношении и не влияло на соседние звуки, просто долгие произносились более напряжённо, вот и всё.
  8. Даже в латинском долгое а единственным из долгих звуков было открытым.
  9. То же самое характерно и для латышского, и для вымерших малых балтских языков. Но в также вымершем балтском языке древних пруссов внезапно оказалось-таки n в начале слова «девять», но проблема в том, что немалая часть известных записей это буквально вандальные граффити, а носители языка последние столетия были двуязычны и получали образование в немецких школах. Если кратко — есть шанс, что тут не архаика и немецко-прусский суржик пьяного селюка. Но не можем не отметить, что в балтских языках фиксировалась путаница d и n, например namas «дом» вместо damas в литовском, а также debesìs вместо nebesìs «небо».
  10. В латинском языке была такая особенность произношения: звук «а» в корневом слоге, оказавшемся при словосложении вторым (не считая приставок) и далее от конца переходит в «и», самый известный пример Ю-питер, «Небо-отец», получившееся из Jove + pater. Также напоминаем, что слова «факт», «малефик», «пацифист», бенефиция однокоренные. Также machina получилась из италийско-дорического μᾱχανᾱ́ . Другие примеры: cado — occido: accido: recido: incidō, последнее в средневековой латыни получило значение «внезапно упасть» и образовало причастие incidens и от него французское incident. В санскрите же совсем иной и более интересный случай.
  11. Укажем, что это вовсе не (п+х или б+х), а самое настоящее густое придыхание. Мы уже упоминали, что у нас есть описание фонетики древнегреческого языка и римлянами, и греками, и вдобавок они греческое слово для обозначения рода даже не переводили и всегда писали его как phrātria, буквально «братия». И напомним, что в древнегреческом, в отличие от потомков, не было звуков, похожих на «ф» и «х». Богиню Атхэну почитали не только в городе Атхэнай, но и также в городе Тхэбай (Фивы). Но даже там знали, что Эрикхтхон не ей порождён.
  12. Вдобавок тут омоним к populus «народ», который с краткой гласной и мужского рода; раньше профессура любила устраивать подляны при заданиях на перевод на таких тонкостях.
  13. В пракельтском основы на -u- были расширены окончанием -os, отметим что имя небызвестной Maedb ((Медб) этимологизируется из Medwos:Medwa, так что толкование крылышек ирландских фей и их способность насылать мороки обретают иные толкования и объяснения.
  14. Сравни с др.-греческой приставкой пан-, панта- и русским «звено» и английский knee.
  15. Особенность славянских языков в том, что основы на -i- в них не имеют среднего рода, но данные прочих индоевропейских указывают на то что изначально они имели и средний род.
  16. Но укажем, что историческую основу в латыни не всегда можно определить только по окончанию именительного падежа, поэтому в словарях часто указывается и родительный падеж. Если очень кратко — был период массового падения окончаний в именительном падеже, но потом их восстановили из косвенных падежей, но не у всех слов и не всегда корректно.
  17. w в *rew-/*row- ведёт себя двойственно — между гласными она становится согласной, а перед согласной сама переходит в гласную, как в предыдущем примере, а потом в результате фонетической эволюции аблаутные или даже обычные варианты одного корня уже просто не опознаются, как родственные. Похоже, что от нулевой степени аблаута корня *kel- «помечать, выделять» было суффиксом -(e)w образовано *(s?)klew «слух, слава», в позднем ОИЕ языке уже воспринимавшееся, как самостоятельный корень и по аналогии со сложившимися рядами получившее свои аблаутные «ступени»: *klew-, *klow-, *klōw-,*klēw-. А потом еще и разделенные родовыми окончаниями: *klew-te-i, *klow-om, *klōwā, klēw-(e)t-ā и ныне «слыть, слово, слава, клевета» уже не воспринимаются родичами, слово «клевета» небезосновательно полагается заимствованным в праславянский из вымершего древнего ИЕ языка с непрошедшей сатемизацией. Если был вариант корня с [w: s-mobile], то прекрасно этимологизировалось бы ранневизантийское склавин вместо словенин. Также среди эллинистов принято иронично переводить имя Κλεοπατρα, как Славабатя ибо родственное и именно это и значит.