Ученые создали компьютерную программу, которая, по их словам, поможет восстановить потерянные древние языки, использующие большие вычислительные методы данных и машинного обучения. Они уже использовали ее, чтобы реконструировать древний прото-австронезийский язык, который лег в основу полинезийского языка. Команда теперь планирует использовать ту же вычислительную модель для восстановления коренных североамериканских прото-языков.

Программа основана на установленной лингвистической теории так, что слова развиваются по ветвям родословной. Лингвисты обычно используют то, что известно как «сравнительный метод», чтобы установить отношения между языками, определяя звуки, которые меняются с регулярностью в течение долгого времени, чтобы выяснить, имеют ли они общий материнский язык.

Вычислительная модель, использующая торию вероятности, которая включает логику и статистику, чтобы предсказать исход, реконструировала более 600 прото-австронезийских языков из существующей базы данных, включающей более 140.000 слов.

Программа воспроизвела всю работу лингвистов, которую они ранее проделали вручную, с 85%-ой точностью всего за несколько часов. Используя алгоритм, известный как цепь Маркова Монте-Карло, программа перебирает наборы родственных слов из разных языков, чтобы обнаружить общий звук, историю и происхождение, а также рассчитать шансы, которые позволяют определить, являются ли слова производными от одного прото-языка.

Кроме того, программа может не только выявить развитие языков в прошлом, но также дает ключ к тому, как языки могут измениться в будущем.


Поделитесь в соцсетях: