Ученые выяснили, как работает музыка речи 1 23.04.2025, 10:27

Открытие может кардинально изменить подход к созданию ИИ.

Ученые из лаборатории профессора Элиши Мозеса в Институте Вейцмана в Израиле раскрывают, что интонация речи — просодия — работает как отдельный язык со своими «словами» и «правилами синтаксиса». Открытие может кардинально изменить подход к созданию искусственного интеллекта, способного понимать не только слова, но и интонации — то, как мы на самом деле передаем смысл. Работа опубликована в журнале Proceedings of the National Academy of Sciences (PNAS).

Просодия включает в себя такие характеристики, как интонация, громкость, темп и тембр голоса. Эти элементы существовали в общении задолго до появления слов — их используют и шимпанзе, и киты. У людей просодия позволяет выражать настроение, эмоции и отношение к сказанному. Например, короткая пауза или изменение тона может полностью изменить смысл фразы.

Команда исследователей под руководством лингвиста доктора Надава Маталона и нейробиолога доктора Эяля Вайнреба проанализировала огромные массивы аудиозаписей спонтанных разговоров — от телефонных до кухонных бесед. Они выделили сотни повторяющихся мелодических «слов» — коротких звуковых паттернов длительностью около секунды, и начали формировать словарь их значений и функций.

«Мы обнаружили, что каждая мелодия может выполнять разные функции — указывать, задает ли человек вопрос или делает утверждение, но при этом обычно передает одно конкретное эмоциональное состояние, например, удивление или одобрение», — отметил Маталон.

Также ученые выявили простую «грамматику» просодии: определенные мелодии следуют друг за другом по предсказуемым правилам, формируя пары, похожие на короткие предложения, каждое из которых передает новую идею.

Эти данные открывают путь к созданию нового поколения ИИ, способного понимать тонкости человеческой речи и адаптироваться под эмоциональное состояние собеседника.

