веб-сервис

PHONOTEXT


Система автоматического выявления и измерения звуковой связности текста
Automatic Measuring of Sound Cohesion of the Text (the "Phonotext" Web-Service)
Создана при поддержке РФФИ (грант № 17-04-12022)
Начать работу с русской версией Начать работу с латинской версией

Реализованный в 2017-2018 гг. при поддержке РФФИ проект 17-04-1202 (сокращенно - проект "Фонотекст") был нацелен на создание компьютерной программы для автоматического выявления звуковых повторов и измерения звуковой связности текста в формате общедоступного веб-сервиса "Фонотекст". В настоящее время веб-сервис «Фонотекст» представляет собой полнофункциональный научно-исследовательский и научно-познавательный интернет-ресурс для автоматического распознавания звуковых повторов в тексте и измерения звуковой связности речи. Информационный продукт является результатом работы коллектива проекта по руководством автора концепции проекта д.ф.н. Г.В.Векшина при участии д.ф.н. Н.В.Перцова и группы, обеспечившей лингвистическую и программную разработку технологии.

Концептуальную лингвистическую основу проекта составляет силлабоцентрическая версия звуковой организации текста, разработанная на рубеже веков и позволяющая рассматривать повторы согласных и гласных в их слоговом единстве и соединении с ритмической и композиционно-синтаксической структурой речи, - единственная на настоящий момент лингвистическая концепция и методика, доказывающая свою эпистемологическую эффективность и объясняющую способность для анализа таких речевых явлений, как аллитерация, инструментовка, эвфония и т.п. В качестве базовой единицы текстообразования, образуемой в силу звукового уподобления сегментов речи, рассматривается фоносиллабема и ее варианты – фоносиллабы, которые и выступают основным объектом автоматического распознавания.

Созданная на этой основе программная разработка – веб-сервис «Фонотекст» – дает возможность представления целостной картины звуковой организации текста путем ее автоматического анализа, с возможностью дальнейшего соотнесения выделенных повтором сегментов текста с его ритмической и морфосинтаксической структурой. Программа (веб-сервис) позволяет регистрировать звуковые повторы и определять их функциональные возможности независимо от степени осознанности данных повторений носителем языка, выявлять все актуально и потенциально значимые звуковые связи в тексте. Важнейшим элементом функционала программы является способность визуализации квантитативных данных, в том числе полученных на основе сопоставления характеристик звуковой организации различных текстов. Таким образом открывается возможность автоматической обработки большого массива текстов различной природы и их компаративного изучения, при выводе показателей в виде диагармм и графиков. Для обеспечения работы программы по автоматической обработке речи создана специальная система ввода текстов и составлены актуальные корпуса (в настоящее время – более 1000 текстов корпуса русской поэзии и более 1000 газетных текстов). Таким образом обеспечена возможность сопоставительного изучения звуковой организации текстов, позволяющая, в частности, впервые, с опорой на фронтальное структурное и квантитативное автоматическое исследование речи, говорить о существенных различиях в организации поэтических (стихотворных) и непоэтических (прозаических) тестов на композиционно-звуковом уровне, а также о сходствах и различиях поэзии и художественной прозы, с одной стороны, и художественной и нехудожественной прозы – с другой. Программа открывает возможность дальнейшего выделения и оценки желательных и нежелательных (в соответствии с прагматикой текста, конкретного типа и жанра речи) звуковых повторений, регистрировать связанные созвучием единицы текста более высокого порядка (слова, словосочетания, предложения, ритмико-синтаксические единства, композиционные стиховые единства (строки, строфы), измерять и регулировать активность звуковых повторов и степень эффективности звукового воздействия текста.

Разработанный и действующий веб-сервис позволяет лингвистам автоматически находить и размечать в тексте звуковые повторы, определять их силу. Функционал программы предусматривает возможность графического отображения как общей картины звуковых повторов, так и звуковых цепочек определенных типов, а также сохранения полученной разметки в файле и последующей загрузки ее из файла.

Выявленная картина внутритекстовых звуковых связей может служить важным материалом для филологического и психолингвситического изучения. Программа может быть востребована как филологами (лингвистами, стиховедами, текстологами и др.), так и психолинвистами, нейролингвистами, специалистами в сфере лингвистической прагматики, использована для обработки данных об индивидуальных характеристиках текста, в частности с целью установления их авторства, может быть востребована в сфере лингвокриминалистики, применена для оценки звуковой спаянности речевых конструкций в заголовках, рекламных слоганах и политических лозунгах, сочетаниях собственных имен – в любых высказываниях и текстах, требующих оценки и контроля эффективности их звукового и звукосмыслового воздействия.

Разработанная методика, с учетом особенностей английской морфонологии и психофонетики, позволила создать действующий базовый аналог веб-сервиса «Фонотекст» для анализа англоязычных текстов, а в перспективе открывает возможности применить алгоритмы выявления звуковых повторов в русском тексте к текстам на любых индоевропейских языках. Основные алгоритмы работы программы описаны в подготовленных и уже вышедших в свет публикациях коллектива проекта – монографии, серии научных статей и докладов на конференциях по филологии и компьютерной лингвистике и уже заслужила высокую оценку в научном сообществе и среди пользователй веб-сервиса «Фонотекст» в его русскоязычной и англоязычной версиях.