2010-07-11 20:31:49
ГлавнаяРусский язык и культура речи — Квалитативно-квантитативный компаративный анализ опубликованных региональных словарей русских народных говоров



Квалитативно-квантитативный компаративный анализ опубликованных региональных словарей русских народных говоров


На протяжении ряда лет на филологическом факультете, информационно-вычислительном центре и Коми Региональном центре новых информационных технологий СыктГУ производился источниковедческий анализ опубликованных региональных словарей русских народных говоров (как завершенных, так и продолжающихся — не доведенных до последней буквы алфавита) и материалов рукописных словарей и словарных картотек говоров русского языка с точки зрения возможности их интеграции в виде лингвистического программно-источникового пакета и автоматизированной лексикографической системы «ГОВОР» в рамках создания диалектной Словарной базы данных знаний Диалектологического подфонда Машинного фонда русского языка. В процессе создания Словарной БД формировалась также Текстовая БД. На Словарной и Текстовой БД были проведены некоторые численные эксперименты по построению статистик связных диалектных текстов и региональных словарей русского языка.

Теоретическое обоснование таксономического анализа лингвогеографических материалов, а также некоторые способы группирования объектов в диалектологии и классификация частных диалектных систем вероятностно-статистическим методом достаточно подробно и обстоятельно рассмотрены в работах Н.Н.Пшеничновой. Алгоритм и методика реализации квалитативно-квантитативных компаративных расчетов на этапе постановки задачи и начальных шагах численного эксперимента были созданы совместно с Э.В.Калашниковым. Поэтому в данной работе основное внимание уделялось исключительно практической стороне вопроса. Не претендуя на изобретение новых расчетных формул (соответственно не концентрируя на них внимание) и коэффициентов, была предпринята попытка воспользоваться известным математическим аппаратом для оценки квантитативных связей лексикографических объектов диалектологии и на этой базе их системно-структурной классификации.

В частности, на основе информации о совместной встречаемости вокабул Словаря русских народных говоров (под ред. Ф.П.Филина и Ф.П.Сороколетова. М.;Л., 1965-1992. Вып. 1-27), осуществляя интерактивную репрезентативную случайную выборку вокабул по категории «часть речи» с одинаковыми значениями лексем одновременно в двух и более говорах, а также с учетом явлений как синхронии, так и диахронии (но, прежде всего, синхронии), используя коэффициент парной корреляции, затем расчет показателя связи и расстояния Роджерса-Тонимото с последующей оценкой иерархической связи отдельных говоров по коэффициенту ранговой корреляции по Спирмену, позволило констатировать адекватное соответствие полученных результатов описываемого компаративного метода известной и общепринятой классификации русских диалектов, что дает основание для продолжения более глубинного компьютерного эксперимента и дальнейшей теоретической разработке и практическому использованию рассматриваемой методики анализа региональных словарей русских народных говоров (а их — в нами составленной реферативно-аннотированнои базе данных — уже свыше 200) для эффективного решения задачи классификации диалектов и выделения отдельных групп говоров с выявлением и подчеркиванием специфических черт диалектов и конкретных говоров.

Относительно полное решение рассматриваемых проблем классификации диалектов можно предполагать и планировать, на наш взгляд, лишь при вводе на машиночитаемые магнитные носители информации лексикографических данных всех 27 выпусков Словаря русских народных говоров, т.к. это позволит иметь безусловно репрезентативную базу данных для ведения глобального компаративного анализа диалектологических материалов.

В совокупности новые информационные технологии (например, гипертекст и мультимедиа) позволяют расширить представление о диалектном языке в целом и его отдельных составляющих, тем самым приводя к уточнению некоторых лексикографических данных о русском литературном языке, реально сопоставлять диалектный язык с литературным на основе математического, компьютерного, эвристического ... компаративного методов сравнительно-исторического языкознания.

Материалы компьютерной обработки словарных и текстовых материалов, таким образом, в будущем позволят на основе достоверных статистических результатов и выявленных закономерностях приступить к автоматизированному анализу семантики и синтаксиса, а установив закономерности формой словообразования, приступить к автоматизированному распознаванию морфологической структуры слов и тем самым — к автоматизированной индексации. При этом уже имеющийся опыт по использованию автоматизированных лексикографических систем в области компьютеризации диалектологических исследований позволяет смотреть в будущее с оптимизмом.

С. В.Лесников







Интересное:


Концепт «менеджмент» в американской лингвокультуре: структура и содержание
Лингвокультурологический анализ урбанонимов
Этнокультурные характеристики концепта «management» в американской и русской лингвокультурах
Речевые жанры научного академического текста
Проблема переименований внутригородских объектов
Вернуться к списку публикаций