Национальный корпус русского языка стал одним из наиболее востребованных инструментов русистов во всем мире

10.04.2024



На заседании Президиума Российской академии наук обсудили вопрос фундаментальных проблем лингвистики и задачи корпусных исследований языков.

Академик РАН Владимир Плунгян доложил о современном этапе развития корпусной лингвистики — направления, получившего особенно интенсивное развитие в связи с появлением больших электронных коллекций текстов (в том числе доступных в Интернете) и технологий обработки больших данных. Особое внимание он уделил терминологии и методологии этого актуального направления научной мысли.

Национальный корпус русского языка стал одним из наиболее востребованных инструментов русистов во всем мире 1-3.jpg (jpg, 175 Kб)

В докладе была дана общая характеристика понятию «корпус языка», краткая история развития корпусной лингвистики в России и в мире, обозначены современные приоритеты этой области исследований. Корпусная лингвистика позволяет получать принципиально новые данные о языковых изменениях, а также осуществлять более эффективные исследования грамматики и лексики практически во всех релевантных для современной теории языка аспектах.

Кроме того, Владимир Плунгян сообщил о высокой востребованности главного проекта отечественной корпусной лингвистики — Национального корпуса русского языка, и его особенностей по сравнению с другими существующими корпусами.

Национальный корпус русского языка стал одним из наиболее востребованных инструментов русистов во всем мире 2-3.jpg (jpg, 206 Kб)

О развитии Национального корпуса русского языка как компьютерно-лингвистической платформы, создаваемой на базе Института русского языка им. В. В. Виноградова РАН при участии специалистов других академических институтов (прежде всего, ИППИ РАН и ИЛИ РАН), российских вузов и компании «Яндекс», рассказала профессор и руководитель Школы лингвистики НИУ ВШЭ Екатерина Рахилина. Среди основных функций НКРЯ — новые статистические инструменты, визуализация выдаваемых пользователю результатов, поиск языковых выражений по всему 1000-летнему периоду истории русского языка (от XI века до наших дней), со всеми произошедшими за это время изменениями. Это ресурс не только для лингвистов, но и для широкой аудитории. Он способствует сохранению и приумножению знаний о русском языке, делает их доступными учителям, школьникам, преподавателям русского как иностранного и переводчикам — всем, кому интересен русский язык.

В свою очередь, директор по развитию Яндекс.Учебник Кирилл Медведев обратил внимание на успешный, уже более чем двадцатилетний опыт сотрудничества по созданию Национального корпуса русского языка лингвистов академических институтов и компании «Яндекс», что способствует развитию и совершенствованию поисковой системы, а также YandexGPT.

Национальный корпус русского языка стал одним из наиболее востребованных инструментов русистов во всем мире 3-3.jpg (jpg, 234 Kб)

Директор Института языкознания РАН Андрей Кибрик рассказал о корпусных исследованиях языков Российской Федерации, которых сегодня 155, не считая диалектов. В качестве примеров он привёл корпусные ресурсы по татарскому, бурятскому, калмыцкому, чувашскому, удмуртскому, эрзянскому, адыгейскому, хакасскому, цыганскому, эвенкийскому, кетскому и другим языкам.

Член-корреспондент РАН Ирма Муллонен поделилась опытом создания и развития корпуса вепского и карельского языков. Работы ведутся исследовательским коллективом сотрудников Института ЯЛИ и Института прикладных математических исследований КарНЦ РАН.

С завершающим докладом выступил академик РАН Александр Молдован. Он отметил, что создание лингвистического корпуса непосредственно смыкается с лексикографическими задачами. Институт русского языка им. В.В. Виноградова РАН три года назад выступил инициатором масштабного проекта, который получил название «Национальный словарный фонд». Была сформулирована задача — собрать на единой информационной платформе материалы всех академических словарей русского языка и сделать их общедоступными.

Благодаря Национальному корпусу русского языка лексикографы получили прямой доступ к информации, которая раньше добывалась в течение длительного времени и никогда не достигала необходимой полноты и точности. Эти возможности решительно перестраивают технологию лексикографии, позволяя исследователю освободиться от множества рутинных операций и сосредоточиться на решении научных задач, связанных с изучением лексической семантики и норм словоупотребления.

В ходе мероприятия выступил специальный представитель Президента Российской Федерации по международному культурному сотрудничеству Михаил Швыдкой, который отметил важную роль отечественной лингвистики в продвижении и защите русского языка за рубежом как языка межнационального общения.

В завершении обсуждения вице-президент РАН академик РАН Николай Макаров подчеркнул актуальность озвученной тематики. По его словам, Российская академия наук должна выступать в роли заказчика таких исследований и работ, так как в настоящее время нет централизованного ведомства, которое могло бы взять на себя эту функцию.

Ссылка на видеозапись заседания президиума РАН доступна здесь.

Подразделы

Объявления

©РАН 2024