Корпусная лингвистика

We use cookies. Read the Privacy and Cookie Policy

Корпусная лингвистика

Лексикографический и квантитативный подходы сошлись в так называемой корпусной лингвистике, которая основывается на использовании корпуса, т. е. большого объема языкового материала, извлеченного из разнообразных источников и сведенного в компьютеризованную систему (например, Cobuild Bank of English включает более 500 млн словоупотреблений). У исследователей открывается доступ к большому объему текстов, что позволяет избежать неправомерных обобщений о состоянии языка, которые возможны при работе с ограниченным и разрозненным эмпирическим материалом. [Гвишиани, Герви 2001].

Огромный и постоянно пополняющийся массив языкового материала, фиксирующий накопление тех или иных свойств, позволяет увидеть то, что традиционным словарям не под силу. Выясняется, что многие слова и словосочетания имеют тенденцию появляться в определенном семантическом окружении (так, глагол happen, как правило, ассоциируется с неприятными событиями). Стало очевидным, что между словами существуют семантические ассоциации, своего рода «семантическое притяжение». Замечено, что каждое слово тяготеет к определенному месту или позиции в составе предложения (так, заурядное слово sixty ‘шестьдесят’ в 2/3 случаев встречается в тематической части предложения, в 71 % контекстов является первым словом в предложении, а в 10 % – первым словом в тексте). Корпусные исследования аргументируют тезис, что семантические и функциональные особенности слов находят отражение в частотности их употребления. Корпусный подход постулирует «фразовость и контекстуальность языка» [Гвишиани, Герви 2001].

Корпусная лингвистика сосредоточила своё внимание ка грамматике выбора, отражающей установившуюся практику использования слов, на грамматике речи. Корпусный подход используется и при решении традиционных вопросов, например, разграничения полисемии и омонимии.

Для лингвокультуроведов важным представляется вывод пионеров корпусной лингвистики о том, что это направление пересекается с когнитивными исследованиями, поскольку большинство речевых решений говорящего продиктовано определенной культурой и зависит от нашего знания и понимания мира. Отсюда вытекает идиоматический принцип языка, под которым понимают специфические и уникальные черты языкового употребления, выводимые из привычек, традиций, навыков, норм и стандартов, принятых говорящими в построении. В качестве примера приводится различие французского и немецкого языков: в ряде случаев в немецком представлены три или четыре специальных глагола, соответствующих одному общему наименованию во французском языке [Гвишиани, Герви 2001: 50–51].

Данный текст является ознакомительным фрагментом.