Германские языки | Филологический аспект №12 (92) Декабрь 2022

УДК 81-139

Дата публикации 29.12.2022

Корпусный анализ коллокаций со свободным компонентом «паралимпиада» (на материале современного англоязычного медиадискурса)

Лаврентьев Матвей Алексеевич
студент 3 курса факультета иностранных языков и лингводидактики, Саратовский государственный университет им. Н.Г. Чернышевского, РФ, г. Саратов, happy-teenager@yandex.ru

Аннотация: В статье описываются результаты корпусного анализа коллокаций со свободным компонентом «паралимпиада» в современном англоязычном медиадискурсе на основе данных лингвистического корпуса News on the Web. Были классифицированы коллокаты, находящиеся на расстоянии до пяти слов в пре- и постпозиции от свободного компонента. В статье также приводится семантический анализ L1 и R1 коллокатов ключевых слов свободного компонента «паралимпиада». С учетом полученных результатов делается вывод об особенностях употреблениях коллокаций свободного компонента «паралимпиада» в современном англоязычном медиадискурсе, а также об особенностях медиадискурса в целом.
Ключевые слова: корпусная лингвистика, методы корпусной лингвистики, коллокация, корпусный анализ, семантический анализ, медиадискурс, паралимпиада.

Corpus-driven study of collocations of the noun "Paralympics" (exemplified by the modern English media discourse)

Lavrentev Matvey Alekseevich
3d year student of the department of Foreign Languages and Linguodidactics, Saratov State University, Russia, Saratov

Abstract: This article describes the results of the corpus-driven study of the collocations of the noun “Paralympics” based on the data of the contemporary English media discourse (the NOW Corpus). The article classifies the collocates positioned within five words before and after the noun “Paralympics”. The article also describes the results of the semantic analysis of L1 and R1 collocations of the keywords denoting “Paralympics”. Based on the obtained results, the conclusion is drawn about the peculiarities of the use of collocations of the noun “Paralympics” in the modern English media discourse as well as the peculiar features of the media discourse itself.
Keywords: corpus linguistics, methods of corpus linguistics, collocation, corpus analysis, semantic analysis, media discourse, Paralympics.

Правильная ссылка на статью
Лаврентьев М.А. Корпусный анализ коллокаций со свободным компонентом «паралимпиада» (на материале современного англоязычного медиадискурса) // Филологический аспект: международный научно-практический журнал. 2022. № 12 (92). Режим доступа: https://scipress.ru/philology/articles/korpusnyj-analiz-kollokatsij-so-svobodnym-komponentom-paralimpiada-na-materiale-sovremennogo-angloyazychnogo-mediadiskursa.html (Дата обращения: 29.12.2022)

В настоящее время в отечественной и зарубежной науке увеличивается количество исследований с применением методов корпусного анализа. «По мере проникновения современных информационных и коммуникативных технологий во все сферы науки возрастает востребованность лингвистических корпусов текстов при изучении различных аспектов языка» [1, с. 30]. «Так, например, методы компьютерной обработки текстов позволяют получать сведения о грамматических особенностях употребления культурно-обусловленных единиц дискурса (в частности, о прецедентных феноменах)» [2, с. 376]; «методы сбора и обработки языкового материала, содержащего данные единицы, нередко представляет трудности для исследователей» [3, с. 161].

Таким образом, сегодня корпусная лингвистика представляет собой одну из наиболее перспективных, на наш взгляд, и быстро развивающихся областей языкознания. За последнее десятилетие методы корпусной лингвистики все более активно привлекаются для проведения научных исследований, особенно с точки зрения практического использования корпусов при подготовке словарей и грамматик.

Благодаря методам, разработанным в рамках корпусной лингвистики, иное осмысление приобретают известные лингвистические понятия. Одно из них, коллокация, находится в центре настоящего исследования. Рассмотрим, каким образом коллокацию трактуют современные ученые в свете корпусного подхода. Так, например, лингвист О.С. Ахманова определяет коллокацию как «лексико-фразеологическую обусловленную сочетаемость слов в речи для реализации их полисемии» [4]. Исследователи В. П. Захаров и М. В. Хохлова [5, с. 137] рассматривают коллокацию как комбинацию двух или более слов, имеющих тенденцию к совместной встречаемости. По мнению лингвиста Е.Б. Борисовой, «коллокации – несвободные идеологические словосочетания, где свободный компонент не изменяет своего смысла, а несвободный отличается от того, который реализуется в свободных словосочетаниях» [6]. При этом под свободным компонентом следует понимать слово, которое сохраняет свое значение, в то время как несвободный компонент – слово, выбор которого зависит от ключевого компонента.

 «Главная особенность коллокации – сохранение лексического значения одним из ее компонентов при устойчивости словосочетания в целом и отсутствие или ослабление значения образности и эмоционально оценочной нагрузки» [7, с. 57]. Коллокация присутствует во всех языках и представляет собой одну из главных особенностей языка.

Изучение коллокаций в больших массивах текста способствует пониманию и осмыслению значений слов, образующих их, а также пониманию взаимообусловленности элементов словосочетания; «объединение слов в коллокации является фундаментальным для всего языкового пользования» [7, с. 57].

Применение коллокации как метода корпусного анализа предполагает не только изучение L1 или R1 коллоката (лексической единицы, стоящей непосредственно перед/после исследуемого слова), но и выявление устойчивых коллокаций (c-collocates) – наиболее часто встречаемых слов, стоящих на расстоянии пяти слов в препозиции и постпозиции без учета служебных слов к исследуемому слову.

В фокусе настоящего исследования находится корпусный и семантический анализ коллокаций со свободным компонентом «паралимпиада» на основе данных лингвистического корпуса News on the Web. Представляется важным также отметить, что в рамках данного исследования коллокация выступает не только как предмет, но и как основной инструмент, с помощью которого проводится исследование.

Исследование проводилось в несколько этапов.

На первом этапе был проведен корпусный анализ коллокатов, стоящих в препозиции и постпозиции английского слова Paralympics. Все 100 коллокатов, которые предлагает корпус, были классифицированы на основе общих семантических и грамматических признаков:

  • 1 группа (имена числительные) – 2020, 2016, 2012, 2012, 2008, 2022, 2004, 2021, 2010, 2000, 1992; 24; fifth;
  • 2 группа (города и страны, принимающие Паралимпийские игры) – Tokyo, Rio, London, Beijing, Australia, Janeiro, GB, Sochi, Pyonghang, Brazil, Athens, Russia, Paris, Japan, Sydney, Vancouver, Atlanta, Barcelona, DE;
  • 3 группа (слова и выражения, связанные с награждением, медалями) – gold, medal, medals, silver, bronze, golds, medalist;
  • 4 группа (время года проведения соревнований) – winter, summer, aug, august, sept;
  • 5 группа (Паралимпийские виды спорта) – athletics, swimming, cycling, tennis;
  • 6 группа (участники Паралимпиады) – athlete, athletes, contingent, disabled wheelchair;
  • 7 группа (названия Паралимпийских комитетов и страны, в которых они действуют) – Ireland, New Zealand, NZ, Committee, PNZ, IPC;
  • 8 группа (слова со значением «участвовать, соревноваться») – compete, competed, competing, participate, participating, championships;
  • 9 группа (слова, обозначающие победу, триумф) – won, winning;
  • 10 группа (слова, связанные с организацией и проведением Паралимпиады) – hosting, organizers, tickets;
  • 11 группа (слова, характеризующие процесс отбора к Паралимпиаде) – qualify, qualified, qualifying, qualification;
  • 12 группа (слова, характеризующие этапы при организации Игр) – scheduled, upcoming, delayed;
  • 13 группа (слова, имеющие отношения к соревнованиям в целом – как Олимпийским, так и Паралимпийским) – games, Olympics, Olympic, Paralympic, Paralympics, Para;
  • 14 группа (оставшиеся слова, которые представляется затруднительным отнести к определенной группе) – debut, coverage, jump, Commonwealth, Pisorius, banned, channel, photos.

Данная классификация позволяет проследить какие группы слов из приведенных 100 коллокатов свободного компонента «паралимпиада» являются наиболее распространенными в англоязычном медиадискурсе среди носителей языка. Согласно классификации, наибольшую популярность в дискурсе приобретают имена числительные, обозначающие год проведения Паралимпиады, а также страны и города, в которых проводятся сами соревнования.

На следующем этапе исследования был проведен анализ наиболее частотных L1 коллокатов, стоящих в препозиции английского слова Paralympics (табл. 1). В качестве возможных коллокатов были выбраны все части речи.

Представляется важным отметить, что среди представленных 10 наиболее частотных коллокатов большую часть занимают имена собственные (Tokyo, Rio, London, Beijing) и числительные (2016, 2020, 2012).

Таблица 1 - Количественная характеристика L1 коллокатов лексемы Paralympics

Коллокат

Количество

Доля, %

Tokyo

1762

0,62

Rio

1693

0,53

Winter

988

0,13

2016

597

0,02

2020

542

0,02

2012

537

0,04

London

488

0,03

Summer

384

0,02

Beijing

282

0,06

First

246

0,00

Наиболее частотным коллокатом, согласно таблице 1, является имя собственное Tokyo. Это объясняется, на наш взгляд, тем, что последние летние Паралимпийские игры проходили в Японской столице в 2021, поэтому данное событие подробно освещалось в средствах массовой информации. Название игр осталось прежним – Паралимпиада 2020, с чем и связано высокое 5 место коллоката 2020. Необходимо, по нашему мнению, отметить, что менее года назад в Китае также проходили Паралимпийские игры по зимним видам спорта, однако коллокат Beiging (Пекинский) занимает лишь 9 место в списке приведенных коллокатов. При объяснении данных результатов стоит опираться, на наш взгляд, на особенности языкового материала: тексты корпуса относятся к медиадискурсу, для которого важную роль играет хронотоп, т.е. такие экстралингвистические факторы, как время и место создания текста/ разворачивания дискурса. Соответственно, полученные результаты представляется оправданным трактовать в свете политических событий, освещавшихся в англоязычных СМИ.

За несколько месяцев до начала игр Белый дом объявил, что представительство США в Пекине будет ограниченным. Чуть позже его примеру последовали страны Запада, по той или иной причине имеющие неприязнь по отношению к Китаю. Это Великобритания, Австралия, Канада и Новая Зеландия. Необходимо отметить, что в 2008 году, когда соревнования проходили в столице Китая, Соединенные Штаты также хотели бойкотировать игры. Подобное негативное отношение к стране-хозяйке Паралимпиады также является возможным фактором низкого уровня освещения событий игр в западных СМИ.

Вторым и четвертым коллокатами соответственно являются прилагательное Rio и числительное 2016, имеющие отношение к Паралимпийским играм в Бразилии, проведенными в 2016 году. Подобную частотность приведенных выше коллокатов представляется возможным объяснить также особенностями языкового материала. Одна из основных функций медиадискурса – информационная; поэтому указание времени и места события особенно важно для этого типа дискурса. Если обратить внимание на корпус примеров (рис. 1), можно заметить, что коллокаты Rio и 2016 выполняют роль обстоятельств времени или места.

Рис. 1 – Контекст употребления коллоката Rio

 

На третьем месте по частотности употребления, согласно таблице 1, располагается прилагательное Winter. Изучив контекстовые ситуации, в которых используется данный коллокат, представляется важным отметить, что частота употребления данного коллоката во многом связана с проведением последних Паралимпийских игр в столице Китая - Пекине.

Следующим этапом исследования было изучение наиболее частотных коллокатов, стоящие в постпозиции английского слова Paralympics.

 Наиболее частотными коллокатами, которые употребляются в постпозиции исследуемого слова, являются числительные 2012 и 2016 и имя собственное Rio, которые выполняют роли обстоятельств места и времени.

Третью и четвертую позиции по частотности употребления занимают коллокаты Begin, Open. Такое частое употребление данных глаголов представляется оправданным объяснить следующим образом. Подобно некоторым языкам, где в грамматике отдельно выражается та или иная фаза действия, в англоязычном медиадискурсе особую актуальность приобретает «начальная фаза» Паралимпийских игр, которая обозначается глаголами Begin и Open в постпозиции. Таким образом, в медиадискурсе наиболее часто освещают церемонию открытия Паралимпиады, но не их ход или закрытие, по крайней мере это не представляется возможным наблюдать в исследуемом материале. Эти фазы не подвергаются закреплению в форме коллокаций.

На следующем этапе исследования в рамках проведенного анализа фактического материала были отобраны коллокации различных английских эквивалентов свободного компонента «паралимпиада». В зависимости от денотата все подобранные эквиваленты были разделены на три группы (см. таблица 2).

Таблица 2 – Ключевые слова свободного компонента «паралимпиада»

Группа

Ключевые слова

1

Paralympic Games, Paralympics, Paralympic Sports, Paralympic symbols

2

Paralympic medal, Paralympic champion, Paralympic podium

3

Paralympic sportsman, Paralympic sportsmen, Paralympic sportswoman, Paralympic sportswomen, Paralympic athlete

Дальнейшему анализу подвергались первые коллокаты по левую (L1 - имя прилагательное) и правую (R1 – глагол) стороны от подобранных эквивалентов.

Рассмотрим наиболее частотные прилагательные, стоящие в препозиции ключевых слов первой группы свободного компонента «паралимпиада». Представляется важным отметить, что для последнего ключевого слова первой группы, Paralympic symbols, корпус не находит подходящих коллокатов, поэтому были проанализированы только три первых слова данной группы.

Согласно полученным результатам, наиболее частотными коллокатами для слов первой группы являются: upcoming, consecutive, successful, successive, Sochi, ongoing, subsequent, Malaysian. Представляется оправданным разделить данные коллокаты на категории на основе некоторых признаков. Так, например, прилагательные upcoming, consecutive, successive, ongoing, subsequent представляется оправданным объединить в одну категорию, поскольку они употребляются либо для освещения текущих соревнований, либо для описания предстоящих игр, т.е. данные коллокаты характеризуют ход проведения Паралимпиады.

Ко второй категории относятся коллокаты Sochi и Malaysian, обозначающие конкретное место проведения игр.

Последний коллокат, successful, формирует третью категорию коллокатов, выражающих эмоциональную оценку.

Согласно полученным результатам, при анализе семантически схожих ключевых слов первой группы удалось установить, что при описании самого события «паралимпиада» в англоязычном медиадискурсе главенствующую роль занимают L1 коллокаты, служащие для выражения хода соревнований (5 из приведенных выше 8 коллокатов), в то время, как прилагательные, обозначающие место проведения Паралимпийских игр занимают второстепенную роль. Менее частотными и разнообразными для англоязычного медиадискурса оказываются прилагательные, выражающие экспрессивность, положительную эмоциональную окраску.

Рассмотрим наиболее частотные глаголы, стоящие в постпозиции ключевых слов первой группы.

Представляется важным отметить, что корпус находит гораздо меньшее количество коллокатов среди глаголов в постпозиции, чем среди прилагательных в препозиции. Кроме того, для ключевого сочетания Paralympic symbols корпус не находит глаголов-коллокатов в постпозиции так же, как и прилагательных-коллокатов в препозиции.

При анализе языкового материала для слов данной группы нами было замечено, что более 60% от числа наиболее частотных коллокатов составляют глаголы, указывающие на предстоящее начало Паралимпийских игр. В категорию таковых входят глаголы: begin, open, began, follow, opened, starting, scheduled, arrive, begin, kick off, kicked off. R1 коллокаты, обозначающие закрытие и окончание Паралимпиады, составляют значительно меньшее число. Данная категория представлена глаголами ended, finish, conclude, finishing. Полученные результаты представляется целесообразным обосновать, опираясь на свойства и признаки медиадискурса, где особую актуальность приобретает «начальная фаза» Паралимпийских игр, которая обозначается глаголами Begin,Open, Kick off”, “Start в постпозиции. Таким образом, в медиадискурсе наиболее часто освещают церемонию открытия Паралимпийских игр, но не их ход или закрытие, как отмечалось выше.

В отдельную категорию, по нашему мнению, можно отнести глагол postponed. Его употребление в англоязычном медиадискурсе во многом связано с переносом летней Паралимпиады в Токио с 2020 на 2021 из-за пандемии.

Важно, на наш взгляд, также отметить, что в англоязычном медиадискурсе при освещении событий Паралимпиады описанию слов с оценочным компонентом отводится незначительная роль. Так, например, среди представленных выше коллокатов для слов второй группы только глагол sparked выражает эмоциональную оценку.

Далее обратимся ко второй группе ключевых слов, в которую входят Paralympic medal, Paralympic champion, Paralympic podium.

На основе данных корпуса все L1 коллокаты для слов данной группы представляется оправданным также разделить на категории. Прилагательные Australian, African, Dutch можно объединить в одну категорию как коллокаты, выражающие принадлежность к определенной нации, стране или расе. Согласно полученным результатам, особое место в англоязычном дискурсе отводится коллокатам, указывающим на количество побед в прошедших Паралимпийских соревнованиях (five-time, double, six-time, three-time, four-time, two-time, 11-time, 14-time).

Гораздо меньшую роль в англоязычном медиадискурсе играют прилагательные individual и overall, указывающие на принадлежность награды к личным или командным успехам, ведь, как известно, на Паралимпийских играх существует личный и командный зачеты. Представляется оправданным утверждать, что данным прилагательным в англоязычном медиадискурсе отводится второстепенная роль, чем коллокатам, указывающим на количество побед, особенно если сравнивать частоту их употребления. Таким образом, важное место в медиадискурсе приобретает именно количество «золотых» подиумов.

Провести анализ R1 коллокатов для ключевых слов данной группы представляется затруднительным, в виду малого количества возможных коллокатов и низких показателей их частотности употребления, а также невозможности их группировки на основе каких-либо общих признаков. К единственной возможной категории можно отнести глаголы won, snagged, указывающие на победу в соревнованиях.

Обратимся к последней третьей группе ключевых слов (Paralympic sports(wo)man, Paralympic sports(wo)men, Paralympic athlete). Согласно данным корпуса, наиболее распространенными коллокациями являются national, exemplary, Nigerian, African, Canadian, female, jailed. Представляется целесообразным также разбить данные коллокаты на категории. Так, например, к первой категории можно отнести national, Nigerian, African, Canadian, объединенные на основе принадлежности участника Паралимпиады к определенной стране, нации или расе. Таким образом, национальная принадлежность спортсмена важна для англоязычного медиадискурса. В отдельную категорию также представляется возможным включить прилагательное exemplary, выражающий положительную эмоциональную оценку.

Важную роль в медиадискурсе также играет гендерный фактор, что объясняется наличием прилагательного female в списке частотных коллокатов. Как известно, женские виды спорта появились на Олимпийских соревнований около 100 лет назад. Однако употребление коллоката female позволяет судить о том, что женская гендерная принадлежность особенно подчеркивается при освещении Паралимпийских игр в англоязычном медиадискурсе.

Довольна интересна специфика употребления коллоката jailed. Анализ контекста его употребления показал, что данный коллокат указывает на событие, произошедшее в 2013 году, когда шестикратный паралимпийский чемпион из ЮАР Оскар Писториус был осужден за «случайное» убийство девушки. Таким образом, сенсационные события закрепляются в форме коллокаций в англоязычном медиадискурсе, что представляется возможным расценивать их как особенность данного типа дискурса.

Проведение анализа «правых» коллокатов для ключевых слов данной группы, как и предыдущей, представляется затруднительным, в виду уже указанных выше причин.

Таким образом, анализ 100 наиболее частотных L5-R5 коллокатов свободного компонента «паралимпиада», показал, что при освещении основных событий Паралимпийских игр важную роль в английском медиадискурсе приобретают числительные, обозначающие год проведения Паралимпиады, а также страны и города, принимающие соревнования. Данное утверждение было доказано посредством проведения исследования L1 и R1 коллокаций свободного компонента «паралимпиада». Проведенный качественный анализ языкового материала позволяет заключить, что самыми частотными «правыми» и «левыми» коллокатами являются Tokyo и 2012 соответственно.

Семантический анализ фактического материала показал, что среди L1 коллокатов в англоязычном медиадискурсе особая роль уделяется прилагательным, указывающим на ход соревнований (upcoming, ongoing, consecutive, successive, subsequent); обозначающим принадлежность к стране или расе (African, Canadian); указывающим на количество побед в прошедших Паралимпийских соревнованиях (five-time, double, six-time, three-time и т.д.). Важную роль в медиадискурсе также играют гендерный фактор (употребление прилагательного female) и фактор резонанса (употребление прилагательного jailed).

В ходе семантического анализа также удалось установить, что среди «правых» коллокатов в англоязычном медиадискурсе важную роль выполняют глаголы, указывающие на начало Паралимпийских игр (begin, open, kick off, arrive, follow), в то время как коллокаты, обозначающие окончание Паралимпиады (ended, finish, conclude), составляют значительно меньшее число. Кроме того, в ходе исследования было выявлено, что анализ R1 коллокатов для слов второй и третьей группы провести затруднительно, в виду достаточно малого количества коллокатов и низких показателей частотности их употребления, а также невозможности их объединения по каким-либо общим признакам.


Список литературы

1. Матыцина, М. С. Англоязычный дискурс иммиграции в аспекте корпусной лингвистики / М. С. Матыцина, Т. Григорянова // Вестник Волгоградского государственного университета. Серия 2: Языкознание. – 2021. – Т. 20. - №6. – С. 29-41.
2. Золотарев, М. В. Грамматические структуры с прецедентными феноменами в современном американском молодежном дискурсе / М. В. Золотарев // Известия Саратовского университета. Новая серия. Серия: Филология. Журналистика. – 2018. – Т. 18. – № 4. – С. 376-380. – DOI 10.18500/1817-7115-2018-18-4-376-380.
3. Золотарев, М. В. Развитие когнитивного потенциала прецедентного антропонима / М. В. Золотарев, И. В. Привалова // Вестник Волгоградского государственного университета. Серия 2: Языкознание. – 2020. – Т. 19. – № 2. – С. 159-170. – DOI 10.15688/jvolsu2.2020.2.14.
4. Ахманова, О. С. Словарь лингвистических терминов / О.С. Ахманова. – М.: издательство «советская энциклопедия», 1966. – 608 с.
5. Захаров, В. П. Анализ эффективности статистических методов выявления коллокаций в текстах на русском языке / В. П. Захаров, М. В. Хохлова // Компьютерная лингвистика и интеллектуальные технологии - труды международной конференции "диалог-2010" - Москва: Российский государственный гуманитарный университет. – Т. 9 (16). - 2010. - с. 137-143.
6. Борисова, Е. Г. Коллокации. Что это такое и как их изучать / Е. Г. Борисова. - 2-е изд., стер. - М. : Филология, 1995. - 49 с.
7. Павельева, Т. Ю. Изучение коллокаций на основе лингвистических корпусов текстов / Т. Ю. Павельева // Вестник Тамбовского университета. Серия: Гуманитарные науки. – 2016. – Т. 21. - №3-4 (155-156). – С. 56-61.

Расскажите о нас своим друзьям: