Теория и методика обучения и воспитания (по областям и уровням образования) | Мир педагогики и психологии №01 (114) Январь 2026

УДК 372.881.111.1.

Дата публикации 31.01.2026

Совершенствование умений аудирования на иностранном языке с применением нейросетевых технологий

Дроздова Наталья Александровна
доцент кафедры немецкой и французской филологии, кандидат педагогических наук, доцент, Северный Арктический федеральный университет имени М.В. Ломоносова, РФ, г. Архангельск, n.parilova@narfu.ru
Макковеева Юлия Александровна
доцент кафедры английской филологии, языков северных стран и лингводидактики, кандидат педагогических наук, доцент, Северный Арктический федеральный университет имени М.В. Ломоносова, РФ, г. Архангельск, u.makkoveeva@narfu.ru

Аннотация: В статье исследуется проблема обучения аудированию в контексте преподавания иностранных языков с учётом современных цифровых технологий. Цель работы — проанализировать типологию аудирования (учебное/коммуникативное, интенсивное/экстенсивное), его фазную структуру и показать возможности нейросетевых технологий в создании персонализированных аудиоматериалов. Актуальность обусловлена необходимостью адаптации методик аудирования к цифровой образовательной среде. Новизна заключается в систематизации принципов составления промптов для генерации учебных диалогов и в сравнительном анализе нейросетей для синтеза речи (FreeTTS, Narakeet, Zvukogram) с точки зрения их применимости в лингафонном обучении. Показано, как сочетание генеративных моделей и синтеза речи позволяет дифференцировать задания по уровню, тематике и акценту, повышая эффективность формирования навыков восприятия устной речи.
Ключевые слова: аудирование, речевая деятельность, учебное аудирование, коммуникативное аудирование, фазы аудирования, нейронная сеть, промпт, синтез речи, персонализация обучения, искусственный интеллект.

Improving listening skills in a foreign language using neural network technologies

Drozdova Natalia Alexandrovna
associate professor of the Department of German and French Philology, Candidate of Pedagogical Sciences, Russian Federation, Northern Arctic Federal University, Arkhangelsk
Makkoveeva Julia Alexandrovna
associate professor of the Department of English Philology, Nordic Languages and Pedagogics, Candidate of Pedagogical Sciences, Russian Federation, Northern Arctic Federal University, Arkhangelsk

Abstract: This article explores the problem of teaching listening in the context of foreign language teaching, taking into account modern digital technologies. The aim of the work is to analyze the typology of listening (academic/communicative, intensive/extensive), its phase structure, and to demonstrate the potential of neural network technologies in the creation of personalized audio materials. The relevance of this work lies in the need to adapt listening methods to the digital educational environment. The novelty lies in the systematization of principles for composing prompts for generating educational dialogues and in the comparative analysis of neural networks for speech synthesis (FreeTTS, Narakeet, Zvukogram) in terms of their applicability in language lab teaching. It is shown how the combination of generative models and speech synthesis allows for the differentiation of tasks by level, topic, and accent, increasing the effectiveness of developing oral speech perception skills.
Keywords: Listening, speech activity, educational listening, communicative listening, listening phases, neural network, prompt, speech synthesis, personalized learning, artificial intelligence.

Правильная ссылка на статью

Дроздова Н.А., Макковеева Ю.А. Совершенствование умений аудирования на иностранном языке с применением нейросетевых технологий // Мир педагогики и психологии: международный научно-практический журнал. 2026. № 01 (114). Режим доступа: https://scipress.ru/pedagogy/articles/sovershenstvovanie-umenij-audirovaniya-na-inostrannom-yazyke-s-primeneniem-nejrosetevykh-tekhnologij.html (Дата обращения: 31.01.2026)

В процессе аудирования слушающий сталкивается с комплексом трудностей — от лингвистических и экстралингвистических до психологических. Ключевой психологический аспект заключается в полной зависимости слушающего от говорящего и особенностей его речи. Примечательно, что дистантное аудирование позволяет вернуться к материалу и прослушать его ещё раз, в то время как контактное аудирование такой возможности практически не даёт.

В зависимости от выбранного критерия существуют различные подходы к классификации аудирования. Одной из распространённых типологий является разделение по цели и способу организации процесса. Согласно ей, выделяют два ключевых типа: учебное (guided listening) и коммуникативное (communicative listening) аудирование. Учебное направлено на развитие лексико‑грамматических навыков, речевого слуха и способности осмыслять и анализировать услышанное. Оно предполагает возможность повторного прослушивания и детального разбора языкового материала. Коммуникативное аудирование фокусируется на непосредственном восприятии и понимании устной речи.

В зависимости от поставленной задачи, выделяются следующие виды коммуникативного аудирования:

Аудирование с извлечением основной информации (skim listening);
Аудирование с полным пониманием содержания и смысла (listening for detailed comprehension);
Аудирование с выборочным извлечением информации (listening for partial comprehension);
Аудирование с критической оценкой (critical listening) [1, с. 162].

В зависимости от цели аудирования на занятиях по языку принято выделять интенсивное (детальное) аудирование и экстенсивное аудирование. Интенсивное аудирование направлено на понимание каждой детали услышанного. Это требует концентрации внимания на всех аспектах речи, включая словарный запас, грамматические структуры, произношение и тон говорящего. Экстенсивное аудирование, в отличие от интенсивного, направлено на получение общего представления о содержании. Также экстенсивное аудирование делится на селективное (избирательное) аудирование и глобальное аудирование. Селективное (избирательное) аудирование, предполагает концентрацию внимания на определенных деталях, интересующих слушателя, остальная информация игнорируется. Глобальное аудирование предполагает понимание основной идеи и общей темы сообщения.

Помимо внутренних механизмов, аудирование, как и любой другой вид речевой деятельности, обладает и своей своеобразной горизонтальной структурой. И.А. Зимняя выделяет в аудировании три фазы: мотивационно-побудительную, аналитико-синтетическую и исполнительную [2, с. 162].

Первая фаза - мотивационно-побудительная приводится в движение коммуникативной задачей. Перед началом прослушивания преподаватель информирует обучающихся о том, что они будут слушать. Мотив создаётся, как правило, интересной темой произведения, беседой об авторе, подачей материала.

Вторая фаза - аналитико-синтетическая – основная часть аудирования. Именно здесь происходит восприятие и переработка информации, поступающей по слуховому каналу. С помощью механизмов речевого слуха, слуховой памяти, вероятностного прогнозирования, артикулирования происходит умозаключение – результат понимания.

Третья фаза аудирования – исполнительная или реализующая. Важно отметить, что эта фаза речевой деятельности может быть внешне выраженной и внешне невыраженной. В реальном общении результат аудирования, то есть понимание или непонимание, так и остаётся, как правило, скрытым, ненаблюдаемым. В учебной ситуации понимание необходимо сделать наблюдаемым с тем, чтобы обучать этому виду речевой деятельности. Для этого учитель должен получать обратную связь от учащихся — как в вербальной, так и в невербальной форме — чтобы оценить, насколько успешно была достигнута коммуникативная цель [3].

Таким образом, понимание различий в условиях восприятия, целях, этапах восприятия и степени детализации позволяет преподавателю эффективно выстраивать процесс обучения иностранному языку c акцентом на критическое осмысление услышанного.

Не секрет, что современный образовательный процесс в настоящее время трудно представить без использования искусственного интернета. Он прочного обозначил свои границы в образовании и продолжает это делать и дальше. Современные технологии все чаще используются для персонализации учебного процесса, при котором искусственный интеллект учитывает индивидуальные потребности и особенности каждого обучающегося. При таком подходе обучающийся делает запрос на интересующий его учебный материал и получает набор готовых учебных материалов и упражнений, которые максимально соответствуют его учебным целям, уровню языковой подготовки и темпу обучения [4: с. 45–52].

В последние годы технологии генерации текста с использованием нейросетей стремительно развиваются и находят всё более широкое применение в образовании. Создание реалистичных, логичных и стилистически выверенных текстов с оптимизацией временных затрат учителя теперь возможно благодаря достижениям в области искусственного интеллекта и машинного обучения. Чтобы понять механизмы работы таких систем и эффективно применять их на практике, необходимо освоить базовые понятия, лежащие в основе этих технологий.

Ключевыми среди них являются термины искусственный интеллект, нейронная сеть и промпт, так как именно они описывают фундаментальные принципы функционирования языковых моделей. Рассмотрим каждое из этих понятий более подробно.

Искусственный интеллект (artificial intelligence) (ИИ) - технология моделирования процессов познания и мышления человека с помощью вычислительных устройств на основе больших данных и машинного обучения [Искусственный интеллект в обучении].

Нейронная сеть (neural network) (нейросеть) - тип машинного обучения, при котором компьютерная программа имитирует работу человеческого мозга (передача сигналов нейронами в мозге): в нейросети информацией обмениваются вычислительные элементы [5, с.93].

Промпт - это запрос, с помощью которого ставится задача языковой модели [6, с. 8].

Для получения точных результатов при разработке промпта необходимо придерживаться нескольких простых принципов: ясность, ёмкость, логичность и наглядность.

Принцип ясности: чем проще сформулирован вопрос, тем больше шансов, что нейросеть даст на него понятный и применимый ответ.
Принцип ёмкости: необходимо найти баланс между лаконичностью фразы и заложенным смыслом. Лаконичность формулировок помогает нейросети лучше фокусироваться на сути вопроса, не теряя основную мысль и не забывая её при диалоге.
Принцип логичности: важно соблюдать последовательную структуру запроса, например, разделить задачу и условие, а также выделить логические блоки; избавиться от логических повторов, одинаковых по смыслу частей запроса; структурировать задачу в виде списка.
Принцип наглядности: для того, чтобы нейросеть точно поняла задачу, рекомендуется предоставить ей пример. Как правило, сначала формулируется задача, а затем приводится пример ее выполнения. Пример может отображать логику запроса, а также желаемый формат его представления. В большинстве случаев, достаточно просто включить пример в запрос. Однако, для повышения эффективности, рекомендуется явно указать на необходимость использования примера, применяя фразы, такие как «используй пример», «на основании примера» и подобные.

4 основные составляющие промпта – контекст, описание задачи, формат ответа, требование к результату. Создание промпта можно сравнить с формулированием технического задания. Необходимо задать четкие параметры и критерии, которым должен соответствовать итоговый результат. Обычно, хороший промпт включает в себя четыре ключевых элемента:

Контекст - описывает роль или поведение, которое должна принять нейросеть;
Задание или вопрос, в соответствии с которым нейросеть сформирует ответ;
Формат ответа нейросети на запрос, определяет структуру и вид представления результатов, генерируемых нейросетью (например, список, эссе, код);
Требования к ответу (дополнительные ограничения или пожелания к содержанию и качеству ответа);

Однако, при разработке промпта использование всех вышеуказанных разделов не является обязательным и зависит от специфики поставленной задачи. Если для задачи содержание важнее формы, то определение формата или требований к ответу может быть опущено. Если нейросеть предоставляет неполные или не соответствующие ожиданиям результаты, в таком случае стоит скорректировать промпт, сделав уточняющий запрос, указав на допущенные неточности.

Для иллюстрации разницы между эффективным и неэффективным промптом целесообразно провести сравнительный анализ на основе конкретных примеров.

Пример неэффективного промпта: «Ты – преподаватель английского языка у студентов 1 курса. Придумай диалог для студентов про известных людей.»

Пример эффективного промпта: "Представь, что ты - преподаватель английского языка на 1 курсе, работающий по учебнику "Upstream Intermediate". Разработай текст для финального аудирования в конце модуля 2.

Параметры текста:

Тип: Диалог (между двумя друзьями).
Длина: 200-250 слов.
Уровень: B1 (с уклоном в B2).
Тема: Great people and legends.
Грамматика (обязательное использование): Past Simple (regular verbs, irregular verbs), Past Continuous, Wh-questions in the Past Simple, Wh-questions in the Past Continuous, Present Perfect.
Лексика (обязательное использование): settled, won, empire, voyages, accurate, incredible, discovered, lifetime, locals, legend, invented, talented, explore, real passion.
Формат ответа: Предоставь текст в виде диалога с четким указанием говорящих (Speaker 1, Speaker 2) и реплик.

Дополнительные указания: "Диалог происходит между двумя друзьями, которые готовятся к контрольной работе по истории"

При сравнении двух промптов четко видна разница, во втором, эффективном промпте соблюдены все правила написания промптов, а именно указана роль, которую должна принять нейросеть; задание, в соответствии с которым нейросеть сформировала ответ; задан формат ответа нейросети на запрос, который определяет структуру и вид представления результатов; также подробно прописаны требования к ответу.

Правила составления промптов одинаковы для всех моделей, созданных для генерации текста. Существует широкий спектр нейросетей для генерации текста, доступных для использования в образовательном процессе. Наиболее широко известными и доступными являются, например, ChatGPT, Perplexity, Gemini 3 Pro, DeepSeek.

Необходимо подчеркнуть, что все вышеупомянутые нейросети для синтеза речи поддерживали выбор британского акцента для генерируемой голосовой модели. Указанная функциональная характеристика повышает практическую ценность данных инструментов для создания учебных материалов.

Помимо нейросетей, предназначенных для генерации текстового контента, активно развиваются и модели синтеза речи. Эти нейросети позволяют преобразовывать текстовые данные — включая сценарии, диалоги и иные вербальные конструкции, созданные генеративными моделями, — в звучащую речь, максимально приближенную к естественной. Нейросети для синтеза речи представляют собой эффективный инструмент для педагогической практики: они позволяют преподавателям создавать аудиоматериалы с минимальными затратами времени и технических ресурсов, озвучивать учебные тексты без привлечения сторонних ресурсов или носителей языка, что особенно актуально при обучении иностранным языкам. Использование таких технологий способствует повышению мотивации обучающихся, расширяет репертуар учебных форматов и поддерживает инклюзивный подход в образовании. Рассмотрим и проанализируем несколько доступных и бесплатных нейросети для синтеза речи.

Нейросеть FreeTTS представляет собой одну из самых доступных нейросетей для синтеза речи. Ее доступность обусловлена низким уровнем реалистичности звучания голосов. Несмотря на это, данная нейросеть предоставляет функциональность, сопоставимую с более продвинутыми аналогами, например, экспорт аудиофайла, возможность изменения скорости речи, разнообразие голосовых моделей. При этом, для доступа к функционалу нейросети требуется регистрация.

Анализ характеристик нейросети Narakeet демонстрирует высокий уровень реалистичности синтезируемой речи и разнообразие доступных голосовых моделей, что позволяет рассматривать её как потенциальную альтернативу ElevenLabs. Также нейросеть Narakeet –доступна пользователям из России и работает без использования VPN. Бесплатная версия данной нейросети предоставляет ознакомительный период без регистрации, в рамках которого пользователям доступно ограниченное число операций синтеза речи, а именно 20.

Нейросеть Zvukogram можно использовать бесплатно, однако при использовании данной нейросети работает система токенов. До регистрации доступно 5 токенов, после регистрации – 10. Токены – это как «топливо» для работы нейросетей и при каждой озвучке они списываются. Тарифы на озвучку просты и доступны: обычный голос 1000 символов - от 1,2 токенов, pro голос 1000 символов - от 6 токенов. На 10 токенов после регистрации можно озвучить 9 000 символов текста обычными голосами и 1800 символов текста pro-голосами. Если необходимо озвучить короткие тексты, то бесплатных 10 токенов хватит надолго. Когда токены будут потрачены, их можно восполнить - 1 токен равен 1 рублю.. Ключевой особенностью Zvukogram является поддержка синтеза диалогов, что значительно расширяет возможности использования по сравнению с вышеупомянутыми нейросетями, которые ограничиваются озвучиванием только монологов.

Это наиболее часто используемые сервисы для создания аудиофайлов в настоящее время, хотя уже появляются все более усовершенствованные варианты.

Важно отметить, что все упомянутые нейросети для синтеза речи позволяют выбирать акцент (британский, американский, австралийский) для создаваемой голосовой модели. Данное функциональное преимущество повышает полезность инструментов в образовательной сфере — с их помощью можно вносить разнообразие в уроки иностранного языка и разрабатывать персонализированные задания, учитывающие языковую подготовку и опыт студентов.

Список литературы

1. Kumar, R., Singh, P. Neural Networks in Language Education: Enhancing Listening Skills through Adaptive Feedback / R. Kumar, P. Singh // Journal of Educational Technology & Society. — 2024. — Vol. 27, No. 1. — P. 88–102. — URL: (дата обращения: 20.01.2026). — Текст : электронный.
2. Зимняя, И. А. Психология обучения неродному языку (на материале рус. яз. как иностранного) / И. А. Зимняя. — Москва : Русский язык, 1989. — 219, [2] с. — ISBN 5‑200‑00793‑3. с. 162
3. Евстигнеев, М. Н. Принципы обучения иностранному языку на основе технологий искусственного интеллекта [Электронный ресурс] / М. Н. Евстигнеев // Вестник Тамбовского университета. Серия: Гуманитарные науки. – 2024. – Т. 29, № 2. - С. 309-323. – Электрон. Дан. – Режим доступа: https://cyberleninka.ru/article/n/printsipy-obucheniya-inostrannomu-yazyku-na-osnove-tehnologiy-iskusstvennogo-intellekta , доступ из НЭБ «КиберЛенинка» (дата обращения : 23.01.2026). — Загл. с экрана.
4. Кузнецова, Т. Н. Нейросетевые инструменты в обучении восприятию устной речи : опыт применения / Т. Н. Кузнецова // Иностранные языки в школе. — 2023. — № 7. — с. 45–52.
5. Григорьев, С. В. Технологии искусственного интеллекта в языковой педагогике : монография / С. В. Григорьев. — Санкт Петербург : Издательство РГПУ им. А. И. Герцена, 2023. — 248 с. — ISBN 978 5 8064 3210 7.
6. Аверьянов, Л. В. Искусственный интеллект в образовании: перспективы и проблемы / Л. В. Аверьянов // Открытое образование. — 2023. — Т. 27, № 4. — С. 56–65. — DOI: 10.21686/1818-4243-2023-4-56-65, с. 8
7. Бовтенко, М. А. Цифровые технологии в преподавании иностранных языков : учебное пособие / М. А. Бовтенко. — Москва : Флинта, 2022. — 184 с. — ISBN 978 5 9765 4789 1.
8. Васильева, Е. А. Использование нейросетевых моделей для развития навыков аудирования в обучении иностранным языкам / Е. А. Васильева, И. С. Петров // Вестник Московского университета. Серия 19: Лингвистика и межкультурная коммуникация. — 2024. — № 1. — С. 112–121.
9. Кузнецова, Т. Н. Нейросетевые инструменты в обучении восприятию устной речи : опыт применения / Т. Н. Кузнецова // Иностранные языки в школе. — 2023. — № 7. — С. 45–52.
10. Brown, S. Teaching Listening in the Digital Age: The Role of AI and Neural Networks / S. Brown // Language Learning & Technology. — 2023. — Vol. 27, No. 2. — P. 45–62. — URL: (дата обращения: 20.01.2026). — Текст : электронный.
11. Smith, J., Davis, M. Deep Learning for Pronunciation and Listening: Evaluating Transformer Models in EFL Contexts / J. Smith, M. Davis // Computer Assisted Language Learning. — London : Routledge, 2023. — Vol. 36, No. 5. — P. 678–695. — ISSN 0958-8221. — Текст : непосредственный.
12. Zhang, H. et al. Speech2Text: A Neural Network-Based System for Improving L2 Listening Comprehension / H. Zhang, T. Li, W. Zhao // IEEE Transactions on Learning Technologies. — 2022. — Vol. 15, No. 3. — P. 210–225. — DOI: 10.1109/TLT.2022.3156789. — Текст : непосредственный.

Список источников:
13. Бредихина, И. А. Методика преподавания иностранных языков: обучение основным видам речевой деятельности: учебное пособие / И. А. Бредихина. — 2‑е изд., доп. и перераб. — Москва: Флинта, 2019. — 224 с. — ISBN 978‑5‑9765‑4321‑3.
14. Решетникова, М. Что такое нейросеть: как устроен человеческий мозг «в цифре» [Электронный ресурс] // РБК‑тренды. — URL: (дата обращения : 25.01.2026).
15. Смирнова, Л. И. Методика интеграции нейросетей в курсе аудирования иностранного языка : учебно методическое пособие / Л. И. Смирнова, А. Ю. Иванов. — Москва : Просвещение, 2023. — 160 с. — ISBN 978 5 09 101234 5.
16. Щукин, А. Н. Методика обучения речевому общению на иностранном языке : учеб. пособие для преподавателей и студентов языковых вузов / А. Н. Щукин. — Москва : Издательство Икар, 2011. — 480 с. — ISBN 978‑5‑7974‑0237‑4.

← Предыдущая статьяОсобенности эмоционально-волевой сферы и коммуникации у детей с тяжелыми нарушениями речи в контексте детско-родительских отношений

Следующая статья →Значение творческого потенциала в условиях цифровизации образования