Прикладная и математическая лингвистика | Филологический аспект №12 (68) Декабрь 2020

УДК 811.111

Дата публикации 30.12.2020

Социокультурные факторы и лингвосемиотика англоязычного дигитального дискурса (на примере языка программирования Python)

Лазебная Наталья Валерьевна
канд. филол. н., доц., доц. каф. теории и практики перевода Национального университета «Запорожская политехника», Украина

Аннотация: В статье речь идет о социокультурных факторах и лингвосемиотике англоязычного дигитального дискурса (на языке программирования Python). Рассматривается вопрос о возможности соотнесения социокультурных характеристик в техническом дискурсе в общем, и англоязычном дигитальном дискурсе в частности. На примере языка программирования Питон, прослеживаются его лингвальные особенности, которые коррелируются с английским языком на уровне семантики и синтаксиса. Анализируется прикладное применение языка программирования, имеющего англоязычную базу в использовании инструментов обработки природного языка (NTLK)
Ключевые слова: англоязычный дигитальный дискурс, социокультурные факторы, лингвальные особенности, язык программирования Python, чат-боты.

Sociocultural factors and linguosemiotics of English-language digital discourse (on the example of the Python programming language)

Lazebnaya Natalya Valerevna
Candidate of Philological Sciences, Associate Professor, Associate Professor of the Department of Theory and Practice of Translation of the National University "Zaporizhia Polytechnic", Ukraine

Abstract: The article deals with the sociocultural factors and linguosemiotics of the English-language digital discourse (on the example of Python programming language). The question of correlating sociocultural characteristics in technical discourse in general and in English-language digital discourse in particular, is considered in this paper. On the example of the Python programming language, its lingual features are traced, which are further correlate with the English language at the level of semantics and syntax. The application of the programming language, with an English-language basis in the use of natural language processing tools (NTLK) is analyzed.
Keywords: English-language digital discourse, sociocultural factors, lingual features, Python programming language, chatbots.

Правильная ссылка на статью
Лазебная Н.В. Социокультурные факторы и лингвосемиотика англоязычного дигитального дискурса (на примере языка программирования Python) // Филологический аспект: международный научно-практический журнал. 2020. № 12 (68). Режим доступа: https://scipress.ru/philology/articles/sotsiokulturnye-faktory-i-lingvosemiotika-angloyazychnogo-digitalnogo-diskursa-na-primere-yazyka-programmirovaniya-python.html (Дата обращения: 30.12.2020)

Современный англоязычный дигитальный дискурс является идеальной самопорождающей системой, лингвосемиотические доминанты которой экстраполируются от построения и декодирования команд от человека к машине (компьютеру), осуществляя ресипрокальное взаимодействие между английским языком как идеальной системой, антропоцентрическим лингвальным центром, а также сферой-источником языков программирования, которые, в свою очередь трансформируют морфологические, семантические и синтаксические связи английского языка в определенный лингвосемиотический симбиоз.

Языки программирования как основной инструмент обработки естественного языка (NLP) базируются на языковых средствах английского языка (вербальная основа) и семиотической почве, то есть являются лингвоматематическим континуумом. Иными словами, английский язык создает основу искусственного языка (языка программирования) для самоанализа (обработки естественного языка, Natural language processing) для медиации взаимодействия «человек-машина». Происходит перерождение или кодирование вербальных команд в язык, понятный машине.

Итак, единство вербальных и символических обозначений в современном англоязычном дигитальном дискурсе свидетельствует об упорядоченности и одновременно вариативности конституентов такого типа дискурса. Функциональность лингвосемиотических элементов производит сеть взаимоотношений, в которых каждый из таких элементов в контексте языков программирования или естественного языка (английского) может продуцировать эмерджентность, то есть перерождаться из слова или символа в команду, которая, в свою очередь экстраполируется в англоязычном дигитальном дискурсе.

Актуальность исследования определяется быстрыми изменениями в обществе, относящихся к науке, информационным, коммуникационным технологиям, которые отражаются в языке как в культурном феномене. Развитие компьютеров и современных информационных технологий порождает появление новых синтетических типов языков, которые расширяют информационное и социокультурное пространство, проникая во все виды социальной деятельности человека. В соответствии с этим необходимо изучать социокультурные характеристики синтетических языков, которые изменяются при информатизации всех культурных сфер.

Цель исследования – определение социокультурных факторов и лингвосемиотики англоязычного дигитального дискурса (на примере языка программирования Python).

В своих исследованиях ученые рассматривают проблемы языкового аспекта при информатизации [1; 7; 10]. Целесообразно изучать информационное общество в аксиологическом измерении, ведь оно имеет отношение к изучению культурного аспекта, чтобы четко понимать социальные отношения во время информационной эпохи. Возможно говорить о характере преобразования языка программирования как результата компьютерной революции [7]. Таким образом, универсальные языки репрезентации знаний, или искусственно созданные языки, то есть языки программирования целесообразно рассматривать в социокультурном аспекте. Англоязычная основа большинства таких языков свидетельствует о глобализации научно-технического мира.

Технические отрасли существуют вне культурного влияния, ведь, безусловно, законы физических наук превышают границы любой национальной культуры. Кастберг утверждает, что науки – акультурны, они являются артефактами профессиональной культуры [10]. Точные науки – это определенные модели объяснения, построенные в ретроспективе таким образом, что пока они не будут разрушены более весомыми аргументами, они соответствуют восприятию человека. Тогда в этом смысле науки не являются статичными, Богом данными сущностями, а, скорее динамическими, созданными человеком культурами. Законы науки сами по себе являются культурными артефактами, и возникает следующий силлогизм:

- теории физики являются акультурными;

- технические дисциплины вытекают из физических теорий;

- технические науки являются акультурными.

  • системы технических дисциплин являются стандартизованными. Два фактора препятствуют полному однообразию или полному культурному единству технических отраслей. Прежде всего, растет количество технических концепций. Во-вторых, количество технических дисциплин постоянно увеличивается.

Развитие общества, динамический и открытый характер этого процесса, подобно развитию речи, возможно скоррелировать с дигитальной экспансией англоязычного вербокреативного пространства. В этой связи, постепенно привлекаются и социокультурные факторы не только в дискурсивных утверждениях и проявлениях, а и в своем базисе. Цифра (digit) является базисным элементом, абстрактным и индивидуализированным, но эмерджентным в процессе трансляции в язык для машины. Гипотетически несовместимые идеи / объекты / агенты / процессы и т.д. являются самыми сложными вопросами современности.

Изучение характеристик синтетических языков следует начать с определения сущности современных искусственных объектов и их систем. Существует возможность осмыслить новые тенденции в историческом развитии человека, поскольку такие термины как «природный объект» и «искусственный объект», были внедрены в сферу теоретической когнитивной саморефлексии ученого и философа.

Это может быть вызвано ростом роли искусственных объектов, преобразованием природных объектов в искусственные и наоборот. Определяется новое состояние человека в мире, которое постепенно превращается в синтез естественного и искусственного языков. Анализируя преобразования искусственных объектов, в частности, синтетических языков, в условиях информатизации можно сказать, что они получают новые качественные черты благодаря научно-техническому развитию.

Человеческая речь как способ выражения мыслей, общения и обмена информацией становится системой, четко структурированной с помощью алгоритмов, заданных компьютером. Это еще раз доказывает, что между человеческим и синтетическим языками существует огромное взаимовлияние. Преобразование этой системы и ее медиация между человеком и машиной осуществляется средствами английского языка.

Некоторые исследователи пытались скоррелировать творческие задачи и языки программирования. IT-специалисты пытаются создать программы для составления стихов, однако машина не способна к творчеству. Вновь возникает вопрос о гипотетическом существовании социокультурного аспекта искусственно созданных языков программирования.

Человеческая речь также не может быть формализирована, а следовательно, она не может быть доступной для компьютера. Машине невозможно воспроизвести человеческую интуицию, умственную репрезентацию, творческое вдохновение и бессознательные составляющие человеческой мыслительной деятельности в систему искусственных языковых символов [8]. Это связано с тем, что программы кодируются в соответствии с алгоритмами математического языка, которые могут использовать только метрические значения мозговой деятельности человека. С одной стороны, синтетическая речь информационных технологий не может быть самостоятельной и универсальной в современном обществе ведь она является новым мощным средством накопления, обработки, хранения и передачи информации как одной из высших ценностей информационного общества.

Однако, необходимо помнить о лингвистическом аспекте языков программирования и уменьшить «семантический разрыв» между компьютером и языком человека. Интерпретация языков программирования с точки зрения лингвистики, и, особенно англоязычных языковых студий, поможет преодолеть семантическую двузначность, контекстуальные и другие проблемы, возникающие при коммуникации «человек-машина».

Благодаря абстрактной природе компьютерного языка как средства для манипулирования символами, цифровые компьютеры значительно расширили диапазон систем, поведение которых можно имитировать. Создается определенная лингвосемиотическая модель, которая модифицируется и функционально меняется в различных средах языков программирования. Компьютерное моделирование становится своеобразным «ритуалом киберкультуры», заменяя чувственный опыт и превращаясь из когнитивного инструмента в социокультурный.

В последние десятилетия, особенно с момента создания компьютерного проекта пятого поколения, были достигнуты значительные результаты в создании системных программ, способных общаться с людьми на языке пользователя. Одной из основных тенденций развития языков программирования является поиск таких методологий программирования, которые наиболее точно отражали бы логику человеческих действий, сосредоточенных на решении проблем, касающихся различных предметных областей [2; 4].

Скорость создания новых языков программирования наряду с разработкой компьютерной базы, функциональной структуры и методологии программирования позволяет предположить, что компьютеры последнего и последующих поколений достигнут уровня человека, прежде всего, по уровню интеллектуального и речевого общения с человеком, создавая условия для истинной интеллектуальной революции.

Для обработки естественного языка, как один из возможных вариантов, используется язык программирования Python совместно с открытой библиотекой «Инструментарий естественного языка». NTLK включает общий набор ПО, информацию, документации, доступные для свободной загрузки, дистрибутивы для платформ Windows, Macintosh и Unix. Python был избран в качестве языка для NLTK благодаря простому синтаксису и обработке лингвистической информации.

Как объектно-ориентированый язык программирования Python легко позволяет повторно использовать данные и методы [9]. Англоязычный базис этого языка программирования является ценным эмпирическим материалом ведь если проанализировать ключевые англоязычные слова, семантику и синтаксис, можно увидеть его динамичность и развитие.

Основные англоязычные идентификаторы в Питоне (false, classify, finally, is, return, none, continue for и другие) выполняют функции, схожие с теми, которые ими выполняются и в природном английском языке. Например, рассмотрим декодирование инструкции: функция print в сочетании с методом str.format ():

print(<строка форматирования>.format(<перечень форматирования выражений>))

Строка форматирования содержит текст и спецификации формата, взятые в фигурные скобки {}. Спецификация формата может быть пустой, содержать номер выражения из списка (которые нумеруются, начиная с нуля) или номер выражения со спецификацией формата (). Приведем несколько примеров результатов вывода:

Синтаксис: <имя> = input (<s>). Функция input выводит на экран строку <s>, затем считывает введенную пользователем строку и связывает <имя> с этим срочным значением. Примеры использования:

d = 4

s = input ( 'number:')

print (d * s)

print (d * int (s))

print (d / float (s))

Приведенные примеры можно рассматривать с точки зрения текстовой организации и императива, выражающегося в необходимости выполнения определенной команды или операции [11]. Подобно глаголам в повелительном наклонении в английском языке, человек задает определенную команду машине, прописывает код, и получает отклик на природном языке. Иными словами, английский природный язык проходит кодировку и декодирование посредством машины (компьютера) [3].

Англоязычную текстовую репрезентацию можно увидеть и на примере вывода программы при вводе пользователем строки 'abc':

"Abcabcabcabc"

ValueError: invalid literal for int () with base 10: "abc"

ValueError: could not convert string to float: "abc"

if <условие>:

<Составляющих а оператор а >

if <условие>:

<Составляющих а оператор а >

else:

<Составляющих а оператор а >

if <условие>:

<Составляющих а оператор а >

elif <условие>:

<Составной оператор>

На данном текстовом уровне видны условия, что сходным является по функционированию с условными предложениями английского языка [6].

Суммарную таблицу синтаксических категорий можно рассмотреть на примере следующей таблицы и предложения The man walked a dog and saw a park with a telescope.

 

Символ

Значение

пример

S

Предложения

the man walked

NP

именительных фраза

a dog

VP

глагольная фраза

saw a park

PP

Фраза из наречием

with a telescope

Det

определяющее слово

the

N

имя существительное

dog

V

Глагол

walked

P

Наречие

in

При парсинге, автоматическом кодировании и последующем декодировании англоязычного предлодения компьютером, возможна следующая схема.

 

Структурная неоднозначность видится в двусмысленности дополнительной фразы (NP / VP). Взаимосвязь и взаимоотношения между членами этого англоязычного предложения можно интерпретировать двузначно: A man saw the dog in the park или The dog saw a man in the park.

Итак, после краткого обзора основных команд и принципов синтаксиса, можно рассмотреть применение языка программирования Python для создания англоязычных чат-ботов.

Подбор ключевых слов

Определим реплику-приветствие бота. Если пользователь приветствует бота, бот поздоровается в ответ [5; 6]. В ELIZA используется простое сопоставление ключевых слов для поздравлений.

GREETING_INPUTS = ( "hello", "hi", "greetings", "sup", "what's up", "hey",)

GREETING_RESPONSES = [ "hi", "hey", "* nods *", "hi there", "hello", "I am glad! You are talking to me"]

def greeting (sentence):

for word in sentence.split ():

if word.lower () in GREETING_INPUTS:

return random.choice (GREETING_RESPONSES)

Для создания ответа англоязычного бота, будет использоваться концепция сходства текстов. Поэтому нужно импортировать необходимые модули.

Если запрос не соответствует ни одному ключевому слову, бот выдает ответ «Простите! Я вас не понимаю».

def response (user_response):

robo_response = ''

TfidfVec = TfidfVectorizer (tokenizer = LemNormalize, stop_words = 'english')

tfidf = TfidfVec.fit_transform (sent_tokens)

vals = cosine_similarity (tfidf [-1], tfidf)

idx = vals.argsort () [0] [- 2]

flat = vals.flatten ()

flat.sort ()

req_tfidf = flat [-2]

if (req_tfidf == 0):

robo_response = robo_response + "I am sorry! I do not understand you"

return robo_response

else:

robo_response = robo_response + sent_tokens [idx]

return robo_response

Наконец, мы задаем реплики бота в начале и конце переписки, в зависимости от реплик пользователя [2; 11].

flag = True

print ( "ROBO: My name is Robo. I will answer your queries about Chatbots. If you want to exit, type Bye!")

while (flag == True):

user_response = input ()

user_response = user_response.lower ()

if (user_response! = 'bye'):

if (user_response == 'thanks "or user_response ==' thank you '):

flag = False

print ( "ROBO: You are welcome ..")

else:

if (greeting (user_response)! = None):

print ( "ROBO:" + greeting (user_response))

else:

sent_tokens.append (user_response)

word_tokens = word_tokens + nltk.word_tokenize (user_response)

final_words = list (set (word_tokens))

print ( "ROBO:" end = "")

print (response (user_response))

sent_tokens.remove (user_response)

else:

flag = False

print ( "ROBO: Bye! take care ..")

анализ речи

морфологический и лексический анализ

парсинг

контекстуальное объяснение

применение объяснения и выполнения

синтез речи

морфологическая реализация

синтаксическая реализация

планирование реплик

модель произношения

морфологические правила

лексика и грамматика

дискурс контекст

домен знаний

фонология

морфология

синтаксис

семантика

обоснование

Схема 1. Простая архитектура разговорной диалоговой системы человек-чатбот: анализируется разговорный способ ввода (вверху слева), распознаются слова, синтаксический разбор и интерпретация предложений в контексте происходящих действий, касающиеся приложений (вверху справа) планируется ответ, реализована синтаксическая структура воспроизведенных слов и на произнесенные результаты; различные типы лингвистических знаний информируют о каждой стадии процесса.

Выводы. Итак, существуют различные аспекты дальнейшего  исследования обработки языкового материала в рамках создания англоязычных (универсальных) ботов, обработки речи, автоматических аудиопереводчиков и тому подобное. Обработка природного языка находится на стадии развития и лингвисты могут решить еще множество проблем, чтобы в дальнейшем эта технология будущего развивалась еще более эффективно.


Список литературы

1. Большакова Е.И. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие. — М.: МИЭМ, 2011.
2. Alexandre da Silva Simões, M. I. Conaim: A Conscious Attention-Based Integrated Model for Human-Like Robots // IEEE Systems Journal, 2017. – P. 1296-1307.DOI10.1109 / JSYST.2015.2498542
3. Augello, Agnese & Pilato, Giovanni & Machì, Alberto & Gaglio, Salvatore. An Approach to Enhance Chatbot Semantic Power and Maintainability: Experiences within the FRASI Project. – 2012. – P. 186-193. 10.1109/ICSC.2012.26.
4. Babulak, Eduard. Informatics and Social Impact of IT on Society. – 2013.
5. Bulding a Chatbot Using Python. [Электронный ресурс]. URL: https://github.com/parulnith/Building-a-Simple-Chatbot-in-Python-using-NLTK/blob/master/chatbot.py
6. Classifying Knowledge Representation In Artificial Intelligence. – 2020 –. [Электронный ресурс]. URL: https://www.fingent.com/blog/classifying-knowledge-representation-in-artificial-intelligence/
7. Danesi, M. Language, Society and New Media. – Routledge, 2016.
8. Gabbrielli, M., Martini, S. Programming Languages: Principles and Paradigms, Undergraduate Topics in Computer Science. – 2010. – [Электронный ресурс]. URL: http://websrv.dthu.edu.vn/attachments/newsevents/content2415/Programming_Languages_-_Principles_and_Paradigms_thereds1106.pdf
9. Gao Z. From Industry 4.0 to Robotics 4.0 – A Conceptual Framework for Collaborative and Intelligent Robotic Systems // Procedia Manufacturingб 2020. – No. 46. – P. 591–599.
10. Kastberg, P. Cultural Issues Facing the Technical Translator. [Электронный ресурс]. URL: https://jostrans.org/issue08/art_kastberg.php
11. Krantz et al. Generating Topic-Based Chatbot Responses. – 2017. – [Электронный ресурс]. URL: https://www.diva-portal.org/smash/get/diva2:1118159/FULLTEXT02

Расскажите о нас своим друзьям: