1 марта 2024 г. Семантика в разных ракурсах. Искусственный интеллект Семантика в разных ракурсах. Искусственный интеллект

Традиционный ежегодный семинар научного журнала «Речевые технологии» состоялся 1 марта 2024 года. С приветственным словом к участникам семинара обратился главный редактор журнала, доктор технических наук Харламов Александр Александрович, который отметил, что в этом году семинар расширился по своей тематике и сегодня в обсуждении мы рассмотрим семантику с точки зрения искусственного интеллекта, затрагивая и философский, и практический и теоретический подходы.

Расходчиков Алексей Николаевич, к.соц.н., председатель правления Московского центра урбанистики «Город» в своём докладе «Семантика коммуникативной среды города» выдвинул гипотезу, что «кризис городов», о котором все чаще говорят урбанисты, связан в том числе с потерей городами своих  старых градообразующих функций (оборонной, торговой, промышленной, финансовой).  Интересным представляется подход, если мы рассмотрим современный город - как пространство коммуникаций, особенно это утверждение справедливо, если речь идет о крупных городах, мегаполисах, и мировых центрах, где пересекаются международные потоки людей, информации и капиталы. Коммуникативная среда, с развитием информационных технологий наоборот получает стремительное развитие, превращая коммуникативность в одну из главных характеристик городской среды. Происходящие изменения требуют теоретического осмысления этой составляющей городской жизни, а также новых методов изучения каналов коммуникации, значения отдельных элементов городской среды, символов и знаков, используемых для взаимодействия различных акторов и сообществ. Что актуализирует необходимость разработки такого направления как семантика коммуникативной городской среды. Именно на примере городской среды мы можем наблюдать и исследовать коммуникативные процессы в самом концентрированном и многомерном проявлении. 

Данное направление по мнению Алексея Расходчикова включает значения, символы и знаки, которые используются для передачи информации между городскими различными городскими сообществами, во взаимодействии органов власти с жителями, туристами, бизнесом и различными группами «новых горожан». В таком ключе семантика коммуникационной среды города может стать надежной теоретической основой для исследования городских изменений и практической работы по формированию дизайна коммуникативной среды города. В целом, это образ города, который формируется под воздействием языка, знаков, логотипов, архитектуры, уличного искусства и других элементов городской среды. Теоретическим основанием для развития данного направления могут выступать работы В. Вернадского, Т. М. Дридзе, А. В. Тихонова, А. Лефевра, Ги Дебора, Р. Флориды, А. Щербинина и А. Алексеева. Практическое применение это направление может получить в работах городских проектировщиков, архитекторов и урбанистов по созданию дизайна городских пространства, которое будут способствовать эффективной коммуникации, взаимодействию между людьми и сообществу, формировать культуру диалога и мирного разрешения конфликтов, – считает Алексей Расходчиков.

           

Борисов Вадим Владимирович, доктор технических наук, профессор, президент Российской ассоциации искусственного интеллекта (РАИИ), в своем докладе на тему «Тенденции изменения «смыслового ландшафта» при организации научных исследований», особо обратил внимание на то, что «специфика нынешнего уклада» отображается на существующей модели при организации исследований, а также отметил прорыв в области телекоммуникационных технологий, создание новой инфраструктуры, а также создание новых тенденций в области искусственного интеллекта, в связи с чем преобразуются и сами системы, появляются «новые облики» сложных систем, научных исследований. В предметной области управления Вадим Владимирович информационных и компьютерных наук выделил проблемы, «для осмысления которых нужно время». Среди подходов, которые приводят к организации исследований, было выделено: использование инструментария (информационно-коммуникационная инфраструктура), генерация гипотезы, генерация идеи с возможностью ее проверки – подтверждение либо опровержение, возникновение рисков, «постановок ложно информационного спроса».

Комалова Лилия Ряшитовна, доктор филологических наук, в докладе на тему «Какую реальность мы видим за концептами цифровой экономики (на примере номинаций "Интернет вещей", "Интернет поведения", "Интернет тел")» отметила, что актуальность заданной тематики связана с «цифровым следами», который каждый из нас оставляет в цифровой среде, и которые в последствии можно использовать для разных задач. Среди понятий «Интернет вещей», "Интернет поведения", "Интернет тел" особо было выделено понятие «Интернет вещей», так как оно технологически обеспечивает все возможности, в свою очередь "Интернет поведения" – это совокупность все решений в области технологий и устройств для того, чтобы собирать сведения и данные о поведении людей, "Интернет тел" - это специфичное понятие, так как здесь имеется ввиду конкретные носимые устройства, связанные между собой и показывающие, как изменяется наше поведение, наше состояние организма применительно к разным задачам. Говоря о проводимом исследовании, было отмечена опора на психолингвистические методы ассоциативного эксперимента, предполагая, что в результате можно обнаружить «аморфность семантических границ» этих трех понятий, и где целью исследование было описание трех понятий. Объектом исследования стал процесс ассоциирования и представление об этих явлениях, предмет – ассоциации. В ходе исследования были использованы Два метода ассоциирования – свободный и направленный виды ассоциативного эксперимента при этом испытуемые были в основном представители студенческого сообщества. В результате было определено, что не всегда был получен тот ответ, который представлен в технических описаниях, устройствах, расхождения в нормативно-правовой базе. В ходе ассоциативного эксперимента была отмечена осведомленность о представленных понятиях, частотная реакция. В заключении было отмечено нечеткость в понятийной единице, которая обозначена как «интернет поведения», а также отмечена слабая связь между интернет поведением и технологией, которые его составляют.          

Аверкин Алексей Николаевич, канд. физ.-мат. наук, в своем докладе на тему «Методы объяснительного искусственного интеллекта для больших языковых моделей» отметил, что концепция объяснительного искусственного интеллекта является одной из основных стратегий использования искусственного интеллекта, это процессы работы искусственного интеллекта и процессы достижения результатов. «Пользователи не могут доверять системе без алгоритма принятия решений», и глубокие нейросети являются неустойчивыми, чтобы минимизировать ущерб недостатков необходимы системы объяснительного искусственного интеллекта. Теперь мы вступаем в 3-е поколение ИИ, в котором система искусственного интеллекта сможет интерпретировать и объяснить алгоритм принятия решений, даже если он имеет природу «черного ящика». Объяснимый искусственный интеллект является основной частью 3-го поколения ИИ. На сегодняшний день система искусственного интеллекта может интерпретировать и принять алгоритм принятия решений, основная часть объяснительного искусственного интеллекта. Модель объяснительного искусственного интеллекта может быть представлена такой классификацией, как: локальное, объяснение глобальное, по тексту, по изображению, по целям объяснения, по специфичности цели, по пространству расширения, по локальной и глобальной независимости, независимости от модели и технической пустоты, а также по типам модели, по группам категории, по методам объяснения и др. Также было отмечено, что появились трансформеры, которые являются большими частотными словарями, содержащие энкодеры и декодеры. Существуют базовые модели - модели ассистенты, модели обучения и др., в которых существует возможность «опущения» объяснения на уровень нейронов и активации этих нейронов. Среди представленных классов моделей наибольшей популярностью пользуются модели, имеющие пояснительную способность, объяснительного искусственного интеллекта, доказательством тому служит их применение в широком спектре реальных задач.       

Пильгун Мария Александровна, доктор филол. наук, в докладе на тему «Эксплицитная и имплицитная информация в больших объемах лингвистических данных» отметила, что «взрыв генеративных моделей, которые мы наблюдаем» дал новый ракурс и новые возможности для анализа. И те модели, которые используются, возможно использовать для интерпретации, и в данном случае инструментарий для данных, который использовался, представлен Brand Analytics и TextAnalyst. В докладе представлены модели, которые позволяют анализировать эксплицитную и имплицитную информацию. Говоря о большом объеме лингвистических данных, можно выделить медиаконтент. В отношении имплицитной информации Мария Александровна отметила важным моментом разъяснение мотивации, то есть, то «что я делаю внешне «эксплицитно» и что я делаю «внутренне» - истинные оценки и мнения. На сегодняшний день была определена проблема фейка, синтетического контента, в котором имплицитная информация выходит на первый план (выделение истинных подтекстов). В том числе исследовался позитивный, негативный и нейтральный контент. Анализ агрессии является в данном аспекте более достоверным анализом, где главную роль играют ассоциативные сети – «болевые точки, которые касаются данного объекта», а также было отмечено, что тематическая структура негативного кластера помогает выделять тематическое моделирование, а тематическая сеть позволяет выделить наиболее важные темы для внешнего обсуждения. И говоря о негативном контексте, по результатам исследования, на первый план выходит термин «страх» во всех смыслах, в том числе и связанного с будущим, а позитивный контент выводит на первый план такое понятие, как «справедливость», а также, то, что связано с детьми. Подводя итоги, Мария Александровна отметила ключевым моментом - разделять анализ эксплицитных и имплицитных смыслов.

Джунковский Андрей Владимирович, в теме доклада «Искусственный интеллект как новая форма CAT. Путь к идеальной автоматизации перевода или новый вызов?» обозначил исследования, связанные с работой ChatGPT, где точкой входа является текст на одном языке, а выход на другом, а также работу, связанную с автоматизированной системой. Говоря об искусственном интеллекте, в частности ChatGPT, Андрей Владимирович поднял вопросы, связанные с выполнением работы человеком и машиной. И в ходе исследования было получен результат, определяющий отсутствие «аутентичности», смысловой нагрузки текста, созданной в автоматизированной системе. Приводя примеры кейсов выполненных работ, был обозначен важный критерий определения выполнения работы с помощью человека или искусственного интеллекта.  

Харламов Александр Александрович, докт. техн. наук, в теме доклада «ChatGPT – это интеллектуальная система?» были отмечены ключевые определения, связанные с заданной тематикой, в частности, были рассмотрены понятия «интеллект» и «интеллектуальные системы».

Интеллект, с одной стороны, рассматривается как способность мышления рационального познания, с другой стороны, как способность мозга решать интеллектуальные задачи путем приобретения, накопления и упорядочивания знаний. И таким образом, можно заключить, что интеллект — это способность рационального познания или свойства выполнять творческие функции, которые, если они присущи системе, делают ее интеллектуальной. Важным моментом было определено, что интеллектуальные системы являются «усилителем естественного интеллекта», то есть как системы информационной поддержки естественного интеллекта. Таким образом, с точки зрения нейроинформатики под интеллектуальной системой понимать систему, обладающую свойствами интеллекта – реализовать на их основе целенаправленное поведение. Таким образом в структуру интеллектуальной системы входят лингвистический и экстралингвистический процесс, которые представлены как библиотека и механизм формирования шаблонов ситуаций как комбинаций индексов событий и объектов, представленных в словарях лингвистического и экстралингвистического процессора. Интеллектуальные системы, которые реализуют основные свойства интеллекта, – анализ и синтез текстов, квазитекстов, реализация на основе этого анализа и синтеза целенаправленного поведения, не касающихся ресурсов. Интеллектуальные системы реализуют следующие интеллектуальные функции – моделирование мира в виде моделей мира, в которых существует интеллектуальная система. Что такое модель мира? Она состоит из двух частей – языковой и экстралингвистической, которые рассматриваются как единое целое и которые можно представить как однородные семантические сети.  Целенаправленное поведение в этой модели мира предполагает планы поведения, формируемое при наличии поставленной цели, и контроль по проведению выполнения этого плана. «Цель выносится в интеллектуальную систему извне», и в этом смысле ChatGPT – это как раз тот ресурс, в которую цель вносится извне. В докладе были подробно рассмотрены лингвистические и экстралингвистические процессы, формирующие целенаправленное поведение разных уровней и разной модальности. В результате проведенных исследований, был сделан вывод, что ChatGPT – это интеллектуальная система, имеющий одни модуль «синтеза текстов» (единственный модуль лингвистического процессора), она моделирует язык на основе корпусов текстов исходного, обучавшего всю систему в целом и частных корпусов, которые настраивают эту систему на использование конкретной предметной области в виде некоторой сети слов («это множество цепочек слов, соответствующих текстам языка, которые в этой системе представлены»).

 

Подводя итоги проведения Семинара, Харламов Александр Александрович отметил:  очень важно «не убить» те направления, которые существуют» - несомненно, что все участвовавшие приводили результаты своих исследований и искренне за них отчитывались.  Также был поставлен вопрос дальнейшей работы – расшириться до философского уровня, или сузиться до более конкретного, или сохранить заданную тематику. В связи с полученными предложениями и заключениями по проведённой работе можно предложить тематику для дальнейшего проведения семинара «Семантика в разных ракурсах. Смысловой ландшафт в науке».