Optimization of behaviour strategies within the simulation model of a multi-agent socio-economic system
Table of contents
Share
QR
Metrics
Optimization of behaviour strategies within the simulation model of a multi-agent socio-economic system
Annotation
PII
S042473880027006-5-1
Publication type
Article
Status
Published
Authors
Andranick Akopov 
Occupation: Chief Researcher Scholar
Affiliation:
Central Economics and Mathematics Institute, Russian Academy of Sciences
Russia
Address: Moscow, Russian Federation
Armen Beklaryan
Affiliation: National Research University Higher School of Economics
Address: Russian Federation, Moscow
Edition
Pages
117-131
Abstract

This article presents a new simulation model of a multi-agent socio-economic system (MA-SES), in which individual, including interproduct interactions are implemented. Within the MA-SES, the models of agent-producers and agents-consumers behaviour with their objective functions are studied. In particular, producers follow their own production strategies by choosing the moments for introducing new fixed assets and labour resources. Consumers participate in barter and monetary deals by interacting with other agents. The states of readiness of agents-producers to introduce new fixed assets and labour resources, as well as the states of readiness of agents-consumers to complete barter and monetary deals are set up for each time moment using lognormal distributions with given characteristics, which are the control parameters of the system. Important bi-objective optimisation problems are formulated for ensembles of agents-producers and agents-consumers. A new parallel hybrid genetic algorithm (MORCGA-MOPSO) was developed, in particular, providing the possibility of seeking the Pareto-optimal solutions for maximising the average (over an ensemble of agents) profit and the total number of agent-producers’ buyers, as well as maximising the average utility and monetary savings of agents-consumers. The parameters of log-normal distributions that determine the states of interacting agents that make individual decisions are computed. The features of the behavioural strategies of producers and consumers are determined, which make possible to achieve an improvement in the values of the objective functions through controlling the dynamics of the input of production resources and choosing the preferred types of interproduct interactions, in particular, barter, monetary etc.

Keywords
multi-agent socio-economic systems, simulation of economic processes, interproduct interactions, genetic algorithms, particle swarm optimization, multicriteria optimization
Acknowledgment
The research was supported by Russian Science Foundation (project No. 23–21–00012).
Received
06.08.2023
Date of publication
19.09.2023
Number of purchasers
13
Views
230
Readers community rating
0.0 (0 votes)
Cite Download pdf
Additional services access
Additional services for the article
Additional services for the issue
Additional services for all issues for 2023
1 ВВЕДЕНИЕ
2 Первая экономико-математическая балансовая модель, характеризующая межотраслевые производственные взаимосвязи в экономике, была разработана В.В. Леонтьевым ( Леонтьев , 1925, 1936). Модель межотраслевого баланса (МОБ) описывает соотношения между выпуском продукции в одной отрасли и использованием продукции других отраслей экономики для технологического обеспечения этого выпуска. В дальнейшем в СССР были разработаны динамические модели межотраслевого баланса (МОБ) (Шатилов, 1967; Аганбегян, Вальтух, 1974), с использованием которых можно изучать взаимовлияние динамики конечного спроса и характеристик производителей (основных фондов, трудовых ресурсов и т.д.), в том числе с учетом влияния рыночных факторов на плановую социально-экономическую систему (Ведута, 1999).
3 В настоящее время актуально построение агент-ориентированных имитационных моделей (АОМ) (Makarov, Bakhtizin, Epstein, 2022). Методы АОМ применятся для изучения поведения взаимодействующих агентов с индивидуальными системами принятия решений, (например, для исследования популяционной динамики мигрантов и коренных жителей (Макаров и др., 2019, 2020, 2022), изучения эффектов сегрегации и десегрегации населения в моделях ограниченного соседства (Акопов, Бекларян Л., Бекларян А., 2021), оптимизации характеристик интеллектуальных транспортных систем (Akopov, Beklaryan, Thakur, 2022) и др.). Важным преимуществом АОМ является возможность учета влияния индивидуального поведения каждого агента и процессов их взаимодействия на систему в целом, что обеспечивает существенно большую реалистичность и управляемость моделируемой системы.
4 Предпринимаются усилия по созданию агент-ориентированных МОБ (Суслов и др., 2016), в том числе с использованием оптимизационных алгоритмов для формирования сбалансированных межотраслевых и межрегиональных связей (см. оптимизационные межотраслевые межрегиональные модели (ОМММ) в (Ершов, Мельникова, Суслов, 2009).
5 Комбинированное применение АОМ и МОБ представляет собой нетривиальную задачу, так как включение в модель агентов со своими индивидуальными системами принятия решений, реализующих стохастические процессы межотраслевого и межпродуктового взаимодействия, приводит к принципиальному усложнению изучаемой системы. В этом случае традиционные методы линейного программирования и векторной оптимизации практически не применимы для поиска наилучших траекторий развития многоагентной социально-экономической системы (МСЭС). Поэтому для оптимизации характеристик крупномасштабной МСЭС целесообразно использовать эвристические методы оптимизации, в частности генетические (Holland, 1992; Akopov et al., 2019) и роевые алгоритмы (Kennedy, 1997; Xiaohui, Eberhart, 2002).
6 Актуальность развития методов моделирования и оптимизации характеристик МСЭС обусловлена прежде всего потребностью в улучшении динамики макроэкономических характеристик системы за счет оптимального управления индивидуальными стратегиями межотраслевого и межпродуктового взаимодействия. Здесь под стратегией взаимодействия понимается выбор моментов времени, обеспечивающих максимизацию интегрального выпуска и минимизацию совокупных производственных издержек со стороны агентов–предприятий различных отраслей экономики. При этом на поведение агентов-производителей и агентов-потребителей оказывают влияние множество факторов, в частности — их пространственные распределение, радиус торгового взаимодействия, вероятность заключения продуктовых сделок и др. Подобные стохастические модели, предложенные впервые в работах (Поспелов, 2018; Поспелов, Жукова, 2012), применяются, в частности, для поиска оптимальных торговых стратегий.
7 Улучшение характеристик МСЭС может быть реализовано в результате постановки и решения задач многокритериальной оптимизации для формирования и аппроксимации фронтов Парето (Lotov, Bushenkov, Kamenev, 2004; Lovot, Miettinen, 2008) с использованием предложенных эвристических алгоритмов.
8 Цель данной статьи состоит в разработке подхода к моделированию стохастических продуктовых взаимодействий между агентами-потребителями (индивидуумами) и агентами-производителями (предприятиями различных отраслей промышленности), управляющими динамикой ввода новых производственных ресурсов. Для поиска наилучших компромиссных (Парето-оптимальных) решений в подобной крупномасштабной МСЭС разработан новый двухкритериальный генетический алгоритм MORCGA-MOPSO (Multi-objective real-coded genetic algorithm aggregated with particle swarm optimization).
9 ИМИТАЦИОННАЯ МОДЕЛЬ МСЭС
10 Концепция модели
11 Рассматривается закрытая МСЭС, состоящая из территориально распределенных промышленных агентов-производителей (предприятий) и агентов-потребителей (индивидуумов), в которой в каждый момент модельного времени между каждой парой агентов, находящихся в диапазоне видимости, может быть осуществлен товарообмен или монетарная сделка (т.е. покупка продукта за деньги) для обеспечения производственного процесса и получения прибыли агентами-предприятиями либо удовлетворения потребительского спроса со стороны домохозяйств.
12 Производственные возможности предприятий зависят от числа задействованных в них работников и динамики основных фондов, определяемой интенсивностью инвестиционных вложений. Для расчета объемов выпускаемой предприятиями продукции в натуральном выражении используются производственные функции Кобба–Дугласа с заданными параметрами. Для упрощения модели будем считать, что каждое предприятие имеет однозначную отраслевую классификацию и выпускает только один тип продукта (например, нефть, продукцию черной металлургии и т.д.). Темпы изменения цен на продукцию считаются эндогенными и зависят от соотношения объема продукции, имеющейся у агентов-производителей (данного продукта), и совокупного спроса на эту продукцию со стороны агентов-потребителей. Таким образом, имитируется формирование равновесных цен на локальных рынках, которые используются при расчете прибыли производителей и расходов потребителей. Аналогично, увеличение прибыли агентов-предприятий изменяет темпы роста заработной платы, что приводит к периодическому перераспределению рабочей силы между предприятиями в пределах отрасли.
13 Агенты-потребители сами ничего не производят, но участвуют в монетарных и бартерных сделках, взаимодействуя друг с другом и производителями с целью личного потребления готовой продукции. При этом потребление носит инерционный характер, т.е. в течение некоторого периода времени приобретенный или обмененный продукт сохраняется за агентом (т.е. рассматриваются потребительские товары долговременного пользования). Также, работники могут участвовать в производственных процессах агентов-производителей для получения денежных средств (формирования накоплений для будущего потребления), могут менять место работы в случае существенной асимметрии в уровнях заработной платы между предприятиями своей отрасли и при наличии свободных рабочих мест в территориальной доступности.
14 Конфигурация пространственного размещения агентов-производителей и связанных с ними индивидуумов задается централизованно (рис. 1). На нем показана ситуация потенциальной конкуренции двух агентов-предприятий (выделенных светло-серым цветом) за трудовые ресурсы (выделенных темно-серым цветом), находящихся в зоне территориальной доступности (рабочих мест) заданной размерности, а также конечных потребителей, в том числе предприятий-потребителей, находящихся в зоне торгового взаимодействия.
15

16 Рис. 1. Конфигурация пространственного размещения агентов-предприятий и связанных с ними трудовых ресурсов
17 Стратегия принятия индивидуальных решений агентов-производителей состоит в формировании оптимальных состояний (готовности) ввода новых основных фондов и трудовых ресурсов, влияющих на объемы выпуска соответствующей продукции. Стратегия для агентов-потребителей — в формировании оптимальных состояний (готовности) заключения торговых сделок для каждого момента времени.
18 В рамках изучаемой МСЭС рассматривается пара концептуально связанных двухкритериальных оптимизационных задач. В первой задаче целевыми функционалами являются средняя (по ансамблю агентов) накопленная прибыль агентов-производителей и среднее число покупателей, которые должны быть максимизированы. Во второй задаче целевые функционалы — средняя (по ансамблю агентов) полезность от потребления конечной продукции для агентов-потребителей и сформированные накопления, которые также должны быть максимизированы. Для каждой подобной задачи требуется сформировать подмножества решений оптимальных по Парето, среди которых экономические агенты могут выбрать наиболее предпочтительные субоптимальные решения. При этом необходимо учитывать ограничения на значения соответствующих целевых функций и искомых переменных. Далее приведем краткое формальное описание разработанной модели МСЭС.
19 Пусть T={t0,t1...,T} — набор моментов времени (по месяцам), T  — общее число моментов времени; t0T и tTT  — начальный и конечный моменты модели; P={p1,...,pP}  — набор индексов отраслей промышленности и выпускаемых ими продуктов (упорядоченных по уровню отраслевой схожести продуктов), где P — общее число отраслей (видов продукции); Jp={jp1,...,jpJp},    pP — набор индексов агентов-производителей (предприятий отраслей промышленности), где Jp — общее число агентов-производителей в отрасли промышленности p ; I={i1,...,iI} — набор индексов агентов-потребителей (домохозяйств), где I — общее число агентов-потребителей.
20 Модель поведения агентов-производителей
21 Агенты-производители реализуют собственную производственную стратегию посредством выбора моментов времени для ввода новых основных фондов и трудовых ресурсов. Подобный подход впервые предложен в работах, посвященных изучению динамических МОБ (Шатилов, 1967; Аганбегян, Вальтух, 1974).
22 Основные фонды агента-производителя jp , зависящие от интенсивности инвестиций в момент tk (tkT), равны
23 Kjp(tk)=Kjp(tk-1)+ajp(tk)ΔKp(tk), (1)
24 где ΔKp(tk),    jpJp,    pP — заданный темп ввода новых основных фондов агента-производителя jp в момент tk (tkT) ; ajp(tk){0,1},    jpJp,    pP  — состояние готовности агента-производителя jp (jpJp,    pP) к вводу новых основных фондов в момент tk (tkT) .
25 Количество трудовых ресурсов (из числа агентов-потребителей), задействованных агентом-производителем jp в момент tk (tkT), равно
26 Ljp(tk)=Ljp(tk-1)+cjp(tk)ΔLjp(tk), (2)
27 где ΔLjp(tk),jpJp,pP  — темп формирования новых рабочих мест, занятых агентами-потребителями, входящими в зону территориальной доступности соответствующего агента-производителя в момент tk (tkT) ; cjp(tk){0,1},jpJp,pP  — состояние готовности агента-производителя jp (jpJp,pP) к вводу новых основных фондов и трудовых ресурсов в момент tk (tkT) .
28 Состояния готовности агента-производителя jp (jpJp,pP) к вводу новых основных фондов и трудовых ресурсов задаются для каждого момента времени tk с помощью логнормальных распределений с заданными характеристиками:
29 ajp(tk)=lnN(μa,σa2)/lnN(μa,σa2),    еслиlnN(μa,σa2)>0,0,еслиlnN(μa,σa2)=0, (3)
30 сjp(tk)=lnN(μс,σс2)/lnN(μс,σс2),еслиlnN(μс,σс2)>0,0,еслиlnN(μс,σс2)=0, (4)
31 где {lnN(μa,σa2),lnN(μc,σc2)}  — случайные величины, имеющие логнормальные распределения с параметрами {μa,σa2,μc,σc2} .
32 Объем продукции, выпускаемой производителем jp в отрасли p , вычисляемый с использованием производственной функции Кобба–Дугласа в момент tk, равен
33 v^jp(tk)=ApKjpγp(tk)Ljp1-γp(tk), (5)
34 где Ap , γp  — параметры производственной функции в отрасли p . Производственные расходы производителя jp в момент tk
35 z~jp(tk)=pPπp(tk)gpjpv^jp(tk), (6)
36 где gpjp[0,1],pP,jpJp — коэффициент прямых затрат, характеризующий количество продукции отрасли p , которое расходуется при производстве одной единицы продукции производителя jp .
37 Уровень заработной платы, выплачиваемой агентом-производителем jp , зависящий от темпов роста прибыли в момент tk :
38 wjp(tk)=wjp(tk-1)r~jp(tk-1)/r~jp(tk-2). (7)
39 Стоимость единицы продукции в отрасли p (зависит от соотношения объемов продукции, имеющихся у продавцов, и спроса со стороны покупателей) в момент tk может быть определена как
40 πp(tk)=πp(tk-1)jp=1Jpv^jp(tk)/i=1I+Jpv^di(tk), (8)
41 где v^di(tk),diP,iJbI  — количество продукта di , востребованного агентами i (спрос со стороны предприятий и домохозяйств) в момент tk .
42 Валовая прибыль агента-производителя jp в момент tk :
43 r~jp(tk)=πp(tk)v~jp(tk)-z~jp(tk)-Ljp(tk)wjp(tk), (9)
44 где v~jp(tk),jpJp,pP,tkT  — объем продукции, реализованной агентом-производителем jp в результате монетарных сделок в момент tk .
45 Средняя прибыль агентов-производителей равна
46 R=1Jptk=0Tjp=1Jpr~jp(tk). (10)
47 Среднее число покупателей продукции агентов-производителей —
48 С=1Jptk=0Tjp=1JpiI+Jpn~ijp(tk), (11)
49 Где
50 n~ijp(tk)=1,еслиv~ijp(tk)>0,0,еслиv~ijp(tk)=0.
51 Здесь v~ijp(tk)  — объем продукции, проданной или переданной по бартеру агенту i (iIJp,pP) агентом-производителем jp (jpJp,pP) в момент tk .
52 Тогда можно сформулировать первую задачу формирования оптимальных стратегий поведения агентов-производителей в следующем виде.
53 Задача A. Требуется максимизировать среднюю прибыль и среднее число покупателей для ансамбля агентов-производителей по набору управляющих параметров, определяющих состояния агентов {μa,σa2,μc,σc2}
54 max{μa,σa2,μc,σc2}R;max{μa,σa2,μc,σc2}C (12)
55 при ограничениях R_RR- , C_CC- , μa,μc[-1,1] , σa2,σc2(0,1], где U_,N_ , U-,N-  — нижние и верхние граничные значения целевых функций агентов-потребителей.
56 В рамках предложенного подхода для ансамбля агентов-производителей могут быть выбраны и другие целевые функционалы, например объем выпуска (5), производственные расходы (6) и др.
57 Модель поведения агентов-потребителей
58 Агенты-потребители участвуют в бартерных и монетарных сделках, взаимодействуя с другими агентами-потребителями и агентами-производителями. Подобный подход впервые был предложен для построения и изучения моделей случайных продаж (Kiyotaki, Wright, 1989; Поспелов, Жукова, 2012; Akopov et al., 2023).
59 В такой системе расстояние между продуктом pi~(tk) (pi~(tk)P) , имеющимся у продавца i~, и продуктом di^(tk) (di^(tk)P), который необходим агенту-потребителю i^ , измеренное по длине дуги числовой окружности с равномерно распределенными числами 1,  ...,  P в момент tk :
60 δi~i^(tk)=P-1-1minpi~(tk)-di^(tk),    P-pi~(tk)-di^(tk). (13)
61 Здесь pi~(tk)P,    i~JpI,    pP — индекс продукта, имеющегося у агента-продавца i~ в момент tk ; di^(tk)P,    i^I — индекс продукта, который необходим агенту-потребителю i в момент tk .
62 Оценка уровня соответствия продукта продавца i~ (i~JpI,    pP) интересам агента-потребителя i^ (i^I) в момент tk может быть задана как:
63 βi~i^(tk)=1,еслиδi~i^(tk)α,0,еслиδi~i^(tk)>α, (14)
64 где α0 — коэффициент контрактности (т.е. порогового соответствия) продукта агента-продавца интересам агента-покупателя. Поскольку α0,1, этот коэффициент может интерпретироваться как вероятность сделки.
65 Состояния готовности агента-потребителя i к заключению бартерных и монетарных сделок задаются для каждого момента времени tk с помощью логнормальных распределений с заданными характеристиками:
66 bi(tk)=lnN(μb,σb2)/lnN(μb,σb2),еслиlnN(μb,σb2)>0;0,еслиlnN(μb,σb2)=0, (15)
67 mi(tk)=lnN(μm,σm2)/lnN(μm,σm2),еслиlnN(μm,σm2)>0;0,еслиlnN(μb,σb2)=0, (16)
68 где {lnN(μb,σb2),lnN(μm,σm2)}  — случайные величины, имеющие логнормальные распределения с параметрами {μb,σb2,μm,σm2} .
69 В каждый момент tk между агентом i~ (i~JpI,    pP) и агентом-потребителем i^ может осуществляться монетарная или бартерная сделка, результатом которой является симметричное изменение количества денежных средств при монетарном взаимодействии:
70 qi~(tk)=qi~(tk-1)+πp(tk),есливыполняетсяI;qi~(tk-1),есливыполняетсяIII, (17)
71 qi^(tk)=qi^(tk-1)-πp(tk),есливыполняетсяI;qi^(tk-1),есливыполняетсяIII,    - (18)
72 и продуктов у агентов при монетарном или бартерном взаимодействии:
73 vpi~(tk)=vpi~(tk-1)-1,есливыполняетсяIилиII;vpi~(tk-1),есливыполняетсяIII, (19)
74 vpi^(tk)=vpi^(tk-1)+1,есливыполняетсяIилиII;vpi^(tk-1),есливыполняетсяIII, (20)
75 Где
76 I: πi~(tk-1)=0&πi^(tk-1)>0&βi~i^(tk)=1&mi~(tk)mi^(tk)=1 и агенты расположены в пределах зоны торгового взаимодействия, что означает отсутствие денег у продавца, наличие денег у покупателя, наличие продукта у продавца, пороговое соответствие продукта агента-продавца интересу агента-покупателя и обоюдная готовность агентов к монетарным сделкам;
77 II: πi~(tk-1)=0&πi^(tk-1)=0&βi~i^(tk)=1&bi~(tk)bi^(tk)=1 и агенты расположены в пределах зоны торгового взаимодействия, что означает отсутствие денег у продавца и покупателя, пороговое соответствие продукта агента-продавца интересу агента-покупателя и обоюдная готовность агентов к бартерным сделкам;
78 III: πi~(tk-1)>0&πi^(tk-1)>0, или {πi~(tk-1)=0  &πi^(tk-1)>0  & pi~(tk)=di^(tk)&mi~(tk)mi^(tk)=0}, или {πi~(tk-1)=0&πi^(tk-1)=0&pi~(tk)=di^(tk)&bi~(tk)bi^(tk)=0), или βi~i^(tk)=0, или агенты не расположены в зоне торгового взаимодействия, что означает встречу двух агентов с деньгами, или неготовность агентов к сделке, или пороговое несоответствие продукта агента-продавца интересу агента-покупателя.
79 Прирост денежных средств у агентов-потребителей также обеспечивается получением заработной платы от агентов-производителей в случае занятости.
80 Средняя полезность для агентов-потребителей может быть определена как
81 U=1Itk=0Ti=1Iβi~i^(tk)(δi~i^(tk)+1)-ν-λr,    i{i~:i^I,βi~i^(tk)=1}; (21)
82 средние денежные накопления агентов-потребителей —
83 N=1Itk=0Ti=1Iqi(tk). (22)
84 Здесь r[1,r-]  — радиус торгового взаимодействия, т.е. диапазон ячеек дискретного пространства размещения агентов, считающихся соседними, r-  — максимально допустимое расстояние между взаимодействующими агентами; {v,λ}  — коэффициенты, определяющие влияние издержек расстояния между целевым и приобретаемым продуктом, а также между покупателем и продавцом соответственно.
85 Тогда можно сформулировать вторую задачу формирования оптимальных стратегий поведения агентов-потребителей в следующем виде.
86 Задача B. Требуется максимизировать среднюю полезностью от потребления и средние денежные накопления для ансамбля агентов-потребителей по наборам управляющих параметров, определяющих состояния агентов {μb,σb2,μm,σm2}
87 max{μb,σb2,μm,σm2}U;max{μb,σb2,μm,σm2}N (23)
88 при ограничениях: U_UU- , N_NN- , μb,μm[-1,1] , σb2,σm2(0,1] . Здесь, U_,N_ , U-,N-  — нижние и верхние граничные значения целевых функций агентов-потребителей.
89 ГЕНЕТИЧЕСКИЙ ОПТИМИЗАЦИОННЫЙ АЛГОРИТМ
90 Алгоритм MORCGA-MOPSO
91 Далее, был разработан генетический оптимизационный алгоритм (MORCGA-MOPSO), агрегированный по целевым функционалам с предложенной МСЭС (рис. 2), реализованными с использованием FLAME GPU (Richmond et al., 2010). Особенностью MORCGA-MOPSO является применение методов машинного обучения, в частности искусственных нейронных сетей (ИНС), для аппроксимации фитнес-функции, компоненты которой (т.е. целевые функционалы) вычисляются в результате имитационного моделирования. Подобный подход позволяет существенно сократить временные затраты, обусловленные необходимостью множественных пересчетов агентной модели для каждого варианта потенциальных решений (Jin, 2005).
92

93 Рис. 2. Блок-схема генетического алгоритма (MORCGA-MOPSO) ( t={t0,...,T} — набор итераций MORCGA-MOPSO, T  — общее число итераций, t0T , tTT  — начальный и конечный моменты MORCGA-MOPSO; w  — частота чередования использования алгоритмов MORCGA и MOPSO и взаимного обновления полученными недоминируемыми решениями в рамках единой процедуры эволюционного поиска)
94 Важным отличием MORCGA-MOPSO (см. рис. 2) от других известных алгоритмов многокритериальной оптимизации (например, SPEA (Zitzler, Thiele, 1999), SPEA2 (Zitzler, Laumanns, Thiele, 2001), NSGA-II (Deb et al., 2002a) MOPSO (Xiaohui, Eberhart, 2002) и FCGA (Akopov et al., 2022)) является комбинирование различных эвристических методов в рамках единой процедуры эволюционного поиска Парето-оптимальных решений. В частности, выполнена интеграция многокритериального генетического алгоритма вещественного кодирования MORCGA (multi-objective real-coded genetic algorithm) и многокритериального роевого алгоритма MOPSO (multi-objective particle swarm optimization). В результате обеспечивается существенно большее быстродействие вычислительной процедуры при сохранении достаточно высокого качества получаемых решений (в сравнении с автономным использованием генетических и роевых алгоритмов).
95 Результаты тестирования и верификации MORCGA-MOPSO
96 Для апробации и верификации разработанного алгоритма MORCGA-MOPSO были привлечены известные тестовые функции (табл. 1).
97 Таблица 1. Тестовые функции для RCGA-PSO
98
Тестовая функция Постановка задачи (минимизируемые целевые функции) Диапазоны поиска решений
FT1 — функция Бина – Корна (Binh, Korn, 1997) f1=4x2+4y2f2=(x-5)2+(y-5)2 при условии g1=(x-5)2+y225;g2=(x-8)2+(y+3)27,7 0x5; 0y3
FT2 — функция Фонсеки–Флеминга (Fonseca, Fleming, 1995) f1=1-exp-j=1nxj-n-1/22;f2=1-exp-j=1nxj+n-1/22 -4xj4 , 1jn
FT3 — функция Курсаве (Kursawe, 1991) f1=j=12-10exp-0,2xj2+xj+12;f2=j=13xj0,8+5xj3 -5xj5 , 1j3
FT4 — функция Полони 2 для задач двухкритериальной оптимизации (Po-loni, et al., 2000) f1=1+A1-B12+A2-B22;f2=(x+3)2+(y+1)2 где A1=0,5sin1-2cos1+sin2-1,5cos2;A2=1,5sin1-cos1+2sin2-0,5cos2;B1=0,5sinx-2cosx+siny-1,5cosy;B2=1,5sinx-cosx+2siny-0,5cosy -πxπ-πyπ
FT5 — функция Зистера–Дьеба–Тери N.3 (Deb, et al., 2002b) f1=x1;f2=gh, где g=1+929j=230xj;h=1-f1/g-f1/gsin(10πf1) 0xj1 , 1j30
FT6 — функция Зистера–Дьеба–Тери N.4 (Deb, et al., 2002b) f1=x1;f2=gh, где g=91+j=210xj2-10cos(4πxj);h=1-f1/g 0x11 , -5xj5 , 2j10
99 Затем была выполнена оценка производительности алгоритма MORCGA-MOPSO в сравнении с другими известными параллельными алгоритмами многокритериальной оптимизации, также реализованными с использованием FLAME GPU по наиболее важным критериям:
100 LHV — максимизируемый показатель, характеризующий логарифмический гиперообъем, определяющий суммарную площадь пространства, покрываемого фронтом Парето;
101 IGD — максимизируемая метрика, характеризующая расстояние между фронтом Парето, полученным с помощью эвристического алгоритма, и эталонным фронтом Парето;
102 CPF — максимизируемая мощность фронта Парето, характеризующая число найденных недоминируемых решений, принадлежащих фронту Парето (при условии равномерного распределения решений по фронту Парето);
103 PT, секунд — минимизируемое время, затрачиваемое на формирование Парето-оптимальных решений;
104 CPF / PT — соотношение числа полученных недоминируемых решений к затраченному процессному времени.
105 В табл. 2 представлены средние значения показателей производительности MORCGA-MOPSO в сравнении с другими известными параллельными алгоритмами многокритериальной оптимизации. Оптимизационные эксперименты были проведены на суперкомпьютере ЦЭМИ РАН DSWS PRO (2x Intel Xeon Silver 4114, 1x NVIDIA QUADRO RTX) при использовании 100 агентов-процессов и агентов-частиц, общем числе итераций T=100 и w=5 . Таблица 2. Оценка эффективности MORCGA-MOPSO
106
Показатель эффективности MORCGA-MOPSO Алгоритмы MORCGA и PSO
SPEA SPEA2 NSGA-II FCGA MOPSO
FT1 — Функция Бина и Корна
LHV 3,841 3,824 3,829 3,840 3,843 3,807
IGD 0,0759 0,0224 0,0761 0,1323 0,2795 0,0223
CPF 1712 996 1052 2587 2760 835
PT, с 54 52 63 103 147 21
CPF/PT 31,7 19,2 16,8 25,0 18,8 39,1
FT2 — Функция Фонсеки и Флеминга
LHV –0,0014 –0,0038 –0,0034 –0,0013 –0,0019 –0,0019
IGD 0,0002 0,0004 0,0002 0,0001 0,0001 0,0009
CPF 1330 379 519 2826 2825 308
PT, с 41 27 32 165 257 21
CPF/PT 32,2 14,2 16,2 17,2 11,0 14,9
FT3 — Функция Курсаве
LHV 1,9016 1,8895 1,8923 1,8996 1,9035 1,8664
IGD 0,0439 0,0493 0,1489 0,0608 0,0618 0,1166
CPF 117 29 24 357 335 36
PT, с 31 21 14 44 45 21
CPF/PT 3,8 1,4 1,7 8,1 7,4 1,7
FT4 — Функция Полони
LHV 2,7065 2,6815 2,7055 2,6933 2,6925 2,7061
IGD 0,1606 0,2787 0,2002 0,3737 0,3362 0,1298
CPF 112 53 84 54 67 94
PT, с 25 17 18 31 35 21
CPF/PT 4,5 3,2 4,7 1,8 1,9 4,5
FT5 Функция ЗистераДьебаТери N.3
LHV 0,2021 0,2011 0,2021 0,2014 0,2021 0,2017
IGD 0,0023 0,0023 0,0023 0,0023 0,0024 0,0024
CPF 259 259 259 258 260 258
PT, с 22 17 23 35 43 11
CPF/PT 11,8 15,5 11,4 7,4 6,0 24,2
FT6 — Функция ЗистераДьебаТери N.4
LHV 0,0678 0,0561 0,0614 0,0758 0,0743 0,0630
IGD 0,0096 0,0153 0,0151 0,0111 0,0104 0,0103
CPF 1106 144 116 3588 3480 123
PT, с 37 15 13 121 185 11
CPF/PT 29,6 9,4 9,2 29,6 18,8 11,5
107 Примечание. Темно-серым цветом выделены ячейки с показателями эффективности эвристических алгоритмов, значения которых являются наилучшими для соответствующей тестовой функции (т.е. максимальными для LHV, CPF, CPF/PT и минимальными для IGD и PT).; светло-серым — показатели, значения которых можно оценить как относительно благоприятные.
108 Анализ показал, что предложенный гибридный генетический алгоритм MORCGA-MOPSO по критерию временной эффективности (PT) сопоставим c методами быстрой многокритериальной эвристической оптимизации MOPSO (Xiaohui, Eberhart, 2002) и SPEA (Zitzler, Thiele, 1999), а по мощности фронта Парето (CPF) и логарифмическому гиперобъему (LHV) — с ресурсозатратными алгоритмами NSGA-II (Deb et al., 2002) и FCGA (Akopov et al., 2022).
109 На рис. 3 представлена визуализация аппроксимируемых фронтов Парето, полученных с использованием исследуемых алгоритмов для выбранного набора тестовых функций. Результатом решения двухкритериальных задач A и B являются множества субоптимальных решений. Из них на рис. 3 приведены 8 наиболее различающихся решений (А.1–А.8 и В.1–В.8).
110

111 Рис. 3. Аппроксимируемые фронты Парето для набора тестовых функций
112 Как следует из графиков на рис. 3 и данных в табл. 2 (см. показатель IGD), алгоритм MORCGA-MOPSO обеспечивает достаточное приближение аппроксимируемых фронтов Парето к соответствующим истинным фронтам, количественные характеристики которых являются известными.
113 РЕЗУЛЬТАТЫ ОПТИМИЗАЦИОННЫХ ЭКСПЕРИМЕНТОВ
114 Далее, были проведены оптимизационные эксперименты с использованием разработанного гибридного генетического алгоритма MORCGA-MOPSO, агрегированного по целевым функционалам с предложенной имитационной моделью МСЭС. При этом были приняты следующие наиболее важные допущения.
115 Период моделирования T=12 (мес.).
116 Общее число отраслей промышленности — P=15 , отрасли характеризуются эластичностью выпуска по основным фондам γp[0.3,0.98],pP (нижняя граница соответствует «производству резиновых и пластмассовых изделий», верхняя — «производству машин и оборудования»).
117 Общее число агентов-производителей, т.е. промышленных предприятий, Jp=150 (соотношение с реальным числом предприятий 1 : 2000) и агентов-потребителей, т.е. занятых и незанятых индивидуумов, I=3000 (соотношение с реальным числом людей 1 : 5000).
118 Радиус торгового взаимодействия: r=10 (ячеек дискретного пространства).
119 Коэффициенты, определяющие влияние издержек расстояний: v=1,5 , λ=0,01 .
120 На рис. 4 показаны фронты Парето и выделены частные наиболее отличающиеся субоптимальные альтернативы, полученные в результате решения задач A и B с использованием MORCGA-MOPSO.
121

122 Рис. 4. Аппроксимируемые фронты Парето, вычисленные для задач A и B с использованием MORCGA-MOPSO
123 В табл. 3 представлены субоптимальные решения, принадлежащие фронтам Парето (см. рис. 4), вычисленным с использованием MORCGA-MOPSO для задач A и B.
124 Таблица 3. Субоптимальные решения, принадлежащие фронтам Парето
125
Субоптимальные решения для задачи A Параметры логнормальных распределений агентов-производителей Преимущественные состояния агентов
μa σa2 μc σc2 ajp(tk) сjp(tk)
Решение A.1 –0,4450 0,4620 –0,1010 0,8190 0 0
Решение A.2 –0,6500 0,0540 –0,2730 0,3440 0 0
Решение A.3 0,1530 0,6810 0,1930 0,4850 0 0
Решение A.4 0,1720 0,5360 0,2680 0,3020 0 1
Решение A.5 0,3890 0,6700 0,6480 0,6690 1 1
Решение A.6 0,6730 0,4850 0,9740 0,5540 1 1
Решение A.7 0,7250 0,4700 0,8230 0,5350 1 1
Решение A.8 0,8050 0,7740 0,9840 0,6190 1 1
Субоптимальные решения для задачи B Параметры логнормальных распределений агентов-потребителей Преимущественные состояния агентов
μb σb2 μm σm2 bi(tk) mi(tk)
Решение B.1 0,9710 0,3500 0,9520 0,0200 1 1
Решение B.2 0,9340 0,0230 0,8570 0,8240 1 1
Решение B.3 0,7850 0,3220 0,9200 0,7360 1 1
Решение B.4 0,9670 0,7690 0,8970 0,5790 1 1
Решение B.5 0,7350 0,1520 0,1170 0,9010 1 0
Решение B.6 0,1620 0,7910 0,1470 0,6610 0 0
Решение B.7 – 0,1220 0,8260 –0,1490 0,5720 0 0
Решение B.8 – 0,5510 0,2320 –0,2870 0,7650 0 0
126 Стратегия поведения агентов-производителей, направленная на максимизацию собственной прибыли (решения A.1–A.4) в основном реализуется за счет ограничения темпов ввода новых основных фондов и трудовых ресурсов (см. табл. 3). Увеличение клиентской базы, наоборот, обусловливает необходимость наращивания производственных ресурсов (решения A.5–A.8). Стратегия поведения агентов-потребителей, направленная на максимизацию средней полезности от потребления, как правило, предполагает реализацию всех типов сделок (решения B.1–B4). Максимизация денежных накоплений сопровождается отказом от монетарных сделок в пользу бартерного обмена (решения B.5–B.8).
127 ЗАКЛЮЧЕНИЕ
128 В данной работе представлен подход к имитационному моделированию продуктовых взаимодействий и оптимизации стратегий поведения экономических агентов в рамках МСЭС. Сформулированы важные двухкритериальные оптимизационные задачи для ансамблей агентов-производителей и агентов-потребителей. Разработан новый параллельный гибридный генетический алгоритм (MORCGA-MOPSO), в рамках которого реализуется комбинированное использование генетического алгоритма вещественного кодирования (класса RCGA) и метода роевой оптимизации (PSO) для достижения максимальной временной эффективности. Выполнена программная реализация разработанной имитационной модели МСЭС, агрегированной по целевым функционалам с предложенным генетическим алгоритмом в системе крупномасштабного агентного моделирования FLAME GPU.
129 Дальнейшие исследования будут направлены на детализацию МСЭС, увеличение типов и общего количества взаимодействующих экономических агентов, а также развитие методов оптимального управления их поведением с использованием генетических алгоритмов и машинного обучения.

References

1. Aganbegyan A.G., Valtukh K.K. (1974). The use of national-economy models in planning. Mos-cow: Ekonomika (in Russian).

2. Akopov A.S., Beklaryan A.L., Zhukova A.A. (2023). Optimization of characteristics for a sto-chastic agent-based model of goods exchange with the use of parallel hybrid genetic algo-rithm. Cybernetics and Information Technologies, 23 (2), 87–104.

3. Akopov A.S., Beklaryan L.A., Beklaryan A.L. (2022). Multisector bounded-neighborhood model: Agent segregation and optimization of environment’s characteristics. Math. Models & Comput. Simul., 14, 503–515 (in Russian).

4. Akopov A.S., Beklaryan L.A., Thakur M. (2022). Improvement of maneuverability within a mul-tiagent fuzzy transportation system with the use of parallel biobjective real-coded genetic algorithm. IEEE Transactions on Intelligent Transportation Systems, 23 (8), 12648–12664.

5. Akopov A.S., Beklaryan L.A., Thakur M., Verma D.B. (2019). Parallel multi-agent real-coded genetic algorithm for large-scale black-box single-objective optimisation. Knowledge-Based Systems, 174, 103–122.

6. Binh T., Korn U. (1997). MOBES: A multiobjective evolution strategy for constrained optimiza-tion problems. In: Proceedings of the Third International Conference on Genetic Algorithms. Czech Republic, 176–182.

7. Deb K., Pratap A., Agarwal S., Meyarivan T. (2002a). A fast and elitist multiobjective genetic algorithm: NSGA-II. IEEE Transactions on Evolutionary Computation, 6 (2), 182–197.

8. Deb K., Thiele L., Laumanns M., Zitzler E. (2002b). Scalable multi-objective optimization test problems. Proceedings of the 2002 IEEE Congress on Evolutionary Computation, 1, 825–830.

9. Ershov Yu.S., Melnikova L.V., Suslov V.I. (2009). The practice of the use of multiregional input-output models in strategic forecasts of Russian economy. Vestnik NSU. Series: Social and Economics Sciences, 9 (4), 9–23 (in Russian).

10. Fonseca C.M., Fleming P.J. (1995). An overview of evolutionary algorithms in multiobjective optimization. Evolutionary Computation, 3 (1), 1–16.

11. Holland J.H. (1992). Genetic Algorithms. Scientific American, 267 (1), 66–73.

12. Jin Y. (2005). A comprehensive survey of fitness approximation in evolutionary computation. Soft Computing, (9), 3–12.

13. Kennedy J. (1997). The particle swarm: Social adaptation of knowledge. Proceedings of IEEE In-ternational Conference on Evolutionary Computation, 303–308.

14. Kiyotaki N., Wright R. (1989). On money as a medium of exchange. Journal of Political Econo-my, 97 (4), 927–954.

15. Kursawe F. (1991). A variant of evolution strategies for vector optimization. PPSN I990. Lecture Notes in Computer Science. Springer, Berlin, Heidelberg, 496, 193–197.

16. Leontief W.W. (1925). Balance of the national economy of the USSR. Methodological analysis of the work of the CSB. Planned Economy: Monthly Journal. Publication of the State Planning Commission of the USSR, 12, 254–258 (in Russian).

17. Lotov A.V., Bushenkov V.A., Kamenev G.K. (2004). Interactive decision maps. Approximation and visualization of the Pareto frontier. Boston: Kluwer Academic Publishers. 307 p.

18. Lotov A.V., Miettinen K. (2008). Visualizing the Pareto Frontier. In: Multiobjective optimization. Interactive and evolutionary approaches, lecture notes in computer science, 5252. Berlin-Heidelberg: Springer, 213–244.

19. Makarov V.L., Bakhtizin A.R., Beklaryan G.L., Akopov A.S., Rovenskaya E.A., Strelkovskii N.V. (2022). Agent-based modeling of social and economic impacts of migration under the government regulated employment. Economics and Mathematical Methods, 58 (1), 113–130 (in Russian).

20. Makarov V.L., Bakhtizin A.R., Beklaryan G.L., Akopov A.S., Rovenskaya E.A., Strelkovskiy N.V. (2020). Agent-based modelling of population dynamics of two interacting social com-munities: Migrants and natives. Economics and Mathematical Methods, 56 (2), 5–19 (in Russian).

21. Makarov V.L., Bakhtizin A.R., Beklaryan G.L., Akopov A.S., Rovenskaya E.A., Strelkovskiy N.V. (2019). Aggregated agent-based simulation model of migration flows of the European Union countries. Economics and Mathematical Methods, 55 (1), 3–15 (in Russian).

22. Makarov V.L., Bakhtizin A.R., Epstein J.M. (2022). Agent-based modeling for a complex world. 2nd ed., revised. Moscow: GAUGN, Scientific publications department. 74 p.

23. Poloni G., Giurgevich A., Onesti L., Pediroda V. (2000). Hybridization of a multi-objective ge-netic algorithm, a neural network and a classical optimizer for a complex design problem in fluid dynamics. Computer Methods in Applied Mechanics and Engineering, 186 (2–4), 403–420.

24. Pospelov I.G. (2018). A model of random sales. Math. Notes, 103, 453–465 (in Russian).

25. Pospelov I.G., Zhukova A.A. (2012). Stochastic model of illiquid asset trade. Proceedings of MIPT, 2, 131–146 (in Russian).

26. Richmond P., Walker D., Coakley S., Romano D. (2010). High performance cellular level agent-based simulation with FLAME for the GPU. Briefings in Bioinformatics, 11 (3), 334–347.

27. Shatilov N.F. (1967). Modeling the expanded reproduction. M.: Ekonomika (in Russian).

28. Suslov V.I., Domozhirov D.A., Ibragimov N.M., Kostin V.S., Melnikova L.V., Tsyplakov A.A. (2016). Agent-based multiregional input-output model of the Russian economy. Economics and Mathematical Methods, 52 (1), 112–131 (in Russian).

29. Veduta N.I. (1999). Socially effective economy. Moscow: REA (in Russian).

30. Xiaohui Hu, Eberhart R. (2002). Multiobjective optimization using dynamic neighborhood par-ticle swarm optimization. Proceedings of the 2002 Congress on Evolutionary Computation. CEC'02 (Cat, 02TH8600). Honolulu, HI, USA, 1677–1681.

31. Zitzler E., Laumanns M., Thiele L. (2001). SPEA2: Improving the strength Pareto evolutionary algorithm. Swiss Federal Inst. Technol., Zürich, Switzerland, TIK-Rep. 103 p.

32. Zitzler E., Thiele L. (1999). Multiobjective evolutionary algorithms: A comparative case study and the strength Pareto approach. IEEE Transactions on Evolutionary Computation, 3 (4), 257–271.

Comments

No posts found

Write a review
Translate