The Property of Synthesizing by the Wald-Savage Criterion and Economic Application
Table of contents
Share
Metrics
The Property of Synthesizing by the Wald-Savage Criterion and Economic Application
Annotation
PII
S042473880006775-1-1
DOI
10.31857/S042473880006775-1
Publication type
Article
Status
Published
Authors
Lev Labsker 
Occupation: Professor to the Department
Affiliation: Financial University under the Government of the Russian Federation
Address: Moscow, Russian Federation
Pages
89-103
Abstract

In the game with nature, the synthetic Wald–Savage criterion is defined as the principle of optimality, which makes possible to evaluate the optimality of strategies from a synthetic (joint) point of view of wins and risks. The definition of the synthesized strategy is given, i.e. a strategy that is optimal by the Wald–Savage criterion and is not optimal by either the Wald criterion or the Savage criterion. Introduced into the property of synthesizing, which consists in the existence of a synthesized strategy. Scientific novelty consists in solving the formulated problem of synthesizing, which consists in finding the necessary and sufficient conditions for the Wald–Savage criterion to have no synthesizing properties. Sufficient conditions are also of practical importance in analyzing the problems of making optimal economic decisions, since the fulfillment of these conditions means that it does not make sense to use the Wald–Savage criterion to find synthesized strategies. Moreover, the verification of sufficient conditions does not require reference to the Wald–Savage criterion itself, but is based only on the component criteria. However, the exploitation of the Wald–Savage criterion in the absence of its synthesis properties is not absolutely useless, since it reveals the dependence of the application of the Wald and Savage criteria on the determined payoff indicator. The application of the obtained results is illustrated on the solution of the problem of economic content on the optimal choice of the technological mode of production.

Keywords
playing with nature, Wald criterion, Savage criterion, payoff-indicator, Wald–Savage criterion, synthesized strategy, Wald–Savage synthesizing problem, synthesizing problem solving, two-criterion optimization problem, technological methods of production, need for products , the optimal choice of production method.
Received
21.10.2019
Date of publication
16.12.2019
Number of purchasers
23
Views
362
Readers community rating
0.0 (0 votes)
Cite Download pdf 100 RUB / 1.0 SU

To download PDF you should sign in

Full text is available to subscribers only
Subscribe right now
Only article
100 RUB / 1.0 SU
Whole issue
720 RUB / 15.0 SU
All issues for 2019
2534 RUB / 30.0 SU
1

Введение

2 Во многих задачах финансово-экономического содержания принятие решений зависит не только от лица, принимающего решение (ЛПР), но и от объективной действительности, о которой у ЛПР в момент принятия решения недостаточно информации. Часто подходящей математической моделью для анализа таких задач служит «Игра с природой» (или, в другой терминологии, «Статистическая игра»), в которой участвуют два игрока: рациональный игрок A — ЛПР и П — природа, представляющая собой объективную действительность, определяющую при каждом решении игрока A появление конкретного исхода (результата). Природа не является ни противником, ни союзником игрока A. Она в любой момент случайным образом принимает то или иное свое состояние, не преследуя никакой конкретной цели, и абсолютно безразлична к результатам игры.
3 Таким образом, ЛПР принимает решение в условиях неопределенности, которая все же не будет абсолютной, поскольку ЛПР известны все возможные состояния природы, но при этом неизвестны вероятности, с которыми природа может находиться в этих состояниях, и отсутствует всякая статистическая возможность их определения.
4 Для принятия решения, которое, как известно, является одной из главных составляющих любого управления, игрок A, будучи рациональным, стремится из возможных альтернативных стратегий выбрать стратегию, максимально отвечающую поставленным целям решения задачи. Для сравнения стратегий по их эффективности ЛПР необходимо подобрать подходящий принцип оптимальности.
5 Проблема выбора принципа оптимальности стратегий в играх с природой (Лабскер, 2014, с. 12–59) — одна из центральных в теории принятия решений. Существуют разнообразные критерии оптимальности с различными свойствами. Некоторые из них, выигрыш-критерии, определяют оптимальность выбираемых стратегий с точки зрения выигрышей, абстрагируясь от рисков, например критерий Вальда (Wald, 1950; Лабскер, 2014, с. 273–308), максимаксный критерий (Лабскер, 2014, с. 349–362) и др. Риск-критерии характеризуют оптимальность стратегий с позиций рисков, абстрагируясь от выигрышей. Например, критерий Сэвиджа (Savage, 1951; Лабскер, 2014, с. 308–349), миниминный критерий (Лабскер, 2014, с. 362–376) и др. Широко используются комбинированные критерии, составленные из двух выигрыш-критериев или двух риск-критериев. В каждой такой паре один из критериев является крайне пессимистическим, а другой — крайне оптимистическим, например, классический выигрыш-критерий Гурвица (Hurwicz, 1951; Arrow, Hurwicz, 1972; Лабскер, 2014, с. 479–558) и риск-критерий Гурвица (Лабскер, 2014, с. 534–558).
6 Заслуживает внимания подход выбора стратегии, оптимальной с синтетической (совместной) точки зрения выигрышей и игровых рисков. Такие критерии будем называть синтетическими. В (Лабскер, 2014, с. 652–655) предложен общий подход к конструированию синтетических критериев и приведены формулы показателей эффективности стратегий по различным синтетическим критериям. В работах (Лабскер, Ященко, Амелина, 2011, 2012) был введен в рассмотрение конкретный синтетический критерий Вальда–Сэвиджа, проведен его детальный математический анализ и дано приложение к решению задачи об установлении приоритетного порядка кредитования потенциальных корпоративных заемщиков банка. Для описания критерия Вальда–Сэвиджа кратко напомним необходимые определения.
7

Критерий Вальда–Сэвиджа

8 Пусть в игре с природой игрок A обладает множеством альтернативных стратегий S={A1,...,Am} , m2 ; П1,  ...,  Пn — состояния природы, n2 . Пусть действительные числа aij , iI={1,...,m} , jJ={1,...,n} — это выигрыши игрока A в игровой ситуации (Ai,Пj) , когда игрок A выбирает стратегию Ai, а природа находится в состоянии Пj. Величину βj=max{aij:iI} , jJ , назовем показателем благоприятности состояния Пj. Выбор игроком A стратегии Ai, когда природа находится в состоянии Пj, сопровождается риском rij=βj-aij,iI,jJ , неполучения игроком A наибольшего при состоянии природы Пj выигрыша βj (Лабскер, 2014, с. 18–25). Таким образом, риск rij количественно характеризует упущенную игроком A возможность (при выборе им стратегии Ai) получения максимального выигрыша βj при нахождении природы в состоянии Пj и может интерпретироваться как своеобразная плата за отсутствие у игрока A информации о состоянии природы при выборе им стратегии Ai.
9 Критерий Вальда (W-критерий) определяется следующими компонентами (Wald, 1950; Лабскер, 2014, с. 273–308): Wi=min{aij:jJ} — показатель эффективности стратегии Ai, iI ; WS=max{Wi:iI} — цена игры (W-цена); стратегия Ak называется оптимальной (W-оптимальной), если Wk=WS ; SO(W) — множество W-оптимальных стратегий.
10 Критерий Сэвиджа (Sav-критерий) описывается следующими составляющими (Savage, 1951; Лабскер, 2014, с. 308–349): Savi=max{rij:jJ} — показатель неэффективности стратегии Ai, iI ; SavS=min{Savi:    iI} — цена игры (Sav-цена); стратегия Ak называется оптимальной (Sav-оптимальной), если Savk=SavS ; SO(Sav)  — множество Sav-оптимальных стратегий.
11 Далее нам понадобится критерий (-Sav) , противоположный критерию Сэвиджа, который определяется следующим образом: (-Sav)i=-Savi — показатель эффективности стратегии Ai, iI ; (-Sav)S=-SavS — цена игры (–Sav-цена); стратегия Ak называется оптимальной (–Sav-оптимальной), если (-Sav)k=(-Sav)S ; SO((-Sav)) — множество –Sav-оптимальных стратегий.
12 Два критерия будем называть эквивалентными, если множества оптимальных стратегий по этим критериям совпадают. Нетрудно показать, что критерий Сэвиджа и противоположный ему критерий эквивалентны.
13 В определении критерия Вальда–Сэвиджа важную роль играют выигрыш-показатель α[0,1] и риск-показатель (1-α)[0,1] , количественно выражающие степень предпочтения, отдаваемого игроком A соответственно выигрышам и рискам. Выбор игроком A значения выигрыш-показателя α является субъективным и связан с его психологическими особенностями, определяющими его отношение к выигрышам и рискам.
14 При α=0 и, следовательно, 1-α=1 игрок A при выборе стратегии абстрагируется от выигрышей, сконцентрировав свое внимание только на рисках. И, наоборот, при α=1 и, следовательно, 1-α=0 игрок A во главу угла ставит выигрыши, абстрагируясь от рисков.
15 Критерий Вальда–Сэвиджа с выигрыш-показателем α[0,1] (далее — (WSav)(α)-критерий) определяется следующим образом:
16 (WSav)i(α)=αWi-(1-α)Savi=(Wi+Savi)α-Savi — (WSav)(α)-показатель эффективности стратегии Ai, iI ; (WSav)S=max{(WSav)i(α):iI} — (WSav)(α)-цена игры; стратегию Ak назовем (WSav)(α)-оптимальной, если (WSav)i(α)=(WSav)S(α) ; SO((WSav)(α)) — множество (WSav)(α)-оптимальных стратегий.
17 Очевидно, что при α=0 критерий Вальда–Сэвиджа превращается в критерий, противоположный критерию Сэвиджа, и, следовательно, эквивалентен критерию Сэвиджа. При α=1 критерий Вальда–Сэвиджа превращается в критерий Вальда.
18 Из определения показателя (WSav)i(α) видно, что он является линейной функцией аргумента α[0,1] с угловым коэффициентом (Wi+Savi) . Следовательно, графиком показателя (WSav)i(α) является отрезок (-Savi)Wi (обозначаемый двумя его концами) с левым концом (-Savi)=(WSav)i(0) и правым концом Wi=(WSav)i(1) . Тогда графиком цены игры (WSav)S(α) является верхняя огибающая m отрезков (-Savi)Wi , iI , представляющая собой ломаную, состоящую из не более m звеньев, число которых обозначим через lI . Очевидно, что 1lm .
19

Проблема синтезирования критерием Вальда–Сэвиджа

20 Определение 1. Стратегию, оптимальную по критерию Вальда–Сэвиджа при выигрыш-показателе α(0,    1) , будем называть синтезированной при данном значении выигрыш-показателя α, если она не является оптимальной ни по критерию Вальда, ни по критерию Сэвиджа.
21 Определение 2. Будем говорить, что в данной игре с природой критерий Вальда–Сэвиджа при фиксированном значении выигрыш-показателя α(0,1) обладает свойством синтезирования, если при данном значении выигрыш-показателя α существует синтезированная стратегия, т.е. SO((WSav)(α))[SO(W)SO(Sav)] .
22 Определение 3. Если в данной игре с природой ни при каком значении выигрыш-показателя α[0,1] не существует синтезированной стратегии, т.е. при любом значении α[0,1] каждая стратегия, оптимальная по критерию Вальда–Сэвиджа, оптимальна по критерию Вальда или по критерию Сэвиджа:
23 SO((WSav)(α))[SO(W)SO(Sav)] , α[0,1] , —(1)
24 будем говорить, что в данной игре критерий Вальда–Сэвиджа не обладает свойством синтезирования.
25 Нетрудно убедиться в том, что в общем случае включение (1) необратимо.
26 Так как при α=0 и α=1 критерий Вальда–Сэвиджа соответственно эквивалентен критерию Сэвиджа и совпадает с критерием Вальда, то при этих значениях α критерий Вальда–Сэвиджа свойством синтезирования не обладает. Именно поэтому в определениях 1 и 2 указанные значения α исключены из рассмотрения.
27 В следующем предложении сформулировано еще одно условие отсутствия у критерия Вальда–Сэвиджа свойства синтезирования.
28 Предложение 1. В игре с природой, в которой число m стратегий игрока A равно 2, критерий Вальда–Сэвиджа свойством синтезирования не обладает.
29 Доказательство. В рассматриваемой игре у игрока A имеется две стратегии A1 и A2 . Отрезки (-Sav1)W1 и (-Sav2)W2 , представляющие графики показателей эффективности (WSav)1(α) и (WSav)2(α) этих стратегий либо совпадают, либо не пересекаются, либо пересекаются.
30 В первых двух случаях графиком цены игры (WSav)S(α) является отрезок. Тогда (Лабскер, Ященко, Амелина, 2011, теорема 11) выполняется условие
31 SO(W)SO(Sav) Ø. (2)
32 Из условия (2) (Лабскер и др., 2011, теорема 10) следует равенство SO((WSav)(α))=SO(W)SO(Sav) , α(0,1) , из которого вытекает включение (1).
33 Если же отрезки (-Sav1)W1 и (-Sav2)W2 пересекаются, очевидно, что выполняется и включение (1).
34 Таким образом, во всех трех возможных случаях имеет место включение (1), означающее по определению 3, что (WSav)(α)-критерий свойством синтезирования не обладает. ▄
35 Таким образом, при α=0, или α=1 , или m=2 никакого синтезирования быть не может. Значит, ожидать синтезированное решение в результате применения критерия Вальда–Сэвиджа можно только при выигрыш-показателях α(0,1) и при числе стратегий m3 , что мы и будем предполагать в дальнейшем.
36 Из определения критерия Вальда–Сэвиджа следует, что основное его предназначение состоит в синтезировании крайне высоких предпочтений, отдаваемых ЛПР выигрышам ( α=1 , используется критерий Вальда) и рискам ( α=0 , используется критерий Сэвиджа).
37 Применяя критерий Вальда–Сэвиджа при определенном значении выигрыш-показателя α(0,1) , ЛПР надеется получить собственно взвешенное оптимальное решение по этому критерию, а не оптимальные решения, которые в то же время будут оптимальными по исходным критериям Вальда или Сэвиджа, так как в последнем случае применение критерия Вальда–Сэвиджа при выбранном значении выигрыш-показателя не дает желаемых результатов. Столкнувшись с этим, ЛПР задается естественным вопросом, а, может быть, при каких-то других значениях выигрыш-показателя существует собственно взвешенное оптимальное решение. Но проверить это для каждого значения выигрыш-показателя α(0,1) прямым вычислением показателей эффективности стратегий по критерию Вальда–Сэвиджа для последующего их сравнения, к сожалению, принципиально не представляется возможным, поскольку этих значений бесконечно много. В связи с этим возникает вопрос, в любой ли игре (при условиях α(0,1) и m3 ) критерий Вальда–Сэвиджа обладает свойством синтезирования. Этот вопрос порождает проблему синтезирования критерием Вальда–Сэвиджа.
38 В настоящей статье дано решение этой проблемы, а именно найдены необходимые и достаточные условия на игру с природой, при которых критерий Вальда–Сэвиджа в этой игре свойством синтезирования не обладает и, следовательно, применять его для отыскания синтезированных стратегий не имеет смысла. При этом важно отметить, что эти условия не связаны с вычислением и последующим сравнением между собой показателей эффективности стратегий по критерию Вальда–Сэвиджа, а основываются только на исходных критериях Вальда и Сэвиджа. Тем не менее любое решение, полученное в результате применения критерия Вальда–Сэвиджа, синтезированное или нет, выявляет распределение стратегий, оптимальных по критерию Вальда или по критерию Сэвиджа, по значениям выигрыш-показателя α[0,1] . Приложение полученных результатов иллюстрируется на решении задачи экономического содержания.
39 Рассматриваемая проблема с математической точки зрения, абстрагированной от теории игр с природой, является задачей о нахождении в двухкритериальной задаче оптимизации необходимых и достаточных условий существования решений, оптимальных по взвешенному критерию и не оптимальных ни по одному из двух исходных критериев.
40

Математическое решение проблемы

41 Приведем необходимые обозначения и определения для постановки и решения задачи в рамках двухкритериальной задачи оптимизации.
42 I={1,...,m},    m3, J={1,...,n},    n3; S — множество m векторов Ai=(ai1,...,ain),    iI, в пространстве Rn ; K1 — первый исходный критерий ( K1 -критерий); Ki1=min{aij:jJ} — целевая функция K1 -критерия, определенная на множестве S ( K1 -показатель вектора Ai ); KS1=max{Ki1:iI}=max{min{aij:jJ}:iI} — максимин; SO(K1)={Ai:Ki1=KS1}; — множество векторов, оптимальных по K1 -критерию ( K1 -оптимальных) во множестве S, т.е. векторов Ai , удовлетворяющих условию Ki1=KS1; K2 — второй исходный критерий ( K2 -критерий); Ki2=max{rij:jJ} , где rij=βj-aij , βj=max{aij:iI} , — целевая функция K2 -критерия, определенная на множестве S ( K2 —показатель вектора Ai ); KS2=min{Ki2:iI}=min{max{rij:jJ}:iI} — минимакс; SO(K2)={Ai:Ki2=KS2} — множество векторов, оптимальных по K2 -критерию ( K2 -оптимальных) во множестве S, т.е. векторов Ai , удовлетворяющих условию Ki2=KS2 ; K(α)  — синтетический критерий ( K(α) -критерий), где α[0,1] — коэффициент критерия K(α) ; Ki(α)=αKi1-(1-α)Ki2=(Ki1+Ki2)α-Ki2,    iI, — целевая функция K(α) -критерия, определенная на множестве S ( K(α) — показатель вектора Ai ); KS(α)=max{Ki(α):iI} — максимальное значение целевой функции Ki(α) на множестве S при фиксированном α[0,1] ; SO(K(α))={Ai:Ki(α)=KS(α)} — множество векторов, оптимальных по K(α) -критерию ( K(α) -оптимальных) во множестве S, т.е. векторов Ai , удовлетворяющих условию Ki(α)=KS(α) ; (SO(K1))O(K2) — множество векторов, K2 -оптимальных во множестве K1 -оптимальных; KSO(K1)2=min{Ki2:AiSO(K1)} ; (SO(K2))O(K1) — множество векторов, K1 -оптимальных во множестве K2 -оптимальных; KSO(K2)1=max{Ki1:AiSO(K2)} .
43 Нетрудно убедиться, что (SO(K1))O(K2), (SO(K2))O(K1), (SO(K1))O(K2)SO(K1), (SO(K2))O(K1)SO(K2).
44 Графиками показателей Ki(α),iI, как линейных функций аргумента α[0,    1] , являются отрезки (-Ki2)Ki1,iI, с левым концом Ki(0)=(-Ki2) и правым концом Ki(1)=Ki1 . Тогда графиком функции KS(α) является ломаная с l звеньями, представляющая верхнюю огибающую указанных отрезков.
45 Графики показателей Kσ(α) всех векторов Aσ(SO(K2))O(K1) совпадают и представляют отрезок (-KS2)KSO(K2)1, а графики показателей Kω(α) всех векторов Aω(SO(K1))O(K2) совпадают и представляют отрезок (-KSO(K1)2)KS1 (рис. 1).
46 Рис. 1. Графики показателей векторов в случае, когда ломаная, представляющая график KS(α) , состоит из трех звеньев (l=3)
47 Вектор, оптимальный по K(α) -критерию при некотором α[0,1] , назовем синтезированным, если он не является оптимальным ни по одному из критериев K1 и K2 . Математическая задача состоит в нахождении необходимых и достаточных условий отсутствия синтезированных векторов при любом α[0,1] , т.е. в справедливости включения
48 SO(K(α))[SO(K1)SO(K2)],α[0,1]. (3)
49 Очевидно, что при α=0 или α=1 выполняется (3). При m=2 включение (3) также имеет место. Чтобы в этом убедиться, достаточно воспроизвести доказательство предложения 1 в терминах математической задачи.
50 Далее будем предполагать, что α(0,1) , m3 ,
51 SO(K1)SO(K2)= ,(4)
52 S[SO(K1)SO(K2)]. (5)
53 Через τ(K) обозначим условие, состоящее в том, что для каждого вектора
54 AρSO(K1)SO(K2) (6)
55 (существующего в силу (5)), справедливо неравенство
56 (KSO(K1)2-KS2)Kρ1-(KS1-KSO(K2)1)Kρ2<KSO(K2)1KSO(K1)2-KS1KS2 . (7)
57 Аналогично доказательству леммы 3 (Лабскер и др., 2011а; Лабскер, Ященко, 2013) можно показать справедливость следующего предложения.
58 Предложение 2. Пусть выполняется условие (4) и Aσ(SO(K2))O(K1), Aω(SO(K1))O(K2) . Тогда отрезки Kσ(α)=(-KS2)KSO(K2)1 и Kω(α)=(-KSO(K1)2)KS1 не совпадают и пересекаются в точке N(α(K),δ(K)) с абсциссой
59 α(K)=KSO(K1)2-KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1)(0,1) (8)
60 и ординатой
61 δ(K)=KSO(K2)1KSO(K1)2-KS1KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1) (9)
62 (см. рис. 1).
63 Предложение 3 (необходимые условия). При условиях (4) и (5) условие (3) влечет за собой справедливость утверждений:
64 a)l=2 ;
65 b) выполняется условие τ(K) ;
66 с) множество
67 SO(K(α))=SO(K2)    при    α=0;(SO(K2))O(K1)    при    0<α<α(K);SO(K(α))=(SO(K2))O(K1)(SO(K1))O(K2)    при    α=α(K);(SO(K1))O(K2)    при    α(K)<α<1;SO(K1)    при    α=1, (10)
68 где α(K) определяется формулой (8).
69 Доказательство. Докажем утверждение a). Допустим противное этому утверждению: l2 . При этом нетрудно убедиться, что (4) эквивалентно неравенству l2 . Следовательно, l3 . В этом случае найдется вектор Aρ такой, что отрезок (-Kρ2)Kρ1 будет пересекать отрезок (-KS2)N во внутренней его точке N1 , порождая звено N1N2 ломаной KS(α) (см. рис. 1). Отрезок (-KS2)N1 является первым (слева направо) звеном ломаной KS(α) . Точка N2 будет концом второго звена и началом третьего звена (на рис. 1 l=3 и ломаная KS(α)=(-KS2)N1N2KS1 выделена полужирной линией).
70 По определению KS2 справедливо неравенство Kρ2KS2 . Но Kρ2KS2 , поскольку в противном случае отрезок (-Kρ2)Kρ1 не мог бы пересекать отрезок (-Kρ2)N во внутренней его точке N1 . Следовательно, имеет место неравенство Kρ2>KS2 , означающее, что вектор AρSO(K2) .
71 Справедливо неравенство -Kρ2>-KSO(K1)2 , поскольку в противном случае -Kρ2-KSO(K1)2 , и тогда отрезок (-Kρ2)Kρ1 не мог бы пересекать отрезок (-Kρ2)N во внутренней его точке N1 (см. рис.1). По определению KS1 справедливо неравенство Kρ1KS1 . Но Kρ1KS1 , поскольку в противном случае вектор AρSO(K1) и по определению KSO(K1)2 было бы справедливо неравенство Kρ2KSO(K1)2 , противоречащее неравенству -Kρ2>-KSO(K1)2 . Таким образом, Kρ1<KS1 и, следовательно, стратегия AρSO(K1) .
72 Пусть α1 и α2 — абсциссы соответственно левого и правого концов второго звена ломаной KS(α) (см. рис.1). Тогда при каждом α(α1,α2) справедливо равенство Kρ(α)=KS(α) , т.е. AkSO(K(α)) . Таким образом, совокупность AkSO(K(α)) , AρSO(K1) и AρSO(K2) противоречит условию (3) теоремы. Полученное противоречие доказывает, что l=2 . Утверждение а) доказано.
73 Докажем утверждение b). По доказанному утверждению a) число звеньев ломаной KS(α) равно 2 ( l=2 ). Символический вид этой ломаной изображен на рис. 2 (выделена полужирной линией).
74 Рис. 2. Графики показателей векторов в случае, когда ломаная, представляющая график KS(α) , состоит из двух звеньев (l=2)
75 Пусть чистая стратегия Aρ удовлетворяет условию (6) (существование таких стратегий обусловлено требованием (5) ). Докажем неравенство
76 Kρ(α(K))<δ(K) (11)
77 (на рис. 2, Kρ(α(K))=-Nρα(K) , где Nρα(K) — длина отрезка Nρα(K) ).
78 Для левого конца Kρ(0)=-Kρ2 и правого конца Kρ(1)=Kρ1 отрезка Kρ(α)=(-Kρ2)Kρ1 имеем соответственно
79 -Kρ2-KS2 и Kρ1KS1 , (12)
80 так как в противном случае соответственно AρSO(K2) и AρSO(K1) , что противоречит (6).
81 Для этих же концов в силу определения (-KS2) и KS1 имеем соответственно
82 -Kρ2-KS2 и Kρ1KS1 . (13)
83 Из (12) и (13) следует, что отрезок (-Kρ2)Kρ1 не может пересекать только один из отрезков (-KS2)N или NKS1 . Но отрезок не может пересекать и оба отрезка (-KS2)N и NKS1 , поскольку в противном случае ломаная KS(α) имела бы 3 звена, что противоречит утверждению а).
84 Отрезок (-Kρ2)Kρ1 не может иметь с отрезками (-KS2)N и NKS1 единственную общую точку N . В самом деле, если бы отрезок (-Kρ2)Kρ1 проходил бы через точку N и не имел бы других общих точек ни с отрезком (-KS2)N , ни с отрезком NKS1 , то Kρ(α(K))=KS(α(K)) , т.е. AρSO(K(α(K))) и, следовательно, вектор Aρ был бы синтезированным при α=α(K) , что противоречит условию (3) теоремы.
85 Итак, мы доказали, что отрезок (-Kρ2)Kρ1 лежит ниже точки N . Этим доказано неравенство (11).
86 Левую часть неравенства (11) заменим по ее определению, а вместо α(K) и δ(K) подставим их значения соответственно по формулам (8) и (9); в результате получим:
87 (Kρ1+Kρ2)KSO(K1)2-KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1)-Kρ2<KSO(K2)1KSO(K1)2-KS1KS2(KSO(K1)2-KS2)+(KS1-KSO(K1)1) . (14)
88 Из положительности α(K) и KSO(K1)2-KS2 следует положительность знаменателя в (14). Поэтому обе части неравенства (14) можем умножить на этот знаменатель, после чего элементарными преобразованиями получаем неравенство (7). Таким образом, для любой стратегии Aρ , удовлетворяющей условию (6), справедливо неравенство (7), т.е. выполняется условие τ(K) . Утверждение b) доказано.
89 Утверждение c) следует из утверждения b) (Лабскер, Ященко, 2013; доказательство в терминах теории игр с природой). ▄
90 Предложение 4 (достаточные условия). Пусть выполняются условия (4) и (5). Тогда каждое из следующих условий:
91 a) выполняется условие τ(K) и b) множество SO(K(α)) имеет структуру (10), влечет за собой включение (3).
92 Доказательство. Докажем, что из условия a) следует включение (3). Допустим противное: существуют αρ(0,1) и стратегия Aρ , удовлетворяющая условию (6) (существование такой стратегии гарантировано условием (5)) и такая, что
93 AρSO(K(αρ)) . (15)
94 Из (15) следует равенство Kρ(αρ)=KS(αρ) , означающее, что при α=αρ отрезок Kρ(α) имеет общую точку с ломаной KS(α) .
95 В силу (4) число звеньев ломаной KS(α) не меньше 2 (l2) и, следовательно, отрезки (-KS2)KSO(K2)1 и (-KSO(K1)2)KS1 не совпадают и пересекаются в точке N (рис. 3, на котором число звеньев l=4 ). В силу (6) отрезок Kρ(α) не может совпадать ни с одним из отрезков (-KS2)KSO(K2)1 и (-KSO(K1)2)KS1 и не может пересекать только один из отрезков (-KS2)N или NKS1 , поскольку из (6) следует, что -Kρ2<-KS2 и Kρ1<KS1 .
96

Рис. 3. Графики показателей K(α) -оптимальных векторов в случае, когда ломаная, представляющая график функции KS(α) , состоит из четырех звеньев (l=4)

97 Если отрезок Kρ(α) пересекает оба отрезка (-KS2)N и NKS1 и занимает, например, положение отрезка Kρ1(α)=(-Kρ12)Kρ11 (см. рис. 3), то
98 Kρ(α(K))=Kρ1(α(K))>δ(K) , (16)
99 где δ(K) — ордината точки N ( рис. 3, δ(K)=-Nα(K) , где Nα(K) — длина отрезка Nα(K) ).
100 Если отрезок Kρ(α) имеет с отрезками (-KS2)N и NKS1 единственную общую точку N и занимает, например, положение отрезка Kρ2(α)=(-Kρ22)Kρ21 , то
101 Kρ(α(K))=Kρ2(α(K))=δ(K) . (17)
102 Оба случая (16) и (17) можно объединить одним неравенством Kρ(α(K))δ(K) . Подставляя в это неравенство выражения для α(K) и δ(K) по формулам соответственно (8) и (9), получим
103 (Kρ1+Kρ1)KSO(K1)2-KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1)-Kρ2KSO(K2)1KSO(K1)2-KS1KS2(KSO(K1)2-KS2)+(KS1-KSO(K2)1) . (18)
104 Умножая обе части неравенства (18) на положительный знаменатель и проведя элементарные преобразования, получим неравенство
105 (KSO(K1)2-KS2)Kρ1-(KS1-KSO(K2)1)Kρ2KSO(K2)1KSO(K1)2-KS1KS2 ,
106 которое противоречит неравенству (7). Следовательно, отрезок Kρ(α)=(-Kρ2)Kρ1 не имеет общих точек с ломаной KS(α) , и потому вектор Aρ не является K(α) -оптимальным, что противоречит допущению (15). Таким образом, доказано, что из условия a) следует (3).
107 Теперь докажем, что (3) следует также и из условия b). Пусть множество SO(K(α)) имеет структуру (10) и пусть AρSO(K(αρ)) при некотором α=αρ[0,1] .
108 Из структуры (10) очевидным образом вытекают следующие утверждения: если αρ[0,α(K)) , то AρSO(K2) ; если αρ=α(K) , то AρSO(K2)SO(K1) ; если αρ(α(K),1] , то AρSO(K1) .Таким образом, справедливо включение SO(K(αρ))SO(K2)SO(K1) , но поскольку αρ[0,1] было произвольным, для которого AρSO(K(αρ)) , то справедливо включение (3). ▄
109

Формулировка полученных результатов в терминах теории игр с природой

110 Придадим обозначениям в терминах двухкритериальной задачи оптимизации конкретный смысл из теории игр с природой. Пусть S — множество стратегий Ai=(ai1,...,ain),    iI, игрока A, где aij,iI,jJ, — его выигрыши; K1=W — критерий Вальда и K2=Sav — критерий Сэвиджа. Тогда Ki1=Wi — показатель эффективности стратегии Ai,iI, по критерию Вальда; KS1=WSW-цена игры; SO(K1)=SO(W) — множество W-оптимальных стратегий; Ki2=Savi — показатель неэффективности стратегии Ai,iI, по критерию Сэвиджа; KS2=SavSSav-цена игры; SO(K2)=SO(Sav) — множество Sav-оптимальных стратегий; K(α)=(WSav)(α) — критерий Вальда–Сэвиджа с выигрыш-показателем α[0,1]; Ki(α)=(WSav)i(α),iI, — показатель эффективности стратегии Ai,iI, по критерию Вальда–Сэвиджа; KS(α)=(WSav)S(α) — цена игры по критерию Вальда–Сэвиджа; SO(K(α))=SO((WSav)(α)) — множество (WSav)(α) -оптимальных стратегий; (SO(K1))O(K2)=(SO(W))O(Sav) ; KSO(K1)2=SavSO(W) ; (SO(K2))O(K1)=(SO(Sav))O(W) ; KSO(K2)1=WSO(Sav) .
111 Условия (4) и (5) будут выглядеть так:
112 SO(W)SO(Sav)=, (19)
113 S[SO(W)SO(Sav)], (20)
114 условие τ(K) превратится в условие τ(WSav) : для каждого вектора AρSO(W)SO(Sav) (существующего в силу (20)), справедливо неравенство
115 (SavSO(W)-SavS)Wρ-(WS-WSO(Sav))Savρ<WSO(Sav)SavSO(W)-WSSavS . (21)
116 Тогда предложение 3 перефразируется в терминах теории игр с природой следующим образом.
117 Теорема 1 (необходимые условия отсутствия синтезирования). Пусть в игре с природой не существует стратегии, оптимальной одновременно по критерию Вальда и по критерию Сэвиджа (выполняется условие (19)), и существует стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа (выполняется условие (20)). Тогда если в данной игре критерий Вальда–Сэвиджа не обладает свойством синтезирования, то справедливы следующие утверждения:
118
  1. а) число звеньев ломаной, представляющей график цены игры по критерию Вальда–Сэвиджа, равно 2;
  2. игра удовлетворяет условию τ(WSav) ;
  3. с) множество стратегий, оптимальных по критерию Вальда–Сэвиджа, имеет структуру
119 SO((WSav)(α))=SO(Sav)    при    α=0;(SO(Sav))O(W)    при    0<α<α(K);SO((WSav)(α))=(SO(Sav))O(W)(SO(W))O(Sav)    при    α=α(K);(SO(W))O(Sav)    при    α(K)<α<1;SO(W)    при    α=1, (22)
120 где
121 α(WSav)=SavSO(W)-SavS(SavSO(W)-SavS)+(WS-WSO(Sav)). (23)
122 Теорема 2 (достаточные условия отсутствия синтезирования). Пусть в игре с природой не существует стратегии, оптимальной одновременно по критерию Вальда и по критерию Сэвиджа (выполняется условие (19)), и существует стратегия, не являющаяся оптимальной ни по критерию Вальда, ни по критерию Сэвиджа (выполняется условие (20)). Тогда из каждого из следующих условий:
123
  1. игра удовлетворяет условию τ(WSav) ;
  2. множество стратегий, оптимальных по критерию Вальда–Сэвиджа, имеет структуру (22); —
124 следует, что критерий Вальда–Сэвиджа не обладает свойством синтезирования.
125 Из теорем 1 и 2 следует, что каждое из утверждений a) и b) теоремы 2 есть необходимое и достаточное условие того, что критерий Вальда–Сэвиджа не обладает свойством синтезирования.
126 Отметим, что необходимое условие a) теоремы 1 не является достаточным условием отсутствия у критерия Вальда–Сэвиджа свойства синтезирования. Для доказательства этого нетрудно привести соответствующий пример.
127

Иллюстрация применения полученных результатов

Применение полученных результатов проиллюстрируем на решении следующей задачи (Лабскер, 2016).
128 Задача. Для изготовления X единиц определенной продукции предприятием должен быть выбран один из четырех технологических способов производства. Потребность количества этой продукции носит случайный характер и, как показывает маркетинговый анализ данных за прошлые периоды, может принимать значения 25, 35, 45 и 50 единиц. Производственные затраты TCi на изготовление X единиц продукции технологическим способом i ( i=1,...,4 ) включают фиксированные затраты Q1=145 , Q2=70 , Q3=180 , Q4=110 условных денежных единиц (у.е.) и удельные затраты c1=3 , c2=5 , c3=2 , c4=4 у.е. на производство единицы продукции и выражаются формулой
129 TCi=Qi+ciX , i=1,...,4 . (24)
130 Перед предприятием стоит задача выбора одного из четырех технологических способов изготовления продукции, с тем чтобы производственные затраты были наименьшие.
131 Предприятию до принятия им решения о выборе технологического способа известны возможные значения спроса на изготавливаемую продукцию (25, 35, 45, 50 ед.). Если бы предприятие в момент выбора технологического способа знало, какой будет спрос, оно выбрало бы технологический способ, при котором наименьшие производственные затраты. Но предприятие этого не знает. Также у предприятия отсутствует информация о вероятностях значений спроса, и нет статистической возможности определить это вероятностное распределение. Реальный спрос в режиме реального времени становится известным предприятию в период реализации готовой продукции после выбора технологического способа и производства продукции по выбранной технологии. Таким образом, предприятию предстоит принять решение о выборе технологического способа производства в условиях неопределенности.
132 Решение. Для анализа данной задачи подходящей является модель «Игра с природой», в которой рациональным игроком A выступает предприятие, а природой является потребность в изготавливаемой продукции. Игрок A располагает четырьмя стратегиями Ai , i=1,...,4 и выбрать для изготовления продукции технологический способ i. Природа может пребывать в одном из четырех состояний: П1=25, П2=35, П3=45 и П4=50 ед. спроса.
133 Отметим, что одним из принципов модели «Игра с природой» является принцип синхронности выбора определенной стратегии рациональным игроком и принятия природой одного из возможных состояний. Понятие синхронности не означает одновременность этих событий в смысле реального хронологического времени, а указывает на то, что выбор стратегии рациональным игроком осуществляется в условиях незнания им состояния природы, т.е. эти события происходят одновременно в смысле игрового времени.
134 В модели в качестве выигрышей aij , i,j=1,2,3,4 , игрока A в игровой ситуации (Ai,Пj) , когда игрок A выбирает стратегию Ai , а природа находится в состоянии Пj , будем рассматривать производственные затраты предприятия, вычисляемые по формуле (24). Таким образом, выигрыши aij , i,j=1,...,4 , — это отрицательные величины, которые в обозначениях модели подсчитываются по формуле aij=-(Qi+ciПj) , i,j=1,...,4 . Из них формируем платежную матрицу А.
135 Подсчитываем показатели βj=max{aij:i=1,...,4} , j=1,...,4 , благоприятности состояний природы и проставляем их в последней дополнительной строке матрицы А. Находим риски rij=βj-aij,i,j=1,...,4 , и формируем матрицу рисков R.