Dynamic model of investments in research of oligopolia
Table of contents
Share
Metrics
Dynamic model of investments in research of oligopolia
Annotation
PII
S042473880008561-6-1
DOI
10.31857/S042473880008561-6
Publication type
Article
Status
Published
Authors
Ilya Lesik 
Occupation: Senior Engineer
Affiliation: Joint-Stock Company «Scientific and Production Association Russian basic information technology
Address: Moscow, Russian Federation
Aleksandr Perevozchikov
Occupation: Senior Research Scholar
Affiliation: Joint-Stock Company «Scientific and Production Association Russian basic information technology
Address: Russian Federation
Pages
101-113
Abstract

The authors propose the algorithm for determining the balances on credit line that maximize the current cost of equity capital of an oligopoly company through investment in research. This article is based on the Cournot oligopoly model described in the work by (Vasin, Morozov, 2005). In contrast to the Cournot model, where the static case is investigated, in this article the dynamic extension of the investment model proposed in the work by (Perevozchikov, Lesik, 2014) is studied. This model is a generalization of the classic production problem for a dynamic case and allows to take into account the limitations on limiting leverage, defining an acceptable level of financial sustainability of the company, to formulate sufficient conditions for the company's sustainable growth regime and estimate rates of growth (Perevozchikov, Lesik, Karimov, 2016). The work’s main result is obtaining an explicit expression for the profit of oligopoly in the Cournot model, as a function of the volume of investment in research aimed at reducing the unit cost, from which follows the piecewise differentiability of the criterion in the constructed dynamic expansion of the model. This allows us to apply the projection method of a stochastic gradient with the averaging from the work by (Zavriev, Perevozchikov, 1991) to the obtained problem of discrete optimal control.

Keywords
dynamic investment model, the current cost of equity capital, investment financing, optimal balances on the credit line.
Received
12.04.2020
Date of publication
11.06.2020
Number of purchasers
19
Views
229
Readers community rating
0.0 (0 votes)
Cite Download pdf 100 RUB / 1.0 SU

To download PDF you should sign in

Full text is available to subscribers only
Subscribe right now
Only article
100 RUB / 1.0 SU
Whole issue
792 RUB / 15.0 SU
All issues for 2020
2534 RUB / 50.0 SU
1

ВВЕДЕНИЕ

2 В статье рассматривается задача определения оптимальных остатков по кредитной линии в динамической модели инвестиций в олигополию Курно (Васин, Морозов, 2005). Отличие состоит в том, что исследуется задача увеличения прибыли олигополии в зависимости от выделенного объема инвестиций в научные исследования, уменьшающие удельную себестоимость продукции. Связь между прибылью компании и текущими инвестициями в каждом периоде устанавливается через классическую модель олигополии, изученную в работах (Novchek, 1985; Amir, 1996; Kukushkin, 1999).
3 К компаниям-олигополиям относятся, в частности, государственные корпорации, работающие в области ОПК. Например, государственная корпорация (ГК) Воздушно-космической обороны (ВКО), созданная на базе государственного концерна Алмаз-Антей, делит рынок систем ВКО с американскими и европейскими корпорациями и относится к компаниям-олигополиям, исследование которых является задачей мезоэкономики (Мезоэкономика развития, 2011) и рынков однородных товаров. Изучение таких компаний позволяет сэкономить инвестиционные ресурсы для достижения поставленных целей завоевания рынка вооружений и увеличения доли на этом рынке.
4 Практическая значимость работы связана с получением конструктивных алгоритмов, позволяющих осуществить согласование параметров инвестиционного процесса, обеспечивающее устойчивый рост государственных корпораций, действующих в области ОПК. Вывод на траекторию роста является главной задачей стагфляционной (стагнация плюс инфляция) экономики в настоящий момент. Предложенные модели роста особенно подходят для государственных корпораций ОПК, поскольку стоимость кредитов для них могла бы быть минимальной (или даже нулевой), так как они финансируются из бюджета за счет дополнительной эмиссии, а залогом могли бы служить векселя, обеспеченные постоянно возрастающими внеоборотными активами (ВА).
5 В общетеоретическом плане концепция инвестиционной стоимости лежит в основе современной теории оценки бизнеса (Дамодаран, 2010). Дисконтированная стоимость денежного потока на собственный капитал компании представляет универсальный агрегированный критерий, который позволяет решать все вопросы, связанные со структурой и стоимостью капитала в зависимости от предполагаемых капитальных вложений согласно методологии компании «Deloitte & Touche» (Методология и руководство по проведению оценки бизнеса и/или активов ОАО РАО «ЕЭС России» и ДЗО ОАО РАО «ЕЭС России», 2003–2005). Оценке инвестиционной стоимости бизнеса посвящено большое число публикаций (Виленский, Лившиц, Смоляк, 2004). Однако до сих пор фундаментальный вопрос о связи инвестиций с операционной деятельностью компании остается актуальным. Кроме того, как правило, одни специалисты занимаются дисконтированием, а другие прогнозированием и оптимизацией денежного потока. Поэтому актуальной является задача объединения дисконтирования, прогнозирования и оптимизации денежного потока инвестиций в одной динамической модели (Мезоэкономика развития, 2011, с. 64).
6 Основной результат работы состоит в выводе явной формулы для прибыли олигополии в модели Курно как функции объема инвестиций во внеоборотные средства, направленные на уменьшение удельной себестоимости, откуда следует кусочная дифференцируемость критерия оптимальности в построенном динамическом расширении модели. Это позволяет применить к полученной задаче дискретного оптимального управления метод проекции стохастического градиента с осреднением из работы (Завриев, Перевозчиков, 1991).
7

1. ПРОИЗВОДСТВЕННАЯ ФУНКЦИЯ ОЛИГОПОЛИИ

8 Следуя работе (Васин, Морозов, 2005), опишем модель олигополии по Курно. Рассматривается отрасль экономики, выпускающая однородный товар. В отрасль входит m предприятий-производителей, каждое характеризуется постоянной удельной себестоимостью сa>0 и максимальным объемом производства Va>0,aA=1,...,m . Задана однозначная функция спроса на товар D(p) , причем она убывает по p и D(p)0 при p. Характерным примером функции спроса служит функция вида
9 D(p)=K/pα,    α>0. (1)
10 Стратегией предприятия aA является объем выпуска va[0,Va] . Цена на рынке устанавливается таким образом, чтобы фактическое предложение товара aAva соответствовало его спросу. Обозначим через v=va,aA вектор выпуска товара. Тогда цена на рынке будет равна p(v)=D-1aAva.
11 Прибыль производителя a зависит от вектора выпусков v и определяется как
12 ua(v)=va(p(v)-ca). (2)
13 В точке v=0 функции ua(v) имеют особенность. По определению полагают ua(0)=0 . В случае
14 limV0+D-1(V)V>0 (3)
15 функция ua(0va)=va(D-1(va)-ca) разрывна в точке va=0 . При этом равновесие по Нэшу в описанной игре Г может не существовать (Васин, Морозов, 2005, с. 192, упражнение 18.1). В случае (1) условие (3) эквивалентно неравенству α>1 .
16 Лемма 1 (Васин, Морозов, 2005, с. 187). Если v- равновесие по Нэшу, то v-0 и выполнены следующие необходимые условия:
17 1) v-a=0u'va(v-)0;
18 2) v-a(0,Va)u'va(v-)=0;
19 3) v-a=Vau'va(v-)0.
20 Производная функции прибыли по объему выпуска имеет вид
21 u'va(v)=D-1(bAvb)-ca+va/D.(p(v)).
22 Теорема 1 (Васин, Морозов, 2005, с. 188). Пусть c1c2...cm и функция спроса убывает и дифференцируема. Тогда найдется такое предприятие k, что в равновесии по Нэшу v-a>0,    a=1,...,k, и v-a=0,    a=k+1,...,m, причем ck+1>ck.
23 Рассмотрим сначала модель без ограничений на объемы выпуска. В точке максимума прибыли ua(v) в (2) по va все производные u'va(v-)=0,    a=1,...,k, и для поиска равновесия по Нэшу получаем систему уравнений относительно неизвестных v-a,aAk={1,...,k}:
24 u'va(v-)=D-1(bAkv-b)-ca+v-a/D(p(v-))=0,aAk. (4)
25 Суммируя уравнения (4) по всем aAk , приходим к уравнению
26 kD-1(bAkv-b)-bAkcb+bAkv-b/D(D-1(bAkv-b))=0 (5)
27 относительно одной неизвестной величины bAkvb . Определив эту величину и подставив в уравнение (4), найдем значения v-a,    aAk.
28 Например, для функции (1) p(v)=D-1(aAkva)=K/aAkva уравнение (5) преобразуется к виду
29 kK/bAkv-b-bAkcb-K/bAkv-b=0. (6)
30 Отсюда получим выражение bAkvb=(k-1)K/bAkcb (7) и, подставим его в (4): u'va(v-)=K/bAkv-b-ca-v-aK/(bAkv-b)2=0,      aAk. (8)
31 Найдем равновесие по Нэшу в модели Курно:
32 v-a=bAkv-b-caK(bAkv-b)2=K(k-1)bAkcb1-ca(k-1)/bAkcb,    aAk. (9)
33 Согласно предположению v-a>0,    a=1,...,k. Отсюда с учетом (9) следует, что bAkcb>ca(k-1),    a=1,...,k, или эквивалентное неравенство
34 bAkcb>ck(k-1). (10)
35 Заметим, что (10) всегда выполняется для k=2 в силу ca>0,aA.
36 Далее, v-a=0,    a=k+1,...,m. Из условия 1 леммы 1 имеем v-a=0u'va(v-)0. Подставляя в (10) v-a=0 и учитывая (9), получим условие u'va(v-)=K/bAkv-b-ca= =bAkcb/k-1-ca0, a=k+1,...,m. Это условие равносильно неравенству bAkcbck+1(k-1), эквивалентному неравенству
37 bAk+1cbck+1k, (11) которое означает, что (10) не выполняется при следующем номере l=k+1 .
38 Лемма 2. Предположим, что справедливо (13), тогда отношение dk=ck(k-1)/bAkcb
39 не убывает, начиная с номера l=k+1 .
40 Доказательство. Достаточно показать, что (13) влечет неравенство
41 cl+1(k)/bAlcb+cl+1cl(l-1)/bAlcb
42 при l=k+1 . Или после преобразования cl+1lbAlcbcl(l-1)bAlcb+cl+1cl(l-1) , т.е. bAlcbcl(l-1) , но последнее равносильно (13).
43 Лемма 3. При условии Va=,aA, номер k в утверждении теоремы 1 является максимальным номером, для которого выполняется неравенство (10). Отсюда следует, что v3=0 .
44 Доказательство. Предположим, что k — максимальный номер, удовлетворяющий неравенству (10), тогда bAkcb+сk+1ck+1kbAkcbck+1(k-1)ca(k-1), a=k+1,...,m, и выполняется (11).
45 Наоборот, если k не максимальный номер, то из (11) следует, что (10) не выполняется при следующем k+1, но тогда оно не будет выполняться и дальше в силу неубывания отношения dk с номера k+1 согласно лемме 2. Таким образом, получается противоречие с тем, что k — максимальный номер, удовлетворяющий неравенству (10).
46 Пример 1. Найти равновесие при условиях K=1000,    m=3, Va=,    c1=1,    c2=2,    c3=3 .
47 Решение. Неравенство (10) не выполняется при k=2 и при k=3 . Согласно утверждению леммы 3 номер k в утверждении теоремы 1 равен 2. Отсюда следует, что v3=0 . Далее, из формулы (11) получим
48 v1=K(2-1)1+2(1-1(2-1)1+2)=29K и v2=K(2-1)1+2(1-2(2-1)1+2)=19K .
49 При этом имеет место формула (7) bAkvb=(2-1)K/1+2=K/3 . Отсюда из формулы (1) при α=1 можем рассчитать равновесную цену p(v)=K/aAkva=3 .
50 Таблица 1. Пример 1
51
a 1 2 3 aAkva
ca 1 2 3
va 2K/9 K/9 0 K/3
p(v) 3
52 Для модели с ограничениями на объемы выпуска отметим два случая:
53 1) maxa=1,...,k(v-a-Va)<0, тогда решение задач с ограничениями на объемы выпуска совпадает с решением (11) той же задачи без ограничений;
54 2) maxa=1,...,k(v-a-Va)0, тогда перенумеруем последовательность Vaf,f=1,...,k, чтобы выполнялись неравенства Va1Va2...Vak . Фиксируем номер s,  1sk и рассмотрим набор
55 v-al=v~al,ls,Val,l>s.
56 Тогда, переписав (8), для этого случая получим систему для нахождения v~al,    l=1,...,s:
57 u'va(v-)=K/(l=s+1kVal+l=1sv~al)-cal-v~alK/(l=s+1kVal+l=1sv~al)2=0,l=1,...,s. (12)
58 Уравнение (5) преобразуется к виду
59 sK/(l=s+1kVal+l=1sv~al)-l=1scal-l=1sv~alK/(l=s+1kVal+l=1sv~al)2=0. (13)
60 Отсюда находим величину l=1sv~al и, подставляя ее в (12), получаем v~al=v~al(s),    l=1,...,s.
61 Начинаем поиск равновесия по Нэшу с s=k . Из (12)–(13) определяем v~al=v~al(s),    l=1,...,s и проверяем условия
62 0<v~al(s)<Val,    l=1,...,s. (14)
63 Мы не можем воспользоваться леммой 3 для определения k как максимального номера, удовлетворяющего неравенству (10). Поэтому условия 1 и 3 леммы 1 приходится проверять отдельно. Условие 1 имеет вид
64 v-a=0u'va(v-)=K/(l=s+1kVal+l=1sv~al)-ca0,a=k+1,....,m, (15)
65 а условие 3 —
66 v-al=Valu'va(v-)=K/(l=s+1kVal+l=1sv~al)-cal-ValK/(l=s+1kVal+l=1sv~al)20,    l=s+1,....,k. (16)
67 При этом значения k также перебираются последовательно от m к 1 до тех пор, пока не будут выполнены все условия (15), (16).
68 Пример 2. Предположим, что в условиях примера 1 имеем V1=K/9,    V2=2K/9,    V3=3K/9. Требуется найти равновесие.
69 Решение. Перебирая значения s=k,...,1;    k=3,2,1 , убеждаемся, что они выполняются при s=2;k=3 . С учетом упорядоченности последовательности V3V2V1 это означает, что v-1=V1,v-2=v~2,v-3=v~3 . Обозначим x=V1+v~2+v~3 . Тогда уравнение (13) будет иметь вид 2K/x-c2-c3-(v~2+v~3)K/x2, а после преобразований — 5x2/K-x-V1=0 , откуда получим x=K+9K2+20/3/10K/5 при достаточно больших K .
70 Уравнение (12) будет иметь вид K/x-ca-v~aK/x2,    a=2,3, откуда следует v~a=x-cax2K/Kx,    a=2,3. Подставляя найденные значения, получим v~2K/5-2K2/25K=0,16K;v~3K/5-3K2/25K=0,14K. Теперь можно вычислить равновесную цену p(v)=K/x5 .
71 Проверим условия (14)–(16). Условие (14) выполняется
72 0<v~20,16K<V2=2K/9=0,22K;0<v~30,16K<V3=3K/9=0,33K,
73 условие (15) отсутствует, условие (16) —
74 v-1=V1Kx-c1-V1Kx25-1-259=1,230 .
75 Предположим, что фиксированная олигополия bA хочет улучшить свое положение на рынке за счет инвестиций в научные исследования (НИС) компании, снижающие удельную себестоимость cb. Зависимость элементов технологической матрицы компании от произведенных инвестиций в НИС по правилу треугольника может иметь вид (Мезоэкономика развития, 2011):
76 cb(y)=cb(1+χ)1+ψs(y);      s(y)=21+yy-1323y,      y. (22)
77 Здесь χ — коэффициент износа оборудования на предприятии; s=s(y) — коэффициент ресурсосбережения; y — средства, направляемые на НИС и влияющие на изменение удельной себестоимости cb с учетом износа оборудования и ресурсосбережения; ψ — коэффициент влияния ресурсосбережения, который определяется как отношение величины ресурсосбережения к величине удельных затрат.
78 Прибыль производителя b зависит от вектора выпусков v-=v-(y) и находится по формуле (2): Q(y)=ub(y)=v-b(y)(p(v-(y))-cb(y)). (18)
79 Из алгоритма определения функции v-=v-(y) следует, что справедлива следующая лемма.
80 Лемма 4. Функция маржинального дохода (18) будет непрерывной и кусочно-дифференцируемой функцией y в области y>0 .
81 Пример 3. Предположим, что b=3;    s(y)2/3y;    χ=0,1;    ψ=0,3 . В условиях примера 1 требуется найти прибыль третьего производителя при y1 .
82 Решение. Из формулы (17) получим
83 c3(y)=c3(1+0,1)1+0,32/3y3,31+0,142y<3      y1.
84 Отсюда следует, что неравенство (10) при y1 выполняется при k=3 , тогда из формулы (11) имеем
85 v3=K(3-1)3+c3(y)1-c3(y)(3-1)3+c3(y)=2K3-c3(y)(3+c3(y))2,
86 а по формуле (7) — bAkvb=2K/3+c3(y) . Отсюда из формулы (1) при α=1 находим цену p(v)=K/aAkva=0,5(3+c3(y)) . Подставляя в формулу (18), получим
87 Q(y)=u3(y)=v-3(y)(p(v-(y))-c3(y))=K3-c3(y)3-c3(y)2.
88 Заметим, что эта функция будет непрерывно-дифференцируемой в силу дифференцируемости функции c3(y) при y1 .
89

2. ПОСТПРОГНОЗНАЯ СТОИМОСТЬ СОБСТВЕННОГО КАПИТАЛА КОМПАНИИ

90 В простейшем случае стоимость собственного капитала компании в постпрогнозный период может быть получена методом прямой капитализации по формуле Гордона (Методология…, 2003–2005):
91 X=X(y)=Q(y)(1+τ)i-τ=Q(y)1+τ1+i+1+τ1+i2+... , (19)
92 где τ — постпрогнозный темп роста на уровне долгосрочного прогноза инфляции; i —предполагаемая (инвестором) доходность на собственный капитал (стоимость собственного капитала).
93 Пример 4. Предположим, что τ=0,04;    i=0,14 . В условиях примера 3 требуется исследовать зависимость чистой стоимости инвестиционного проекта в научные исследования от объема инвестиций третьего производителя в постпрогнозный период с учетом начального вложения капитала в размере y1 .
94 Решение. Из формулы (19) чистая стоимость проекта будет равна
95 X-(y)=X(y)-y=Q(y)(1+τ)i-τ-y=10,4K3-c3(y)3-c3(y)2-y.
96

Рис. 1. График функции X-(y) Из графика на рис. 1 видно, что максимальная стоимость проекта X-(y)=3750 достигается при y=1500 , а при y&gt;7500 проект становиться нерентабельным.

97 Формула (19) метода прямой капитализации предполагает бесконечный период получения дохода и выводится суммированием соответствующей геометрической прогрессии. Она применяется для стационарного периода, наступающего после завершения всех предполагаемых инвестиций и возврата основной суммы займа, поэтому проценты по займам не учитываются. Формула (19) показывает потенциальные возможности роста стоимости компании в долгосрочной перспективе в зависимости от располагаемых финансовых ресурсов. Интересно сравнить эту потенциальную стоимость с текущей стоимостью компании. Для этого построим модель нестационарного изменения дохода компании в прогнозном периоде, охватывающем по времени все предполагаемые инвестиции и стабилизацию структуры капитала, следуя работе (Перевозчиков, Лесик, Каримов, 2016а).
98

3. ОБЩАЯ МОДЕЛЬ ФИНАНСИРОВАНИЯ ИНВЕСТИЦИОННОГО ПРОЕКТА

99 Финансирование инвестиций в ОС предполагается в форме кредитной линии, т.е. соглашения, по которому заемщик может брать новые кредиты, не погасив предыдущих, но так, чтобы остаток долга на конец каждого года был не менее нуля и не более оговоренного объема V потолка кредитной линии. Суммарные платежи pt по кредитной линии, включающие проценты и части основного долга, можно представить в виде (Методология…, 2003–2005)
100 pt=Zt-1g-Zt+Zt-1=Zt-1g-ΔZt,    t=0,...,n. (20)
101 Здесь g — средняя стоимость заемных средств. Остаток долга должен находиться в пределах
102 0ZtV,      t=1,...,n-1. (21)
103 В простейшем случае мы предполагаем нулевые начальные и конечные значения остатков, необходимых для расчета платежей по формуле (20): Z0=0,Zn=0. Это позволяет считать остатки Zt,    t=1,...,n-1, по кредитной линии независимыми переменными. В частности, величина ΔZt=Zt-Zt-1>0 представляет собой новый кредит, увеличивающий общую задолженность, а ΔZt=Zt-Zt-1<0 — часть основного долга с обратным знаком, погашенного в периоде t . Поэтому значения Zt,    t=1,...,n-1, не связаны друг с другом и могут быть выбраны независимо из условий (21). Предполагается, что величина ΔZt=Zt-Zt-1>0 идет в инвестиции в НИС.
104 Пусть dt — прогноз денежного потока на инвестированный капитал на конец года t , который получается по формуле (Методология…, 2003–2005): dt=qt-Kt-ΔOt . Здесь qt=q(zt) — величина чистой прибыли компании до уплаты процентов по займам, определяемая по формуле (18), скорректированная на ставку l налога на прибыль; zt — задолженность по кредитной линии нарастающим итогом, определяемая из рекуррентного уравнения zt=zt-1+max(Zt-Zt-1;0),t=1,...,n;z0=0; Kt=Δzt — предполагаемые капитальные вложения в году t ; ΔOt=νΔQt — увеличение оборотного капитала Ot компании, привязанное к изменению ΔQt=ΔQ(zt) маржинального дохода; ν — параметр линейной регрессии, построенный по ретроспективным данным по рекомендации компании «Deloitte&Touche» (Методология…, 2003–2005).
105 Предполагается, что амортизация A0 , остающаяся фактически в распоряжении предприятия после уплаты налога на прибыль, расходуется по своему назначению, т.е. на ремонт и замещение выбывающих основных средств.
106

4. ПРОСТЕЙШАЯ ДИНАМИЧЕСКАЯ МОДЕЛЬ ИНВЕСТИЦИЙ В ПРОГНОЗНЫЙ ПЕРИОД

107 Предположим, что все инвестиции осуществляются до момента T<n . Для периода t=1,...,T справедливо равенство ZT=V и выполняется условие yt=ΔZt=Zt-Zt-10,    t=1,...,T. Тогда zt=Zt,    Δzt=ΔZt и критерий текущей стоимости Xt собственного капитала компании на начало инвестиционного проекта принимает вид (Перевозчиков, Лесик, 2014):
108 X0=t=1Tq~(Zt)-g'Zt-1-νΔQ(Zt)(1+i)t+XT(1+i)TmaxZt , (22)
109 где q~(V)=(1-l)(Q(V)-C0-A0),    g'=(1-l)g; C0 — постоянные расходы компании. Таким образом, последовательность Zt монотонно не убывает и выполняется конечное условие ZT=V.
110 Постпрогнозную стоимость собственного капитала компании XT в (22) с учетом возможного ненулевого остатка по займу и равенства ZT=V в простейшем случае можно найти по формуле прямой капитализации прибыли после уплаты налога на прибыль и процентов по займам, которые уменьшают базу налога на прибыль:
111 XT=X(zT)={q(V)-g'V}(1+τ)/(i-τ) . (23)
112 Полученная стоимость должна быть положительной для любых V0 . Это означает, что функция q(V) прибыли растет не медленней процентов по займам. Предполагается, что значение левериджа L будет сохраняться на достигнутом уровне, т.е. сохраняться постоянная структура капитала компании.
113 Более точно постпрогнозную стоимость собственного капитала компании XT в (8) можно определить как отложенную продажу (Перевозчиков, Лесик, Каримов, 2016б): XT=Xn/(1+i)n-T . Здесь Xn=q(V)(1+τ)/(i-τ) определяется по формуле Гордона (18) метода прямой капитализации.
114 Уравнение (22) равносильно рекуррентному уравнению
115 Xt-1=q~(Zt)-g'Zt-1-νΔQ(Zt)+Xt/1+i,    t=T,...,1,
116 с конечным условием (23). Перегруппировкой членов разностей νΔQ(Zt)=vQ(Zt)-vQ(Zt-1) в (22) можно получить эквивалентное выражение:
117 X0=νQ(0)/1+i+t=1T(1-l-νi/(1+i))Q(Zt+уt)-C'0-A'0-g'Zt-1/(1+i)t++XT-νQ(V)/(1+i)/(1+i)T, (24)
118 где C'0=(1-l)C0,    A'0=(1-l)A0.
119 Введем величины X~t=Xt-νQ(Zt)/(1+i),    t=0,...,T . Тогда уравнение (24) равносильно рекуррентному уравнению
120 X~t-1=(1-l-νi/(1+i))Q(Zt+уt)-C'0-A'0-g'Zt-1+X~t/1+i,    t=T,...,1,
121 с конечным условием X~T=XT-νQ(V)/(1+i) .
122 Поскольку Ot=νQ(Zt) — оборотный капитал на конец периода t , то величины X~t представляют стоимость собственного капитала компании, скорректированную на стоимость оборотного капитала, дисконтированного к началу периода t . Скорректированный собственный капитал естественно назвать внеоборотным капиталом, по аналогии с оборотным. Действительно, если ввести внеоборотный капитал как разницу внеоборотных активов и долгосрочных займов, то собственный капитал будет балансировать сумму внеоборотного и оборотного капитала. То, что оборотный капитал при этом дисконтируется на начало периода, выражает особенность его влияния на денежный поток в принятой нами дискретной модели динамики инвестиционного процесса.
123 Как показано в работе (Перевозчиков, Лесик, 2017), критерий в поставленной задаче может быть не ограничен сверху без дополнительных условий. Ограниченной задачу делает дополнительное условие на предельный финансовый леверидж L : ZtLX~t, t=0,...,T-1 , где X~τ, τ=0,...,T-1, по аналогии с (24) определяются по формулам
124 X~τ=t=τT-1(1-l-νi/(1+i))Q(Zt+yt)-C'0-A'0-g'Zt(1+i)t+X~T(1+i)T .
125

5. МЕТОД ГРАДИЕНТНОГО ПОДЪЕМА ДЛЯ РЕШЕНИЯ ПОСТАВЛЕННОЙ ЗАДАЧИ

126 Для решения полученной в разд. 4 задачи максимизации текущей стоимости компании с дополнительными ограничениями на предельный леверидж компании рассмотрим более общую задачу дискретного оптимального управления в абстрактной форме.
127 Задача дискретного оптимального управления (ОПУ), частным случаем которой является поставленная динамическая задача инвестиций во внеоборотные активы компании, может быть записана в виде:
128 I0utmax;Ijut0,    j=1,...,J;Ijut=t=0T-1Ftj(xt,ut)+Φj(xT),    j=0,...,J;xt+1=Ft(xt,ut),    t=0,...,T-1;    x0=a;xtEn,    ut=(u0,...,uT-1),    utVtEr;    t=0,...,T-1;    Ft=(F11,...,Ftn). (25)
129 Функции Φ,Ft,Ftj,    t=0,...,T-1;    j=0,...,J предполагаются непрерывными вместе со своими производными по x,u , множества допустимых управляющих воздействий Vt выпуклы, замкнуты и ограничены. Пусть функции Ft являются липшицевыми по совокупности переменных в области определения с единой константой L>0 .
130 Градиент критерия. Введем функцию Гамильтона Htj(xt,ψt,ut)=ψtj,Ft(xt,ut)+Ftj(xt,ut) (где ψtjEn — сопряженные переменные; .,. — скалярное произведение векторов в En ) и сопряженную систему
131 ψt-1j=Htj(xt,ψtj,ut)x,    t=T-1,...,1;    ψT-1j=Φj(xT)x.
132 Через L2T[0,T] обозначим гильбертово пространство вектор-функций дискретной переменной [ut]=(u0,...,uT-1) со скалярным произведением и нормой, заданными формулами
133 ut,vtL2=t=0T-1ut,utEr;    ut=t=0T-1utEr21/2.
134 Тогда функционалы Ijut,j=0,1,...,J, в (25) непрерывны и дифференцируемы в норме L2T[0,T] , причем их градиенты Ijut имеют вид
135 Ijut=Htuj(xt,ψtj,ut),t=0,1,...,T-1}L2T[0,T], (26)
136 где xt,ψtj — решения основной и сопряженной системы, соответствующие выбранному управлению ut .
137 В частности, для поставленной динамической задачи инвестиций в НИС имеем:
138 Ftj=(1-l-νi/(1+i))Q(Zt+yt)-C'0-A'0-g'zt/(1+i)t,    tj,0,    t<j,;Ft=Zt+yt,xt=ZtE1;ΦjΦ(xT)=XT-νQ(V)/(1+i)/(1+i)T;XT={q~(yT)-g'e,yT}(1+τ)/(i-τ),q~(yT)=(1-l)(Q(yT)-C0-A0),ut=ytE1;    Vt=W=0,WE1;t=0,...,T-1. (27)
139 Здесь W — максимальная величина приращения инвестиций yt в НИС за 1 год.
140 Метод Б.Т. Поляка. Имея градиенты (26), для решения поставленной динамической задачи можно теперь воспользоваться методом проекции градиента, описанного в (Поляк, 1983), с программным шагом:
141 ut(k+1)=P(ut(k)+akHut0(xt(k),ψt0(k),ut(k)),G(u(k))0;P(ut(k)+akGut(u(k));G(u(k))<0;t=0,...,T-1;    k=1,2,..., (28)
142 где k — номер шага; ak=Dk-s — программный шаг метода; s,1/2<s1, — параметр (например, s=3/4 ); D — характерный размер множества допустимых решений задачи (например, оценка диаметра); G(u)=minj=1,...,JIjut — агрегированная функция в ограничении (13) задачи; Gu=Ijut,jArgminj=1,...,JIjut, — любой квазиградиент слабовогнутой функции G(u) минимума от дифференцируемых функций Ijut,j=1,...,J; Pt(ut) — оператор проектирования на множество допустимых управляющих воздействий W .
143 Имеет место следующая теорема сходимости метода (28). Предположим, что задача (25), (26) обладает свойством регулярности в смысле работы (Михалевич, Гупал, Норкин, 1987).
144 Теорема 1 (Михалевич, Гупал, Норкин, 1987). Последовательность ut(k) в методе (28) сходится по значению к стационарному множеству задачи (25), (27).
145

6. СГЛАЖИВАНИЕ ПОСТАВЛЕННОЙ ЗАДАЧИ ДИСКРЕТНОГО ОПТИМАЛЬНОГО УПРАВЛЕНИЯ

146 Главной проблемой в простейшей задаче управления системой эшелонированной обороны является недифференцируемость липшицевых функций Ftj,Φj в определении функционалов Ijut,j=0,...,J, в (25), что делает некорректным использование классических результатов о дифференцируемости терминального критерия и вычисление его градиента на основе сопряженной системы. В этом разделе предлагается использовать процедуру осреднения функций Ftj,Φj по совокупности переменных xt,ut в малой окрестности, радиус которой h считается малым параметром. Величина h>0 задает точность аппроксимации функций Ftj,ΦjΦ их осредненными функциями:
147 Ftjh(xt,ut)=E2Ftj(xt+hρ1,ut+hρ2)ω2ρ0dρ1dρ2,Φh(xT)=E1Φ(xT+hρ1)ω1ρ0dρ1.
148 Ядро осреднения здесь определяется, например, по формуле (Михалевич, Гупал, Норкин, 1987):
149 ωnρ0=2-n,ρOn,0,υOn, On=ρE2ρ01;    ρ0=maxi=1,..,nρi.
150 Известно (Михалевич, Гупал, Норкин, 1987), что осредненная функция от липшицевой функции будет дифференцируемой и справедлива оценка Ftjh(xt,ut)-Ftj(xt,ut)Lh, Φh(xT)-Φ(xT)Lh, где L — соответствующая константа Липшица. В результате осреднения функции Ftj,Φj становятся дифференцируемыми по совокупности переменных, причем производные от средних функций равны среднему от производных:
151 Ftxjh(xt,ut)=E2Ftxj(xt+hρ1,ut+hρ2)ω2ρ0dρ1dρ2,Φxh(xT)=E1Φx(xT+hρ1)ω1ρ0dρ1,
152 Ftujh(xt,ut)=E2Ftuj(xt+hρ1,ut+hρ2)ω2ρ0dρ1dρ2,Φuh(xT)=0.
153 Заметим, что в случае производные от липшицевых функций под интегралами существуют почти всюду, измеримы и, следовательно, интегрируемы в силу ограниченности соответствующей константой Липшица L>0 .
154 Для решения аппроксимирующей задачи можно использовать метод градиентного спуска. Критерий полученной задачи аппроксимирует исходный критерий с точностью O(h) при сделанных предположениях (Васильев, 1981), и, следовательно, сглаженная задача аппроксимирует исходную задачу по значению с такой же точностью. Для того чтобы избежать вычисления интегралов от правых частей системы, предложенную процедуру следует рандомизировать, вводя в правую часть сопряженной системы случайные возмущения:
155 ψ~t-1j(k)=Htj(xt(k)+hνtk,ψ~tj(k),ut(k)+hηtk)x;t=T-1,...,1;ψ~T-1j(k)Φ(xT(k)+hνTk)x. (29)