控制与决策  2020, Vol. 35 Issue (2): 285-296  
0

引用本文 [复制中英文]

高太光, 王庆, 黄敏, 王兴伟, 张玉. 基于团队合作博弈的自动协商模型[J]. 控制与决策, 2020, 35(2): 285-296.
[复制中文]
GAO Tai-guang, WANG Qing, HUANG Min, WANG Xing-wei, ZHANG Yu. Automated negotiation model with collaborative offering of team[J]. Control and Decision, 2020, 35(2): 285-296. DOI: 10.13195/j.kzyjc.2018.0588.
[复制英文]

基金项目

国家自然科学基金重点国际合作研究项目(71620107003);辽宁省高校创新团队支持计划资助项目(LT2016007);流程工业综合自动化国家重点实验室基础科研业务费资助(2013ZCX11);黑龙江省省属本科高校基本科研业务费项目(2018-KYYWF-1164);黑龙江省哲学社会科学研究规划年度项目(19GLE331, 18JYB155, 14C004)

作者简介

高太光(1979—), 男, 讲师, 博士, 从事现代物流建模与优化、商务智能建模与优化的研究, E-mail: tggao@mail.usth.edu.cn;
王庆(1969—), 男, 副教授, 博士, 从事系统建模与优化、供应链与ERP系统等研究, E-mail: qwang@mail.neu.edu.cn;
黄敏(1968—), 女, 教授, 博士生导师, 从事物流与供应链管理、生产计划、调度与存储控制及其应用等研究, E-mail:mhuang@mail.neu.edu.cn;
王兴伟(1968—), 男, 教授, 博士生导师, 从事计算机网络、IP/DWDM光Internet等研究, E-mail: wangxw@mail.neu.edu.cn;
张玉(1989—), 女, 博士生, 从事供应链管理及共享经济的研究, E-mail: zhangyu0408@stumail.neu.edu.cn

通讯作者

黄敏, E-mail:mhuang@mail.neu.edu.cn

文章历史

收稿日期:2018-05-05
修回日期:2018-08-15
基于团队合作博弈的自动协商模型
高太光 1,2,3, 王庆 1,2, 黄敏 1,2, 王兴伟 1,2, 张玉 1,2     
1. 东北大学 信息科学与工程学院,沈阳 110004;
2. 东北大学 流程工业综合自动化国家重点实验室,沈阳 110004;
3. 黑龙江科技大学 管理学院,哈尔滨 150022
摘要:企业在联盟方式下运营, 有利于提高供应链的协同运作能力.为进一步发挥其在与需求方进行协商时的群体协作报价优势, 将协商团队、合作博弈和自动协商理论进行融合, 以供应链典型生产和物流企业结成产运纵向联盟为背景, 提出基于团队合作博弈的纵向联盟成员协同报价自动协商模型, 并基于Shapley值对报价方案按照成员报价的贡献对联盟收益进行分配.研究表明, 产运纵向联盟集中定价的情况下, 团队成员采取完全合作的方式进行报价, 可以在团队收益最大化的同时, 实现自身收益最佳, 且有利于维持激烈市场竞争环境下产运纵向联盟的稳定合作关系.
关键词产运纵向联盟    协商团队    自动协商    合作博弈    Shapley值    
Automated negotiation model with collaborative offering of team
GAO Tai-guang 1,2,3, WANG Qing 1,2, HUANG Min 1,2, WANG Xing-wei 1,2, ZHANG Yu 1,2     
1. College of Information Science and Engineering, Northeaster University, Shenyang 110004, China;
2. State Key Laboratory of Synthetical Automation for Process Industries, Northeastern University, Shenyang 110004, China;
3. School of Management, Heilongjiang University of Science and Technology, Harbin 150022, China
Abstract: Enterprises operating as an alliance is beneficial to improve the cooperative operation ability of a supply chain. To further give full play to its advantage in negotiating with their demanders by group collaborative offering, according to the characteristics of the vertical alliance with production and logistics enterprises in the supply chain, this paper proposes an automated negotiation model with collaborative offering of production-logistics vertical alliance based on cooperative game, in which the theories of negotiation team and cooperative game are combined with automated negotiation theory. In addition, the alliance collaborative profit derived from negotiation result is distributed with the Shapley value method according to contribution or importance contributed by each team member. The results show that, in the case of centralized pricing by the production-logistics vertical alliance, each team member may get the best profit meanwhile optimizing the total profit of negotiation team if they calculate offer with a completely cooperative attitude, which may also be good for maintaining the stable cooperation relationship of production-logistics vertical alliance in the fierce market competition environment.p
Keywords: roduction-logistics vertical alliance    negotiation team    automated negotiation    cooperative game    Shapley value    
0 引言

激烈的市场竞争环境和多变的客户需求使得市场竞争已不再局限于单个企业间竞争, 供应链之间的竞争已成为当下经济发展的主流趋势[1-2].供应链中的生产和物流企业纷纷采取组建产运联盟的形式来提升客户服务水平和保持市场竞争优势[3], 进而促进生产和物流等环节的有效协同和对闲置资源合理利用水平的提升[4], 并使得如何有效协调联盟中各方利益和充分发挥联盟内部协作优势成为关键[5].随着互联网和信息技术的迅速发展, B2B(Business to Business)平台环境极大地提高了供应链协调与管理效率和质量, 而自动协商技术作为解决供应链协作中的各类矛盾和利益冲突的有效手段也随之得到了广泛的发展和应用[6]. Sheu等[7]通过研究发现, 企业联盟若以团队方式与需求方开展协商, 不但可以提高联盟的决策质量, 还能有效提升其议价能力.但已有相关研究却并未对产运纵向联盟以团队方式参与自动协商进行具体研究, 缺少对团队内报价的决策博弈过程的有效刻画.

本文根据供应链中企业长期以合作联盟的形式运营时, 成员间的决策行为会逐渐由非合作转化为合作关系[8]的特征, 针对供应链中产运纵向联盟以协商团队的形式参与自动协商的需求, 根据产运纵向联盟的结构特点和决策过程, 在联盟内成员彼此间充分了解的条件下(即成本和偏好信息等为团队内部的共识性信息), 通过融合协商团队、合作博弈和自动协商等理论, 提出基于团队合作博弈的产运纵向联盟成员协同报价自动协商模型, 并通过证明和数值仿真的方式验证了所提出模型的合理性和有效性.

1 相关研究综述 1.1 供应链定价方面

作为供应链内部协调和开拓市场的手段, 供应链定价机制与方法的设计已成为国内外学者们研究的热点[9], 根据不同的市场环境和供应链结构, 学者们进行了比较广泛的研究.针对供应链中产品差异化定价问题, 文献[9-11]分别针对产品特点和消费者差异化需求对销售商产品定价问题进行了研究; 文献[12-13]则具体针对存在多代产品同时销售过程中的产品定价问题进行了研究.为了实现上下游企业间的有效协作与关系协调, 针对供应链中单主体定价问题, 文献[14-17]分别研究了上游企业为下游企业定价的问题; 文献[18-21]则具体研究了在多渠道销售环境下的销售商产品定价问题.而针对供应链中多主体同时定价问题, 文献[22-25]对供应链中多上游企业竞争定价问题进行了研究, 并分别基于非合作博弈方法对不同市场环境和产品条件下定价过程进行了刻画; 而文献[26-28]则分别对多级供应链中上下游企业竞争定价问题进行了建模和研究.对于不同决策方式下的供应链定价与收益分配问题, 文献[29-30]在系统分析了报价决策中的关键影响因素的基础上, 对供应链中上下游企业集中定价决策进行了研究, 并通过与非集中决策情况的对比分析验证了所提模型的有效性; 文献[31]则基于收益共享与合作投资合约对易腐产品供应链协调问题进行建模, 具体分析了集中与分散定价决策对制造商与销售商的影响, 考虑了定价过程中的收益分配问题, 但收益分配是基于固定比率的, 未考虑各方定价决策对供应链总收益的贡献问题; 文献[32]对供应商与两个销售商集中决策下的定价问题进行了研究, 但未对收益与成本评估进行差异化处理, 且忽视了合作方式和收益分配方法对决策的影响.文献[33]通过研究发现, 不合理的联盟关系与决策规则会导致联盟后的总收益低于非联盟状态下的收益和.

综上, 对于供应链定价的研究方法方面, 大多数学者都是基于博弈论方法的.虽然文献[29-32]利用数学规划方法以供应链收益最大为目标对供应链中多主体集中定价进行了建模, 但并没有具体考虑这些主体在合作中的差异化需求和具体的合作博弈过程, 且收益分配并未体现出报价中的主体贡献情况.文献[12, 16-17, 21]基于协商的方法研究了供应链定价问题, 并明显改善了供应链的收益和协调性, 但研究均是基于供应链内部非合作视角的, 而当供应链中企业长期以合作联盟的形式进行运营时, 成员间的决策行为会逐渐由非合作转化为合作关系[8].因此, 有必要基于协商方法和合作博弈理论对供应链内部合作与协同定价问题进行研究.

1.2 自动协商在供应链中的应用

自从1899年Baekeland为销售他的发明专利权与Eastman Kodak开展交易价格协商以来, 协商逐渐成为化解各方利益冲突和矛盾的主要手段[6, 34].随着互联网和信息技术的广泛发展, 为了提高运营的效率和质量, 基于多agent技术的自动协商技术在供应链运营与管理中得到广泛的研究和应用[6, 35].为了实现供应链中需求、生产与订货的有效协同, 文献[36-37]分别针对供应链的协同规划和敏捷制造问题, 提出了基于自动协商的供应链协调模型, 并通过理论分析和数值仿真验证了各自研究的合理性和有效性; 文献[38]则针对供应链中的分散异构资源管理和调度问题的特点和要求, 设计了基于多agent自动协商机制资源协同调度机制, 并通过数值仿真对不同约束和环境下该机制的有效性进行了验证.虽然基于自动协商的供应链协调与管理问题已得到比较广泛的关注, 但基于自动协商理论对供应链联盟协同决策的相关研究较少.而在现实中, 企业以联盟的方式进行运营, 不但可以通过降低交易费用提高运营效率和增加联盟社会福利, 还可以有效提升其在协商中的议价能力[7]; 因此, 基于联盟内部协调决策的自动协商机制设计成为研究的重点.文献[39-40]虽然在对自动协商中协商团队概念进行定义的基础上, 针对供应链中企业联盟运营和决策特点, 提出了基于协商团队的联盟内部投票报价自动协商模型(team negotiation based on profit order difference, TNPOD), 并通过数值仿真验证了模型的有效性.但该模型中, 协商团队成员报价仅基于本方利益最大化目标, 团队报价过程没能真正发挥协商团队内部协作在报价中的优势, 且该研究也没有对团队报价决策的博弈过程进行有效刻画与分析, 未对团队报价将产生联盟协作收益的分配问题进行考虑.

2 基于团队报价的自动协商框架与流程 2.1 场景描述

现实中, 供应链中的很多产品成本对生产和物流环节协作效果依赖度较高, 物流成本占总成本比例较大, 且不同任务量和交货时间会对总成本产生显著的影响, 如生鲜等难保存且易腐产品、煤炭和石油等能源产品的运输.为了提升运营效率, 减少由于低效率协作而产生的额外成本或损失, 该类产品的生产和物流企业通常会选择组建产运纵向联盟的方式进行运营, 并期望通过联盟协作来降低自身运营成本和风险, 巩固自己市场竞争优势地位[2-4].为了能够进一步凸显群体协作和规模效应在与需求方进行协商时的优势, 该联盟将以团队形式与需求方进行业务洽谈.由于供应链中企业长期以合作联盟的形式进行运营会增加成员间的了解和默契程度, 联盟内部成员间的决策行为会逐渐由非合作博弈转化为合作博弈[8].本文假设由产运纵向联盟成员组成的协商团队内部彼此充分了解, 团队定价函数、成员间的成本和收益函数及历史协商信息等均为共识性信息.团队在与需求方的自动协商中, 主要针对产品的交易量、交易单价和交货时间3个关键议题进行协商, 团队成员均希望交易量、价格和交货时间3个议题的取值在可接受区间内均是越大越好, 而需求方正好相反.协商过程中, 需求方给出需求量, 产运联盟根据该需求量计算出具体交货时间和交易价格.}

2.2 自动协商流程设计

根据产运纵向联盟以团队方式与需求企业开展自动协商的特点和要求, 本文基于合作博弈理论, 对产运纵向联盟成员团队协同报价的自动协商过程进行分析与设计(具体流程如图 1所示).

图 1 基于团队报价的自动协商流程

依托B2B的电子商务平台环境, 当产运纵向联盟收到需求企业的协商请求后, 联盟运营协调部门会针对该协商的具体情况选定合适盟员组成协商团队, 并以团队的形式与该需求企业围绕具体合作议题开展协商.本文假设该协商团队由1个产运联盟协调部门、1个生产企业和1个物流企业组成.根据开展自动协商的需要, 产运纵向联盟和需求企业都需在自动协商开始前分别实例化本方agent, 其中联盟运营协调部门、生产企业和物流企业实例化后的agent分别为Ta、Pa和La, 而需求企业实例化的agent为Da.每轮协商中(本文中的一轮自动协商是指在自动协商中, Ta和Da的一次报价交互过程), Da先对需求量进行报价, 当Ta收到该报价后, 若没有达到协商终止条件, 则Ta会组织协商团队成员分别给出自己的交货时间(需要参照历史协商信息中前两轮协商报价的收益分配系数), 而后产生相应的交易价格, 进而形成Da给定该需求量下团队的交货时间和价格, 并将本轮报价及求得该报价下团队内部基于Shapley收益的分配系数存入历史协商信息, 而后将交货时间和价格发送给Da.若Ta给出的报价达到Da接受条件, 则协商成功, Ta收到Da达成合作确认信息, 终止当前协商, 并与团队成员对团队协作与收益分配方案进行确认; 若Ta给出的报价不能达到Da的接受条件, 则Da会继续产生新的需求量并发给Ta, 如此循环, 直到协商成功或达到终止条件.

3 基于团队报价的自动协商模型(TAN)

根据团队自动协商的特点, 本文将基于团队报价的自动协商模型(TAN)定义为一个三元组(关键符号说明见表 1), 即

(1)
表 1 定义中的关键符号说明

其中: I={q, p, d}为自动协商的议题集合, qpd分别为产品交易中的数量、单价和交货时间; Nt={Ta, Pa, La}代表由供应链产运纵向联盟组建的协商团队agent集合; Da代表需求企业的agent.

3.1 团队中联盟协调agent Ta的定义
(2)

其中: =[qTa, qTa]和=[dTa, dTa]分别代表Ta对交易量和交货时间的协商范围; b为Ta获知的市场均价, 且b=(1+γ) ci; pTa为Ta的定价函数[11, 14], 用于求解每轮报价中Nt的最佳单价, 第t(1≤ tTTa)轮报价中的单价计算如下:

(3)

其中: dit为成员i的交货时间; Ψt(0≤Ψt≤1)为交易量对单价的影响因子.当0 < qDat < qTa时, Ψt=0;而当qTaqDat < qTa时, Ψt=(qDat-qTa)/(qTa-qTa); ηt=( dit-dTa)/(dTa-dTa)2为成员交货时间对单价的影响因子.

式(2)中, U为Ta的成本函数, 在第t轮报价的成本CTat可以通过下式计算:

(4)

其中Cit为第t轮报价中成员i的完成成本.

式(2)中, U代表Ta的收益函数, 主要对每轮协商中的报价方案可以为Nt带来的收益进行评估, 第t轮报价的总收益Ut可以表示为

(5)

另外, 在协商开始前, 产运纵向联盟需要为Ta设定一套完备的协商策略(即协商中的决策规则集合), 以保证Ta可以借助平台针对不同的协商情况自动选择一个适当的决策.在收到Da在第t轮协商中的报价qDat后, Ta会辅助Nt中Pa和La基于合作博弈产生团队反报价方案oTat={pTat, dTat}, 式(2)中的ϕTa即为Ta的协商策略, 具体如下所示(oTat-1={pTat-1, dTat-1}为Ta上一轮(第t-1轮)协商中的反报价):

(6)
3.2 团队中成员agent的定义

协商过程中, Pa和La实现利益均衡的策略是交货时间, 每个成员agent需根据Da在第t轮协商中给出的qDat, 并从可行集中选择各自的交货时间, 确定任务执行的成本. Nt中成员agent i可定义为

(7)

其中, =[qi, qi]和=[di, di]分别代表i对交易量和交货时间的协商范围; Cii的完成成本函数[8, 29], 第t(1≤ tTTa)轮报价成本为

(8)

其中: cii的单位最低完成成本, 且需满足ci < αipTat; ψt(0≤ψt≤1)为交易量对i单位成本的影响因子, 当0 < qDat < qi时, ψit=0, 而当qiqDat < qi时, ψit=(qDat-qi)/(qi-qi); εit为各团队成员的交货时间对i生产成本的影响因子, 存在εit=(di- dit-ekdkt-σit)/(di-di), ∀i, k∈{Pa, La}, ik, diditdi, 其中ek=1/(di-di)为成员k的交货时间对i交货时间的影响系数; σiti在第t轮报价中根据历史报价对交货时间的改进系数.当t≤2时, σit=0;当2 < tTTa时, σit=dit-1(βit-1-βit-2), 其中βit-1βit-2分别代表在第t-1轮和第t-2轮报价中基于Shapley值方法求解的i对联盟收益的分配系数, 因为分配中充分考虑到了团队成员报价对联盟总体收益的贡献, 因此更加有利于维持团队稳定协作关系[2].

式(7)中的uii的收益评价函数, 第t(1≤ tTTa)轮反报价收益的具体计算可表示为

(9)

其中αii在第t轮报价中对pTat的获得比例, 且存在( αi=1).假设协商开始前, Nt内部已明确该比例的求解方式, 即依照i的单位最低完成成本而定, 具体表示为αi=ci/(cPa+cLa).

3.3 基于合作博弈的团队报价求解

根据产运纵向联盟的运营特点, 本节将基于合作博弈对团队报价方法进行设计, 并基于Shapley值法给出协商团队的收益分配方案.为了研究需要, 本节将分别对团队内非合作与合作状态下报价方案求解过程进行分析.

3.3.1 成员非合作条件下的反报价

如果Nt中的成员在报价时不考虑团队协作, 并采取策略性行为来保证本方利益最大化, 则Nt中成员报价的求解过程可以通过Nash博弈过程进行刻画.可行集Di和收益评价函数ui可以限定i求解最佳交货时间dit*(i∈{Pa, La})的策略形式, 反应函数ri:(Dk)→ Di, i, k∈ {Pa, La}, ik可以作为成员ik求解最优交货时间的依据.假设ui是可微和严格凹的, 而且满足合适的边界条件, 即i的最优反应包含在可行集Di中.通过对第t轮收益函数uPatuLat分别求dPatdLat的一阶偏导, 并令等式为0, 即əuit/ədit=0, ∀i∈{Pa, La}, 1≤ tTTa, 可以求解得到dPatdLat反应函数交点, 即为Pa和La在不合作状态下求解反报价博弈的Nash均衡解.在交易量qDat一定的情况下, 任何一个成员agent都不能通过改变自己的交货时间而获益, 整理后可得

(10)

其中

通过对非合作条件下dit(i∈{Pa, La})表达式联合求解, 得到i在第t轮报价最佳交货时间为

(11)

其中

dit*代入式(9), 即可得到qDat一定的情况下, i的第t轮报价可产生的最大收益为uit*, ∀i∈{Pa, La}.

3.3.2 成员完全合作条件下的反报价

若Nt成员在报价计算中相互积极沟通和交流, 采取合作策略, 即从Nt整体利益最大化的角度出发求解交货时间, 则可通过对联合收益函数Ut分别求解dPatdLat的一阶偏导, 并令等式为0, 可以找出合作策略下的最佳报价点, 整理后可得

(12)

其中λtξitξktμitμkt的表达式和含义与式(10)和(11)相同.

通过合作策略下dPatdLat的联合求解, 得到i在第t轮报价中的最佳交货时间为

(13)

其中, ∀i, k∈{Pa, La}, ik, 1≤ tTTa.然后, 将dPat**dLat**同时代入式(5), 即可得到Nt在第t轮报价中可得到的最大收益Ut**.

3.3.3 基于Shapley值法的收益分配

协商中, 为了按照报价中的贡献情况对Nt总收益进行分配, 本研究利用Shapley值法[41-42]对具体的分配方法进行了设计.根据Shapley值法基本理论, Pa和La报价收益的Shapley值可通过下式求得:

(14)
(15)

其中: v({1})=uPat*, v({2})=uLat*, v({1, 2})=Ut**, v(0)=0, 而uPat*uLat*分别为在非合作策略下, Pa和La第t轮报价可获最大收益; Ut**为Pa和La在合作策略下, 协商团队Nt在第t轮报价可获总收益, 1≤ tTTa.通过整理后得

(16)
(17)

式(16)和(17)也可以理解为Pa和La如果在报价计算中采用完全合作的策略时可分别获得的收益.因此, Pa和La第t(1≤ tTTa)轮报价的分配系数为

(18)
(19)

命题1  一个生产商和一个物流服务商组成的协商团队与需求方进行协商时, 若团队内部信息共识且产运联盟集中定价, 则基于团队合作博弈的产运纵向联盟成员协同报价产生的收益是超可加的, 且该合作博弈的核心非空.

证明  由式(3)和(8)可知, Ta第t轮协商中的收益函数Ut是决策变量dPatdLat的二次凹函数, 因此3.3.2节中求得的dPat**dLat**即为该收益函数的最大极值点, 代入式(5)即可得到团队报价的最大收益值Ut**.当团队成员采取非合作方式进行报价时, 通过3.3.1节中计算得到dPat*dLat*, 即为Pa和La非合作状态下求得的最佳任务交货时间, 将其分别代入式(9)即可得到Pa和La非合作报价下各自的最佳收益uPat*uLat*.根据式(5)和(9)的关系可以得出uPat*+uLat*=Ut*, 由于Ut**已为团队报价可获的最大收益值, 必然存在uPat*+uLat*=Ut*Ut**, 即基于团队合作博弈的产运纵向联盟成员协同报价产生的收益是超可加的.另外, 由于本研究中的协商团队仅由Pa和La两个成员组成, 协商团队只包含两个非空子集, 若 hi=1, 0≤ hi≤ 1, 则由式(5)和(9)的关系不难发现, 总有Ut hiuit.因此, 可以得出该博弈是一个平衡的博弈, 博弈的核心为非空.

定义1  若团队内部通过博弈(Nt, v)产生的团队报价和收益分配方案是稳定的, 则任何成员agent针对该方案所提出的任何异议均存在一个反异议, 而所有稳定报价和收益分配方案的集合称为团队无约束协商集合PM(v).

定义2  博弈(Nt, v)的协商集合M(v)可以具体表示为M(v)=O(v)∩PM(v), 其中O(v)为团队报价和收益分配方案集合.

推论1  若以Core(v)为核的博弈(Nt, v)是超可加性博弈, 则当且仅当∀ oO(v), o∈ PM(v), Core(vo)≠∅时, PM(v)=Core(v).

推论2  若以Core(v)为核的博弈(Nt, v)是超可加性博弈, 则当且仅当∀ oO(v), oM(v), Core(vo)≠ ∅时, M(v)=Core(v).

由推论1和推论2可以得出, 当团队内部基于合作博弈进行报价时, 报价与收益分配方案的合理设计有利于提高团队的整体认可水平, 进而提高团队的协作效果, 因此对团队内部报价形成的机制及相应的协商决策方法设计变得十分关键, 也是基于团队合作博弈自动协商问题研究的核心环节之一.

命题2  在激烈的市场竞争环境下, 考虑到联盟合作的长期性和持续性, 团队成员基于合作博弈产生的报价方案是稳定的.

证明  由命题1的证明可知, 产运纵向联盟通过团队合作博弈报价所产生报价方案的总收益总是大于或等于成员非合作报价所产生收益之和, 再由式(16)和(17)给出的基于Shapley值的团队收益分配, 可以保证每个成员都可以按照本方报价方案的贡献分得相应的联盟收益, 且最终获得的总收益不会低于本方非合作报价产生的收益, 因此基于合作博弈的团队报价方案具有内部稳定性.另外, 由于激烈的市场竞争环境使得产运纵向联盟中的任意企业很难独立应对[5], 为了维系与联盟其他成员的长期和稳定的合作关系, 即使团队协作并没有产生足够多的联盟收益, 但只要团队报价中本方可得收益不低于本方独立报价获得的收益, 团队成员还是会坚持接受基于合作博弈的团队报价方案, 故基于合作博弈产生的报价方案具有外部稳定性.

命题3  基于团队合作博弈报价后求解得到产运纵向联盟收益分配Shapley值是满足匿名性、有效性、可加性和虚拟性的唯一解.

证明  可以很容易地验证每一轮报价中求解的Shapley值确实满足这4条公理[41-42], 因此要证明该命题的正确性, 只需要证明4个性质的解一定是每轮报价的Shapley值.

η表示一个满足4个公理的值, 对于任意子团队∈Nt, 用R2Nt表示下述-一致性(-unanimity)博弈:

(20)

假定存在一个分配系数β(0≤β≤1), 因为在团队报价博弈中, Nt\中所有的团队成员均为虚拟参与方agent, 所以他们都分配到0.根据匿名性的特点, 中的所有agent获得同样的分配, 再结合有效性的要求, 向量η()恰好能将整个报价产生收益值分配完毕.这样一来, 中的每一个agent都能得到β/||, Nt\中的每个agent得到0.考虑到每轮报价中可能存在的这些博弈的一个线性组合

(21)

如果并非所有系数都是0, 则必定存在一个子团队, 使得对于任意⊂(≠), 满足≠0且=0.因此, 根据式(21)可以得出

(22)

其中求和符号是将不包含在中的团队成员报价的收益进行加总.但在处, 右侧的向量值为0, 而左侧的向量值为()=0, 因此产生矛盾.这样就证明了博弈R2Nt的一个基, 而且η是由每轮报价中的博弈所决定的.由可加性属性可知, 至多存在一个值向量满足这4条公理, 因此4个性质的解一定是每轮报价的Shapley值.

4 需求企业agent Da的定义

根据需求企业的基本特征, 本文将自动协商中需求方企业对应的agent Da做如下定义:

(23)

其中: WDa={ωDap, ωDaq, ωDad}为Da对协商议题的权重集合, 且存在ωDap+ωDaq+ωDad=1;oDa={pDa, qDa, dDa}和oDa={pDa, qDa, dDa}分别代表Da对全部协商议题的期望值和底线值集合; TDa代表Da能接受的最大协商轮次; θDa代表Da一般可接受报价方案满意度水平, 是Da进行协商决策的主要依据; δDa代表Da在报价时让步速度控制系数, 本文假设Da基于时间的让步策略[34]产生需求量报价, 具体表示为

(24)

其中:当δDa=1时, Da让步是线性的, 且每轮协商中选用相同的让步系数; 当δDa>1时, Da的让步属于迫切型, 让步属于Conceder型策略, 会在首轮协商中朝着本方的底线值靠近; 当δDa < 1时, Da的让步属于Boulware型策略, 即在协商的开始阶段让步小, 但在临近协商最大期限TDa时, 让步幅度很大.

式(23)中的vDa为Da在协商中的报价方案满意度评价函数, 基于MAUT理论, 第t(1≤ tTDa)轮协商中Ta发来的反报价给Da带来的满意度为

(25)

式(23)中的ϕDa代表Da在协商中的决策规则, 当对方报价产生的满意度水平大于等于本方一般可接受的满意度水平θDa或本方当前轮次的报价坚持力=1-(1-θDa)(t/TDa)1/θDa[6, 39], Da会选择接受对方报价; 若超过本方可接受的最大协商轮次, 则退出协商, 否则, 发出需求量反报价.具体如下所示:

(26)
5 数值仿真与分析 5.1 仿真背景描述

近些年, 煤炭企业承受着去产能化和行业内剧烈竞争的双重压力, 仿真以内蒙古某大型煤炭企业为了实现对核心生产能力的升级改造, 提升业务运营效率和质量, 将煤炭的物流业务进行分离, 并与某专业物流公司结成煤炭产运纵向联盟为背景.联盟中的煤炭企业和物流企业将通过协作运营的方式完成需求企业对煤炭生产与物流运输的任务.某年第1季度, 广州某大型电热公司希望与该联盟达成煤炭交易合作, 并向联盟发出协商的请求(为了满足发电需求, 电热公司需要大量单位发热量为6 300 ~ 6 400大卡、挥发分低于14 %、全硫低于0.9 %、全水分低于8 %的煤炭, 且需要由煤炭产运纵向联盟完成全部的煤炭生产和物流运输任务.已知, 煤炭企业的生产坑口距离电热公司2 500多千米, 物流成本在销售成本中占有较大比重(根据客观统计数据, 该比重约占煤炭销售成本的60 %[43-44])).为了达成合理而且稳定的合作协议, 联盟将以团队的形式与该电热公司借助B2B电子商务平台环境开展自动协商, 对合作中的交易总量q(吨)、单价p(元/吨)和交货时间d(天)进行协商.自动协商开始前, 煤炭企业和物流公司结成的产运纵向联盟被定义为协商团队Nt, 而联盟内部协调部门、煤炭企业和物流企业则分别被初始化为agent Ta、Pa和La, 电热公司被初始化为agent Da.

5.2 数值仿真中相关参数的设定

为了验证所提出模型的合理性, 仿真将随机产生Ta、Pa、La和Da, 具体取值范围如表 2所示.

表 2 数值仿真中相关参数的随机取值范围
5.3 数值仿真结果分析

为了验证所提出模型在多轮自动协商过程中的有效性, 本文对团队合作博弈报价下的自动协商过程进行数值仿真, 并与团队非合作博弈报价下的议题取值、团队收益和Da的满意度与报价坚持力的变化情况进行对比的同时, 进一步分析和论证本文所提出模型的作用.通过图 2可以看出, 协商中基于合作博弈报价的Nt总收益会随着协商的进行和Da在需求量上的让步而得到持续改善(而团队非合作博弈报价获得收益不稳定), 与很多传统自动协商研究中各方期望收益也会持续下降不同.本文所提出模型中的协商团队在每轮报价中并不是对每个议题值都进行让步, 而是需在兼顾多个成员收益的同时, 对多议题取值进行权衡.

图 2 多轮自动协商过程中协商团队的总收益变化

图 3(a)可以看出, 协商过程中, Da对需求量的报价会依照初始报价和式(24)持续作出让步(即逐渐增加需求量).由图 3(b)图 3(c)可以看出, 团队合作博弈报价中的交货时间d会有所增加, 而价格也会作出相应的让步, 议题值的变化过程相对比较平缓, 而团队非合作博弈报价中的交货时间和相应的价格变化波动较大, 且任务总交货时间和交易价格相对较高.造成这种现象的主要原因是团队非合作报价导致成员均仅以本方收益最大为目标, 使得交货时间得不到有效协调, 进而需要花费更多的时间和完成成本, 因此需要更高的交易价格来保证团队收益.由图 3(a)不难发现, Da给出的需求量会随着协商的进行而持续增加.根据前文假设, 这对于协商团队收益而言是起到正向推动作用的.而由图 3(b)图 3(c)可以看出, 虽然协商团队会随着对方给出需求量的增加而持续降低交易价格, 但也会相应地增加交货时间, 降低完成成本.因此, 通过对多议题取值和成员收益的协调, Nt在协商中的收益可以得到持续改善.而由于非合作团队报价过程中成员间的协调性不佳, 团队报价中对议题的取值不稳定, 造成交货时间和完成成本上的浪费, 进而导致协商中团队收益波动较大, 没有固定的变化趋势.

图 3 协商中议题的取值变化曲线

图 2图 3可以看出, 所提出模型通过区分团队内各成员企业的性质和运营特征, 对价格、成本和收益等的计算与评估函数进行差异化定义, 可在有效满足物流供应链纵向企业联盟以团队形式与需求企业开展自动协商需求的同时, 为协商过程中团队报价决策提供必要支持.同时, 通过合作博弈形式对团队成员在物流供应链运作中的关系进行刻画, 借助各函数间的关联和映射关系对每轮协商报价中的交易价格、数量和交货时间等议题取值进行优化, 使协商逐渐向有利于供需双方的方向发展, 最终达成协商各方满意的协商合作方案. 图 2中的协商收益变化对比情况, 充分说明了本文所提出基于团队合作博弈报价模型相对于团队非合作博弈报价的优越性, 而图 3则说明所提出模型在合作博弈情况下可以保证各轮报价的平稳性, 更加利于最佳协商合作方案的达成.

图 4可以看出, 基于合作博弈的团队报价在提升协商团队Nt收益的同时, 并没有伤害Da的收益, 反而也让Da的满意度得到不断地改进.最终在第21轮协商中, 由于Ta给出的报价方案的满意度(0.283 2)已经超过Da的报价坚持力(0.267 9), 根据如式(26)所示的协商策略, Da选择接受了Ta给出的报价方案:交易量为38 155.4吨、119.0天完成、交易单价为803.06元/吨, 协商宣告成功. Nt获得总收益为18 274, 131.34元, 其中Pa和La的收益分别为5 746 037.59元和12 528 093.75元.另外, 由图 4还可以看出, 协商团队基于非合作博弈的报价给Da带来的满意度波动很大, 虽然在第17轮中Da也接受了Nt的报价(交易量37 161.66吨、129.0天完成、交易单价720.11元/吨), 但Nt获得总收益仅为10 067 357.83元.通过比较可知, 虽然Nt基于非合作博弈报价比基于合作博弈报价更快地与需求方达成合作协议, 但总收益减少了8 206 773.51元, 这足以验证团队内通过合作博弈报价的优越性.

图 4 多轮自动协商中需求方(Da)满意度和报价坚持力的变化情况

另外, 为了进一步比较基于团队合作与非合作博弈报价在自动协商中的差异, 本文基于表 2的参数设定, 重复进行了100次数值仿真实验, 并对最终的协商效果进行了对比分析, 具体如图 5所示.

图 5 不同模型下的100次仿真平均结果对比

图 5(a)可以看出, 在100次仿真中团队内基于合作博弈报价可以比非合作博弈报价产生更多的成功协商次数.虽然图 5(b)说明基于合作博弈报价需要更多的协商轮次, 协商效率上有所降低, 但从图 5(c)看, 这种效率上的略微降低是值得的, 因为基于合作博弈报价可以产生更大的收益.同时, 由图 5(b)还可以看到二者在成功协商轮次的差距并不显著, 这对于高性能计算机平台下的自动协商而言, 协商效率方面并不会产生明显的影响.通过对所提出模型结构和合作博弈原理分析可知, 造成团队基于合作博弈报价需要更多协商轮次才能成功的主要原因在于报价方式更趋于谨慎, 让步幅度相对较小, 因此会造成达到对方理想点的速度较慢.综合数值仿真结果和分析可以得出, 本文所提出模型对于处理基于团队内合作博弈的产运纵向联盟成员协同报价是有效的, 可以产生比团队内非合作博弈报价更加理想的协商效果, 有利于激励团队内成员为了获得更多收益而倾向于选择积极合作的态度, 这不但有利于优化团队协商报价方案和提高协商中团队的总收益, 还有利于提高物流供应链中各方合作的效率和质量.

6 结论

激烈的竞争环境和苛刻的客户需求, 让供应链中的生产企业和物流企业均面临着巨大市场压力, 为了维护市场竞争地位, 组建产运纵向联盟逐渐成为他们分散经营风险、提高运营效率和质量、优化资源配置和减少重复投资的必然选择.联盟组建后的规模效应和交易成本的降低, 不但可以提高联盟社会福利, 也有利于提升其在与客户协商中的议价能力, 进而获得更为理想的合作方案.本文为了有效发挥产运纵向联盟在协商中的产运协作优势, 在对产运纵向联盟运营特点进行分析的基础上, 基于合作博弈理论提出了产运纵向联盟团队报价自动协商模型, 并借助Shapley值方法设计了依据团队成员报价贡献分配联盟收益的方法.通过命题证明和数值仿真实验的方式, 在对所提出模型的有效性进行验证的同时, 揭示了基于团队合作博弈报价相对于非合作博弈报价的优越性.当然, 研究中也存在着一些需要进一步完善的地方, 如仅将交货时间作为决策要素, 没有考虑到其他议题对决策的影响, 且未考虑团队内部成员报价顺序可能对报价方案计算产生的影响.因此, 下一步研究将重点围绕着这些问题展开.另外, 将团队内部报价决策博弈与交易双方在协商中的博弈过程进行联合分析, 也将是非常有趣的研究内容.

参考文献
[1]
Ai X, Chen J, Zhao H, et al. Competition among supply chains: Implications of full returns policy[J]. International Journal of Production Economics, 2012, 139(1): 257-265. DOI:10.1016/j.ijpe.2012.04.018
[2]
宋敏, 黄敏, 王兴伟. 基于链链竞争的闭环供应链渠道结构选择策略[J]. 控制与决策, 2013, 28(8): 1247-1252.
(Song M, Huang M, Wang X W. Selection strategies of channel structure for competing closed-loop supply chains[J]. Control and Decision, 2013, 28(8): 1247-1252.)
[3]
Grauberger W, Kimms A. Revenue management under horizontal and vertical competition within airline alliances[J]. Omega, 2016, 59: 228-237. DOI:10.1016/j.omega.2015.06.010
[4]
Huang M, Cui Y, Yang S, et al. Fourth party logistics routing problem with fuzzy duration time[J]. International Journal of Production Economics, 2013, 145(1): 107-116. DOI:10.1016/j.ijpe.2013.03.007
[5]
蔡建湖, 邓丽丽, 黄卫来, 等. 产出不确定环境下供应链竞争与协调研究综述[J]. 系统工程学报, 2017, 32(4): 547-556.
(Cai J H, Deng L L, Huang W L, et al. Review on supply chain competitions and mechanisms under yield uncertainty[J]. Journal of Systems Engineering, 2017, 32(4): 547-556.)
[6]
Fatima S, Kraus S, Wooldridge M. Principles of automated negotiation[M]. New York: Cambridge University Press, 2014.
[7]
Sheu J B, Gao X Q. Alliance or no alliance--Bargaining power in competing reverse supply chains[J]. European Journal of Operational Research, 2014, 233(2): 313-325. DOI:10.1016/j.ejor.2013.09.021
[8]
Zhao Y, Wang S, Cheng T E, et al. Coordination of supply chains by option contracts: A cooperative game theory approach[J]. European Journal of Operational Research, 2010, 207(2): 668-675. DOI:10.1016/j.ejor.2010.05.017
[9]
Hopp W J, Xu X. A static approximation for dynamic demand substitution with applications in a competitive market[J]. Operations Research, 2008, 56(3): 630-645. DOI:10.1287/opre.1080.0541
[10]
Ceryan O, Sahin O, Duenyas I. Dynamic pricing of substitutable products in the presence of capacity flexibility[J]. Manufacturing & Service Operations Management, 2013, 15(1): 86-101.
[11]
Oh S, Sourirajan K, Ettl M. Joint pricing and production decisions in an assemble-to-order system[J]. Manufacturing & Service Operations Management, 2014, 16(4): 529-543.
[12]
Kuo C W, Huang K L. Dynamic pricing of limited inventories for multi-generation products[J]. European Journal of Operational Research, 2012, 217(2): 394-403. DOI:10.1016/j.ejor.2011.09.020
[13]
Jia J, Zhang J. Dynamic ordering and pricing strategies in a two-tier multi-generation durable goods supply chain[J]. Interantional Journal of Production Economics, 2013, 144(1): 135-142. DOI:10.1016/j.ijpe.2013.01.029
[14]
He X, Prasad A, Sethi S P. Cooperative advertising and pricing in a dynamic stochastic supply chain: Feedback Stackelberg strategies[J]. Production and Operations Management, 2009, 18(1): 78-94.
[15]
Zhang J, Chiang W Y K, Liang L. Strategic pricing with reference effects in a competitive supply chain[J]. Omega, 2014, 44: 126-135. DOI:10.1016/j.omega.2013.07.002
[16]
Chu L Y, Shamir N, Shin H. Strategic communication for capacity alignment with pricing in a supply chain[J]. Management Science, 2017, 63(12): 4366-4388. DOI:10.1287/mnsc.2016.2527
[17]
Kouvelis P, Turcic D, Zhao W. Supply chain contracting in environments with volatile input prices and frictions[J]. Manufacturing & Service Operations Management, 2018, 20(1): 130-146.
[18]
Yao D Q, Liu J J. Competitive pricing of mixed retail and e-tail distribution channels[J]. Omega, 2005, 33(3): 235-247. DOI:10.1016/j.omega.2004.04.007
[19]
Chen J, Liang L, Yao D Q, et al. Price and quality decisions in dual-channel supply chains[J]. European Journal of Operational Research, 2017, 259(3): 935-948. DOI:10.1016/j.ejor.2016.11.016
[20]
浦徐进, 李栋栋, 王执杰. 考虑参照价格效应的双渠道供应链协调机制设计[J]. 控制与决策, 2017, 32(7): 1273-1278.
(Pu X J, Li D D, Wang Z J. Coordination mechanism of dual-channel supply chains considering reference price effect[J]. Control and Decision, 2017, 32(7): 1273-1278.)
[21]
Yang H, Luo J, Zhang Q. Supplier encroachment under nonlinear pricing with imperfect substitutes: Bargaining power versus revenue-sharing[J]. European Journal of Operational Research, 2018, 267: 1089-1101. DOI:10.1016/j.ejor.2017.12.027
[22]
Liu Q, Zhang D. Dynamic pricing competition with strategic customers under vertical product differentiation[J]. Management Science, 2013, 59(1): 84-101. DOI:10.1287/mnsc.1120.1564
[23]
Luo Z, Chen X, Chen J, et al. Optimal pricing policies for differentiated brands under different supply chain power structures[J]. European Journal of Operational Research, 2017, 259(2): 437-451. DOI:10.1016/j.ejor.2016.10.046
[24]
Kumar M, Basu P, Avittathur B. Pricing and sourcing strategies for competing retailers in supply chains under disruption risk[J]. European Journal of Operational Research, 2018, 265(2): 533-543. DOI:10.1016/j.ejor.2017.08.019
[25]
Chen J, Chen B, Li W. Who should be pricing leader in the presence of customer returns?[J]. European Journal of Operational Research, 2018, 265(2): 735-747. DOI:10.1016/j.ejor.2017.07.069
[26]
Lee E, Staelin R. Vertical strategic interaction: Implications for channel pricing strategy[J]. Marketing Science, 1997, 16: 185-207. DOI:10.1287/mksc.16.3.185
[27]
Yang S L, Zhou Y W. Two-echelon supply chain models: Considering duopolistic retailers' different competitive behaviors[J]. International Journal of Production Economics, 2006, 103(1): 104-116. DOI:10.1016/j.ijpe.2005.06.001
[28]
Wu C H. Product-design and pricing strategies with remanufacturing[J]. European Journal of Operational Research, 2012, 222(2): 204-215. DOI:10.1016/j.ejor.2012.04.031
[29]
Anderson E J, Bao Y. Price competition with integrated and decentralized supply chains[J]. European Journal of Operational Research, 2010, 200(1): 227-234.
[30]
Hua G, Wang S, Cheng T E. Price and lead time decisions in dual-channel supply chains[J]. European Journal of Operational Research, 2010, 205(1): 113-126.
[31]
Zhang J, Liu G, Zhang Q, et al. Coordinating a supply chain for deteriorating items with a revenue sharing and cooperative investment contract[J]. Omega, 2015, 56: 37-49. DOI:10.1016/j.omega.2015.03.004
[32]
Qi Q, Wang J, Bai Q. Pricing decision of a two-echelon supply chain with one supplier and two retailers under a carbon cap regulation[J]. Journal of Cleaner Production, 2017, 151: 286-302. DOI:10.1016/j.jclepro.2017.03.011
[33]
Taleizadeh A A, Soleymanfar V R, Choi T M. Optimal pricing and alliance strategy in a retailer-led supply chain with the return policy: A game-theoretic analysis[J]. Information Sciences, 2017, 420: 466-489. DOI:10.1016/j.ins.2017.08.054
[34]
Faratin P, Sierra C, Jennings N R. Negotiation decision functions for autonomous agents[J]. Robotics and Autonomous Systems, 1998, 24(3-4): 159-182. DOI:10.1016/S0921-8890(98)00029-3
[35]
Eshragh F, Pooyandeh M, Marceau D J. Automated negotiation in environmental resource management: Review and assessment[J]. Journal of Environmental Management, 2015, 162: 148-157.
[36]
Hernández J E, Mula J, Poler R, et al. Collaborative planning in multi-tier supply chains supported by a negotiation-based mechanism and multi-agent system[J]. Group Decision and Negotiation, 2014, 23(2): 235-269. DOI:10.1007/s10726-013-9358-2
[37]
Giannakis M, Giannakis M, Louis M, et al. A multi-agent based system with big data processing for enhanced supply chain agility[J]. Journal of Enterprise Information Management, 2016, 29(5): 706-727. DOI:10.1108/JEIM-06-2015-0050
[38]
Lang F, Fink A, Brandt T. Design of automated negotiation mechanisms for decentralized heterogeneous machine scheduling[J]. European Journal of Operational Research, 2015, 248(1): 192-203.
[39]
Sanchez-Anguix V, Julian V, Botti V, et al. Tasks for agent-based negotiation teams: Analysis, review, and challenges[J]. Engineering Applications of Artificial Intelligence, 2013, 26(10): 2480-2494. DOI:10.1016/j.engappai.2013.07.006
[40]
Sanchez-Anguix V, Julian V, Botti V, et al. Studying the impact of negotiation environments on negotiation teams' performance[J]. Information Sciences, 2013, 219: 17-40. DOI:10.1016/j.ins.2012.07.017
[41]
Roth A E. The Shapley value: Essays in honor of Lloyd S. Shapley[M]. New York: Cambridge University Press, 1988.
[42]
Shapley L S. A value for n-person games[J]. Contributions to the Theory of Games, 1953, 28(2): 307-317.
[43]
Cheng Q, Ning S, Xia X, et al. Modelling of coal trade process for the logistics enterprise and its optimisation with stochastic predictive control[J]. International Journal of Production Research, 2016, 54(8): 2241-2259. DOI:10.1080/00207543.2015.1062568
[44]
Wang C, Ducruet C. Transport corridors and regional balance in China: The case of coal trade and logistics[J]. Journal of Transport Geography, 2014, 40: 3-16. DOI:10.1016/j.jtrangeo.2014.08.009