控制与决策  2019, Vol. 34 Issue (1): 167-179  
0

引用本文 [复制中英文]

马珍珍, 朱建军, 张世涛, 王翯华, 刘小弟. 面向犹豫模糊语言信息的大型群体分类集结模型[J]. 控制与决策, 2019, 34(1): 167-179.
[复制中文]
MA Zhen-zhen, ZHU Jian-jun, ZHANG Shi-tao, WANG He-hua, LIU Xiao-di. Classification-based aggregation model on large scale group decision making with hesitant fuzzy linguistic information[J]. Control and Decision, 2019, 34(1): 167-179. DOI: 10.13195/j.kzyjc.2017.0952.
[复制英文]

基金项目

国家自然科学基金项目(71502073, 71601002, 71171112);江苏省普通高校学术学位研究生创新计划项目(KYZZ15_0094);中央高校基本科研业务费专项资金项目(NS2014086);安徽省自然科学基金面上项目(1708085MG168)

作者简介

马珍珍(1988-), 女, 博士生, 从事复杂决策理论与方法、复杂产品供应链管理的研究;
朱建军(1976-), 男, 教授, 博士生导师,从事决策理论与方法、复杂系统建模、智能算法等研究。

通讯作者

马珍珍, E-mail: zhenzhen5886@163.com

文章历史

收稿日期:2017-07-16
修回日期:2017-11-08
面向犹豫模糊语言信息的大型群体分类集结模型
马珍珍1, 朱建军1, 张世涛2, 王翯华3, 刘小弟2    
1. 南京航空航天大学 经济与管理学院,南京 211106;
2. 安徽工业大学 数理学院,安徽 马鞍山 243002;
3. 金陵科技学院 商学院,南京 211169
摘要:研究基于犹豫模糊语言信息的大型群体决策分类和集结问题.提出一种面向犹豫模糊语言信息的专家相似度构建方法, 相似度测算基于犹豫相似度和距离相似度综合考虑; 改进编网分类方法, 借助基于相似矩阵的编网分类方法对大型群体专家进行初步分类, 确定可接受范围, 对专家进行再分类并通过分类精度指标对分类的有效性进行验证以确定最终类别; 构建大规模群体信息集结的类内集结和类间集结框架, 对类内专家信息进行集结以获得概率语言信息; 提出一种基于语言概率分布的类可靠度计算方法, 基于类可靠度和类专家数量占总体数量比例综合考虑确定类别权重以实现类间信息集结, 进而根据集结的概率语言信息计算对象期望值并进行排序.最后, 通过算例及方法比较验证所提出方法的有效性.
关键词大型群决策    犹豫模糊语言    群体分类    相似度    概率语言    可靠度    
Classification-based aggregation model on large scale group decision making with hesitant fuzzy linguistic information
MA Zhen-zhen1, ZHU Jian-jun1, ZHANG Shi-tao2, WANG He-hua3, LIU Xiao-di2    
1. College of Economics and Management, Nanjing University of Aeronautics and Astronautics, Nanjing 211106, China;
2. School of Mathematics & Physics Science and Engineering, Anhui University of Technology, Ma'anshan 243002, China;
3. School of Business, Jinling Institute of Technology, Nanjing 211169, China
Abstract: A classification and aggregation problem on large-scale group decision making is studied based on the hesitant fuzzy linguistic terms. Specifically, a method to measure the similarity of two hesitant linguistic sets is proposed considering both hesitancy and distance. Then, the preliminary expert classes are generated using the netting method based on a similarity matrix, and an acceptable level is set to help make a second classification. Through a classification accuracy index, the final classes are obtained. Furthermore, two aggregating frames are constructed respectively for the information within one class and between the classes. The proportional linguistic groups are obtained through combing the information within one class. On that basis, the degree of reliability of each class is calculated and the class weights are determined based on the class reliability and the percentage of expert number in one class to the total number to aggregate the information among classes. Additionally, the expected values of the alternatives are calculated to make a selection. Finally, a case is given to illustrate the effectiveness and feasibility of the proposed method.
Keywords: large-scale group decision making    hesitant fuzzy linguistic    group classification    similarity    proportional linguistic    reliability    
0 引言

在一些复杂问题的决策过程中, 决策者往往难以给出精确的定量评判, 适宜运用语言变量形式进行评判[1].当决策对象介于两个语言等级之间时, 或者群体决策过程中决策者有多种不确定的语言判断时, 单一语言术语难以准确描述这类复杂的情况, 文献[2]提出了犹豫模糊语言决策框架.犹豫模糊语言研究主要集中于语言转化[3]、集结算子[4-5]、群体相似性[6-7]、比较方法[8]等方面.其中文献[5, 8]将犹豫模糊语言信息转化为概率语言信息后进行信息集结, 相较于其他方式清晰呈现出每个语言所对应的概率, 可减少信息损失.

在许多实际决策中, 由于单个决策者对复杂信息和复杂问题的认知难以满足科学决策的需求, 群决策理论和方法得到了广泛应用和研究[9-10], 通常, 专家数或决策者数大于20的决策问题被称为大型群决策问题[11].目前, 随着群决策新模式和新方法的发展, 如社交网络、电子民主等, 大型群体决策在实际决策中日益频繁.大型群决策问题相较于一般群决策会带来较大的时间和资金消耗, 且复杂度较高, 主要表现于: 1)专家群体相似度解决; 2)专家群体对决策的影响作用确定; 3)专家信息的可靠性度量.因此, 如何应对这些问题便成为关键.在信息集结方面, 文献[12]针对异构语言信息集结展开了研究; 文献[13]针对不同大型决策场景提出了考虑决策者能力的量化集结算法.在群体相似性方面, 文献[14]提出了一种图形化监督工具以寻求专家一致性; 文献[15]提出了一种共识模型以识别和管理大型决策中专家非合作行为.在分类方面, 文献[16]提出了二叉树DEA循环分类模型; 文献[17]提出了动态相似性分类方法; 文献[18]提出了三维灰关联分类方法; 文献[19]针对多属性群决策聚类问题提出了一种通用的概念框架.这些方法通过对决策问题进行分类来发现群体内在规律特点, 有效解决了大型决策所引起的复杂问题, 但均未考虑犹豫模糊语言信息情况下的群体分类问题.

为有效解决大型群体决策分类问题, 基于相似度的分类方法[20]不但考虑了群体相似性, 而且可以快速有效地解决群体分类问题, 因此值得深入研究.文献[21]提出了基于犹豫模糊语言的相似度编网分类方法, 其根据截割水平进行初步分类, 但未考虑如何客观验证分类有效性.文献[22]提出了基于类中心距离的分类精度检验指标, 解决了分类有效性验证问题.

本文提出一种基于犹豫模糊语言的大型群决策相似度分类和集结方法.首先, 通过构建基于犹豫模糊语言的群体相似度测度方法, 利用改进的相似度编网分类方法对大型群体专家进行分类; 然后, 在分类基础上对类内专家进行信息集结转化为概率语言信息; 最后, 通过计算类可靠性来计算每类权重以实现类间信息集结.本文具体研究思路见图 1.本文创新点主要有以下两点:

图 1 本文研究思路

1) 针对犹豫模糊语言信息提出群体相似度构建方法, 以解决大型群体决策分类问题;

2) 提出基于不确定量的类可靠度测量方法, 以解决每类专家的权重确定问题以及专家信息不确定性问题.

1 基本定义与问题描述

设自然语言术语集合S={s0, ..., sg}, 满足s1≺...≺sg, g为奇数, 且Neg(sl)=sl', l'=g-l.在不确定型决策中, 决策者可能由于对决策对象某个属性缺乏了解而存在一定的犹豫性, 需借助S中一个或多个术语来准确表达自己的意见.因此, 犹豫模糊语言的提出不仅丰富了决策者意见的表述, 而且增加了其灵活性[7].

定义1 [23]    设语言集合S={s0, ..., sg}, 若HS是一个犹豫模糊语言集合, 则HSS中一个连续的有序子集, 表示为

设专家集合E={e1, ..., eK}(ekE, k=1, ..., K≥20);决策对象集合A={a1, ..., aM}(aiA, i=1, ..., M); 属性集合F={f1, ..., fN}(fjF, j=1, ..., N), 对应的权重向量为W={w1, ..., wN}, wj∈[0, 1], 且.设等级语言集合S= {s0, ..., sg}(si'S, i'=0, ..., g).设θ表示犹豫模糊语言集, 即θ=(sL, sL+1, ..., sU).其中LU, LU∈{0, ..., g}.|θ|表示θ的模, θ越大, 表示专家犹豫程度越大.设Hij, sk(θ)表示决策者ek针对对象ai在属性cj给出的信息, 且Hij, sk(θ)⊂θ.

针对犹豫模糊语言的环境, 本文主要解决的问题是如何基于大型群体的分类特点, 挖掘群体信息的相似特征并对群体信息进行有效集结.

2 主要模型与方法

由于分类能较清晰地辨识大型群体的类别特征, 本文首先对专家群体进行分类, 构建分类精度检验指标以确定专家最终类别; 然后, 将类内专家信息进行整合并转化为类概率语言组合信息; 最后, 计算类间可靠度并将其考虑到类间信息融合过程, 以进行最终排序.

2.1 分类方法构建

在群体决策中, 决策者由于自身经验、认知、背景等方面有所差异而给出不同的决策信息, 如何有效集结大量的差异信息成为研究关键.通常方法是对专家赋予权重以简化差异带来的影响, 但是对于大型群体决策方法有两个难题:一是专家数量较大, 在某种情况下, 权重赋予有难度且有可能被均化; 二是若直接对大型群体信息进行集结, 则很可能未对群体差异有效解决而造成信息损失, 影响决策结果.因此, 分类方法适用于大型群体决策[17].

2.1.1 基于犹豫模糊语言的群体相似度测算

分类处理方法的本质是通过衡量决策对象之间的相似关系, 从而将相似的对象归为一类[24].显然, 分类问题首先需要解决的是如何衡量对象之间的相似关系.不同于基于单一语言的相似度测算方法, 由于犹豫模糊语言之间的相似度不能直接衡量, 需要深入考虑影响因素以求出合理的相似关系.在衡量专家相似关系时, 前提是需要对各语言术语进行量化处理.

目前, 语言决策中语言量化研究可归结为以下几种: 1)模糊扩展原理的语言量化模型[25], 该方法需事先确定隶属函数, 在一些情况下由于缺少信息而难以实现, 否则会增加结果的模糊性; 2)符号转移方法[26], 该方法需对信息进行近似估计, 因而存在一定的信息损失; 3)二元语义方法[27-28], 主要适用于信息对称分布的语言集合; 4)语言颗粒化方法[29], 需要事先确定语言颗粒优化约束条件以及确定优化目标函数, 计算过程较为复杂.若未给定其他条件, 则模糊扩展量化模型和语言颗粒优化方法不易操作; 二元语义方法和符号转移方法通过常用的标度理论进行处理, 既简单又有一定的心理学依据[27].此外, 相较于简单符号转移方法, 二元语义方法未造成信息损失, 且转移后的语言值具有语义代表性高、分布均匀(相邻语言值距离相等)、操作性简单等特点[27-28].因此, 本文采用二元语义方法进行语言量化处理, 具体见定义2.

定义2 [27]    设S={s0, s1, ..., sg}是一个预先定义好的自然语言评价集, siS中第i个语言短语, βisi中的元素集成运算值, βi∈[0, g].设i=round(βi)(“round”指四舍五入运算), 令αi∈[-0.5, 0.5), 称αisi的符号转移值, 则存在函数Δ-1可将二元语义形式(si, αi)转化为集成值βi, 即

相似度是衡量专家意见接近程度的主要工具[30].在犹豫模糊语言相似性研究方面:文献[30]基于海明式距离研究了犹豫模糊语言相似度; 文献[31]基于专家犹豫度距离研究了专家一致性; 文献[32]基于区间数距离研究了专家犹豫模糊集合一致性; 文献[6]基于期望距离研究了犹豫相似性.这些方法都是针对犹豫模糊集合距离计算专家相似度, 而未考虑专家犹豫所引起的相似性, 导致相似度计算的片面性.与单一语言相似度计算相比, 犹豫模糊语言的相似关系主要包括两个方面: 1)专家犹豫模糊语言引起的犹豫相似度; 2)基于两者距离的相似度.文献[6, 30-32]中由于只考虑了方面2)引起的相似度, 从而导致计算误差.对此, 本文构建了考虑犹豫角度和距离角度的相似度.

定义3Hij, sk(θ)、Hij, sk'(θ)分别表示决策者ekek'针对对象ai有关属性cj给出的犹豫模糊语言集合, 则将两者的相似度定义为

(1)

其中

式(1)由两部分构成:一是两者直观意义上的相似性, 即两者交集个数所占并集个数的比例; 二是由两者距离差异所引起的间接相似性.前者说明犹豫模糊语言集合的相似元素所占两者并集个数比例越多, 相似性越大; 后者表示集合之间的间接距离, 距离越大, 相似性越小.值得注意的是, 犹豫相似度与各个不同的犹豫模糊语言集所含变量个数无直接关系, 而与两个犹豫模糊集的交集和并集个数相关.犹豫模糊语言中的变量个数反映专家的不确定程度, 变量个数愈多, 不确定性愈高.而在计算相似度时, 本文主要考虑专家所提供信息的接近程度, 而不用考虑专家自身的不确定程度, 这是因为有时即使两专家的不确定程度相同, 其所给信息也可能较为矛盾, 如{s0}和{sg}.此时, 若基于两者相似变量个数(交集)所占并集比例, 则所得犹豫相似度为零, 更符合实际情况.因此, 基于后者计算犹豫相似度则较为合理.为进一步说明式(1)相似度构建的合理性, 本文通过例1以及求解方法的比较加以说明.

例1    在某项招标项目中, 设语言集合为S= {s0, ..., s4}, 有3个专家参与决策.针对某一招标对象给出的犹豫模糊信息为H1(θ)={s2, s3, s4}, H2(θ)={s4}, H3(θ)={s3, s4}.

本例中采用犹豫模糊语言而未直接采用1-9标度法是因为后者是对信息的近似处理, 会造成一定的信息损失.此外, 犹豫模糊语言表达有两个优势: 1)犹豫模糊语言有助于专家针对某对象存在不确定性或犹豫性时更为准确灵活地表达自身意见; 2)语言集合包含变量个数不定, 语言等级个数多样化.

按照文献[6]方法有sm1, 3=0.875, sm2, 3=0.875, 则sm1, 3=sm2, 3.对比H1(θ)与H3(θ), 两者交集个数所占并集个数比例为2/3;对比H1(θ)与H3(θ), 两者交集个数所占并集个数比例为1/2.因此, 前者犹豫方面引起的相似度要高于后者.根据文献[6], H1(θ)与H3(θ)在距离方面的相似度和H2(θ)与H3(θ)的距离相似度相等, 则有sm2, 3 < sm1, 3, 因此sm1, 3=sm2, 3不甚合理.按照式(1), 例1中有sm1, 3=0.958, sm2, 3= 0.938.对比文献[6]方法, 相似度数值有所差异, 有sm1, 3 > sm2, 3, 在这种情况下, 式(1)相对更为合理.结合例1, 相似度构建示意如图 2所示.再者, 若两犹豫模糊集存在交集, 则所得相似度均高于文献[6]方法(以smij, sk, k'(2)表示文献[6]相似度, 有smij, sk, k'(2)=1-Dij, sk.k'), 此可通过如下推论1得到.

图 2 相似度构建示意

推论1    设两个犹豫模糊集合Hij, sk(θ)、Hij, sk'(θ), 若Hij, sk(θ)∩ Hij, sk'(θ)≠∅, 则有smij, sk, k' > smij, sk, k'(2).

证明    若Hij, sk(θ)∩ Hij, sk'(θ)≠∅, 有Hij, sk(θ) ∪ Hij, sk'(θ)≠∅, 则

根据式(1), 有

故推论1得证.

此外, 式(1)相似度还具有以下性质:

性质1

1) 0≤ smij, sk, k'≤1;

2) smij, sk, k'=smij, sk', k;

3) 当Hij, sk(θ)=Hij, sk'(θ)时, smij, sk, k'=1;

4) 当Hij, sk(θ)={s0}, Hij, sk'(θ)= {sg}或Hij, sk(θ) ={sg}, Hij, sk'(θ)={s0}时, smij, sk, k'=0.

证明    1)设

明显地有0≤ A≤1.

对于Dij, sk.k', 有Dij, sk.k'≥0.此时, 需进一步证明Dij, sk.k'≤1, 有

同理, , 则有

因此Dij, sk.k'≥ 0.在此基础上, 有

则有0≤ smij, sk, k'≤1.

2) 已知

则有

3) 当Hij, sk(θ) = Hij, sk'(θ)时, 有

因此Dij, sk.k' = 0, 则有

4) 当Hij, sk(θ) = {s0}, Hij, sk'(θ) = {sg}时, 有

同理, 当Hij, sk(θ) = {sg}, Hij, sk'(θ) = {s0}时, 有smij, sk, k' = 0.

基于上述考虑, 本文相似度构建更具全面性.通过式(1), 可获得决策者之间的综合相似度, 有

(2)

式(2)是对相似度在对象和属性维度的加权平均, 与常用方法不同的是将属性权重加以考虑, 以加大关键属性对应相似度的作用, 得到更为合理的分类.

2.1.2 基于犹豫模糊相似度的群体分类方法

设专家ek, ek'(1≤ k < k'≤ 20), 根据定义3计算专家相似度, 可生成K× K上三角矩阵, 有

根据文献[21, 33], 本文采用基于相似矩阵的编网分类方法进行分类.具体方法是:设定截割水平αe(0 ≤αe≤1), 构建αe截矩阵SMαe, 主对角线上用ek(k=1, ..., K)代替, 右上方“1”以符号“*”取代, 且将“0”划去.符号“*”所在的位置称为结点, 过结点作经纬线, 所谓编网就是将过结点处的经纬线对应的方案捆绑起来, 通过打结能互相联结的点属于一类.此种分类方法可以快速有效地获取初步分类, 设为C={c1, ..., cR}(crC, r=1, 2, ..., R).但是若出现如sms1, 2αe, sms1, 3αe, sms2, 3 < αe情况, 则按照编网分类方法将3个专家划为一类, 此时可能导致分类不准确的情况发生.对此, 本文进一步对方法进行改进, 针对类别cr中smsk, k' < αe的情况设定可接受范围[αe-ν, αe].

一般情况下, 针对两相邻语言{si'}、{si'+1}, 依据定义3可得两相邻语言距离为Di', i'+1=1/g.根据平均法则可理解为与{si'}({si'+1})距离小于1/(2g)的语言信息和{si'}({si'+1})视为一类(见图 3), 因此可取ν=1/(2g).在类别cr中, 若存在smsk, k' < αe, 则可进一步确定其是否属于[αe-ν, αe], 若是, 则按此分类进行下一步; 若存在smsk, k' < αe-ν, 则可计算类别cr中剔除专家ek(ek')后的平均相似度, 即

图 3 ν值确定思路

, 则将专家ek'留在cr类, 而ek自成一类, 反之亦然.从而可以得到新的初步分类Cs={c1s, ..., cRss}(crssCs, rs=1, 2, ..., Rs).

此外, 在分类过程中, αe的大小直接影响分类结果, 某种情况下αe即使有些许变化(如0.001)也会引起分类结果的改变.在实际中, αe通常大概给出, 而给出精准数字的难度较大.为了实现合理范围内的有效分类, 文献[22]提出了分类精度验证方法, 其思想是类内中心距离越小, 类间中心距离越大, 则分类效果越好.在此基础上, 本文针对犹豫模糊语言信息提出一种分类精度检验方法.

Tij, i'k表示专家ek给出的属性bj(j=1, 2, ..., N)下对象ai(i=1, 2, ..., M)隶属于等级si'(i'=1, ..., g)的次数, 当si'Hij, sk(θ)时, Tij, i'k=1;否则Tij, i'k=0.由此可以得到次数语言组合Tk={(sij, i'k, Tij, i'k)|i=1, ..., M; j=1, ..., N; i'=1, ..., g}.对于分类Cs={c1s, ..., cRss}, 设Tij, i'rs表示类别crss内专家给出的属性bj下对象ai隶属于等级si'(i'= 1, ..., g)的次数, 且, 其对应的平均数表示为, 则类别crss中心可表示为|i=1, ..., M; j=1, ..., N; i'= 1, ..., g}.设专家ek给出的属性bj(j=1, 2, ..., N)下对象ai(i=1, 2, ..., M)对应的信息值为

其对应的类别crss中心值表示为

为提高分类精度, 以确定较为合适的αe, 根据文献[22]思想, 构建分类精度检验指标, 可表示为

(3)

其中

表示类别之间的距离, 而

表示类内各专家信息与类内中心之间的距离.

由式(3)可知, Ip值与类间距离成反比, 与类别内距离成正比, 即类别间差距越大, 类别内差距越小, 则分类效果越好.显然, 当专家分为一类时, 类间距离为零, Ip为无穷大, 此时分类没有意义; 当专家各自为一类时, 类内距离为零, Ip等于零, 尽管此时Ip值达到最小, 但是并没有达到分类目的.这是因为Ip值亦与分类数量Rs成正比, Rs值过大会影响分类精度, 此时需确定合理的分类数量.此外, Ipαe值成反比, 即αe越大, 分类效果越好.然而, 随着αe的增加, 分类数量也相应增加, 说明αe过大也会影响分类精度.综上所述, 在进行分类时, 首先需确定αe的合理范围, 在此范围内选择较小Ip值所对应的最终分类结果, 可表示为C'={c1'}, ..., {cR''}(c'r'C', r'=1, 2, ..., R').设类别cr''中专家数量为Kr', 则有.

本文实现分类主要有两个作用: 1)考虑大型群体相似度, 且实现群体分类, 将较大的专家数量化为可差异处理的少数类别数量; 2)是后续信息集结的前提, 一方面有助于类内专家信息进行等同处理以得到概率语言信息, 另一方面可实现类间信息差异处理, 通过考虑类可靠性, 有助于得到可靠性较高的集结信息.

2.2 群体信息集结模型 2.2.1 基于犹豫模糊语言的类内信息集结}

针对分类结果C'={c1'}, ..., {cR''}, 获得决策结果的前提是解决类内各专家信息集结问题.为增加专家信息表达灵活性及体现专家语言信息犹豫性, 文献[23]提出了犹豫模糊语言信息并给出了相关定义(定义1).在定义1中, 犹豫模糊集合中每个语言变量对应的隶属度未加以考虑, 因此, 可将专家给出的集合中每个变量视为等可能发生.

针对犹豫模糊语言集结的研究, 大致可归结为两种集结方法:一种将离散的犹豫模糊语言扩展为连续的语言术语集[34], 如H1(θ)={s2, s3, s4}⇒[2, 4], 此方法将犹豫变量区间进一步过大化, 因而加大了信息的不确定性; 另一种方法是将犹豫模糊语言方法转化为概率语言组合[6, 8], 该方法将犹豫模糊语言集合中每个语言元素等概率处理.根据犹豫模糊语言定义[23], 若专家针对某个属性下某个决策对象在多个语言变量间犹豫, 则可认为这些变量是等可能发生的.因此, 将集合中每个语言等概率处理转化为概率语言组合是合理的, 并没有信息损失.对此, 本文采用概率语言转化方法进行类内方法集结, 具体有两个优势: 1)信息集结过程中, 将各专家信息等同处理, 可简化计算过程且没有信息损失; 2)将每类专家信息集结后各语言术语对应的概率具体呈现, 不仅有助于清晰了解每类内各对象在每个属性下对应的绩效分布状况, 而且可以体现每类专家的犹豫程度, 概率分布越集中, 犹豫程度越小, 说明该类专家信息确定性越大, 反之越小.对此, 本文采用概率语言转化方法进行类内专家信息整合处理.对于同一类群体, 由于专家之间比较相似, 集结时专家之间的差异可忽略不计, 而类间信息集结则不然.与现有方法不同的是, 本节重点研究如何有效处理类内信息和类间信息.

定义4 [35]    设语言术语集S={s0, ..., sg}和S内每个元素sk(k=0, ..., g)对应的概率为pk, pk≥ 0, , 则PHs={(sk, pk)|k=0, ..., g}被定义为概率语言组合.

Tij, i'r'表示聚类c'r'内专家给出属性bj(j=1, 2, ..., N)下对象ai(i=1, 2, ..., M)隶属于等级si' (i'=1, ..., g)的总次数, 即, 则有

(4)

其中pij, i'r'∈[0, 1], 且

将犹豫模糊语言转化为概率语言组合, 有

2.2.2 基于概率语言组合信息的类间信息集结

与类内信息集结思想不同, 类间信息整合需要考虑类间差异的影响作用.在不确定性决策中, 专家给出的犹豫模糊信息带有一定的不确定性, 则不同类别会由于不同的不确定性导致对集结效果的作用(即权重)有所不同.通常情况下, 专家对某决策对象或属性的犹豫程度越大, 不确定性越大, 对应的可靠性越小[36-37], 则相应的权重越小.此外, 对于同一类别, 专家犹豫性直接影响着生成的语言概率分布情况, 专家犹豫程度越大, 语言概率分布越分散, 表示此类专家信息不确定性越大.对此, 在文献[38]概率语言不确定性度量方法的基础上, 本文提出一种语言信息可靠度测算方法, 以便于确定每类权重, 有效实现类信息集结.

定义5 [38]    设自然语言术语集S={s0, ..., sg}, pk为元素sk(skS, k=0, ..., g)对应的概率, 则其不确定量可定义为

(5)

其中pk∈[0, 1]且.

根据定义5, 可以计算类不确定量为

一定程度上, 信息不确定性直接影响着决策的可靠性, 不确定性越大, 可靠性越低.因此, 类不确定量可以作为类可靠性的一个有效衡量标准, 其对应的类可靠度可表示为

(6)

由式(6)可以看出, 不确定量越大, 可靠度越小.此处的类可靠度与分类精度有所不同.分类精度是衡量分类有效性的关键指标, 本文构建分类精度指标, 目的是寻求类间距离较大而类内距离较小的分类结果.本文方法中, 分类精度计算是类可靠性获得的前提条件.此外, 分类的目的是将相似度较高的专家分为一类, 而类可靠性则是从信息不确定性角度验证每类信息的价值.类可靠性是验证每类信息可靠性的有效指标, 基于每类各专家信息集结后的语言概率分布进行计算, 语言概率分布越集中, 说明此类专家信息的不确定性越小, 进而每类信息的可靠性就越高.就本文方法而言, 高效分类产生的类可靠性不一定高, 如语言集合S={s0, s1, s2, s3, s4}, 两位专家的信息分别为H1(θ)={s0, s1, s2, s3, s4}, H2(θ)={s0, s1, s2, s3, s4}.显然, 两位专家由于信息一致可分为一类, 分类精度较高, 而通过类内信息集结所得的类可靠度为0.在本文中, 分类精度指标是类可靠度计算的前提条件, 具体见图 4, 若没有实现分类, 则类可靠性也就无法获得.

图 4 分类精度与类可靠性的逻辑示意

定理1    Rijr'必属于[0, 1]区间.

证明    首先确定AUijr'范围.已知

由于, 通过构造拉格朗日函数可得

其中λ为拉格朗日常数.为了获得其极值, 对函数求偏导, 得

因为, c为常数, 所以有, 即c=1/(g+1), 可得极值为

对函数进行二次求导, 得

因此, f(pij, i'r')是凸函数, 且所得极值为极大值, 有

则有

定理1得证.

在进行类间信息集合时, 首先需确定每类权重.类别权重代表每类对决策结果的影响作用.常用的类别权重确定方法是求出每类专家数量占总数量的比例[22], 即

(7)

在实际操作中, 对于一类信息, 越多的专家给予认可, 说明此类信息的一致度越大, 在信息集结时所起的作用越大, 故以式(7)衡量类别权重是合理的.

然而, 在实际情况下也存在真理被少数人所掌握的情况, 所以需要考虑其他更深层次的影响因素, 如类可靠度.在决策中, 若一类专家的犹豫性越大, 其信息可靠性就越小, 则此类专家信息在信息集结中所起的作用应给以弱化.因而, 本文将类可靠度作为衡量类别权重的另一个因素, 即

(8)

设偏好系数α(α∈[0, 1]), 通过偏好系数将式(7)、(8)所确定的两类权重进行综合以得到类别综合权重, 即

(9)

值得注意的是, 在多数情况下, 类可靠度所占的比重越大, 所得各对象集结信息所对应的可靠度越大.若α > 0.5, 则决策偏重多数专家的意见; 若α < 0.5, 则决策偏重信息可靠性方面.一般无特殊情况说明, 有α=0.5.然而存在少数情况, 由于类别较多, 而且各类语言概率分散较大, 决策对象对应的可靠度随着α的增大而减小, 此时设定α=0即可.经过确定类别权重λijr', 可将信息进一步合成, 得

(10)

则每个评价对象的概率语言组合为

为了便于比较, 可计算每个决策对象最终的期望值[6]

(11)

设决策对象acad(cd=1, ..., M), 若Ec>Ed, 则acad; 若Ec < Ed, 则acad; 若Ec=Ed, 则需进一步计算两对象对应的可靠度RcRd.此时分3种情况:当Rc>Rd时, 有acad; 当Rc < Rd时, 有acad; 当Rc=Rd时, 有acad.从而得出最终决策结果.

综上所述, 本文方法的具体步骤描述如下:

Step 1:生成分类.根据定义3计算专家相似度smij, sk, k', 在此基础上由式(2)计算专家综合相似度smk, k', 得出上三角相似矩阵SMk, k'.根据改进的编网分类方法对专家进行初步分类.通过构建分类精度指标Ip, 根据合理的Ip值确定最终分类结果C'={c'1}, ..., {c'R'}.

Step 2:类内专家信息集结.对类内专家信息按式(4)进行集结, 生成概率语言组合

Step 3:类间信息集结.由式(6)确定类可靠度Rijr', 然后按照式(7)和(8)计算影响类别集结的两种权重并进一步获得综合权重.进而根据式(10)将类间信息进行集结, 生成新的语言概率集合

Step 4:进行排序.由式(11)计算每个决策对象最终的期望值, 由式(6)计算每个对象对应的可靠度, 并按照本文方法进行排序.

3 算例分析

大型客机制造业对一个国家的国防、经济增长及民用航空工业的发展至关重要, 许多国家对此行业发展非常重视.该行业主要为“主制造商-供应商”的生产模式, 即主制造商是行业组织者, 供应商是其主要合作伙伴.例如波音, 作为全球航空航天业的领袖公司, 是世界上最大的民用制造商之一, 拥有来自70多个国家的545家供应商.为制造出安全且有竞争力的飞机, 供应商的选择程序较为严格.尤其对于我国, 随着C919客机进入新的发展阶段, 对供应商的要求更为严格.因此, 提供比较合理的供应商选择方法成为关键之一.

客机关键系统主要包括飞行控制系统、航空电子系统、引擎系统、液压能源系统、环境控制系统、燃油系统、电气系统以及应急系统等.其中, 航空电子系统在客机系统位置极为重要, 约占客机出厂价格的40%, 需要满足严格的安全可靠性要求且其直接影响民用飞机运营及维护的成本, 同时其供应商选择过程涉及范围广, 需多部门专家参与评选以尽量获得全面有效信息, 因此, 航空电子系统的供应商合理选择至关重要.

本文以某民用客机制造商选择航空电子系统供应商为例.由于航空电子系统生产及资格认证的复杂性, 满足基本要求的供应商较少, 经过初步筛选, 有3家供应商被作为最终候选对象参与评选, 表示为A={a1, a2, a3}.经过调查, 评选指标涉及3个方面, 即设计制造能力、财务能力及协作服务能力, 以F ={f1, f2, f3}表示.设计制造能力是供应商产品质量水平、发展能力及计划管理能力的综合体现, 主要反映该系统的硬件质量水平; 财务能力体现供应商的财务健康水平, 是保证产品满足质量要求、正常交付的基本能力, 决定主制造商风险承担水平; 协作服务能力是指对顾客需求的响应水平以及从订货到售后一系列的服务水平, 主要包括技术服务人员的响应时间、现场解决问题的能力、紧急交货的协调能力、与适航监督有关的支持与合作能力和为客户提供的产品培训水平.在大型客机行业, 此三类指标具有综合性、复杂性、不确定性和认知局限性等因素而无法获得准确数值, 因此, 以语言形式给出能更好地解决问题.常用的方法是要求来自相关领域专家以语言形式表达他们的意见.某种情况下, 由于有限的经验和认知, 有些专家对某个指标或对象存在不确定认知而带有一定的犹豫性.为较准确获得专家意见, 建议专家以犹豫模糊语言的形式表达自身想法.因此, 此案例适用于本文所提出的方法.

行业内赋予指标权重比例分别为: f1占35 %, f2占35 %, f3占30 %.此例中, 借助于大型客机供应链相关课题调研数据, 本文随机选取30位来自公司内通信、导航和显示管理等相关领域的专家(以ek(k=1, ..., 30)表示)所提供的犹豫模糊语言信息.在调研过程, 由于涉及人数较多, 未对专家权重进行特殊处理, 将30位专家视为具有相同重要性.在调研中, 预先设定语言等级术语集为S={s0=极差, s1=差, s2=稍差, s3=一般, s4=较好, s5=好, s6=极好}, 专家可根据自身实际情况在对应的语言变量下打“对号”, 若专家在多个语言变量间犹豫, 则可同时在多个语言变量下打“对号”.基于专家给出的有关3个供应商对应属性的犹豫模糊信息, 本案例借助于所提出方法进行决策分析, 具体数据见表 1.

表 1 30位专家给出的犹豫模糊语言信息
3.1 决策过程分析

将本文方法应用于案例分析以帮助主制造商选择合适的供应商进行合作.

Step 1:生成分类结果.根据定义3计算专家相似度smij, sk, k'.其中: i=1, 2, 3;j=1, 2, 3;k=1, ..., 30;k'=1, ..., 30;且kk'.在此基础上由式(2)计算专家综合相似度smk, k', 得出上三角相似矩阵SMk, k'.根据本文改进的编网分类方法进行分类.当αe < 0.899时, 所有专家分为一类, 分类失去意义; 当0.899≤αe < 0.953时, αe=0.948, 使得Ip=14.88在此范围内取到最小值(见图 5); 当αe>0.953时, 尽管随着αe的增大, Ip值逐渐减少直至为零, 但是分类在10类以上, 占原来总数三分之一以上, 致使分类效果不好.因此, 本例应取αe=0.948, 则专家分为6类, 有

图 5 Ipαe的关系

Step 2:聚集类内专家信息.对类内专家信息按式(4)生成概率语言组合

Step 3:聚集类间专家信息.首先计算类可靠度Rijr'(i=1, 2, 3;j=1, 2, 3;r'=1, ..., 6).根据式(7)获得权重λ11=8/30=0.267;λ21=7/30=0.233;λ31=7/30=0.233;λ41=6/30=0.2;λ51=1/30=0.033;λ61=1/30=0.033.根据数据分析, 本案例各决策对象集结可靠度随着α的增大而减小, 因此设定α=0, 通过式(8)和(9)可得类综合权重λijr', 在此基础上求出最终集结结果, 即

Step 4:得出排序结果.由式(11)计算3个供应商对应的期望值, 有E1=3.751, E2=3.267, E3=4.402;对应的可靠度为R1=0.15, R2=0.084, R3=0.256.则排序结果为a3a1a2.

3.2 比较分析

根据最终排序a3a1a2, 供应商a3应被选为主制造商合作的供应商.就本例而言, 供应商a3在计制造能力、财务能力及协作服务能力方面皆优于其他两个供应商, 且信息可靠性方面, 供应商a3也相对较高, 所以供应商a3的综合表现优于另两个.

将文献[8]方法应用于此案例, 得出结果为a3a1a2, 与本文排序一致, 说明了本文方法的合理性.此外, 本文方法相较于文献[8]方法具有两个优势: 1)不同于文献[8]中主观确定专家类别, 本文方法基于原始信息对专家进行分类, 结果更具客观性; 2)将类可靠度考虑到决策过程中, 减少了不可靠信息对决策结果的影响, 从而有利于得出较为可靠的决策结果.

与文献[6]方法相比(见表 2), 两种方法在期望值、排序结果方面相似, 而由本文方法所得的相似性均大于文献[6]方法, 从而表明了本文方法的有效性.具体而言, 在计算过程中, 文献[6]方法未对大群体考虑分类, 需要集结30个专家的差异信息, 使得大型群体决策情况计算量较大且计算过程复杂; 而本文方法将专家分为6类, 类内无需考虑差异性, 只需将6类信息差异化处理即可, 在简化了计算过程的同时保证了决策结果的准确性(见表 2, 两种方法在期望值和排序方法上均相似).若考虑分类, 则在同等类别下, 基于两种相似度所获得的分类精度指标值, 本文方法均低于文献[6]方法.例如, 将专家分为4类时, 文献[6]方法的Ip=16.033, 本文方法的Ip=15.6, 显然本文方法分类精度较高.此外, 两种方法所得的对象可靠度较为接近, 这是因为本文案例取α=0.而对于其他案例情况, 本文方法可对α值进行灵活调整以提高决策可靠度, 有助于得出各对象较为符合专家意见的语言概率分布.本案例表明, 文献[6]的集结方法是本文方法的特例, 即α=0.在相似度计算方面, 本文方法所得相似度从两个方面考虑:交集和补集, 未造成信息损失, 且两语言集合存在交集时, 所得相似度均大于文献[6]方法.

表 2 方法比较

综上所述, 本文相较于其他两种比较方法主要有3个优势: 1)通过对大型犹豫模糊语言决策先分类再集结, 可降低集结复杂度且有效处理不同专家对集结结果的影响; 2)考虑犹豫和距离两方面相似度, 有利于提高专家相似度和分类精度; 3)将类可靠度作为衡量每类在集结过程影响作用的一个指标, 有助于提高决策有效性.总之, 本文方法主要解决大型不确定型多属性群决策问题, 具有专家数量较大(≥20个)、信息存在犹豫性(犹豫模糊语言给出)、评价指标多维化等特点, 可适用于大数据环境下社会、经济、军事等领域内不确定型决策问题, 如供应商选择、项目招标、中小企业投资、医药评价等.此外, 本文方法也适用于犹豫语言环境下针对大型决策对象的分类问题.

4 结论

本文针对基于犹豫模糊语言的大型群体决策提出了分类方法和集结方法.通过计算专家犹豫模糊语言信息相似度, 依据改进的编网分类方法对专家群体进行了分类, 并通过分类精度指标对分类效果进行了验证, 有助于寻求较为合理的分类结果.针对每类专家的信息, 对类内专家信息进行集结并转化为概率语言信息, 得出了比较具体的类内专家信息集结结果, 且可以在未损失专家信息的同时降低计算过程复杂度.对于类间信息集结, 借助概率语言信息求出类可靠度并融合到类权重测算方法中, 有助于获得可靠度较高的决策结果.本文贡献主要可归结为两点: 1)针对犹豫模糊语言信息构建群体相似度并提出了改进的编网分类方法对大群体进行分类; 2)提出了基于不确定量的类可靠度测量方法.

本文方法计算过程简单, 步骤清晰, 有效解决了大型群体决策可靠性、分类问题, 为不确定型决策研究方面提供了新的视角.下一步可扩展至对应软件系统的开发、动态群体决策分类、给定条件下语言颗粒优化等问题的研究.

参考文献
[1]
Zadeh L A. The concept of a linguistic variable and its application to approximate reasoning - Ⅰ[J]. Information Sciences, 1975, 8(3): 199-249. DOI:10.1016/0020-0255(75)90036-5
[2]
Torra V. Hesitant fuzzy sets[J]. Int J of Intelligent Systems, 2010, 25(6): 529-539.
[3]
Liao H C, Xu Z S, Zeng X J. Hesitant fuzzy linguistic VIKOR method and its application in qualitative multiple criteria decision making[J]. IEEE Trans on Fuzzy Systems, 2015, 23(5): 1343-1355. DOI:10.1109/TFUZZ.2014.2360556
[4]
Dong Y C, Li C C, Herrera F. Connecting the linguistic hierarchy and the numerical scale for the 2-tuple linguistic model and its use to deal with hesitant unbalanced linguistic information[J]. Information Sciences, 2016, 367: 259-278.
[5]
Dong Y C, Wu Y Z, Zhang H J, et al. Multi-granular unbalanced linguistic distribution assessments with interval symbolic proportions[J]. Knowledge-Based Systems, 2015, 82: 139-151. DOI:10.1016/j.knosys.2015.03.003
[6]
Wu Z B, Xu J P. Possibility distribution-based approach for MAGDM with hesitant fuzzy linguistic information[J]. IEEE Trans on Cybernetics, 2016, 46(3): 694-705. DOI:10.1109/TCYB.2015.2413894
[7]
Wu Z B, Xu J P. Managing consistency and consensus in group decision making with hesitant fuzzy linguistic preference relations[J]. Omega, 2016, 65: 28-40. DOI:10.1016/j.omega.2015.12.005
[8]
Chen Z, Chin K S, Li Y L, et al. Proportional hesitant fuzzy linguistic term set for multiple criteria group decision making[J]. Information Sciences, 2016, 357: 61-87. DOI:10.1016/j.ins.2016.04.006
[9]
Wei G W. Interval valued hesitant fuzzy uncertain linguistic aggregation operators in multiple attribute decision making[J]. Int J of Machine Learning and Cybernetics, 2016, 7(6): 1093-1114. DOI:10.1007/s13042-015-0433-7
[10]
Liu Y Z, Fan Z P, Gao G X. An extended LINMAP method for MAGDM under linguistic hesitant fuzzy environment[J]. J of Intelligent & Fuzzy Systems, 2016, 30(5): 2689-2703.
[11]
陈晓红, 刘蓉. 改进的聚类算法及在复杂大群体决策中的应用[J]. 系统工程与电子技术, 2006, 28(11): 1695-1699.
(Chen X H, Liu R. Improved clustering algorithm and its application in complex huge group decision-making[J]. Systems Engineering & Electronics, 2006, 28(11): 1695-1699. DOI:10.3321/j.issn:1001-506X.2006.11.023)
[12]
Zhang Z, Guo C H, Martínez L. Managing multigranular linguistic distribution assessments in large-scale multiattribute group decision making[J]. IEEE Trans on Systems, Man, and Cybernetics: Systems, 2017, 47(11): 3063-3076. DOI:10.1109/TSMC.2016.2560521
[13]
Zafeiris A, Koman Z, Mones E, et al. Phenomenological theory of collective decision-making[J]. Physical A - Statistics and Its Applications, 2017, 479: 287-298. DOI:10.1016/j.physa.2017.02.026
[14]
Palomares I, Martínez L, Herrera F. MENTOR: A graphical monitoring tool of preferences evolution in large-scale group decision making[J]. Knowledge-Based Systems, 2014, 58(S1): 66-74.
[15]
Palomares I, Martínez L, Francisco Herrera F. A consensus model to detect and manage noncooperative behaviors in large-scale group decision making[J]. IEEE Trans on Fuzzy Systems, 2014, 22(3): 516-530. DOI:10.1109/TFUZZ.2013.2262769
[16]
Liu B, Shen Y, Chen X, et al. A partial binary tree DEA-DA cyclic classification model for decision makers in complex multi-attribute large-group intervalvalued intuitionistic fuzzy decision-making problems[J]. Information Fusion, 2014, 18: 119-130. DOI:10.1016/j.inffus.2013.06.004
[17]
Przybya-Kasperek M, Wakulicz-Deja A. Global decisionmaking system with dynamically generated clusters[J]. Information Sciences, 2014, 270: 172-191. DOI:10.1016/j.ins.2014.02.076
[18]
Zhu J J, Zhang S T, Chen Y, et al. A hierarchical clustering approach based on three-dimensional gray relational analysis for clustering a large group of decision makers with double information[J]. Group Decision and Negotiation, 2016, 25(2): 325-354. DOI:10.1007/s10726-015-9444-8
[19]
Kabak Ö, Ervural B. Multiple attribute group decision making: A generic conceptual framework and a classification scheme[J]. Knowledge-Based Systems, 2017, 123: 13-30. DOI:10.1016/j.knosys.2017.02.011
[20]
Luukka P, Kurama O. Similarity classifier with ordered weighted averaging operators[J]. Expert Systems with Applications, 2013, 40(4): 995-1002. DOI:10.1016/j.eswa.2012.08.014
[21]
刘小弟, 朱建军, 刘思峰. 基于对称交互熵的犹豫模糊信息相似度及聚类应用[J]. 控制与决策, 2014, 29(10): 1816-1822.
(Liu X D, Zhu J J, Liu S F. Similarity measure of hesitant fuzzy sets based on symmetric cross entropy and its application in clustering analysis[J]. Control and Decision, 2014, 29(10): 1816-1822.)
[22]
Wang Y, Mab X L, Lao Y T, et al. A fuzzy-based customer clustering approach with hierarchical structure for logistics network optimization[J]. Expert Systems with Applications, 2014, 41(2): 521-534. DOI:10.1016/j.eswa.2013.07.078
[23]
Rodríguez R M, Martínez L, Herrera F. Hesitant fuzzy linguistic term sets for decision making[J]. IEEE Trans on Fuzzy Systems, 2012, 20(1): 109-119.
[24]
Wu T, Liu X W. An interval type-2 fuzzy clustering solution for large-scale multiple-criteria group decision-making problems[J]. Knowledge-Based Systems, 2016, 114: 118-127. DOI:10.1016/j.knosys.2016.10.004
[25]
Yan H B, Ma T J. A group decision-making approach to uncertain quality function deployment based on fuzzy preference relation and fuzzy majority[J]. European J of Operational Research, 2015, 241(3): 815-829. DOI:10.1016/j.ejor.2014.09.017
[26]
Rodríguez R M, Martínez L. An analysis of symbolic linguistic computing models in decision making[J]. Int J of General Systems, 2013, 42(1): 121-136. DOI:10.1080/03081079.2012.710442
[27]
Herrera F, Martínez L. A 2-tuple fuzzy linguistic representation model for computing with words[J]. IEEE Trans on Fuzzy Systems, 2000, 8(6): 746-751. DOI:10.1109/91.890332
[28]
Martínez L, Herrera F. An overview on the 2-tuple linguistic model for computing with words in decision making: Extensions, applications and challenges[J]. Information Sciences, 2012, 207(1): 1-18.
[29]
Herrera-Viedma E, Cabrerizo F J, Kacprzyk J, et al. A review of soft consensus models in a fuzzy environment[J]. Information Fusion, 2014, 17(S1): 4-13.
[30]
Liao H C, Xu Z S, Zeng X J. Distance and similarity measures for hesitant fuzzy linguistic term sets and their application in multi-criteria decision making[J]. Information Sciences, 2014, 271: 125-142. DOI:10.1016/j.ins.2014.02.125
[31]
Zhang Z M, Wu C. On the use of multiplicative consistency in hesitant fuzzy linguistic preference relations[J]. Knowledge-Based Systems, 2014, 72: 13-27. DOI:10.1016/j.knosys.2014.08.026
[32]
Zhu B, Xu Z S. Consistency measures for hesitant fuzzy linguistic preference relations[J]. IEEE Trans on Fuzzy Systems, 2014, 22(1): 35-45.
[33]
贺仲雄. 模糊数学及其应用[M]. 天津: 天津科学技术出版社, 1983: 165-169.
(He Z X. Fuzzy mathematics and its application[M]. Tianjin: Tianjin Science and Technology Press, 1983: 165-169.)
[34]
冯向前, 谭倩云, 钱钢. 犹豫模糊语言的可能度排序方法[J]. 控制与决策, 2016, 31(4): 640-646.
(Feng X Q, Tan Q Y, Qian G. Possibility degree methods for ranking hesitant fuzzy linguistic sets[J]. Control and Decision, 2016, 31(4): 640-646.)
[35]
Zhang G Q, Dong Y C, Xu Y F. Consistency and consensus measures for linguistic preference relations based on distribution assessments[J]. Information Fusion, 2014, 17(S1): 46-55.
[36]
Jousselme A L, Liu C S, Grenier D, et al. Measuring ambiguity in the evidence theory[J]. IEEE Trans on Systems, Man, and Cybernetics, Part A: Systems and Humans, 2006, 36(5): 890-903. DOI:10.1109/TSMCA.2005.853483
[37]
Frikha A. On the use of a multi-criteria approach for reliability estimation in belief function theory[J]. Information Fusion, 2014, 18: 20-32. DOI:10.1016/j.inffus.2013.04.010
[38]
Maeda Y, Nguyen H T, Ichihashi H. Maximum entropy algorithms for uncertainty measures[J]. Int J of Uncertainty, Fuzziness and Knowledge-Based Systems, 1993, 1(1): 69-93. DOI:10.1142/S021848859300005X