第一作者简介:池吉奕,女,浙江金华人,硕士研究生,研究方向为决策理论、刑事侦查和数字图像取证。E-mail: chijyi@163.com
为协助警方在侦破电信网络诈骗案件时实现对所获证据的有效聚合,得到多名涉案人员的嫌疑程度排序,提出了一种基于语言毕达哥拉斯模糊集的多属性决策方法。首先,根据已有线索确定相关涉案人员及属性信息;其次,基于语言毕达哥拉斯模糊集以定性的语言术语表示模糊信息,对不确定的属性信息进行统一描述;最后,在语言毕达哥拉斯模糊环境下,利用基于WOWA算子的软似然函数这一多属性决策方法对各属性值进行有效聚合,得到相关涉案人员综合得分值的结果排序。结果表明,相较于定量的评估形式,定性的语言术语评估形式更适用于实际电诈犯罪案件;同时实验结果表明,相较于基于OWA算子的软似然函数多属性决策方法,本文所采用的WOWA算子能在一定程度上避免极端数据带来的影响,并且能更好地软化权重值,使得软似然值的变化更趋于平缓。本文所提多属性决策方法可协助警方关联与案件有关的属性信息,在弱化决策者主观因素的前提下缩小人工甄别范围以获得涉案人员的嫌疑程度结果排序,本文首次将该技术应用于电信网络诈骗案例中,对电诈犯罪嫌疑人认定具有实际意义。
Currently, fraud cases often occur with the form of intelligence, mainly appearing as those telecom network swindles. For such cases, police investigation usually renders the presumable yet not clear evidence about which the relevant evaluation is mostly rooted on the investigators’ experience and knowledge. Obviously, this manipulation exists with certain human subjectivity capable of dwelling into some extent of fuzzinesss. Therefore, it is valuable to introduce the linguistic-fuzzy set into the operation course of quantifying the involving evidential data so as to reduce the impact of human subjectivity on the obtained results. Here, the linguistic-fuzzy Pythagorean multi-attribute decision-making approach was tried to construct on the basis of WOWA-operator soft likelihood function, purposed to both effectively handle the essential weight of each attribute relating to those case-involved people described with equivocal language and get rid of the influence of extreme data and subjective decision-makers. First of all, the case-involved people and relating attribute information were determined according to the existing clues. Secondly, the qualitative linguistic terms were adopted to express the fuzzy information with linguistic Pythagorean fuzzy setting, having the uncertain attribute information uniformly described. Finally, the multi-attribute decision-making approach was put into the linguistic Pythagorean fuzzy environment through WOWA-operator soft likelihood function so that the value of each attribute was effectively defined and aggregated, consequently having the ranked comprehensive scores delivered about those case-involved people. The results showed that the qualitative linguistic-term evaluation excelled to the quantitative one, more suitable for application into investigating actual telecom fraud cases. Meanwhile, the results also revealed that it was the WOWA-operator multi-attribute decision-making manner adopted in this assay not the OWA-operator one that was able to get rid of the influence of extreme data to some extent and better smoothen the weighted value, making the change of soft likelihood value more fluent. The multi-attribute decision-making approach proposed here can assist the police to associate the case-related attribute information, reduce the screening scope about case and get ranking of suspects while weakening the subjectivity of decision-makers, hence demonstrating practical significance for identification of suspects committing telecom fraud crime.
近年来, 以电信网络诈骗为代表的新型犯罪呈现快速上升趋势且成为诈骗类案件的主流, 已经从传统的单一诈骗模式逐渐转向高智慧型的新型网络诈骗, 受害群体数量、团伙结构和技术手段都发生了翻天覆地的变化。在案件实际侦查过程中, 警方通常不会用精确的数值量化犯罪证据[1, 2], 而是对各项证据给出一个模糊的态度信息。因此, 对多名涉案人员考虑各项证据的多元化影响, 通过多属性决策方法[3]进行多项证据的综合研判从而得出涉案人员的嫌疑程度结果排序, 甚至认定多名涉案人员中的犯罪嫌疑人, 这对于案件的侦查具有重要意义。同时由于警方大多根据过往经验和知识背景给出评估值, 该值存在一定的主观性, 因此将语言模糊术语集引入到数据量化环节, 从而降低人为主观因素对结果造成的影响。然而如何对模糊信息进行有效的表达和聚合并将其构建为决策问题[4]是一大难题。
本文结合基于WOWA算子的软似然函数构建语言毕达哥拉斯模糊多属性决策方法, 有效处理语言模糊条件下涉案人员间各属性重要性权重的影响, 并规避极端数据和决策者主观因素带来的影响, 为公安实战提供有力支撑, 满足打击犯罪的现实需求, 助力公安有效遏制与打击犯罪, 提高破案率, 维护社会稳定。
多属性决策是根据多个相关属性实现对多个备选方案排序的过程, 通常分为两步:第一步为捕获决策信息, 即获得属性值和属性权重, 属性值的表达方式有很多, 如:实数、区间数、语言模糊数等。前期研究表明, 许多涉及犯罪嫌疑人认定的决策问题由于表达和处理的对象难以确定, 往往更倾向于用定性的语言术语[5, 6, 7, 8]来近似描述犯罪嫌疑人, 语言术语集和模糊集[9]的融合衍生了一系列语言模糊术语集, 如:语言直觉模糊术语集[10]、语言区间直觉模糊术语集[11]、语言毕达哥拉斯模糊集(linguistic Pythagorean fuzzy set, LPFS)[12]。第二步为确定有效的聚合方法, 聚合决策信息时多采用似然函数方法[13, 14], 似然函数最初用于聚合刑事案件中的多个概率证据, 但是传统的似然函数极易受极端值干扰。当隶属度或非隶属度取得较小值时会使似然值显著降低, 为改进这一缺陷, Yager等[15]提出软似然函数, 即“基于OWA算子(ordered weighted average, OWA)[16]的软似然函数方法[17]”, 用于实现对多个概率证据的优化聚合, 常用于案件中对嫌疑人的认定。然而, 在实际决策过程中, 各属性间的重要性权重未必相等, 为满足这类决策问题的需求并考虑重要性权重的影响, 有学者提出“基于WOWA算子(weighted ordered weighted average, WOWA)[18]的软似然函数方法[19]”。
文献[15, 17, 19]表明软似然函数已在刑事案件中得到有效应用, 同时, 由于目前在电诈嫌疑人判定工作中大多采用传统的侦查手段[20, 21, 22], 尚未发现相关的智能化侦查方法, 因此本文结合基于WOWA算子的软似然函数提出语言毕达哥拉斯模糊多属性决策方法, 并首次将其应用于电信网络诈骗案例中。
在某起电信网络诈骗案件中, 警方圈定m名涉案人员, 对每名涉案人员同时考察相同的n个证据属性, 并考虑其重要性权重的影响, 对相关属性信息进行预处理, 以语言毕达哥拉斯模糊数(linguistic Pythagorean fuzzy number, LPFN)的形式给出一系列评估信息。在此假设所有的属性都是相互独立的, 利用基于WOWA算子的软似然函数决策方法, 对得到的属性信息进行多属性研判, 从而实现对m名涉案人员的嫌疑程度结果排序, 如图1所示为本文提出的电信网络诈骗犯罪嫌疑人认定的流程示意图。
1.2.1 语言毕达哥拉斯模糊集
专家Garg[12]首先提出了LPFS的概念, 其定义可用简单的数学公式表示为L={(y, sμ(y), sv(y))|y∈Y}。其中, Y是一给定论域, S={sε|ε∈[0, τ]}, τ为语言术语集的基数, sμ(y)、sv(y)分别表示隶属度函数和非隶属度函数, LPFN表示为(sμ(y), sv(y)), 也可转化为简易表达式β=(sμ, sv), sμ代表隶属度, sv代表非隶属度, 满足约束条件0≤μ≤τ, 0≤v≤τ以及0≤μ2+v2≤τ2。
Garg还提出了一种比较两个LPFN的方法, 语言毕达哥拉斯模糊数β的得分值为:
$D(\beta)=\sqrt[s]{\left.\sqrt{\left(\tau^{2}+\mu^{2}\right.} v^{2}\right) / 2}$ (1)
准确值为:
$J(\beta)=\sqrt[s]{\mu^{2}+v^{2}} $ (2)
对于两个语言毕达哥拉斯模糊数β1和β2, 通常对两者的得分值进行较量, 有如下比较规则:
1)如果D(β1)>D(β2), 则β1>β2;
2)如果D(β1)<D(β2), 则β1<β2;
3)如果D(β1)=D(β2), 则比较两者准确值, 细分为以下3种情况:a. 如果J(β1)>J(β2), 则β1>β2; b. 如果J(β1)<J(β2), 则β1<β2; c. 如果J(β1)=J(β2), 则β1=β2。
1.2.2 基于WOWA算子的软似然函数方法
WOWA算子由Yager[18]提出, 表示为一种映射:WOWA:Rn→ R, 具有两个n维向量W=[w1, ..., wn]T和V=[v1, ..., vn]T, 其中0≤wj≤1, ∑jwj=1, 且0≤vj≤1, ∑jvj=1, 每个参数都与重要性权重v∈[0, 1]有关, 索引函数σ i(k)表示第k大的重要性权重, Qi代表第i个备选方案的所有重要性权重之和, Qij代表第i个备选方案的前j大的重要性权重之和。
$Q_{i}=\sum_{k=1}^{n} v_{i k} $ (3)
$Q_{i j}=\sum_{k=1}^{j} v_{i \sigma_{i}(k)} $ (4)
权重值一般通过$w_{j}=f\left(\frac{j}{n}\right)-f\left(\frac{j-1}{n}\right) $公式计算 得出。
获取权重值的方法有许多, 一般引入函数f(x)=xm(m>0)[15], 这对于确定态度特征α极为重要, $\alpha=\int_{0}^{1} x^{m} $$d_{x}=\frac{x^{m+1}}{m+1}|1| 0=\frac{1}{m+1}$, 可以得出α∈[0, 1], α越大则代表决策者越乐观。任取态度特征α∈[0, 1], WOWA权重表示为:
$w_{i j}=\left(\frac{Q_{i j}}{Q_{i}}\right)^{\frac{1-\alpha}{\alpha}}-\left(\frac{Q_{i(j-1)}}{Q_{i}}\right)^{\frac{1-\alpha}{\alpha}} $ (5)
$\hat{w}_{i j}=\left(\frac{\left(Q_{i}-Q_{i(j-1)}\right)}{Q_{i}}\right)^{\frac{1-\alpha}{\alpha}}-\left(\frac{\left(Q_{i}-Q_{i j}\right)}{Q_{i}}\right)^{\frac{1-\alpha}{\alpha}} $ (6)
对于某备选方案Ai, 假设它在属性Cj下语言毕达哥拉斯模糊表现形式为β=(sμ, sv), 则传统的似然函数表示为:$L_{i}=\left(L_{i}^{\mu}, L_{i}^{v}\right)=\left(\prod_{k=1}^{j} S_{\mu_{i} \lambda_{i}(k)}, \prod_{k=1}^{j} S_{v_{i} \varphi_{i}(k)}\right) $, 基于WOWA算子的软似然函数可表示为:
$L_{i}^{W}=\left(L_{i, W}^{\mu}, L_{i, \hat{W}}^{v}\right)=\left(\sum_{j=1}^{n} w_{i j} S_{P r o d i}(j), \sum_{j=1}^{n} \hat{w}_{i j} S_{P r o d i}(j)\right)= \\ \left(\sum _ { j = 1 } ^ { n } \left(\left(\frac{Q_{i j}}{Q_{i}}\right)^{\frac{1-\alpha}{\alpha}}-\left(\frac{Q_{i(j-1)}}{Q_{i}}\right)^{\frac{1-\alpha}{\alpha}} \prod_{k=1}^{j} S_{\mu, \lambda(k)}, \right.\right. \\ \left.\sum_{j=1}^{n}\left(\left(\frac{Q_{i}-Q_{i(j-1)}}{Q_{i}}\right)^{\frac{1-\alpha}{\alpha}}-\left(\frac{Q_{i}-Q_{i j}}{Q_{i}}\right)^{\frac{1-\alpha}{\alpha}}\right)_{\prod_{k=1}^{j}} S_{v i, i(k)}\right)$ (7)
在此结合WOWA算子和软似然函数来讨论语言毕达哥拉斯模糊环境下的多属性决策方法。
步骤1:获取警方对m名涉案人员以及n个属性的评估信息, 进行预处理操作, 用LPFN的形式来表示m名涉案人员间共同的n个证据属性的评价信息LPFNs。
步骤2:引入λi和φi两个索引函数, 对LPFNs进行排序, 获得Sμiλi(k)和Sνiφi(k), 并分别依次进行乘积, 得到隶属度乘积Sprodμi(j)和非隶属度乘积Sprodνi(j)。
步骤3:对于可疑人员Ai, 取态度特征参数α∈[0, 1], 利用公式(5)和公式(6)计算权重wij和Ŵij, 从而利用公式(7)得出Ai隶属度和非隶属度的软似然值, 隶属度的软似然值为$\sum_{j=1}^{n} w_{i j} S_{\operatorname{Prod}_{i}^{\mu}(j)} $, 非隶属度的软似然值为$\sum_{j=1}^{n} \hat{w}_{i j} S_{\operatorname{Prod}_{i}{ }^{v}(j)}$。
步骤4:利用公式(1)计算Ai在态度特征α下的得分值Di, a。
步骤5:根据得分值的大小对m名涉案人员进行排序, 得到多名涉案人员的嫌疑程度结果排序。
以浙江省某市“体育彩票”电信网络诈骗案为例。
案情概况:2021年5月1日, 报警人朱某称, 在微信群看见有人发注册体育彩票网站, 下载某飞APP后联系客服做任务赚佣金, 损失价值10万元。
受害人朱某提供了汇款的嫌疑人银行卡号, 警方在对该银行卡进行多级资金流分析研判后, 确定6名涉案银行卡的卡主, 初步认定为6名涉案人员, 即{A1, …, A6}, A1=王某, A2=李某某, A3=周某, A4=郑某, A5=刘某某, A6=吴某某。由于存在银行卡在卡主不知情时被冒名顶替的情况, 因此需要再进一步通过网络流等多属性综合决策分析, 得出这6名涉案人员的嫌疑程度结果排序。在进一步研判过程中, 警方对这6名涉案人员考虑以下五个证据属性, 即{C1, …, C5}, C1=设备平台(如:微信、QQ、抖音等)的聊天内容, C2=聊天设备IP地址和嫌疑人活动轨迹的吻合程度, C3=涉案人员名下银行卡是否涉及其他电诈案件(串并案), C4=涉案人员前科情况, C5=涉案人员经济来源情况。
在此, 我们用LPFNs来表示属性信息, 取τ=8, 具体语言术语集S如下, S={sε | ε=0, 1, …, τ}={非常不吻合, 很不吻合, 不吻合, 略微不吻合, 适中, 略微吻合, 吻合, 很吻合, 非常吻合}, 即:S={s0=非常不吻合, s1=很不吻合, s2=不吻合, s3=略微不吻合, s4=适中, s5=略微吻合, s6=吻合, s7=很吻合, s8=非常吻合}。
此案例考虑了与涉案人员相关的不同属性下的重要性权重, 表1给出了评估信息。
以态度特征α=0.2时第一名涉案人员A1的隶属度计算为例, 来阐述基于WOWA算子的软似然函数这一多属性决策方法的应用。为验证本文方法的有效性, 采用文献[23]中的案件算例进行对比分析。从表1能得出:
$A_{1}^{\mu}=\left\{I_{11}^{\mu}=s_{7}, I_{12}^{\mu}=s_{6}, I_{13}^{\mu}=s_{5}, I_{14}^{\mu}=s_{3}, I_{15}^{\mu}=s_{2}, \right\}$
利用公式(3)(4)(5)对重要性权重进行计算得到:
$\frac{Q_{1 j}}{Q_{1}}=\left\{\frac{Q_{11}}{Q_{1}}=\frac{1.0}{3.0}=0.3333, \frac{Q_{12}}{Q_{1}}=\frac{1.8}{3.0}=0.6, \frac{Q_{13}}{Q_{1}}=\frac{2.3}{3.0}=\right.$
$\left.0.7667, \frac{Q_{14}}{Q_{1}}=\frac{2.7}{3.0}=0.9, \frac{Q_{15}}{Q_{1}}=\frac{3.0}{3.0}=1.0\right\} $
表2为A1的第j大隶属度的乘积$S_{P r o d_{1}^{\mu}(j)} $, 利用公式(5)和公式(7)计算权重wj, 从而得出第一名涉案人员的隶属度的软似然值$S_{L_{1, 0.2}^{\mu}}=S_{2.8095} $, 如表3所示, 利用同样的计算方法得出其非隶属度的软似然值$S_{L_{1, 0.2}^{v}}=S_{7.4015} $。最后计算态度特征α=0.2时A1的得分值, $D_{1, 0.2}=S_{2.9250}$。以α=0.2、α=0.5、α=0.8为例, 用同样的方法得出6名涉案人员在这三种典型态度特征值下的得分值, 如表4所示, 根据得分值Di, a和准确值Ji, a的大小比较方法, 这6名涉案人员的嫌疑程度结果排序为A4 >A5 >A6 >A1 >A2>A3。
文献[23]基于OWA算子的软似然函数方法得到的排序结果为A4 >A5 >A6 >A2 >A1 >A3, 图2和图3分别反映了两种方法在不同态度特征下关于6名涉案人员的软似然值, 其中纵坐标代表了得分值的下标值。可以看出, 两种方法的软似然值都随态度特征的增加而增加, 呈现了相同的趋势, 虽然两者的排序结果非常相似, 但并不完全一致, A1与A2之间的排序存在些许差异, 但对于嫌疑程度最大的前几名涉案人员的选择始终不变。基于WOWA算子的软似然函数能更好地减弱极值造成的影响, 并软化权重值, 使得软似然值的变化更趋于平缓, 因此, 这一比较结果可以验证所提出的基于WOWA算子的软似然函数决策方法的鲁棒性。本文充分体现了此方法的特点与优势, 不仅能够考虑到警方的态度信息, 而且可以同时兼顾各属性间的重要性权重, 为现实中普遍存在的属性权重不一致的语言模糊决策问题提供有效的解决方法。
针对公安领域的电信网络诈骗类型案件, 本文提出了语言毕达哥拉斯模糊环境下基于WOWA算子的软似然函数多属性决策方法, 在侦判多名涉案人员时可通过多属性决策研析来给出涉案人员的嫌疑程度结果排序。首先, 在确定相关涉案人员和相关证据后, 利用语言毕达哥拉斯模糊集统一描述属性信息, 降低人为主观因素对结果的影响; 其次, 采用基于WOWA算子的软似然函数方法对属性信息进行有效聚合, 同时考虑决策者态度特征带来的影响; 最后, 通过实例对比分析证明, 在语言毕达哥拉斯模糊环境下本文所提方法相较于基于OWA算子的软似然函数方法具有更强的鲁棒性。实验结果表明, 所提方法可以合理有效地解决语言模糊环境下的多属性决策问题, 在以侦破电信网络诈骗犯罪为代表的公安工作中具备实际应用价值。
由于电信网络诈骗这一新型犯罪方式在实际生活中具有一定的变化性、随机性和复杂性, 并且全国案件数量过大, 因此对于构建电信网络诈骗案件系统的、通用的模型仍具有一定挑战, 如何使其更满足实际应用需求是下一步的研究规划, 也是未来研究难点。