您的当前位置:首页正文

一种基于历史容量相似特征的容量评估方法及设备[发明专利]

2023-04-13 来源:尚佳旅游分享网
(19)中华人民共和国国家知识产权局

(12)发明专利申请

(10)申请公布号 CN 111598148 A(43)申请公布日 2020.08.28

(21)申请号 202010356418.1(22)申请日 2020.04.29

(71)申请人 中国电子科技集团公司第二十八研

究所

地址 210014 江苏省南京市秦淮区苜蓿园

东街1号(72)发明人 董斌 严勇杰 施书成 黄吉波 

付胜豪 徐善娥 童明 毛亿 单尧 (74)专利代理机构 南京苏高专利商标事务所

(普通合伙) 32204

代理人 李淑静(51)Int.Cl.

G06K 9/62(2006.01)G06Q 10/06(2012.01)

权利要求书3页 说明书9页 附图3页

G06Q 50/30(2012.01)G08G 5/00(2006.01)

CN 111598148 A(54)发明名称

一种基于历史容量相似特征的容量评估方法及设备(57)摘要

本发明公开了一种基于历史容量相似特征的容量评估方法及设备。所述方法针对待评估对象在待评估时段的运行特征,结合待评估对象已运行历史数据,准确评估相应的运行容量,具体包括:针对空域单元运行过程中的容量影响因素,构建容量相似特征模型,形成容量相似特征指标集合;获取评估对象历史数据,以容量相似特征指标集合为依据,采用聚类算法对分时段历史数据样本进行分类,生成当前评估对象的评估时段所属的容量相似时段样本集合;采用密度聚类算法对容量相似时段样本集合的历史容量值进行分类,以最大类簇为基础计算得到容量参考值。该方法以具体容量评估目标为驱动,对真实客观历史数据进行抽象、分析,从而使容量评估结果具有客观参考性。

CN 111598148 A

权 利 要 求 书

1/3页

1.一种基于历史容量相似特征的容量评估方法,其特征在于,包括以下步骤:针对空域单元运行过程中的容量影响因素,构建容量相似特征模型,形成容量相似特征指标集合;

获取评估对象历史数据,以容量相似特征指标集合为依据,采用聚类算法对分时段历史数据样本进行分类,生成当前评估对象的评估时段所属的容量相似时段样本集合;

采用密度聚类算法对容量相似时段样本集合的历史容量值进行分类,以最大类簇为基础计算得到容量参考值。

2.根据权利要求1所述的基于历史容量相似特征的容量评估方法,其特征在于,所述容量影响因素包括结构类因素、运行类因素和突发因素,所述结构类因素用于表征待评估对象的静态特征与容量的关系,是指将待评估对象抽象为带权网络后,从复杂网络的角度对待评估对象进行的统计分析;所述运行类因素用于表征待评估对象的动态特征与容量的关系,是指在特定航班计划的前提下,待评估对象在待评估时段内的宏观运行情况;所述突发因素用于表征待评估对象的随机特征与容量的关系,是指突发事件对待评估对象运行影响的量化度量。

3.根据权利要求2所述的基于历史容量相似特征的容量评估方法,其特征在于,所述结构类因素指标集合为Des={K,P,De},其中,非直线系数K是统计时段内航班飞行航线的起始、终止点之间的实际飞行长度与空间距离之比的均值,计算公式为

m表示统

计时段内在评估对象内飞行的航班数量,n表示第f个航班飞经的航段个数,dfi表示第f个航班飞经的航段i的长度,dmin表示航线起讫点之间的空间距离;节点压力P表示统计时段内经过关键点的流量均值,计算公式为

ωk表示单位时间内经过航路点k的航班流量,

num表示

num表示节点个数;节点度均值De表征空域结构的复杂度,计算公式为

节点个数,dei表示与航路点i相连的航段个数;

所述运行类因素指标集合为Dyn={F,Td},时段流量F是指在统计时段内进入待评估对象的航班数量;平均延误时间指待评估时段内航班在待评估对象内的延误时间,计算公式为

表示航班i的延误时间,是航班i在待评估对象内的计划飞行时间与实际飞行

时间的差值;

所述突发因素指标集合为Out={ρ,R},ρ表示气象阻塞度,R代表容量下降率;所述容量相似特征指标集合为T={K,P,De,F,Td,ρ,R}。

4.根据权利要求1所述的基于历史容量相似特征的容量评估方法,其特征在于,所述采用聚类算法对分时段历史数据样本进行分类,生成当前评估对象的评估时段所属的样本集,包括:根据容量相似特征模型对待评估的对象历史运行航迹数据以及待评估时段的航迹数据进行分时段指标化统计,形成容量相似特征指标集合矩阵D,其中列数为容量相似特

2

CN 111598148 A

权 利 要 求 书

2/3页

征指标数量,行数为时段样本数量,分时时段的长度为容量评估的时间粒度,采用聚类算法以行为单位对矩阵D进行聚类,得到待评估对象的待评估时段所属的类簇,作为目标样本集合。

5.根据权利要求4所述的基于历史容量相似特征的容量评估方法,其特征在于,所述聚类算法采用模糊C均值算法,进行进行容量样本分类包括以下步骤:

(a)初始化模糊C均值聚类算法参数:对矩阵D进行极差标准化处理,设置模糊指数m∈[1,∞)、稳定分类阈值δ∈[0,1)、分类次数iter∈[1,∞),并确定样本分类数k;对隶属度矩阵U使用(0,1)之间的数据进行初始化,并满足约束条件

(b)进行模糊C均值聚类:根据隶属度矩阵U,由式

得到本次分类的第k个聚类中心,xj表示

n为样本数据总数;

矩阵D第j行中的元素,由欧氏距离公式分别求得n个数据样本到各聚类中心的距离dij,在此基础上,计算价值函数J,公式为:

若本次分类结果的价值函数与上一次分类结果的价值函数的差值大于稳定分类阈值δ,则将连续稳定聚类次数cnt重置为0,更新隶属度矩阵U,再次进行聚类;

若本次分类结果的价值函数与上一次分类结果的价值函数的差值小于稳定分类阈值δ,则连续稳定聚类次数cnt自增,若cnt<iter,更新隶属度矩阵U,再次进行聚类,若cnt=iter,则聚类算法结束,得到历史样本数据根据容量相似特征划分的不同类簇。

6.根据权利要求5所述的基于历史容量相似特征的容量评估方法,其特征在于,所述更新隶属度矩阵的计算公式为:

式中dxj表示第j行数据样本到聚类中心的欧

氏距离。

7.根据权利要求5所述的基于历史容量相似特征的容量评估方法,其特征在于,步骤(a)中采用极值判别法自适应确定容量样本分类数k,包括以下步骤:

(1)设置初始化分类数为k=2;(2)对样本进行聚类,得到k个样本类簇,若k不满足极值判断条件,则k值自增;若满足则对本次聚类结果进行极值判断如下:

计算各个样本类簇的类内距离DI(k)和类间距离DB(k);

dci表示同一数

据簇中样本Di与聚类中心cc之间的欧氏距离,nk表示第k个簇中的样本数;dcij表示聚类中心ci与聚类中心cj之间的欧氏距离;

3

CN 111598148 A

权 利 要 求 书

3/3页

判断比值I(k)=DB(k)/DI(k)的变化情况,若I(k)>I(k-1)并且I(k)>I(k+1),则聚类数设定为k,否则k值自增,返回步骤2。

8.根据权利要求1所述的基于历史容量相似特征的容量评估方法,其特征在于,所述密度聚类算法采用自适应密度聚类算法,对目标集合的历史容量值进行分类,包括:

(a)计算类簇数据重心集合:初始化类簇数据重心集合CenU=φ,未访问对象集合T,设置初始密度聚类半径ε和邻域最小数据个数MinPts,遍历类簇中的点Gi,i=1,2,…num,num为类簇中样本数量,若Gi在聚类半径ε范围的邻域内的样本点数目大于MinPts,则将Gi点设为类簇数据重心点,加入集合CenU;若不存在Gi在聚类半径ε范围的邻域内的点的数目大于MinPts,则密度聚类半径步进递增,重新遍历G寻找类簇数据重心点,类簇G遍历判断类簇数据重心点结束后,令T=G,执行步骤b;

(b)划分类簇,包括以下步骤:(b1)若CenU=φ则算法结束,执行步骤c,否则在类簇数据重心集合CenU中随机选取核心对象o,更新集合CenU,CenU=CenU-{o},初始化当前类簇样本集合Ck={o},令当前类簇样本集合Ck包含的对象集合Q={o},更新未访问样本集合T=T-{o};

(b2)若当前簇对象集合Q=φ,则执行步骤b3;否则,当前簇对象集合Q≠φ,取Q中的首个样本q,通过聚类半径ε找出G中所有邻域内的样本集合Nε(q),令X=Nε(q)∩T,将X中样本加入Q,更新当前簇样本集合Ck=Ck∪X,更新未访问样本集合T=T-X,执行步骤b2;

(b3)当前聚类簇Ck生成完毕,更新类簇划分C={C1,C2,...,Ck},更新集合CenU=CenU-Ck∩CenU,执行步骤b1;

(c)计算容量值:

其中Ck为类簇划分C={C1,C2,...,Ck}中包含样本数量

最多的类簇,num为类簇Ck中的样本个数,为类簇中第i个元素。

9.一种计算机设备,其特征在于,所述设备包括:一个或多个处理器、存储器;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述程序被处理器执行时实现如权利要求1-8中的任一项所述方法的步骤。

4

CN 111598148 A

说 明 书

一种基于历史容量相似特征的容量评估方法及设备

1/9页

技术领域

[0001]本发明涉及空管自动化技术领域,具体涉及一种空域容量的评估方法及设备。背景技术

[0002]容量评估技术是空中交通管理的重要组成部分,容量评估的准确性直接影响到空域运行效率以及管制决策措施的执行效果。通过容量评估可以确定系统能够承受的最大通行量,是进行流量管理的主要依据之一。同时,容量评估也是空域规划的重要内容,通过容量评估提出空域结构优化、改进方案是有效利用空域资源的重要措施。[0003]目前容量评估的方法主要有四类:基于管制员工作负荷的评估方法、基于历史统计数据分析的评估方法、基于数学计算模型的评估方法、基于计算机仿真的评估方法,其中,如何通过历史数据分析获取待评估对象的容量参考值是当前的热点问题。目前,通过历史数据进行容量评估主要采用包络分析法,通过对固定长度的样本集合进行整理筛选,基于样本集合的分布特征获取容量值。该容量值体现的是宏观的集合特征,样本集合的选取对于容量结果影响较大,使用过程中数据驱动性大于目的驱动性。并且该方法主要应用于事后容量分析,缺乏针对具体评估场景的容量预测能力,因此导致该方法的应用领域较为狭隘。

发明内容

[0004]发明目的:针对现有技术的不足,本发明提出一种基于历史容量相似特征的容量评估方法及设备,能够更贴近机场、扇区等空域单元实际容量变化趋势,给出准确的容量参考值。

[0005]技术方案:第一方面,提供一种基于历史容量相似特征的容量评估方法,包括以下步骤:

[0006]针对空域单元运行过程中的容量影响因素,构建容量相似特征模型,形成容量相似特征指标集合;

[0007]获取评估对象历史数据,以容量相似特征指标集合为依据,采用聚类算法对分时段历史数据样本进行分类,生成当前评估对象的评估时段所属的容量相似时段样本集合;[0008]采用密度聚类算法对容量相似时段样本集合的历史容量值进行分类,以最大类簇为基础计算得到容量参考值。[0009]其中,所述容量影响因素包括结构类因素、运行类因素和突发因素,所述结构类因素用于表征待评估对象的静态特征与容量的关系,是指将待评估对象抽象为带权网络后,从复杂网络的角度对待评估对象进行的统计分析;所述运行类因素用于表征待评估对象的动态特征与容量的关系,是指在特定航班计划的前提下,待评估对象在待评估时段内的宏观运行情况;所述突发因素用于表征待评估对象的随机特征与容量的关系,是指突发事件对待评估对象运行影响的量化度量。[0010]进一步地,所述结构类因素指标集合为Des={K,P,De},其中,非直线系数K是统计

5

CN 111598148 A

说 明 书

2/9页

时段内航班飞行航线的起始、终止点之间的实际飞行长度与空间距离之比的均值,计算公式为

m表示统计时段内在评估对象内飞行的航班数量,n表示第f个航班飞经的

航段个数,dfi表示第f个航班飞经的航段i的长度,dmin表示航线起讫点之间的空间距离;节点压力P表示统计时段内经过关键点的流量均值,计算公式为

表示单位时间内

经过航路点k的航班流量,num表示节点个数;节点度均值De表征空域结构的复杂度,计算公式为

[0011]

num表示节点个数,dei表示与航路点i相连的航段个数;

所述运行类因素指标集合为Dyn={F,Td},时段流量F是指在统计时段内进入待评估对象的航班数量;平均延误时间指待评估时段内航班在待评估对象内的延误时间,计算

表示航班i的延误时间,是航班i在待评估对象内的计划飞行时间与实

公式为

际飞行时间的差值;

[0012]所述突发因素指标集合为Out={ρ,R},ρ表示气象阻塞度,R代表容量下降率;[0013]所述容量相似特征指标集合为T={K,P,De,F,Td,ρ,R}。[0014]进一步地,所述采用聚类算法对分时段历史数据样本进行分类,生成当前评估对象的评估时段所属的样本集合,包括:根据容量相似特征模型对待评估的对象历史运行航迹数据以及待评估时段的航迹数据进行分时段指标化统计,形成容量相似特征指标集合矩阵D,其中列数为容量相似特征指标数量,行数为时段样本数量,分时时段的长度为容量评估的时间粒度,采用聚类算法以行为单位对矩阵D进行聚类,得到待评估对象的待评估时段所属的类簇,作为目标样本集合。[0015]作为优选,所述聚类算法采用模糊C均值算法,进行进行容量样本分类包括以下步骤:[0016](a)初始化模糊C均值聚类算法参数:[0017]对矩阵D进行极差标准化处理,设置模糊指数m∈[1,∞)、稳定分类阈值δ∈[0,1)、分类次数iter∈[1,∞),并确定样本分类数k;对隶属度矩阵U使用(0,1)之间的数据进行初始化,并满足约束条件

[0018]

n为样本数据总数;

(b)进行模糊C均值聚类:根据隶属度矩阵U,由式

得到本次分类的第k个聚类中心,xj

[0019]

表示矩阵D第j行中的元素,由欧氏距离公式分别求得n个数据样本到各聚类中心的距离dij,在此基础上,计算价值函数J,公式为:

6

CN 111598148 A[0020]

说 明 书

3/9页

若本次分类结果的价值函数与上一次分类结果的价值函数的差值大于稳定分类

阈值δ,则将连续稳定聚类次数cnt重置为0,更新隶属度矩阵U,再次进行聚类;

[0021]若本次分类结果的价值函数与上一次分类结果的价值函数的差值小于稳定分类阈值δ,则连续稳定聚类次数cnt自增,若cnt<iter,更新隶属度矩阵U,再次进行聚类,若cnt=iter,则聚类算法结束,得到历史样本数据根据容量相似特征划分的不同类簇。

[0022]

其中,所述更新隶属度矩阵的计算公式为:式中dxj表示第j行数

据样本到聚类中心的欧氏距离。[0023]作为优选方案,步骤(a)中采用极值判别法自适应确定容量样本分类数k,包括以下步骤:[0024](1)设置初始化分类数为k=2;[0025](2)对样本进行聚类,得到k个样本类簇,若k不满足极值判断条件,则k值自增;若满足则对本次聚类结果进行极值判断如下:

[0026]

计算各个样本类簇的类内距离DI(k)和类间距离DB(k);dci表示

同一数据簇中样本Di与聚类中心cc之间的欧氏距离,nk表示第k个簇中的样本数;

dij表示聚类中心ci与聚类中心cj之间的欧氏距离;

判断比值I(k)=DB(k)/DI(k)的变化情况,若I(k)>I(k-1)并且I(k)>I(k+1),则聚类数设定为k,否则k值自增,返回步骤2。[0028]进一步地,所述密度聚类算法采用如下的自适应密度聚类算法,对目标集合的历史容量值进行分类,包括:[0029](a)计算类簇数据重心集合:初始化类簇数据重心集合CenU=φ,未访问对象集合T,设置初始密度聚类半径ε=d±σ和邻域最小数据个数MinPts,遍历类簇中的点Gi,i=1,2,…num,num为类簇中样本数量,若Gi在聚类半径ε范围的邻域内的样本点数目大于MinPts,则将Gi点设为类簇数据重心点,加入集合CenU;若不存在Gi在聚类半径ε范围的邻域内的点的数目大于MinPts,则密度聚类半径步进递增,重新遍历G寻找类簇数据重心点,类簇G遍历判断类簇数据重心点结束后,令T=G,执行步骤b;[0030](b)划分类簇,包括以下步骤:[0031](b1)若CenU=φ则算法结束,执行步骤c,否则在类簇数据重心集合CenU中随机选取核心对象o,更新集合CenU,CenU=CenU-{o},初始化当前类簇样本集合Ck={o},令当前类簇样本集合Ck包含的对象集合Q={o},更新未访问样本集合T=T-{o};[0032](b2)若当前簇对象集合Q=φ,则执行步骤b3;否则,当前簇对象集合Q≠φ,取Q中的首个样本q,通过聚类半径ε找出G中所有邻域内的样本集合Nε(q),令X=Nε(q)∩T,将X中样本加入Q,更新当前簇样本集合Ck=Ck∪X,更新未访问样本集合T=T-X,执行步骤b2;[0033](b3)当前聚类簇Ck生成完毕,更新类簇划分C={C1,C2,...,Ck},更新集合CenU=CenU-Ck∩CenU,执行步骤b1;

7

[0027]

CN 111598148 A

说 明 书

4/9页

[0034](c)计算容量值:其中Ck为类簇划分C={C1,C2,...,Ck}中包含样本

数量最多的类簇,num为类簇Ck中的样本个数,为类簇中第i个元素。

第二方面,提供一种计算机设备,所述设备包括:[0036]一个或多个处理器、存储器;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述程序被处理器执行时实现如本发明第一方面所述的步骤。[0037]有益效果:本发明从实际容量应用需求着手,构建了统一的容量相似特征度量标准,以具体评估场景为对象,历史数据为依据,采用分级聚类的方式筛选与待评估对象待评估时段“同质化”的时段样本集合,并通过目标样本的容量集合重心计算对应的容量参考值。本方法贴近机场、扇区等空域单元实际容量变化趋势,能够根据待评估对象待评估时段的运行特征得出准确的容量参考值,为后续流量管理、空域管理等领域的理论研究和系统应用提供客观可靠的数据支撑。

附图说明

[0038]图1是根据本发明的基于历史容量相似特征的容量评估方法总体流程图;

[0039]图2是根据本发明实施例的基于历史容量相似特征的容量评估方法流程细节图;[0040]图3是根据本发明实施例的容量相似特征评价指标集合示意图。

具体实施方式

[0041]下面结合附图对本发明的技术方案作进一步说明。[0042]参照图1和图2,在一个实施例中,一种基于历史容量相似特征的容量评估方法,具体包括以下步骤:[0043]步骤1,针对不同的类型的空域单元,结合实际运行过程中容量影响因素,构建容量相似特征模型。

[0044]容量相似特征模型包含结构类因素、运行类因素和突发因素三大类指标集合。[0045]结构类因素是指将待评估对象抽象为带权网络后,从复杂网络的角度对待评估对象进行的统计分析,体现的是空域单元的静态特征与容量的关系。网络的节点为评估对象内的关键点,一般为航段的端点,网络的边为节点间的航线,边的权值为统计时段内节点间的流量。结构类因素指标集合为Des={K,P,De},非直线系数K是统计时段内航班飞行航线的起始、终止点之间的实际飞行长度与空间距离之比的均值,计算公式为

m表

[0035]

示统计时段内在评估对象内飞行的航班数量,n表示第f个航班飞经的航段个数,dfi表示第f个航班飞经的航段i的长度,dmin表示航线起讫点之间的空间距离;节点压力P表示统计时段内经过关键点的流量值的均值,计算公式为

ωk表示单位时间内经过航路点k的航

8

CN 111598148 A

说 明 书

5/9页

班流量,num表示节点个数;节点度均值De表征空域结构的复杂度,计算公式为

num表示节点个数,dei表示与航路点i相连的航段个数,节点度的均值De越高,代表该空域的结构相对越复杂。

[0046]运行类因素是指在特定航班计划的前提下,待评估对象在待评估时段内的宏观运行情况,体现的是待评估对象的动态特征与容量的关系。结构类因素指标集合为Dyn={F,Td},时段流量F是指在统计时段内进入待评估对象的航班数量;平均延误时间指待评估时段内航班在待评估对象内的延误时间,计算公式为

表示航班i的延误时间,是

航班i在待评估对象内的计划飞行时间与实际飞行时间的差值。

[0047]突发因素是指突发事件对待评估对象运行影响的量化度量,体现随机特征与容量的关系,突发因素指标集合为Out={ρ,R},ρ表示气象阻塞度和R代表容量下降率。本发明的突发因素指标包括气象阻塞度ρ和容量下降率R。由于突发因素通常由专门的机构进行统计度量,计算过程较为专业复杂,且不是本发明的研究重点,因此气象阻塞度ρ和容量下降率R的计算过程在此进行简要描述,首先获取气象雷达回波图,然后判断与待评估对象的覆盖关系,最后采用最大流最小割的方式计算可用通过量与总通过量的比例,即为气象阻塞度。容量下降率是指根据气象阻塞度采用人工会商的方式确定容量下降比例。[0048]综上所述,本发明的容量相似特征评价指标集合为T={K,P,De,F,Td,ρ,R},如图3所示。

[0049]步骤2,基于自适应模糊C均值聚类的容量样本分类。

[0050]容量样本分类的目的是从历史运行数据中筛选出与待评估对象在待评估时段具有相似容量特征的样本集合,从而为容量计算提供数据基础。

[0051]根据容量相似特征指标集合对待评估的对象(包含机场、扇区等类型的空域单元)的历史运行航迹数据(通常历史数据选取时间长度为1年)以及待评估时段的航迹数据进行分时段指标化统计,形成容量相似特征指标集合矩阵D。其中列数为容量相似特征指标数量,行数为时段样本数量,分时时段的长度为容量评估的时间粒度(通常取15分钟、30分钟、60分钟)。以行为单位对矩阵D进行聚类,得到待评估对象的待评估时段所属的类簇,即为目标样本集合。

[0052]本发明采用自适应模糊C均值聚类进行类别划分,模糊C均值算法(Fuzzy C-Means,FCM)是一种基于模糊划分的聚类算法,它的核心思路就是使得被划分到同一类簇的对象之间相似度最大,而不同类簇之间的相似度最小。相比于硬划分的聚类算法,FCM更能客观的反应客观世界中各因子的关联关系。具体包括以下步骤:[0053]步骤2.1,初始化模糊C均值聚类算法的参数。[0054]为了消除指标量纲的不同对聚类结果的影响,首先需要对矩阵D进行极差标准化处理,具体方法为:取数据矩阵D第v(v=1,2…t)列最大值dvmax和最小值dvmin,则集合D标准极差处理公式为:

式中,duv表示矩阵D第u行第v列元素,

n表示矩阵的行数,即样本数据总数,t表示矩阵列数,即每个时段样本数据包含的容量相似

9

CN 111598148 A

说 明 书

6/9页

特征指标数量,本发明实施例中取值为t=7。

[0055]FCM聚类算法需要设置模糊指数m∈[1,∞),模糊指数是在进行分类时约束分类模糊程度的参数,在不做特殊要求时,m一般取值为2。[0056]FCM聚类算法需要设置稳定分类阈值δ∈[0,1),稳定分类阈值用于判断当前分类结果是否达到稳定,若当前分类结果的价值函数与前一次分类结果的价值函数的差值小于δ,则认为本次分类相较于上一次分类是稳定的。否则认为是不稳定的,本发明实施例中设置δ=1×10-4。

[0057]FCM聚类算法需要设置分类次数iter∈[1,∞),由于模糊C均值算法是一种模糊划分的聚类算法,因此需要通过是否达到iter次稳定分类来判断分类结果是否达到稳定状态,从而结束算法流程。本发明实施例中取值为iter=20。

[0058]FCM聚类算法根据每个对象对于每个分类的隶属度来判断属于某个类簇的程度,其中隶属度矩阵U为k×n阶矩阵,k为设定的划分类别数,n为样本总数。隶属度矩阵U使用(0,1)之间的数据进行初始化,并满足约束条件

因此在利用FCM聚类算法

进行分类之前,首先需要确定分类数k,执行步骤2.2。[0059]步骤2.2,确定容量样本分类数。[0060]在传统FCM聚类算法中,分类数k主要由人工进行设置,具有极大的人为主观因素的干扰。本发明采用极值判别法自适应确定分类数,避免人工的干预造成分类不准确的问题。具体算法流程为:[0061](2.2.1)设置初始化分类数k=2;[0062](2.2.2)对样本进行聚类,执行步骤2.3,得到k个样本类簇。若k<=3,不满足极值判断条件,则k值自增;若k>4,则需要对本次聚类结果进行极值判断,执行步骤2.2.3;[0063](2.2.3)计算各个样本类簇的类内距离DI(k)和类间距离DB(k);类内距离均值DI(k)表示数据簇中各样本之间距离的均值,计算方法为:

式中,dci表示同一

数据簇中样本Di与聚类中心cc之间的欧氏距离,nk表示第k个簇中的样本数;类间距离DB(k)表示不同数据簇中心之间的距离,计算方法为:

式中,dcij表示聚类中心ci

与聚类中心cj之间的欧氏距离。[0064](2.2.4)定义比值I(k)=DB(k)/DI(k);若I(k)>I(k-1)并且I(k)>I(k+1),则聚类数设定为k,否则k值自增,返回步骤2.2.3。[0065]以修改后的k值对样本进行聚类,执行步骤2.3。[0066]步骤2.3,进行模糊C均值聚类,得到待评估对象所属的类簇。

[0067]

根据隶属度矩阵U,可由式得到本次分类的第k个聚类中心,

xj表示矩阵D第j行中的元素,表示uij的m次方,由欧氏距离公式可分别求得n个数据样本

10

CN 111598148 A

说 明 书

7/9页

到各聚类中心的距离dij。在此基础上,计算价值函数J,公式为:

若本次分类结果的价值函数与上一次分类结果的价值函数的差值大于稳定分类阈值δ,意味着本次聚类运算改进了分类结果,且具有进一步改进的空间,连续稳定聚类次数cnt重置为0,更新隶属度矩阵U,再次进行聚类,隶属度矩阵的更新公式为:

dxj表示第j行数据样本到聚类中心的欧氏距离,执行步骤2.3。若本次分类

结果的价值函数与上一次分类结果的价值函数的差值小于δ,表明本次分类相较于上一次分类是稳定的,连续稳定聚类次数cnt自增,若cnt<iter,更新隶属度矩阵U,再次进行聚类,隶属度矩阵的更新公式为:

执行步骤2.3;若cnt=iter,则FCM聚类算法

[0068]

结束,认为历史样本数据已经根据容量相似特征特征分为不同的类簇。[0069]步骤3,基于自适应密度聚类算法计算容量参考值。[0070]根据容量相似特征进行分类后,得到待评估对象在待评估时段所属的容量相似特征类簇,获取该类簇中各个样本时段的历史运行容量形成容量集合G,通过对容量集合G进行密度聚类,得出待评估对象在待评估时段容量参考值。[0071]密度聚类的基本思想是根据样本分布的紧密程度,以数据集在空间分布上的稠密程度为依据进行分类。密度聚类算法需要设置两个参数,分别为邻域半径ε和核心对象阈值Minpts,参数设置的合理性对聚类结果影响较大。为了解决因人为因素导致的参数设置不合理问题,本发明提出自适应半径的密度聚类算法。[0072]根据统计学原理,当数据样本数较大、符合正态分布时,区间d±σ理论上包含68.27%的样本,区间d±1.96σ可包含95.54%的样本。[0073]由于容量集合G中的数值不一定符合正态分布,因此,为了剔除边界值,确保密度聚类的核心点处于数据簇中心位置,设置邻域半径初始值ε=d±σ,核心对象阈值MinPts=70%m。式中,d为历史数据容量均值,σ为容量值的标准差,并借鉴微元法思想,利用自适应半径的方式进行密度聚类。[0074]具体地,自适应密度聚类算法计算容量参考值包括以下步骤:[0075]步骤3.1,计算类簇数据重心集合。[0076]初始化类簇数据重心集合CenU=φ,未访问对象集合T,设置初始密度聚类半径ε=d±σ和邻域最小数据个数MinPts。遍历类簇中的点Gi,i=1,2,…num,num为类簇中样本数量,若Gi在聚类半径ε范围的邻域内的样本点数目大于MinPts,那么将Gi点设为类簇数据重心点,加入集合CenU。若不存在Gi在聚类半径ε范围的邻域内的点的数目大于MinPts,则密度聚类半径步进递增,令ε=d±(1+x)σ,(x=x+0.05),重新遍历G寻找类簇数据重心点。[0077]类簇G遍历判断类簇数据重心点结束后,令T=G,执行步骤3.2。[0078]步骤3.2,划分类簇。[0079](a)若CenU=φ则算法结束,执行步骤3.3,否则在类簇数据重心集合CenU中随机选取核心对象o,更新CenU,CenU=CenU-{o},初始化当前类簇样本集合Ck={o},令当前类

11

CN 111598148 A

说 明 书

8/9页

簇样本集合Ck包含的对象集合Q={o},更新未访问样本集合T=T-{o}。[0080](b)若当前簇对象集合Q=φ,则执行步骤c;否则,当前簇对象集合Q≠φ,取Q中的首个样本q,通过聚类半径ε找出G中所有邻域内的样本集合Nε(q),令X=Nε(q)∩T,将X中样本加入Q,更新当前簇样本集合Ck=Ck∪X,更新未访问样本集合T=T-X,再次执行步骤b,直至簇对象集合Q=φ。[0081](c)当前聚类簇Ck生成完毕,更新类簇划分C={C1,C2,...,Ck},更新集合CenU=CenU-Ck∩CenU,执行步骤a,直至所有数据均被划分至某一类簇。[0082]步骤3.3,计算容量值。

[0083]通过对待评估对象待评估时段所属的样本集合中的容量值集合进行密度聚类后,可以确定所属样本集合容量值的聚集特征,因此计算待评估对象待评估时段的容量参考值

其中Ck为类簇划分C={C1,C2,...,Ck}中包含样本数量最多的类簇,num为类

簇Ck中的样本个数,为类簇中第i个元素。

基于与方法实施例相同的技术构思,根据本发明的另一实施例,提供一种计算机设备,所述设备包括:一个或多个处理器;存储器;以及一个或多个程序,其中所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述程序被处理器执行时实现方法实施例中的各步骤。[0085]本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

[0086]本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。[0087]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

[0088]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。[0089]最后应当说明的是:以上实施例仅用以说明本发明的技术方案而非对其限制,尽管参照上述实施例对本发明进行了详细的说明,所属领域的普通技术人员应当理解:依然

12

[0084]

CN 111598148 A

说 明 书

9/9页

可以对本发明的具体实施方式进行修改或者等同替换,而未脱离本发明精神和范围的任何修改或者等同替换,其均应涵盖在本发明的权利要求保护范围之内。

13

CN 111598148 A

说 明 书 附 图

1/3页

图1

14

CN 111598148 A

说 明 书 附 图

2/3页

图2

15

CN 111598148 A

说 明 书 附 图

3/3页

图3

16

因篇幅问题不能全部显示,请点此查看更多更全内容