一种基于状态识别的公交运行评估方法和系统
1.本发明涉及公共交通技术领域,尤其是涉及一种基于状态识别的公交运行评估方法和系统。
背景技术:
2.随着城市的快速发展,城市地面公交承担了巨大的客流,公交系统的运行状态直接影响着城市日常运行的稳定性。城市地面公交是一个复杂的动态系统,在运行过程中易受环境中随机扰动和突发事件的冲击,具有一定的脆弱性。地面公交运行失稳频发,公交车速低、在途准点率不高和串车严重等问题备受诟病。因此,准确表征公交运行状态,解析公交系统运行演化机理,建立公交系统运行稳态判别准则,具有较好的理论价值和现实意义。
3.中国专利cn202010081991.6公开了一种基于gps数据的公交运行状态评估方法,包括公交运行状态划分为集结态、集结过渡态、常态、大间隔过渡态和大间隔状态;运行状态阈值确定:将特征值车头时距的数据集划分为不同的类别,各类别聚类中心从小到大排序,相邻类别聚类中心平均值即为各状态阈值。确定指标、建立公交时空集簇概率模型、空间概率分布拟合和时间概率分布拟合;最后建立多分类logistic公交集簇预测模型,根据所建立的预测模型判定公交运行状态在线路上的状态转移概率,作出公交运行状态评估。
4.现有技术采用可靠性或稳定性指标描述公交运行状态,依赖先验知识与专家经验人为预先定义公交运行状态类别与数量,直接通过聚类方法确定公交运行状态阈值划分,建立公交运行状态转移模型,实现公交运行状态评价。由于公交运行影响因素复杂,面向不同城市路网其运行环境大不相同,因此通过传统手段建模,模型泛化性有所限制;并且,传统研究在聚类之前的初始模式的定义上是主观设定的,由于不同的研究人员的相关先验知识的不同可能会产生不同的分析结果。
技术实现要素:
5.本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于状态识别的公交运行评估方法和系统。
6.本发明的目的可以通过以下技术方案来实现:
7.作为本发明的一个方面,提供一种基于状态识别的公交运行评估方法,其特征在于,所述方法步骤包括:
8.获取车辆定位数据;
9.对所得定位数据进行预处理,并求取公交运行状态表征指标;
10.通过训练好的公交系统状态迁移识别模型将所述公交运行状态表征指标的序列识别为有限种公交基本运行模式的组合;
11.基于定义好的语义类型,对识别的所述公交基本运行模式进行语义类型归属判定;
12.基于语义类型归属判定结果对公交运行状态进行评估;
13.所述公交系统状态迁移识别模型基于hdp-hsmm模型构建,该hdp-hsmm模型的构建与训练具体包括以下步骤:
14.利用hdp模型确定公交基本运行模式的数量,作为无限状态空间的先验知识;
15.利用hsmm模型描述公交运行过程中基本运行模式状态转移的演化机理;
16.训练hdp-hsmm模型参数,使得模型能够自适应学习公交运行状态表征指标的时序特征,以个体公交车为对象,将公交车的公交运行状态表征指标序列划分为有限种公交基本运行模式的组合。
17.作为优选技术方案,所述的数据预处理包括将定位数据按照点到线段距离最短原则匹配到线路地图数据上。
18.作为优选技术方案,所述公交运行状态表征指标包括行程时间可靠性指标和车头时距稳定性指标。
19.作为优选技术方案,所述行程时间可靠性指标包括班次累积延误时间其计算过程包括以下步骤:
20.取任意公交运营线路的历史定位数据,假设某公交线路站点分别为station0,station1,...,station
n-1
,stationn,其中station0为起点站,stationn为终点站;
21.从终点站开始,取stationn与station
n-1
之间行程时间的25%分位数记为stationn与station
n-1
之间行程的标准时间ts
n-1
;随后,取stationn与station
n-2
之间行程时间的25%分位数求得与之差,随即得到station
n-1
与station
n-2
之间行程的标准时间ts
n-2
;以此方式依次递归,最后分别得到每段行程的公交运营参考时间ts0,ts1,...,ts
n-2
,ts
n-1
;
22.取任意班次公交车辆定位数据,分别计算其在各段行程中的实际行驶时间t0,t1,...,t
n-2
,t
n-1
,减去其行程所对应的运营参考时间ts0,ts1,...,ts
n-2
,ts
n-1
,即得到该班次公交车在各段行程中的延误时间time
delay,i
=t
i-tsi,i=0,1,...,n-1,从起点站逐段累加即得到该班次的累积延误时间
23.所述车头时距稳定性指标包括车头时距,将每个站点相对于发车时刻表中理论车头时距的相对误差作为表征车头时距稳定性的指标,即
[0024][0025]
作为优选技术方案,定义所述语义类型包括以下步骤:
[0026]
基于线路运营历史数据拟合公交运行状态表征指标的概率分布函数;
[0027]
分别从延误时间、车头时距和发车时间三方面将公交基本运行模式的语义空间展开类别,基于概率分布拟合结果对各展开类别进行划分;
[0028]
组合上述从延误时间、车头时距和发车时间三方面展开的类别,获得公交基本运行模式的语义类型。
[0029]
作为优选技术方案,所述语义空间展开类别,基于概率分布拟合结果对各展开类别进行划分为:
[0030]
将延误时间展开为四个类别,即加速运行、正常运行、轻微延误以及重度延误,根据线路延误时间概率分布情况,确定分位数组合,划分四种延误时间类别;
[0031]
将车头时距展开为五个类别:即串车、串车过渡、正常间隔、大间隔过渡以及大间隔,依据线路车头时距概率分布情况,确定分位数组合,划分五种车头时距类别;
[0032]
将发车时间展开为三个类别:即早高峰时段、晚高峰时段以及非高峰时段,根据公交在各路段的起始时间,划分车辆所属类别。
[0033]
作为优选技术方案,所述对公交基本运行模式进行语义类型归属判定为:
[0034]
使用k-means聚类方法将每个公交基本运行模式的延误时间、车头时距以及发车时间聚类为一个点,将聚类点的数据与语义类型的数据范围匹配,确定每个公交基本运行模式对应的语义类型。
[0035]
作为优选技术方案,所述基于语义类型归属判定结果对公交运行状态进行评估具体包括以下步骤:
[0036]
基于公交基本运行模式语义类型归属判定结果,以公交线路为单位构建公交基本运行模式归一化频率分布模型,计算语义类型的出现概率,得到不同公交线路的频率分布图以表征线路运行状态;
[0037]
对任意两条公交线路,以公交基本运行模式的归一化频率分布作为指标,使用kullback
–
leibler散度方法,计算两条线路公交运行状态的相似性,在公交线路间进行对比分析;
[0038]
基于发车时间、车头时距以及延误时间的变量等级,引入打分机制,确定每种语义类型所造成的失稳严重程度基础得分,分别从公交班次与公交线路层面对公交运行稳态进行评价打分,建立公交系统运行稳态判别准则。
[0039]
作为优选技术方案,所述公交系统运行稳态判别准则为:
[0040]
在公交班次层面,求得每班次的失稳严重程度得分总和,实现对任意线路任意班次的公交运行状态评价;
[0041]
在公交线路层面,将各语义类型的失稳严重程度基础得分与语义类型对应的归一化频率相乘后求和,得到该线路整体失稳程度,对公交线路运营情况进行评价。
[0042]
作为本发明的另一个方面,提供一种用于实施上述一种基于状态识别的公交运行评估方法的系统,所述系统包括:
[0043]
公交车辆:搭载有定位发射装置,上传车辆自动定位数据;
[0044]
数据中心:包括存储有城市路网地图和历史数据的数据库和用于运行所述基于状态识别的公交运行评估方法的处理终端。
[0045]
与现有技术相比,本发明具有以下有益效果:
[0046]
1)本发明提出了一种公交运行状态识别方法,构建狄利克雷过程-隐半马尔科夫模型(hierarchical dirichlet process-hidden semi-markov model,hdp-hsmm)作为公交系统状态迁移识别模型,直接学习公交运行过程中不同基本运行模式间连续演化机理,不依赖先验知识或专家经验即可确定公交运行状态类别与数量。
[0047]
2)本发明将状态表征指标展开组合,定义公交基本运行模式的语义空间,基于线路历史状态表征指标数据的概率分布函数划分语义空间,对基于各班次的运行状态表征指标数据识别出的公交基本运行模式分别聚类后进行语义理解,在复杂的现实环境下对不同
线路都能实现公交基本运行状态的准确划分。
[0048]
3)本发明提出了一种简单的公交运行稳态量化评估方法,建立公交系统运行稳态判别准则,客观评价公交线路运行状态,使得同一线路不同班次以及不同线路间公交运行状态具有可比性。
附图说明
[0049]
图1为本发明的基于状态识别的公交运行评估方法流程图;
[0050]
图2为本发明的基于状态识别的公交运行评估系统示意图。
具体实施方式
[0051]
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0052]
延误时间:公交车辆到达某一站点的实际行驶时间与时刻表计划行驶时间之差,也称为时刻表偏差。
[0053]
累积延误时间:公交车辆从起点站发车开始,按先后顺序将各段行程的延误时间累积相加,直到终点站进站为止。
[0054]
车头时距:在同一公交线路上行驶的车辆队列,两连续计划班次的公交车辆通过线路上某一断面的时间间隔。
[0055]
班次:公交车的一次计划行程,班次信息包括计划发车时刻、计划到达时刻、起点站、终点站,共计四个元素。每天,一辆公交车会有多个计划班次。
[0056]
如图1所示,本实施例提供的公交运行状态识别方法包括以下步骤:
[0057]
s1:数据预处理:对公交车的自动车辆定位(automatic vehicle location avl)数据进行预处理,开发地图匹配算法将定位数据匹配到线路地图数据上,开发指标构建方法从轨迹数据中提取公交运行状态表征指标。
[0058]
s11:结合城市路网数据,将公交车自动定位数据的定位点投影到城市路网的相关路段。通过计算每个定位点到相关路段的距离,按照点到线段距离最短原则,建立定位点与相关路段的匹配关系表,并修正定位漂移带来的误差。
[0059]
s12:以个体公交车为对象,基于自动车辆定位数据,开发行程时间可靠性指标描述公交运行准时性,开发车头时距稳定性指标描述公交运行规律性,以此构建公交运行状态表征指标。
[0060]
s121:开发行程时间可靠性指标。
[0061]
采用分位数计算方法反推公交运营参考时间:假设某公交线路站点分别为station0,station1,...,station
n-1
,stationn,其中station0为起点站,stationn为终点站。
[0062]
从终点站开始,取stationn与station
n-1
之间行程时间的25%分位数记为stationn与station
n-1
之间行程的标准时间ts
n-1
;随后,取stationn与station
n-2
之间行程时间的25分位数求得与之差,随即得到station
n-1
与station
n-2
之间行程的标准时间ts
n-2
;以此方式依次递归,最后分别得到每段行程的公交运
营参考时间ts0,ts1,...,ts
n-2
,ts
n-1
。
[0063]
以计算公交运行过程中的累积延误时间:取任意班次公交车辆定位数据,分别计算其在各段行程中的实际行驶时间t0,t1,...,t
n-2
,t
n-1
,减去其行程所对应的运营参考时间,即得到该班次公交车在各段行程中的延误时间time
delay,i
=t
i-tsi,i=0,1,...,n-1。从起点站逐段累加即得到该班次的累积延误时间
[0064]
s122:开发车头时距稳定性指标:将车头时距定义为两辆连续公交车之间的运行时间差,将每个站点相对于发车时刻表中理论车头时距的相对误差作为表征车头时距稳定性的指标,即
[0065]
s2:公交系统状态迁移识别:基于公交运行状态表征指标连续变化情况,采用非参数贝叶斯方法(bayesian nonparametric approach)建立公交系统状态迁移识别模型,识别不同的公交基本运行模式。
[0066]
s21:构建分层狄利克雷过程—隐半马尔科夫模型(hierarchical dirichlet process-hidden semi-markov model,hdp-hsmm)作为公交系统状态迁移识别模型。
[0067]
s211:利用hdp模型良好的聚类特性和分层共享原理,确定公交基本运行模式的数量,作为无限状态空间的先验知识。
[0068]
s212:利用hsmm模型状态隐含、观测序列可见且状态具有显式持续时间的特性,描述公交运行过程中基本运行模式状态转移的演化机理。
[0069]
s22:训练hdp-hsmm模型参数使得模型能够自适应公交运行状态表征指标的时序特征,以个体公交车为对象,将其公交运行状态表征指标序列划分有限种公交基本运行模式组合。
[0070]
s3:公交基本运行模式语义理解:识别公交运行状态表征指标分布特征,开发阈值划分方法定义语义空间,对上一步中识别的公交基本运行模式进行语义类型归属判定。
[0071]
s31:拟合公交运行状态表征指标分布的概率函数,假设对于同一条线路,大多数车站遵循相同的概率分布。制定了以下步骤来确定概率分布:
[0072]
s311:列出概率分布函数的潜在候选函数。根据公交运行状态表征指标的定义,确定变量的取值范围。潜在的概率分布的定义域必须与变量的取值范围相同。
[0073]
s312:使用公交运行状态表征指标样本,通过统计参数估计方法估计潜在概率分布中涉及的参数。对于所有候选概率分布,使用最大似然估计方法(mle)估计未知参数。
[0074]
s313:对每个候选概率分布分别进行拟合优度检验,从拟合优度测试结果中,确定最合适的概率分布,显著性水平为0.05。
[0075]
s32:公交基本运行模式的语义空间定义从三方面展开,分别为延误时间、车头时距以及发车时间,基于拟合分布结果对各变量进行类别划分。
[0076]
s321:将延误时间分为四个类别,即加速运行、正常运行、轻微延误以及重度延误(accelerated operation,normal operation,light delayed operation,severe delayed operation),考虑不同线路延误时间分布情况,确定分位数组合{q
ao-no
,q
no-ldo
,q
ldo-sdo
}合理划分四种延误时间类别。
[0077]
s322:将车头时距分为五个类别:即串车、串车过渡、正常间隔、大间隔过渡以及大间隔(bus bunching,bunching transition,normal interval,large interval transition,large interval)。考虑到不同线路车头时距分布情况,确定分位数组合{q
bb-bt
,q
bt-ni
,q
ni-lit
,q
lit-li
}合理划分五种车头时距类别。
[0078]
s323:将发车时间分为三个类别:即早高峰时段、晚高峰时段以及非高峰时段(morning peak hours,evening peak hours,off-peak hours),根据公交在各路段的起始时间,判断其所属类别。
[0079]
s324:基于上述特征变量的划分方法,通过组合每个特征变量(即延误时间、车头时距和发车时间)类别可获得60个语义类型(3
×4×
5=60)。
[0080]
s33:基于公交系统状态迁移识别模型划分结果,使用k-means聚类方法将每个公交基本运行模式的延误时间、车头时距以及发车时间聚类为一个点,根据其数据范围对每个公交基本运行模式进行语义类型的归属判定。
[0081]
s4:公交运行特征分析:开发图形化方法表征公交运行状态,采用kullback
–
leibler散度方法对不同公交线路间运行状态进行比较分析。引入打分机制为每个语义类型赋予一个量化等级标记,提出公交运行稳态量化评估方法,建立公交系统运行稳态判别准则。
[0082]
s41:基于公交基本运行模式语义类型归属判定结果,以公交线路为单位构建公交基本运行模式归一化频率分布模型,计算60种语义类型的出现概率,得到不同公交线路的频率分布图以表征其运行状态。
[0083]
s42:针对任意两条公交线路,选择公交基本运行模式的归一化分布作为指标,使用kullback
–
leibler(kl)散度方法,计算两条线路公交运行状态的相似性,以此说明不同线路间运行状态的差异性。
[0084]
s43:基于发车时间、车头时距以及延误时间等变量等级,引入打分机制,确定60种语义类型所造成的失稳严重程度基础得分。分别从公交班次与公交线路层面对公交运行稳态进行评价打分,以此建立公交系统运行稳态判别准则。
[0085]
s431:在公交班次层面,辨识出每班次中公交失稳事件,求得每班次的失稳严重程度得分总和,实现对任意线路任意班次的公交运行状态客观评价。
[0086]
s432:在公交线路层面,将60种语义类型的失稳严重程度得分与对应的归一化频率相乘并求和,即可得到该线路整体失稳程度,以此实现不同线路间运营情况客观评价。
[0087]
如图2所示,作为本发明其中一种实施方式的公交运行状态识别系统的框架图,其描述了实现公交运行状态识别所需的设备和装置。公交车辆运行过程中,上传车辆自动定位数据;数据中心将车辆自动定位数据与相应的城市路网匹配,在服务器处理终端中分别进行公交系统状态迁移识别与公交运行特征分析工作;基于本发明中提出的运行状态识别方法,在同一公交线路不同班次层面与不同公交线路层面,分别实现公交运行稳态量化评估,最终建立公交系统运行稳态判别准则。
[0088]
以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思作出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。
技术特征:
1.一种基于状态识别的公交运行评估方法,其特征在于,所述方法步骤包括:获取车辆定位数据;对所得定位数据进行预处理,并求取公交运行状态表征指标;通过训练好的公交系统状态迁移识别模型将所述公交运行状态表征指标的序列识别为有限种公交基本运行模式的组合;基于定义好的语义类型,对识别的所述公交基本运行模式进行语义类型归属判定;基于语义类型归属判定结果对公交运行状态进行评估;所述公交系统状态迁移识别模型基于hdp-hsmm模型构建,该hdp-hsmm模型的构建与训练具体包括以下步骤:利用hdp模型确定公交基本运行模式的数量,作为无限状态空间的先验知识;利用hsmm模型描述公交运行过程中基本运行模式状态转移的演化机理;训练hdp-hsmm模型参数,使得模型能够自适应学习公交运行状态表征指标的时序特征,以个体公交车为对象,将公交车的公交运行状态表征指标序列划分为有限种公交基本运行模式的组合。2.根据权利要求1所述的一种基于状态识别的公交运行评估方法,其特征在于,所述的数据预处理包括将定位数据按照点到线段距离最短原则匹配到线路地图数据上。3.根据权利要求1所述的一种基于状态识别的公交运行评估方法,其特征在于,所述公交运行状态表征指标包括行程时间可靠性指标和车头时距稳定性指标。4.根据权利要求1所述的一种基于状态识别的公交运行评估方法,其特征在于,所述行程时间可靠性指标包括班次累积延误时间其计算过程包括以下步骤:取任意公交运营线路的历史定位数据,假设某公交线路站点分别为station0,station1,...,station
n-1
,station
n
,其中station0为起点站,station
n
为终点站;从终点站开始,取station
n
与station
n-1
之间行程时间的25%分位数记为station
n
与station
n-1
之间行程的标准时间ts
n-1
;随后,取station
n
与station
n-2
之间行程时间的25%分位数求得与之差,随即得到station
n-1
与station
n-2
之间行程的标准时间ts
n-2
;以此方式依次递归,最后分别得到每段行程的公交运营参考时间ts0,ts1,...,ts
n-2
,ts
n-1
;取任意班次公交车辆定位数据,分别计算其在各段行程中的实际行驶时间t0,t1,...,t
n-2
,t
n-1
,减去其行程所对应的运营参考时间ts0,ts1,...,ts
n-2
,ts
n-1
,即得到该班次公交车在各段行程中的延误时间time
delay,i
=t
i-ts
i
,i=0,1,...,n-1,从起点站逐段累加即得到该班次的累积延误时间所述车头时距稳定性指标包括车头时距,将每个站点相对于发车时刻表中理论车头时距的相对误差作为表征车头时距稳定性的指标,即5.根据权利要求1所述的一种基于状态识别的公交运行评估方法,其特征在于,定义所
述语义类型包括以下步骤:基于线路运营历史数据拟合公交运行状态表征指标的概率分布函数;分别从延误时间、车头时距和发车时间三方面将公交基本运行模式的语义空间展开类别,基于概率分布拟合结果对各展开类别进行划分;组合上述从延误时间、车头时距和发车时间三方面展开的类别,获得公交基本运行模式的语义类型。6.根据权利要求5所述的一种基于状态识别的公交运行评估方法,其特征在于,所述语义空间展开类别,基于概率分布拟合结果对各展开类别进行划分为:将延误时间展开为四个类别,即加速运行、正常运行、轻微延误以及重度延误,根据线路延误时间概率分布情况,确定分位数组合,划分四种延误时间类别;将车头时距展开为五个类别:即串车、串车过渡、正常间隔、大间隔过渡以及大间隔,依据线路车头时距概率分布情况,确定分位数组合,划分五种车头时距类别;将发车时间展开为三个类别:即早高峰时段、晚高峰时段以及非高峰时段,根据公交在各路段的起始时间,划分车辆所属类别。7.根据权利要求1所述的一种基于状态识别的公交运行评估方法,其特征在于,所述对公交基本运行模式进行语义类型归属判定为:使用k-means聚类方法将每个公交基本运行模式的延误时间、车头时距以及发车时间聚类为一个点,将聚类点的数据与语义类型的数据范围匹配,确定每个公交基本运行模式对应的语义类型。8.根据权利要求1所述的一种基于状态识别的公交运行评估方法,其特征在于,所述基于语义类型归属判定结果对公交运行状态进行评估具体包括以下步骤:基于公交基本运行模式语义类型归属判定结果,以公交线路为单位构建公交基本运行模式归一化频率分布模型,计算语义类型的出现概率,得到不同公交线路的频率分布图以表征线路运行状态;对任意两条公交线路,以公交基本运行模式的归一化频率分布作为指标,使用kullback
–
leibler散度方法,计算两条线路公交运行状态的相似性,在公交线路间进行对比分析;基于发车时间、车头时距以及延误时间的变量等级,引入打分机制,确定每种语义类型所造成的失稳严重程度基础得分,分别从公交班次与公交线路层面对公交运行稳态进行评价打分,建立公交系统运行稳态判别准则。9.根据权利要求8所述的一种基于状态识别的公交运行评估方法,其特征在于,所述公交系统运行稳态判别准则为:在公交班次层面,求得每班次的失稳严重程度得分总和,实现对任意线路任意班次的公交运行状态评价;在公交线路层面,将各语义类型的失稳严重程度基础得分与语义类型对应的归一化频率相乘后求和,得到该线路整体失稳程度,对公交线路运营情况进行评价。10.一种用于实施权利要求1-9任一所述的一种基于状态识别的公交运行评估方法的系统,其特征在于,所述系统包括:公交车辆:搭载有定位发射装置,上传车辆自动定位数据;
数据中心:包括存储有城市路网地图和历史数据的数据库和用于运行所述基于状态识别的公交运行评估方法的处理终端。
技术总结
本发明涉及一种基于状态识别的公交运行评估方法和系统,所述方法步骤包括:获取车辆定位数据;对所得定位数据进行预处理,并求取公交运行状态表征指标;通过训练好的公交系统状态迁移识别模型将所述公交运行状态表征指标的序列识别为有限种公交基本运行模式的组合;基于定义好的语义类型,对识别的所述公交基本运行模式进行语义类型归属判定。与现有技术相比,本发明具有不依赖先验知识或专家经验即可确定公交运行状态类别与数量等优点。即可确定公交运行状态类别与数量等优点。即可确定公交运行状态类别与数量等优点。
