基于Seq2Seq自编码器模型的交通事故实时检测与评价

引用本文 [复制中英文]

赵超, 谢天, 辛国容, 吴坚. 基于Seq2Seq自编码器模型的交通事故实时检测与评价[J]. 控制与决策, 2022, 37(8): 2141-2148.

ZHAO Chao, XIE Tian, XIN Guo-rong, WU Jian. Real-time traffic accident detection and evaluation based on Seq2Seq and autoencode model[J]. Control and Decision, 2022, 37(8): 2141-2148. DOI: 10.13195/j.kzyjc.2020.1742.

[复制英文]

基金项目

国家自然科学基金项目(71971135, 71571166)

作者简介

赵超(1990-), 男, 博士生, 从事交通智能管理和决策的研究, E-mail: zhaochao01@stu.shmtu.edu.cn;
谢天(1995-), 男, 硕士生, 从事时间序列预测、异常检测的研究, E-mail: 1226810136@qq.com;
辛国容(1992-), 男, 硕士生, 从事智能交通相关算法的研究, E-mail: xinguorong2013@163.com;
吴坚(1977-), 男, 教授, 博士生导师, 从事社会网络、群决策方法等研究, E-mail: jyajian@163.com。

通讯作者

吴坚, E-mail: jyajian@163.com。

文章历史

收稿日期：2020-12-14
修回日期：2021-06-17

Contents Abstract Full text Figures/Tables PDF

基于Seq2Seq自编码器模型的交通事故实时检测与评价

赵超 ¹, 谢天 ², 辛国容 ³, 吴坚 ¹

1. 上海海事大学经济管理学院，上海 201306;
2. 朗坤智慧科技股份有限公司，南京 211100;
3. 上海电科智能系统股份有限公司，上海 200063

收稿日期：2020-12-14；修回日期：2021-06-17

基金项目：国家自然科学基金项目(71971135, 71571166)。

作者简介：赵超(1990-), 男, 博士生, 从事交通智能管理和决策的研究, E-mail: zhaochao01@stu.shmtu.edu.cn;
谢天(1995-), 男, 硕士生, 从事时间序列预测、异常检测的研究, E-mail: 1226810136@qq.com;
辛国容(1992-), 男, 硕士生, 从事智能交通相关算法的研究, E-mail: xinguorong2013@163.com;
吴坚(1977-), 男, 教授, 博士生导师, 从事社会网络、群决策方法等研究, E-mail: jyajian@163.com。

通讯作者：吴坚, E-mail: jyajian@163.com。

责任编委：龙建成.

摘要：路侧检测设备可以精准获取交通流量和速度等实时数据, 交管部门可以借此显著提升对交通异常状态的感知水平. 通过分析交通状态和交通流数据特征, 建立一套基于交通流序列数据的交通事故实时检测系统和预警流程. 首先, 在交通状态感知方面, 所建立的Seq2Seq自编码模型引入Attention机制, 实现对交通状态重要特征的捕捉; 其次, 在交通状态异常判定方面, 利用Seq2Seq自编码器对输入的原始序列数据进行重构, 对比原始数据可得到结构重构误差, 根据设定的阈值实现交通预警等级的判定和交通事故的实时检测; 最后, 以上海市延安高架的流量和速度数据为基础, 分别确定不同时空状态下的事故判定阈值, 并通过混淆矩阵评价方法论证所提出交通事故实时检测模型的可行性.

关键词：Seq2Seq Attention机制 Bi-LSTM 自解码器交通异常检测实时检测

Real-time traffic accident detection and evaluation based on Seq2Seq and autoencode model

ZHAO Chao ¹, XIE Tian ², XIN Guo-rong ³, WU Jian ¹

1. School of Economics and Management, Shanghai Maritime University, Shanghai 201306, China;
2. Luculent Smart Technologies Co., Ltd, Nanjing 211100, China;
3. Shanghai SEARI Intelligent System Co., Ltd, Shanghai 200063, China

Abstract: Roadside monitoring equipments can obtain traffic flow and speed real-time data more accurately, so that traffic management departments can significantly improve the perception of traffic anomalies. By analyzing the characteristics of traffic state and traffic flow data, this paper establishes a set of real-time traffic accident detection system and early warning process based on traffic flow sequence data. First of all, in terms of traffic state perception, this paper introduces the Attention mechanism to capture important traffic condition features based on the Seq2Seq model. Secondly, in terms of anomaly detection of traffic condition, the auto-encoder is used to realize the reconstruction of input sequence data, and the structural reconstruction error is obtained by comparing the original data, and then the real-time detection of traffic accidents and the classification of accident warning levels are realized according to the set threshold. Finally, based on the traffic and speed data of the Shanghai Yan'an elevated road, the thresholds for evaluating traffic accidents in different time and space conditions are determined respectively, and the feasibility of the real-time traffic accident detection model is demonstrated by the confusion matrix evaluation method.

Keywords: Seq2Seq Attention mechanism Bi-LSTM auto-encoder traffic anomaly detection real-time detection

0 引言

随着智能交通系统(intelligent transportation system, ITS)的迅猛发展, 交通管理部门通过各种检测设备实时获取交通流量、速度以及密度等数据, 可以显著提高对交通状态的感知程度, 为交通事故的预警、事故的检测以及事故的处理提供更全面的支持. 影响交通事故发生的因素很多, 与交通相关的人、车、路以及环境均会直接影响交通事故的发生率. 从现有的检测设备中可以直接获取并且能够表征交通状态的数据一般以交通流量(断面流量和车道流量)和车辆瞬时速度为主. Chakraborty等^[1]提出了一种数据驱动的AID (automatic incident detection)框架, 利用大规模交通历史数据以及交通网络的固有拓扑获得可靠的交通模式. 很多学者致力于交通模型的开发, 主要用于预测不同程度事故发生的可能性, 并利用从检测站收集的交通数据进行实时事故风险预测. Kwak等^[2]针对高速公路不同路段类型和交通流状态构建了实时事故风险预测模型. 综合过往的研究, 交通事故风险预测模型可以大致分为两类, 即基于统计学理论的模型和机器学习模型.

1) 基于统计学理论的模型. Abdel-Aty等^[3]提出了匹配案例对照逻辑回归模型. Xu等^[4]提出了二进制logit模型论证交通事故问题, 将不同程度的撞车发生的可能性与从检测器数据中得到的各种交通流特征建立关系. 陈玉飞等^[5]采用灰色关联度分析方法研究了静态交通事故预测. 李蓉等^[6]研究了基于超越对数函数的道路交通事故频数预测方法, 其拟合方式无需考虑交通流的实时特征. 整体而言, 以往的实时事故风险评估研究主要采用logistic回归统计模型, 这类模型具有线性函数形式的缺点. 另外, 从统计学角度而言, 此类算法对交通数据获取的上下游关系的要求更高. 现有道路断面的流量和速度等检测数据一般通过埋设的感应线圈直接获取, 但现有的感应线圈布设密度不均、不高, 且数据采集时间间隔相对较长, 难以保证宏观交通流状态的精准捕捉. 因此, 数据本身的关联性较弱, 可以利用单点的感应线圈的序列数据并借助深度学习的方法获取更深刻的交通特征.

2) 机器学习模型. Yu等^[7]提出了一种支持向量机(SVM)统计学习模型评估实时事故风险. Parsa等^[8]比较了不同机器学习模型支持向量机(SVM)的性能. Xiao^[9]提出了一种集成学习方法提高交通事件检测的鲁棒性. Wang等^[10]利用交通、几何、社会人口统计学和出行预测因子分析了高速公路匝道的实时事故风险. Oh等^[11]提出了一种由概率神经网络构成的贝叶斯建模方法(PNN), 以识别导致潜在事故发生的危险交通状况. El等^[12]提出了一种新颖的基于模糊深度学习的TID方法, 该方法考虑并分析了交通流的时空相关性. 文献[11, 13-17]利用贝叶斯随机效应逻辑回归模型, 解决未观察到的问题与事故之间的异质性. Sun等^[15]提出了时序交通数据的动态贝叶斯网络(DBN)模型, 研究事故发生与动态速度状况数据之间的关系. 另外, Zhan等^[18]利用M5P树算法进行车道净空时间预测. Lin等^[19]提出了一种基于频繁模式树(FP tree)的变量选择方法, 论证了基于FP树的事故风险预测模型的结果优于基于随机森林的模型. 殷洪峰等^[20]建立了自编码网络和Softmax分类器, 实现了交通流特征的挖掘. 在机器学习模型方面, 通常容易出现过拟合的问题. 传统文献在构建事故实时检测模型时更多地将其视为机器学习中的分类问题, 若无事故风险, 则设置标签为0;若有事故风险, 则设置标签为1. 但现实情况下发生交通事故数据远远小于正常交通状态数据, 两种样本标签数量非常不平衡. 因此, 这样建立的模型往往不具有可靠性和真实性, 得到的结果存在预测精度低的问题. 此外, 有部分研究即便能够得到不错的交通事故检测效果, 但是, 其检测不具有实时性, 实际应用性较差.

交通流理论中的交通波和瓶颈理论在交通影响评价中有非常重要的作用, 且能够表征事故发生后交通流异常的宏观特征. 在交通流理论的应用上, 交通波和瓶颈理论同样需要明确交通上下游的交互关系, 但现实存在以下问题: 1)现有感应线圈的布设密度不高, 且布设距离也不尽相同; 另外, 相邻线圈之间一般会设定上下匝道, 交通需求的动态变化限制了交通流理论在交通事故实时检测的应用. 2)数据采集时间间隔较长, 难以保证宏观交通流状态的精准捕捉和交通波的特征传递.

已有文献研究了交通事故与交通状态之间的关系, 分别分析了交通事故发生前后的交通特征. 但是, 现有的数据异常检测算法存在挖掘较多假性异常点以及遗漏较多真实异常点的缺陷, 并不适用于交通事故预警和检测的时序数据. 自编码器具有一般意义上表征学习算法的功能, 应用于维度更改和异常值检测. 自编码器能够有效提取和学习输入数据的内在表征与潜在数据分布, 基于此再重构输入的原始数据. 鉴于此, 本文利用自解码器提取速度和流量的原始列特征, 自动学习正常交通状态下流量和速度间的内在关系, 这样有助于提取重要的交通信息并捕捉交通异常下的波动或其他特性. 建立一套Seq2Seq自编码器深度学习模型, 分别确定不同时空状态下的重构窗口和输入窗口的结构误差, 利用统计学显著性分析分别确定交通事故的判别阈值, 确定事故前后的异常交通状态并实现交通事故的预警和检测.

1 Seq2Seq-Attention异常检测模型 1.1 交通事故预警的过程设计

本文研究的基本目标是提出一种基于深度学习的交通事故预警和检测方法, 能够识别交通事故发生前后的状态特征. 具体而言, 该检测算法的核心是通过编码器提取正常交通状态数据在高维度上的抽象潜在特征, 并根据此特征向量重构对应输入的交通状态数据. 输入的交通状态数据的重构会出现两种结果:

1) 正常交通状态的数据输入. 训练好的模型对此类输入的数据具有较强的重构能力, 因此, 重构窗口与输入窗口大概率不会存在显著的结构差异.

2) 异常交通状态的数据输入. 训练好的模型对此类输入数据有较差的重构能力, 因此, 会与输入交通流数据窗口存在较大差异, 这些差异将直接反映出输入的序列数据背后的交通状态的异常.

Seq2Seq自编码器用于异常检测, 本质上是输入窗口到获得重构窗口的预测过程, 具体流程如图 1所示.

图 1 交通事故预警设计流程

图 1实现的算法如下.

step 1:利用嵌入双向长短期记忆Bi-LSTM的Seq2Seq模型直接提取原始的交通流量和速度序列数据;

step 2:通过双层双向Bi-LSTM编码器将某时刻窗口$ W $中所有序列的特征向量编码成固定大小的语义向量$ C $;

step 3:取编码器反向LSTM最终隐含层状态$ H $的非线性作为解码器的初态;

step 4:双层双向递归Bi-LSTM解码器通过中间注意力层的调节不断生成动态的语义向量$ C_{i} $;

step 5:解码器利用解码器初态、$ C_{i} $和$ s_{i} $每个时刻点递归生成原窗口中的连续特征序列, 从而得到预测的重构窗口$ W^{\prime} $;

step 6:计算各时刻检测窗口与重构窗口的总均方误差MSE;

step 7:确定阈值, 判断交通状态是否处于异常状态.

对于交通事故实时的预警, 需要完成两方面的工作: 1)序列下的连续交通流的特征获取; 2)异常点的交通异常识别模型.

1.2 Seq2Seq-Attention异常点检测模型

异常点检测采用的是结合Seq2Seq的自编码器(autoencoder)模型框架, Seq2Seq最早的工作由Cho等^[21]和Sutskever等^[22]完成. 自编码器是神经网络的一种, 经过训练后能够尝试将输入数据降维并应用于输出. 但是, 为了使之能够学习到有效的特征, 通过强加一些约束, 使自编码器只能近似地复制, 从而能够学习到数据的有用特性并达到数据降维的效果. 自编码网络原理如图 2所示.

图 2 Seq2Seq自编码器网络结构

1.2.1 Seq2Seq自编码器

对比传统的全连接层MLP网络的自编码器, Seq2Seq自编码器模型网络参数更少. 此外, 该模型还实现了不定长序列输入到不定长序列的生成, 具有捕捉序列间关系信息的强大能力. 另外, Seq2Seq本身的编码器和解码器需要以某个神经网络为基础, 如CNN、LSTM等. 考虑交通事故前后的交通状态具有典型的前后时间序列性, 所提出模型的神经网络选用Bi-LSTM网络. 这种组合可以学习任意一个时间点前后的序列信息, 并实现动态交通流特征的挖掘.

Seq2Seq由编码层、语义向量和解码层3部分组合而成. 由于网络的输入和输出结构相同, 为了提高网络重构窗口的能力和拟合效果, 可以将输出设为检测窗口的反向序列. Seq2Seq解码器在解码时每一个时刻生成的序列与其前一时刻高度相关, 同时, 模型要生成反向的输入窗口难于生成正向. 这种情况下, 如果输入一个交通异常窗口, Seq2Seq解码器将难以识别异常数据特征并造成生成的序列误差越来越大. 另外, 本文引入了Bahdanau注意力机制增强网络的记忆能力, 更好地获取长序列的重要信息. Seq2Seq自编码器的数据输入-模型拟合-重构过程如图 3所示.

图 3 Seq2Seq自编码器的数据输入-模型拟合-重构过程

1.2.2 网络输入特征矩阵

为满足深度学习中循环神经网络的网络输入形式, 需要构建滑动窗口并重构路段上交通流的特征矩阵: 将原数据形式重构为三维, 定义每个时刻点的前20 min数据作为该时刻的窗口特征矩阵, $ L $为每个窗口的长度, 设定步长$ s = 1 $, 以保证时刻窗口的时间连续性并以滑动窗口的形式依次构造.

1.2.3 编码阶段

在编码阶段, 定义在每一个时间$ i $能够获取双向的隐含变量. 采用Bahdanau等^[23]改进的Bi-LSTM模型, 结合连续输入的窗口序列$ x_{i} $以及上一步隐藏状态$ h_{i-1} $, 有

$ \begin{align} [\stackrel{\rightarrow }{h}_{i}, \stackrel{\leftarrow}{h}_{i}]=h_{i}=\mathrm{Bi}-\mathrm{LSTM}_{\rm {Encoder }}(x_{i}, h_{i-1}). \end{align} $

(1)

由此可以输出得到交通流在正反时间的隐层状态$ \sum h_{i}(i=1, 2, \ldots, T_{x}) $, 最后得到一个包含路段交通流量和速度时空变化特征的初始语义向量$ C_{0} $.

1.2.4 Attention下的动态语义向量

在交通流特性分析中, 交通的影响以波的形式在时空传播, 因此, 事故前后应该具备较为明显的不稳定交通流. 在交通状态异常的情况下, 确定语义向量应该考虑每个步长下的交通关键特征. 参考文献[23]在Seq2Seq模型中内嵌注意力(Attention)机制, 目标是从原始的交通信息的序列窗口中提取关键序列, 最终实现对交通流重要特征变化的捕捉, 并以每个时间步长$ i $的动态语义向量$ C_{i} $的形式反映出来. 有

$ \begin{align} &C_{i}=\sum\limits_{i=1}^{t_{x}} \alpha_{i j} h_{i}, \end{align} $

(2)

$ \alpha_{i j}=\frac{\exp (e_{i j})}{ \sum\limits_{k=1}^{t_{x}} \exp (e_{i k})}, $

(3)

$ e_{i j}=V \times \tanh (W \times h_{t}+U \times s_{t-1}+b). $

(4)

其中: $ C_{i} $为Attention机制下各时间步长$ i $的动态语义向量, $ \alpha_{i j} $为隐藏层的权重系数, $ h_{i} $为编码层在响应时刻的隐藏状态, $ e_{ij} $为输出序列隐藏层$ i $对输入序列隐藏层$ j $的相关系数, $ i $取值为$ 1, 2, \ldots, t_{x} $, $ W $、$ U $、$ b $为模型待训练参数, $ s $为解码层隐藏状态.

1.2.5 解码阶段

在解码阶段, 解码层的输出关系^[21]变为

$ s_{t}=f(\hat{{x}}_{t-1}, s_{t-1}, C), $

(5)

$\hat{{x}}_{t}=g(y_{t-1}, s_{i}, C). $

(6)

其中: $ s_{t} $为解码层$ t $时刻的隐藏状态, $ \hat{x}_{t} $为解码层$ t $时刻的输出值.

1.3 指标异常识别模型

将Seq2Seq自编码网络应用于交通状态异常的检测, 其判别依据是原窗口与重构窗口的结构误差是否达到设定的阈值. 在编码器部分, 将连续的交通流序列依次编码, 输入序列为$ X = \{x_{1}, x_{2}, \ldots, x_{t-1}, x_{t}\} $, 解码器的输出序列为$ \hat{X} = \{\hat{x}_{t}, \hat{x}_{t-1} , \ldots, \hat{x}_{2}, \hat{x}_{1}\} $. 基于Seq2Seq的交通异常识别模型如图 4所示.

图 4 基于Seq2Seq的交通异常识别模型

将总均方误差MSE(mean squared error, MSE)作为重构误差, 有

$ \begin{align} {\rm MSE}=\frac{1}{T_{1}-T_{0}} \sum\limits_{t=T_{0}}^{T_{1}}({X_{t}}-\hat{{X_{t}}})^{2}. \end{align} $

(7)

其中: $ T=T_{1}-T_{0} $为预测时间区间, $ \hat{X_{t}} $为$ t $时刻的预测值, $ X_{t} $为$ t $时刻的真实值.

正常与异常交通状态下的特征显著不同, 因此, 二者的权重分布不同, 即注意力机制提取的正常交通状态特征权重分布为代表性特征, 异常交通状态特征权重分布为非代表性特征. 对于输入的异常交通序列数据, 模型的重构误差MSE相对更大. 若超过判定阈值, 则模型将识别该时刻窗口为异常窗口, 预示着交通状态可能存在异常, 从而更有效地实现异常交通状态检测目的.

2 算例与结果分析

上海延安高架路是一条东西走向的主干高架快速路, 全长13 km, 3段建设横穿市区且以双向6车道为主, 设计时速为80 km /h. 东向西方向上设置了5个上匝道, 8个下匝道, 西向东方向上设置了6个上匝道和7个下匝道.

2.1 数据的准备

本文采用上海市延安高架的数据集, 数据的时间标签为2018年08月26日00时2018年09月08日24时. 数据1为延安高架发布段交通事故数据, 主要包含延安高架两周内发生的94起交通事故统计, 数据包括事故的开始时间、事故结束时间、事故所在路段代码、位置描述、高架道路名称以及事故描述. 数据2为延安高架发布段流量速度数据, 包含延安高架38条路段和2条延安东路隧道段两周401 906条数据. 另外, 考虑数据的特征不同, 将以上数据划分为正常交通状态数据集和异常交通状态集. 经统计, 延安高架南北两侧的事故发生率和事发时段存在显著差异. 根据时空特征将正常数据集拆分为8个数据子集, 并确定相应的训练集, 具体如表 1所示.

表 1 延安高架南北侧不同时段的阈值等级划分

通过分析现有的交通数据特征确定研究的变量或间接变量, 如车辆的流量、速度、速度变化、速度的方差等. 对于事故的定义, 可以在数据集中定义0和1对应无事故和事故.

所构建的交通异常检测的Seq2Seq自编码器模型采用Tensorflow 1.9框架实现, 实验操作的硬件环境为Intel Core i7-6700 HQ CPU@2.60 GHz, 借助GPU加速学习过程. 实验中, 为寻求最佳事故检测效果, 通过观察模型在训练阶段输入不同交通流序列长度$ L $的检测窗口所得到的模型泛化能力差异, 确定窗口的最优序列长度为10;模型结构设置编码器为2层Bi-LSTM网络, 解码器为2层Bi-LSTM网络, 由贝叶斯优化搜索得到网络最佳超参数: Epochs为1 000, 编-解码器神经元节点数为50, 样本批量64, 学习率为0.001, 权重衰减值为$ 10^{-5} $. 同时, 为防止模型训练出现过拟合问题, 引入了Dropout层. 此外, 模型选择Adam优化器, 均方误差MSE为训练损失函数, 以召回率Recall、误报率FRR作为事故实时检测效果的评价指标。

2.2 交通事故阈值设定

根据统计学的基本原理, 异常数据往往出现在随机模型的低概率分布区域, 即属于离群点的概率较大. 考虑交通出现异常波并不一定是由交通事故引起的, 所以需要根据测试结果确定其阈值标准. 借助3$ \sigma $准则的统计学思想, 定义在训练阶段将超过各时刻窗口误差的90 %、95 %、99 %分位点分别作为测试阶段的交通事故判定阈值. 一旦测试集输入某检测窗口得到的重建误差超过此标准, 则视为可能有事故发生的潜在风险, 该窗口称为异常窗口. 具体不同事故风险等级的阈值标准如下: 1)正常, 无事故风险: 小于验证集重建误差的90 %分位点; 2)三级事故预警点: 大于验证集重建误差的90 %分位点, 小于验证集重建误差的95 %分位点; 3)二级事故预警点: 大于验证集重建误差的95 %分位点, 小于验证集重建误差的99 %分位点; 4)一级事故预警点: 大于验证集重建误差的99 %分位点.

阈值的确定综合考虑了整个正常交通流状态(包括速度、流量等), 经5次交叉验证得到平均重构误差阈值结果. 此外, 由于模型的重构误差结果近似正态分布, 符合拉伊达准则使用条件. 基于此, 分别对延安高架南北侧、4个不同时间段进行事故阈值的设定. 表 1为训练模型通过100个Epochs最终标定的窗口误差阈值.

2.3 模型结果验证

利用前文提到的Seq2Seq自编解码网络, 对延安高架各路段、各时刻可能发生的事故进行实时预警和检测. 为验证异常检测模型的有效性, 将原数据两周内所有两/多车事故发生前后1个小时的样本数据代入训练好的模型进行测试. 图 5~图 8为不同时段发生交通事故的预警和检测结果曲线.

图 5 窗口最后时刻-早高峰

图 6 窗口最后时刻-白天平峰

图 7 窗口最后时刻-晚高峰

图 8 窗口最后时刻-晚间平峰

交通异常的检测可用于交通状态异常的预警, 在不稳定交通流状态下, 交通的异常可能会诱增交通事故的发生. 另外, 在事故消散阶段, 交通流同样处于异常状态. 交通消散阶段会存在较多的不稳定交通流且存在较高的二次事故风险, 因此, 在消散阶段也会存在较为明显的交通异常. 图 5和图 7为早高峰和晚高峰段发生的两车事故, 图 5事故发生前路段的断面流量较大, 平均车速较小. 检测模型在事故发生前20 min内便能够准确地识别交通流的不稳定状态, 预警状态处于二级、三级范围内; 图 7事故较为典型, 此时路段较顺畅, 事故发生时交通状态趋势并不明显. 事故只持续了2 min, 虽然模型并未捕捉到事故的具体发生时刻, 但是, 事故发生前短时间内模型有效地检测到了连续的异常窗口, 且事故风险偏高.

图 6和图 8为白天平峰和晚平峰段的交通事故, 其中图 6为两车事故, 图 8为多车事故, 事故持续时间长, 属于较严重的交通事故. 图 6反映了即时出现的交通事故, 事故前交通状态一直处于正常的范围之内, 直至事故突然发生, 检测模型能够迅速地检测出交通异常并启动相应级别的预警. 多车事故(图 8)发生前45 min段, 模型检测到大部分时刻的窗口误差超过设定的三级预警阈值, 直至事故发生引发窗口误差超过一级预警阈值.

另外, 对比图 5~图 8中各个路段方差波的异常状态发生时刻和事故统计时刻可见, 交管部门得到的部分事故报警信息要滞后. 从另外一个角度而言, 根据事故发生和交管部门获取到的情报, 可能会出现以下两种情况:

1) 交通事故发生并记录在案. 事故双方在协商不定后采取被动报警, 这种情况交管部门事后获取到的交通情报滞后于事发时刻.

2) 交通事故发生, 但未记录在案. 交通异常检测系统可能会认定在该时刻发生了交通事故, 但现有的统计并未将此界定为交通事故, 因此会认定为误警.

2.4 混淆矩阵评价

对事故的检测是Seq2Seq自编解码模型的推广, 同样需要对比原检测窗口与预测窗口的结构误差. 若某时刻的窗口总误差大于该时段所标定的预警等级阈值, 则该时刻的预测标签为1 (异常), 否则为0 (正常).

传统的二分类模型一般直接对正常或异常事故数据进行0-1标签的分类预测, 而本文采用的是回归预测, 即利用Seq2Seq自编解码网络比较原检测窗口与预测窗口的结构误差, 继而实现对交通事故的实时检测. 为验证该模型的事故检测效果并衡量模型的泛化能力, 采用分类指标中标准的混淆矩阵作为评价方式.

由混淆矩阵可得, 延安高架北侧的事故样本数据召回率为72.7 %, 事故误报率(假阳率FPR)为21.1 %, 南侧的事故样本数据召回率为76.4 %, 事故误报率为22.8 %. 对比表 2中以往的交通事故实时预警指标, 本文效果在敏感性和误警控制中表现良好.

表 2 以往研究的检测能力对比

大量的文献对象是高速公路这类封闭性较强(物理隔离)的道路, 其他低等级道路不会直接引发其交通异常. 高架道路虽然封闭性较强, 但在早晚高峰时段, 上下匝道可能会诱发连续交织或交通溢出的问题, 并可能直接影响高架主路的交通状态. 另外, 从事故的显著性而言, 高架道路的运行速度相对高速公路较低, 事故严重程度和交通影响较小. 高速公路的交通事故相对严重, 事故处理时间较长且交通影响较大, 比如车辆运行速度变化更显著. 因此, 高架道路的事故特征相对于高速公路显著性差一些, 高架道路的数据噪音相对更大, 检测难度也更大.

3 结论

本文提出了一套基于Seq2Seq自编码器的交通事故实时检测模型, 用于捕捉并判别交通事故事发前后的交通异常状态. 首先, 利用Seq2Seq深度学习的特征学习以及信息记忆能力获取正常交通流的特征, 为了提取系列交通信息序列中的关键序列窗口和特征, 在Seq2Seq模型中内嵌了Attention注意力机制; 其次, 在交通异常识别部分, 利用Seq2Seq自编码器生成输入的数据窗口的重建窗口, 判断原检测窗口与重构窗口的结构相似性程度, 以决策交通状态的异常预警和事故检测; 最后, 通过研究两周的数据, 论证了模型运算流程的可实现性.

深度学习的黑盒子算法对交通流异常检测的解释性较差. 若交通检测设备获取的数据质量更高、关联性更强, 且能够优化上下游的交通波传递, 则可以利用交通流原理提取新的指标作为深度学习的输入变量并提高深度学习在交通事故检测中的可解释性. 本文在案例中将正常数据按照时空进行分类, 未来可以考虑更多因素, 如天气和季节等. 基于此, 将数据集再度划分并分别训练得到权重和事故判定阈值. 另外, 可以考虑在后续研究中增加个性化的判别器, 以服务阈值的精准设定和动态调整, 从而进一步提高模型对交通事故的实时检测水平.

参考文献

[1]	Chakraborty P, Hegde C, Sharma A. Data-driven parallelizable traffic incident detection using spatio-temporally denoised robust thresholds[J]. Transportation Research—Part C: Emerging Technologies, 2019, 105: 81-99. DOI:10.1016/j.trc.2019.05.034
[2]	Kwak H C, Kho S. Predicting crash risk and identifying crash precursors on Korean expressways using loop detector data[J]. Accident Analysis Prevention, 2016, 88: 9-19. DOI:10.1016/j.aap.2015.12.004
[3]	Abdel-Aty M, Uddin N, Pande A, et al. Predicting freeway crashes from loop detector data by matched case-control logistic regression[J]. Board, Journal of the Transportation Research, 2004, 1897(1): 88-95. DOI:10.3141/1897-12
[4]	Xu C C, Tarko A P, Wang W, et al. Predicting crash likelihood and severity on freeways with real-time loop detector data[J]. Accident Analysis & Prevention, 2013, 57: 30-39.
[5]	陈玉飞, 魏思怡, 张林. 基于GM (1, $N$)的道路交通事故预测模型[J]. 华北理工大学学报: 自然科学版, 2020, 42(1): 47-50. (Chen Y F, Wei S Y, Zhang L. Forecast model for road traffic accidents based on GM (1, $N$) model[J]. Journal of North China University of Science and Technology: Natural Science Edition, 2020, 42(1): 47-50. DOI:10.3969/j.issn.2095-2708.2020.01.047)
[6]	李蓉, 刘湘, 刘坚. 基于超越对数函数的道路交通事故频数预测[J]. 湖南大学学报: 自然科学版, 2013, 40(4): 49-54. (Li R, Liu X, Liu J. Research on traffic accident frequency predicition based on translog production function[J]. Journal of Hunan University: Natural Science, 2013, 40(4): 49-54. DOI:10.3969/j.issn.1674-2974.2013.04.008)
[7]	Yu R J, Abdel-Aty M. Utilizing support vector machine in real-time crash risk evaluation[J]. Accident Analysis & Prevention, 2013, 51: 252-259.
[8]	Parsa A B, Taghipour H, Derrible S, et al. Real-time accident detection: Coping with imbalanced data[J]. Accident Analysis & Prevention, 2019, 129: 202-210.
[9]	Xiao J L. SVM and KNN ensemble learning for traffic incident detection[J]. Physica A: Statistical Mechanics and Its Applications, 2019, 517: 29-35. DOI:10.1016/j.physa.2018.10.060
[10]	Wang L, Abdel-Aty M, Lee J, et al. Analysis of real-time crash risk for expressway ramps using traffic, geometric, trip generation, and socio-demographic predictors[J]. Accident Analysis & Prevention, 2019, 122: 378-384.
[11]	Oh C, Oh J S, Ritchie S G. Real-time hazardous traffic condition warning system: Framework and evaluation[J]. IEEE Transactions on Intelligent Transportation Systems, 2005, 6(3): 265-272. DOI:10.1109/TITS.2005.853693
[12]	El Hatri C, Boumhidi J. Fuzzy deep learning based urban traffic incident detection[J]. Cognitive Systems Research, 2018, 50: 206-213. DOI:10.1016/j.cogsys.2017.12.002
[13]	Ahmed M M, Abdel-Aty M, Yu R J. Assessment of interaction of crash occurrence, mountainous freeway geometry, real-time weather, and traffic data[J]. Journal of the Transportation Research Board, 2012, 2280(1): 51-59. DOI:10.3141/2280-06
[14]	Hossain M, Muromachi Y. A Bayesian network based framework for real-time crash prediction on the basic freeway segments of urban expressways[J]. Accident Analysis & Prevention, 2012, 45: 373-381.
[15]	Sun J, Sun J. A dynamic Bayesian network model for real-time crash prediction using traffic speed conditions data[J]. Transportation Research—Part C: Emerging Technologies, 2015, 54: 176-186. DOI:10.1016/j.trc.2015.03.006
[16]	Shi Q, Abdel-Aty M, Yu R J. Multi-level Bayesian safety analysis with unprocessed automatic vehicle identification data for an urban expressway[J]. Accident Analysis & Prevention, 2016, 88: 68-76.
[17]	Yu R J, Wang X S, Yang K, et al. Crash risk analysis for Shanghai urban expressways: A Bayesian semi-parametric modeling approach[J]. Accident Analysis & Prevention, 2016, 95: 495-502.
[18]	Zhan C J, Gan A, Hadi M. Prediction of lane clearance time of freeway incidents using the M5P tree algorithm[J]. IEEE Transactions on Intelligent Transportation Systems, 2011, 12(4): 1549-1557. DOI:10.1109/TITS.2011.2161634
[19]	Lin L, Wang Q, Sadek A W. A novel variable selection method based on frequent pattern tree for real-time traffic accident risk prediction[J]. Transportation Research Part C: Emerging Technologies, 2015, 55: 444-459. DOI:10.1016/j.trc.2015.03.015
[20]	殷洪峰, 周伟健. 深度学习在江苏省高速公路交通事故预测中的应用[J]. 中国交通信息化, 2020(2): 125-129. (Yin H F, Zhou W J. Application of deep learning in prediction of highway traffic accidents in Jiangsu province[J]. China ITS Journal, 2020(2): 125-129.)
[21]	Cho K, Van Merrienboer B, Gulcehre C, et al. Learning phrase representations using RNN encoder-decoder for statistical machine translation[J/OL]. 2014, arXiv: 1406.1078.
[22]	Sutskever I, Vinyals O, Le Q V. Sequence to sequence learning with neural networks[J/OL]. 2014, arXiv: 1409.3215.
[23]	Bahdanau D, Cho K, Bengio Y. Neural machine translation by jointly learning to align and translate[J/OL]. 2014, arXiv: 1409.0473.
[24]	Pande A, Abdel-Aty M. Assessment of freeway traffic parameters leading to lane-change related collisions[J]. Accident Analysis Prevention, 2006, 38(5): 936-948. DOI:10.1016/j.aap.2006.03.004
[25]	Abdel-Aty M, Pande A, Das A, et al. Assessing safety on Dutch freeways with data from infrastructure-based intelligent transportation systems[J]. Journal of the Transportation Research Board, 2008, 2083(1): 153-161. DOI:10.3141/2083-18
[26]	Hossain M, Muromachi Y. A Bayesian network based framework for real-time crash prediction on the basic freeway segments of urban expressways[J]. Accident Analysis & Prevention, 2012, 45: 373-381.
[27]	Ahmed M M, Abdel-Aty M A. The viability of using automatic vehicle identification data for real-time crash prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2011, 13(2): 459-468.
[28]	Lin L, Wang Q, Sadek A W. A novel variable selection method based on frequent pattern tree for real-time traffic accident risk prediction[J]. Transportation Research—Part C: Emerging Technologies, 2015, 55: 444-459. DOI:10.1016/j.trc.2015.03.015
[29]	Sun J, Sun J. A dynamic Bayesian network model for real-time crash prediction using traffic speed conditions data[J]. Transportation Research—Part C: Emerging Technologies, 2015, 54: 176-186. DOI:10.1016/j.trc.2015.03.006
[30]	Basso F, Basso L J, Bravo F, et al. Real-time crash prediction in an urban expressway using disaggregated data[J]. Transportation Research—Part C: Emerging Technologies, 2018, 86: 202-219. DOI:10.1016/j.trc.2017.11.014
[31]	Parsa A B, Taghipour H, Derrible S, et al. Real-time accident detection: Coping with imbalanced data[J]. Accident Analysis & Prevention, 2019, 129: 202-210.