交通违法行为多维时空关联规则挖掘研究——以广州市为例
代兴龙(1999—),男,贵州毕节人,硕士研究生,主要从事地理信息系统理论与方法研究。E-mail:daixlong27@163.com |
收稿日期: 2024-01-20
修回日期: 2024-03-01
网络出版日期: 2024-12-13
Research on Spatio-Temporal Association Rules Mining of Traffic Violations: A Case Study of Guangzhou City
Received date: 2024-01-20
Revised date: 2024-03-01
Online published: 2024-12-13
探究道路违法事件背后的潜在规律,一方面可以从源头减少危险驾驶行为,维护社会和谐稳定;另一方面可以更好地适应城市交通的高效率、高质量发展,提升交通治理精细化水平。因此,对城市内的交通违法行为开展热点探测与影响因素分析,是准确认知交通违法态势与规律的重要前提。本研究以广州2015年10月的交通违法数据为例,进行不同类别的交通违法行为时空热点分析与关联规则挖掘,基于FP-Growth算法挖掘交通违法行为数据中的违法行为种类、发生时间、空间位置和车辆信息等的关联关系,发现本地大型汽车更易发生无环保标识和违规使用车道的行为,外地小型汽车则更多发生超速行为;工作日早晚高峰与发生违反禁令标志行为存在较强关联,而非工作日则与高速公路上的交通违法行为存在较强关联。通过将POI数据及空间位置信息引入关联关系挖掘,能够较准确地识别特定路段或公共设施附近的高发违法行为,为定点交通治理提供支持。
关键词: 交通违法行为; 关联规则; FP-Growth算法; 兴趣点; 广州市
代兴龙 , 马林兵 , 胡靖元 . 交通违法行为多维时空关联规则挖掘研究——以广州市为例[J]. 华南地理学报, 2024 , 2(2) : 11 -19 . DOI: 10.20125/j.2097-2245.202402002
Exploring the underlying laws behind road illegal incidents can reduce dangerous driving behaviors at the source and maintain social harmony and stability. It can also help the development of urban traffic with high efficiency and high quality, and improve the level of refined traffic governance. Therefore, the analysis of influencing factors of traffic violations in cities is an important prerequisite of accurate analysis of the laws of traffic violations. In this study. The authors took traffic violation data of Guangzhou in October 2015 as an example, and the association rule mining(ARM) of traffic violations and various influencing factors was carried out. Based on the FP-Growth algorithm, this paper excavates the relationship between the types of illegal activities, the time of occurrence, the spatial location and the information of the vehicles in the traffic violation data. It is found that large vehicles of local city are more likely to have no environmental protection signs and illegal use of lanes. Cars from other cities are more likely to overspeed; morning and evening peaks on working days are strongly related to violations of prohibition signs, while traffic violations on highways are more likely to occur on weekends. By introducing POI data and spatial location information, this article can more accurately identify high-incidence traffic violations near specific road sections or public facilities, and provide support for fixed-point traffic governance.
Key words: traffic violation; association rules; FP-Growth algorithms; POI; Guangzhou
表1 广州市交通违法数据属性Tab.1 Guangzhou traffic violation data attributes |
字段 | 数据 | 描述 |
---|---|---|
违法编号 | 44 011*** | 违法行为的唯一编号 |
号牌号码 | 粤A*** | 车牌所在地 |
违法日期 | 2015/10/1 | 日期描述(年/月/日) |
违法时间 | 14:39:18 | - |
违法地址 | 广州大道*** | 行为发生地址 |
违法行为 | 1 345 | 违反禁止标线指示 |
天气状况 | 晴 | 当日天气 |
温度等级 | 22 ℃ | 当日温度 |
号牌种类 | 02 | 01为大型汽车,02为小型汽车,03为其他车辆 |
表2 交通违法数据字段分类编码Tab.2 Traffic violation data field classification code |
序号 | 字段 | 内容描述 | 所占比例/% | 字段类别 |
---|---|---|---|---|
1 | 违法日期 | D1=工作日 | 61.28 | 时间信息 |
D2=非工作日 | 48.72 | |||
2 | 违法时间 | T1=上午[6∶00~11∶00) | 30.76 | 时间信息 |
T2=中午[11∶00~14∶00) | 20.71 | |||
T3=下午[14∶00~17∶00) | 31.53 | |||
T4=傍晚[17∶00~22∶00) | 10.87 | |||
T5=深夜[22∶00~6∶00) | 6.13 | |||
3 | 天气 | W1=晴 | 30.82 | 时间信息 |
W2=多云 | 52.92 | |||
W3=阴 | 3.49 | |||
W4=雨 | 12.77 | |||
4 | 违法地址 | A1=番禺区大石街段,……A3218=作新桥路口 | -- | 空间信息 |
5 | 违法种类 | I1=违反规定临时停车……I45=超速10%以下 | -- | 事件类型 |
6 | 车辆类型 | C1=大型汽车 | 7.72 | 车辆信息 |
C2=小型汽车 | 91.84 | |||
C3=其他车辆 | 0.44 | |||
7 | 车牌种类 | P1=本地车辆 | 90.39 | 车辆信息 |
P2=非本地车辆 | 9.71 |
表3 广州市交通违法数据属性Tab.3 Guangzhou traffic violation data attributes |
算法 | 原理 | 特点 |
---|---|---|
Apriori | 多次遍历得到频繁集, 在频繁集中搜索关联规则 | 通过简单的集合规则搜索关联规则,但速度较慢 |
FP-Growth | 构建频繁模式树对频繁集进行压缩,在频繁模式树上寻找关联规则 | 与Apriori算法相比提升了计算速度和减少了空间占用,但计算较复杂 |
Eclat | 基于垂直格式的倒排表,通过对表中数据不断求交集得到频繁集项 | 操作较简单,但求交集过程较慢且需要大量内存 |
表4 交通违法与车辆因素关联规则挖掘Tab.4 Traffic violations and vehicle factors related to rule mining |
序号 | 前导项 | 后继项 | 支持度 | 置信度 | 提升度 |
---|---|---|---|---|---|
1 | 未取得环保检验合格标志,本地牌照 | 大型汽车 | 0.002 | 0.91 | 1.02 |
2 | 违反规定使用专用车道,本地牌照 | 大型汽车 | 0.003 | 0.85 | 1.06 |
3 | 违反禁令标志外地牌照 | 大型汽车 | 0.003 | 0.83 | 1.12 |
4 | 超速未达20%外地牌照 | 小型汽车 | 0.002 | 0.82 | 1.05 |
表5 交通违法与时间因素关联规则挖掘Tab.5 Traffic violations and time factor correlation rule mining |
序号 | 前导项 | 后继项 | 支持度 | 置信度 | 提升度 |
---|---|---|---|---|---|
1 | 机动车临时停车, 傍晚 | 工作日 | 0.007 | 0.86 | 1.21 |
2 | 机动车不在机动车道内行驶 | 工作日 | 0.005 | 0.86 | 1.13 |
3 | 违反禁令标志, 傍晚 | 工作日 | 0.005 | 0.85 | 1.15 |
4 | 违反禁令标志, 上午 | 工作日 | 0.005 | 0.85 | 1.26 |
5 | 在高速公路遇交通拥堵, 占用应急车道行驶 | 非工作日 | 0.006 | 0.85 | 1.08 |
6 | 非紧急情况下在高速公路应急车道上行驶 | 非工作日 | 0.005 | 0.84 | 1.08 |
7 | 机动车临时停车, 上午 | 工作日 | 0.005 | 0.82 | 1.13 |
表6 交通违法事件与全部因素之间的关联规则挖掘Tab.6 Correlation rule mining between traffic violations and all factors |
区域 | 前导项 | 后继项 | 支持度 | 置信度 | 提升度 |
---|---|---|---|---|---|
番禺 | 工作日,傍晚,番禺区洛浦街吉祥北街 | 机动车逆向行驶 | 0.03 | 0.91 | 1.54 |
工作日,小车,番禺区番禺大道—龙美高架桥甘棠村段 | 超速20%以上未达到50% | 0.03 | 0.82 | 1.03 | |
海珠 | 工作日,海珠江湾桥上桥位 | 违反禁止标线指示 | 0.02 | 0.85 | 1.21 |
工作日,滨江中路海印桥上桥位 | 违反禁止标线指示 | 0.02 | 0.85 | 1.32 | |
工作日,午夜,新滘东路赤沙村路段 | 超速20%以上未达到50% | 0.02 | 0.83 | 1.02 | |
荔湾 | 工作日,傍晚,小车,广州市荔湾区花地大道—花地大道南环交界路 | 违反禁止标线指示 | 0.03 | 0.88 | 1.66 |
小车,增南路—增南路芳村车管分所门口 | 违反禁令标志 | 0.02 | 0.83 | 1.17 | |
工作日,傍晚,珠江隧道西孔—珠江隧道黄沙铁路南 | 违反禁止标线指示 | 0.02 | 0.83 | 1.09 | |
越秀 | 工作日,上午,小车,东风东路先烈南路口 | 违反禁止标线指示 | 0.03 | 0.89 | 1.52 |
工作日,上午,越秀区陵园西路—陵园西路路段 | 违反禁令标志 | 0.03 | 0.85 | 1.42 | |
天河 | 工作日,傍晚,小车,珠江东路—利通广场 | 违反禁令标志 | 0.03 | 0.84 | 1.36 |
工作日,傍晚,小车,华夏路—华利路 | 违反禁令标志 | 0.03 | 0.84 | 1.54 | |
工作日,小车,天河北天河软件园路段 | 违反禁止标线指示 | 0.02 | 0.81 | 1.02 | |
白云 | 工作日,傍晚,小车,广州大道北—南方医院路口 | 违反禁令标志 | 0.03 | 0.96 | 1.03 |
小车,内环路B线增槎路出口 | 违反禁止标线指示 | 0.02 | 0.91 | 1.21 |
表7 交通违法与POI特征关联规则挖掘Tab.7 Mining of traffic violations and POI feature correlation rules |
序号 | 前导项 | 后继项 | 支持度 | 置信度 | 提升度 |
---|---|---|---|---|---|
1 | 傍晚,工作日,小车,违反禁令标志 | 中小学校 | 0.02 | 0.83 | 1.34 |
2 | 傍晚,小车,违反禁止标线指示 | 公交站 | 0.03 | 0.79 | 1.13 |
3 | 小车,驾驶机动车违反交通灯通行 | 中小学校 | 0.02 | 0.77 | 1.05 |
4 | 非工作日,小车,机动车临时停车 | 景点 | 0.01 | 0.74 | 1.11 |
5 | 中午,小车,机动车临时停车 | 火车站 | 0.01 | 0.72 | 1.06 |
6 | 上午,小车,违反禁止标线指示 | 文化设施 | 0.01 | 0.71 | 1.11 |
1 |
|
2 |
罗慧, 李良序, 胡胜, 等.公路交通事故与气象条件关系及其气象预警模型[J].应用气象学报, 2007(3):350-357.
|
3 |
|
4 |
|
5 |
尚威, 尚宁, 覃明贵, 等.交通事故的多维关联规则分析[J].计算机应用与软件, 2006(2):40-42, 65.
|
6 |
魏玉晓, 李宗平, 李宵寅.基于加权关联规则的交通事故分析[J].交通信息与安全, 2009,27(1):94-97.
|
7 |
贾熹滨, 叶颖婕, 陈军成.基于关联规则的交通事故影响因素的挖掘[J].计算机科学, 2018,45(S1):447-452.
|
8 |
|
9 |
|
10 |
|
11 |
裴玉龙, 马骥.道路交通事故道路条件成因分析及预防对策研究[J].中国公路学报, 2003(4):78-83.
|
12 |
孟祥海, 郑来, 秦观明.基于模糊逻辑的交通事故预测及影响因素分析[J].交通运输系统工程与信息, 2009,9(2):87-92.
|
13 |
孔令铮.交通事故致因中的人为因素分析[J].中国安全科学学报, 2013,23(1):28-34.
|
14 |
|
/
〈 |
|
〉 |