您当前的位置:首页>论文资料>基于数据挖掘技术的交通事故关联分析

基于数据挖掘技术的交通事故关联分析

资料类别:论文资料

文档格式:PDF电子版

文件大小:2.26 MB

资料语言:中文

更新时间:2024-12-20 15:38:37



推荐标签:

内容简介

基于数据挖掘技术的交通事故关联分析 学术论坛
基于数据挖掘技术的交通事故关联分析
杨东红
(西安汽车科技职业学院基础课教学部陕西西安710000)
与或
摘要:基于数据挖据在潜在价值信息发现、具备大数据量处理能力等优势,采用关联规则挖据方法对英国近10年交通事故数据进行分新,本文通过Python语言建立Apriori关联规则挖抵模型,分析交通事故发生的频繁图素集,发现交通事故数据中存在的关系和规则,从而为交通事故预警和管理提供数据决策支撑
关键词:数据抢抵;关联规则;Apriori;交通事故
中图分类号:TP311.13
文献标识码:A
随着社会经济快速发展,科技水平和人们生活提升,机动车数量近年来呈现出逐年大幅度增长的趋势。交通建设的进度远远跟不上目益增长的车辆数,随之给城市交通带来了巨大的压力,导致交通堵塞间题严重,交通事故日益频发,导致国家和人民大众大量经济损失。
在传统的交通事故分析中,多数采用统计学描述方法,通过事故发生概率、分析事故发生规律,基于这些规律给出一些交通相关参考意见。而数据挖掘作为一种从大量的数据中发揭有价值信息的技术,能给予决策人员基于有价值信息通识全局和潜在情况,并制定相应决策。
本文针对英国交通事故历史数据进行分析,利用数据挖揭技术挖掘出有效的关联规则,探讨相同类型交通事故发生规律,进而通过天气、道路情况等确定其可能的交通事故,利用关联规则实现关联事故的提前预警。同时,了解车辆参数、驾驶员信息对交通事故发
生的潜在影响,掌握交通事故多因素关联关系。 1数据挖掘技术
数据挖掘是指从大量的数据中通过算法搜索隐蔗于其中潜在价值信息的过程,自上世纪70年代起至今,数据挖掘从理论到实践
开始 k=1,
设定min_sup、nin_conf
扫描事物库D,计算支持度
生成频繁&-项集工。结束输出结果/
k = k +1 对Cu剪枝
工自连接,生成模选(K+1)项集C
图1Apriori算法流程图
收稿日期:2017-10-25
文章编号:1007-9416(2017)10-0230-0)
得到了快速进步,待别是在应用实践中,其已涵盖人类生活的方方面面。
数据挖掘常用的分析方法有分类、聚类,预测、关联规则等,其中关联规则分析由于其在商业领域的众多成功应用,使得该方法在数据挖掘领域成为一个重要分支。
1.1关联规则
设」=,,,为项的集合,其中的元素称为项;事物数据库 D=$,f,"-,为事务T的集合,每个事务,(i=1,2,,n)都对应上的一个子集,有X,YeI,XY=,计X→Y为X和Y关联。
1.2支持度
设X→Y=I,项集在事物数据库D上的支持度指特定事务在 D中所占的百分比,即,Support(X→Y)=cou(X→Y)/Dx100%
若项集满足最小支持度,则称之为频紧项集。L表示频繁k-项集的集合。
1.3置信度
关联规则的置信度是指包含X和Y的事务数与包含X的事务数之比,即:
Confidence(X → Y)= Supporr(X UY) / Supporr(X)×100% 1.4 Apriori算法
Apriori算法采用逐层搜索的送代方法,在分类上属于布尔型关联规则,反复冲频繁K-项集去寻找频繁(K+1)一项集。首先遍历事物库,找出频繁1一项集的集合。记作L,将L,自连接从面生成频繁 2-项集的集合L,而L,生成L,如此下去,直到不能找到L,即频繁 K-项集。
Apriori算法的流程图如图1。 2实验
基于数据挖掘技术的交通事故关联分析包括3个步骤聚:
(1)数据预处理,由于数据存在大量缺失,异常数据等间题,因此需要进行数据预处理,包括缺失值处理、异常值处理、属性变换,数据离散化等间题。
(2)建立挖掘模型,挖掘关联规则。
(3)模型评估与分析.评估模型结果和分析关联规则挖掘结果。数据来源于英国交通部公布的2005-2015年交通事故数据,共
包括1780653条交通事故数据:该数据集通盖了交通事故发生的地点、时间、道路类型、交通情况、人员、车辆、天气等信息。
本文对数据缺失值处理主要采用KNN,回归和删除缺失值三种方法,其中对于缺失比过大的采用删除缺失值的方法,对于连续型
·.下转第232页
作者简介:杨东红(1988一),女,汉族,河南商丘人,理学颈士,研究方向:微分方程数值解、机器学习。万方数据
上一章:WSN网络中一种新的关联规则数据挖掘算法 下一章:浅谈数据挖掘算法在财务信息管理系统的应用

相关文章

基于约束的关联规则挖掘 基于数据挖掘的产品功能与结构关联关系发现 基于区间关联度的雷达异类数据识别研究 基于多源数据的北京轨道交通客流特征分析 基于灰关联的山西老陈醋有机酸特征成分分析研究 前置粗糙分类器的基于关联规则的Logistic 回归在脑梗塞发病因素分析中的应用 基于信息化的地铁安保区隧道结构设施内外关联技术 数据挖掘中加权关联规则的研究