主页(http://www.cnwulian.net):智能电网大数据平台及其关键技术研究
结合智能电网的应用需求,在大数据核心平台之上构建各类大数据应用。面向智能电网大数据的应用框架见图4。应用整体框架分数据集成与交互层、大数据核心平台层、应用层。大数据环境下对数据的存储、管理、查询和分析需要采用新的技术,传统的数据库在数据存储规模、吞吐量、以及数据类型和支撑应用等存在瓶颈。分布式数据库由于具有很好的扩展性和协同性,在大规模数据存储和管理中得到广泛的应用。目前主要有键值存储系统、文档数据库、图数据库等。
2015年1至4月新疆发电量稳步增长 智能电网大数据应用众多,涉及电网安全稳定运行、节能经济调度、供电可靠性、经济社会发展分析等诸多方面,进行智能电网大数据分析需要统一智能电网大数据,并且由于应用众多,对计算、存储、网络等性能提出了较高要求,因此需要构建面向智能电网应用的统一大数据处理平台。本文首先分析智能电网大数据特点以及业务应用需求,接着结合业务应用介绍大数据关键技术,进而提出智能电网大数据平台和应用框架。
关键词: 电力新闻
图2 智能电网数据采用频率和生命周期2.3.2 批处理
智能电网大数据平台及其关键技术研究 发布时间: 2016-01-06 来源:本站编辑
大数据是近年来受到广泛关注的新概念,一般是指无法在可容忍的时间内用传统的it技术、软硬件工具和数学分析方法,对其进行感知、获取、管理、处理和分析的数据集合。智能电网被看作是大数据应用的重要技术领域之一。目前许多学者正在进行智能电网大数据研究,包括发展战略研究、大数据技术研究、应用研究等。
智能电网是大数据的重要技术应用领域之一。智能电网大数据结构复杂、种类繁多,具有分散性、多样性和复杂性等特征,这些特征给大数据处理带来极大的挑战。智能电网大数据平台是大数据挖掘的基础,通过智能电网大数据平台可实现智能电网全数据共享,为业务应用开发和运行提供支撑。
3.2应用框架
根据信息处理流程,大数据在智能电网中的应用可以分为数据采集、数据清理、数据存储及处理、数据分析、数据解读和数据应用6个环节,其关键技术包括数据集成技术、数据存储技术、数据处理技术和数据分析技术。
1-10月份乌兰察布市风力发电及太阳能光伏发电投资完成情况 2.2.1 分布式文件系统
智能电网大数据结构复杂、种类繁多,其数据存储需要根据数据的特点选用适合的数据存储方式。数据管理也是智能电网大数据的重要功能,从整体上对存储在不同系统上的数据进行统一管理,并提供数据索引和查询功能。综合以上分析,数据存储对比见表1。
map-reduce的优点主要有2个方面:①不仅能用于处理大规模数据,而且能将很多繁琐的细节隐藏起来,如自动并行化、负荷均衡和灾备管理等,这将极大简化开发工作;②伸缩性非常好,集群能够方便的扩展。而map- reduce的不足是其不适应实时应用的需求,只能进行大规模离线数据分析。
智能电网大数据应用需要构建在大数据平台之上,大数据平台为应用提供统一数据接入、清洗、存储、管理、分析计算等功能。大数据核心平台由基础资源、数据存储、数据分析与处理、数据管理、平台服务和平台管控等组成,见图3。
贵州省风电发展指标 数据集成是智能电网大数据应用的关键环节。智能电网大数据集成涉及众多各类型的应用系统,这些系统类型和特征复杂,在实时性要求、数据规模、数据类型等方面存在较大的差异,在智能电网大数据集成中需要综合考虑各种因素,在集成技术上单一技术可能很难实现,需要结合多种技术来实现智能电网大数据的集成。
图3 智能电网大数据核心平台框架图
智能电网是以物理电网为基础,将现代先进的传感测量技术、通信技术、信息技术、计算机技术和控制技术与物理电网高度集成而形成的新型电网,见图1。它涵盖发电、输电、变电、配电、用电和调度等各个环节,对电力市场中各利益方的需求和功能进行协调,在保证系统各部分高效运行、降低运营成本和环境影响的同时,尽可能提高系统的可靠性、自愈性和稳定性。随着智能电网的发展,电网在电力系统运行、设备状态监测、用电信息采集、营销业务系统等各个方面产生和沉淀了大量数据,充分挖掘这些数据的价值具有重要的意义。
新疆上半年发电量
1)智能电网大数据数据量大、类型多样、数据特征复杂,同时业务应用需求场景多,且存在交叉融合,对现有数据处理方式和平台提出了很高的要求,需要采用新的大数据处理技术来支撑。
2.3数据处理技术
2.4数据分析技术
智能电网大数据业务应用根据对象不同可分为面向电力公司运行管理、面向电力用户服务、面向政府部门辅助决策等3类。面向电力公司运行管理类应用包括电力系统稳定性分析与控制、输变电设备故障诊断与状态检修、配电网运行状态评估与预警、配电网故障定位、负荷预测、城市电网规划等;面向电力用户服务类应用包括用户用电行为分析、需求侧管理、能效分析、供电服务舆情分析等;面向政府部门辅助决策类应用包括社会经济状况分析与预测、政府决策支持与相关政策评估,如电价政策、新能源补贴政策等是否合理等。这些需求需要综合电网运行状态信息、用户用电信息、客服系统信息、气象数据、经济社会数据和互联网数据等。
storm是分布式实时计算系统,主要用于流数据处理,可以简单、高效、可靠地处理大量的数据流。它能够处理源源不断流进来的信息,处理之后将结果写入到某个存储中去。storm的优点是全内存计算,因为内存寻址速度是硬盘的百万倍以上,所以 storm的速度较快。storm弥补了hadoop批处理所不能满足的实时要求,经常用于实时分析、在线机器学习、持续计算、分布式远程调用和etl等领域。
2.2.3 关系型数据库系统
智能电网大数据结构复杂、种类繁多,除传统的结构化数据外,还包含大量的半结构化、非结构化数据,如客户服务中心信息系统的语音数据,设备在线监测系统中的视频数据与图像数据等。这些数据的采样频率与生命周期也各不同,从微秒级、分钟级、小时级,一直到年度级,见图2。
智能电网中很大一部分数据是结构化数据,针对一些数据和业务应用,传统关系型数据库可能更适合,因此在大数据环境下,传统关系型数据库也具有一定的应用。基于传统数据库如oracle等构建数据仓库,开展智能电网业务的分析挖掘。
1.2大数据业务需求分析