所有分类
  • 所有分类
  • 未分类

加拿大工程院院士刘江川报告《能源互联网视角下的边缘智能与通信》

在新一代的互联网里面传感器是终端载体,而传感器的数量是巨大的,和智能手机以及传统的PC比起来,到2023年我们将有147亿机器到机器的连接,占全球连接的一半以上,与国家电网而言我们物联网设备在2020年的时候是5.4亿,到了2030年的时候将到30亿左右。在这么大的规模下我们也面临着异构的挑战,整体而言和消费互联网时代相比,在工业、能源、电力互联网的情况下,在应用数量增长的情况下,我们的成本是不断增长的,这是一个超线性的而不是亚线性的关系。体系结构和操作系统将以10倍以上的复杂度增加。协议将以100倍以上的复杂度增加,DevOps运维费用也是在100倍以上的增加,而解决方案甚至会有10000倍以上的增加。

——加拿大工程院院士,西蒙菲莎大学计算机学院终身教授 院士 刘江川

10月26-27日,以“应对碳排双控挑战,构建新型能源体系”为主题的2023国家能源互联网大会在上海举办。加拿大工程院院士,西蒙菲莎大学计算机学院终身教授 院士刘江川发表题为《能源互联网视角下的边缘智能与通信》的主旨报告。

DSC_0070-614305579.jpg

北极星电力网全程直播,详情点击》》》

今天很荣幸能在这里和大家谈一下我对能源互联网下边缘智能的粗浅看法,首先我们谈一下新一代云边缘架构和能源互联网的一些联系,在2019年的时候硅谷的投资人Mark Cuban和和Steve Case有一个著名的采访,他们在其中谈到了互联网的三次浪潮,从第一次的BC连接到第二次的智能手机连接形成消费互联网。

从2017年开始我们进入了所谓的工业互联网和能源互联网时代,在第三次浪潮中他们提到我们需要不同的心态,在这里不仅仅是互联网自己的事情,而更重要的是与行业伙伴的关系与政策与监管的关系,这里专业领域知识将变得越来越重要。

在新一代的互联网里面传感器是终端载体,而传感器的数量是巨大的,和智能手机以及传统的PC比起来,到2023年我们将有147亿机器到机器的连接,占全球连接的一半以上,与国家电网而言我们物联网设备在2020年的时候是5.4亿,到了2030年的时候将到30亿左右。在这么大的规模下我们也面临着异构的挑战,整体而言和消费互联网时代相比,在工业、能源、电力互联网的情况下,在应用数量增长的情况下,我们的成本是不断增长的,这是一个超线性的而不是亚线性的关系。体系结构和操作系统将以10倍以上的复杂度增加。协议将以100倍以上的复杂度增加,DevOps运维费用也是在100倍以上的增加,而解决方案甚至会有10000倍以上的增加。

在这个情况下,我们需要做所谓的融合与整合同时迈向精细化,在信息系统方面存储、通信、感知、计算等等系统需要进行整合和融资,在这个路径情况有两条主要的路径,实际上也是互相影响的,一条是基础设施的演进为应用与算法提供基础,而另一方面是新一代的应用与算法,依赖于基础设施同时又反向推动基础设施的演进。

在这个过程中,我们看到对信息而言实际上能源始终是瓶颈,比如说对传感器而言,信息处理和传感的瓶颈是电池,在万亿传感器的世界里,我们每天需要大概更换9.13亿个电池。

而对海量的数据分析而言,我们需要高能耗的数据中心,比如说Tier 4 data center,他们高可靠、高性能,在线时间达到99.95%以上,那么这个Power outage protection要在96小时以上,但是耗电量也是惊人的,实际上在美国现在已经需要大概51个电厂专门为数据中心提供电力需求,2.35%的全国耗电量已经用在数据中心上面。

这个数据增量还在不断的增长,每年达到10.64以上。我们看到信息流和能源流是紧密耦合也就产生电力和能源互联网。

著名物理学家罗夫·兰道尔在很早以前就提到过这一点,说INFORMATION IS PHYSICAL信息都是物理的,而这里面不可避免会带来能量的问题,所以在信息处理的延迟上面,带宽问题上面,物理能量上面我们都面临着巨大挑战。我们也需要做能源和电力系统的虚拟化和算法的优化,我们也需要考虑自己技术与社会责任和可持续发展,包括环境保护等等方面的多种课题。

这里我们主要集中在信息系统和能源系统的关系上面,我们可以看到在能源互联网里面信息流与能源流会紧密耦合,在传输系统、燃料系统、电网、通信系统、能源储能、新一代边缘云计算中心做到传感器网络和物联网网络整体的结合来互相控制和互相影响。

在这个过程中我们希望达到整体资源的聚合化,但在服务模型方面我们也希望大家对各行各业服务个性化,我们需要做到云、能量平台、传感器、执行器平台的整体融合,并把计算、存储、通信、感知、能量整体结合起来。

在架构方面,下一代云平台架构实际上在沿着这两个方向走,能源整合与服务精细化,其中方向之一是伯克利大学在去年提出的所谓天空计算 SKy Computing,他们没有对云提出任何要求,但是希望通过市场的力量通过中间代理商的设置来整体提供多种不同云的算力和和算法的融合。

另一个方面是功能即服务产品,提供具备精细化微服务能力的边缘计算架构,把数据在边缘上进行处理或者部分的数据在边缘上进行处理,在这里需要对任务进行切分,一部分能够在边缘上面得到完成。

在天空计算方面,伯克利认为我们可以通过云间代理来抽象云,这样云间代理可以在多个云上运行相同的或者不同的工作负载,或者在不同云上拆分单个作业,这比传统的所谓多云系统更加难,但是也更加有利,这里可以提供服务的联合,但是实际实现时也可能是服务的交集,减少服务的容量。

在上层来说,是否会介入到底层云的不同架构,比如说我们希望利用电力专有的云,但是在天空计算的情况下,如果数据或者计算被移到其他云上面,那我们是否能看见?是否能感知?这里是否有数据合规性问题?实际上这都需要进一步探索。

在这种情况下,伯克利认为我们也许不需要一步到位,天空计算可以从某些应用场景开始逐步构建,特别是我们后面将提到的数据分析任务。另一方面,他也认为天空计算即使没有全面的实现也可能会带来更专业的云,更快速的技术创新,能源互联网实际上就是其中重要的应用。

另一方向迈向更精细的力度,特别是从单体架构到微服务,我们看到在消费互联网时代数据处理,或者视频处理的很多架构已经迈向了微服务,我们把整个视频处理的流程分成多个系统和多个模块之间进行交流,进行各自的优化。

在电网管理情况下,我们会看到电网的Load等等都可以划分不同的模块,其中又包括预测、分发、控制等等互相交互关联,但是各自可以进行独立优化。再有一个方向是迈向更细力度就是在空间上从云走向边缘,实际上福布斯发现到了2025年的时候75%的企业生成数据将在传统数据中心,或者云之外进行创建和处理,也就是所谓的边缘上面进行处理,在这点现在云服务架构开始大量迈向数据中心结合边缘处理中心的架构。

在AWS云上面现在有31个地理区域里面有99个可用区;Akamai CDN就是它的数据分发网络有365000台服务器在135个国家里面分布;字节跳动这种视频分布网络也有分布式节点近百万个;我们也可以利用基站来作为所谓的移动通信和移动边缘计算,这也是5G和6G的重要发展方向,3G和4G我们现在已经有近500个,5G基站最终将达到1000万个,可以提供大量就地计算的能力,当然这里对能源供应和基站稳定性也提出巨大要求。

下面我们来看一下能源互联网与新一代云架构,应该来说来自工业-能源互联网的机遇是巨大的,因为在这里传感器已经变成信息初步载体,另一方面机器将作为终端消费者,而机器有着远远超过人类的视觉感知,或者听觉感知系统,我们可以利用超分辨率/超光谱/超声波等等信息,我们也可以利用新一代的传感器,比如说激光雷达、相机贞烈、声纳等等,这些都是普通用户,人类用户所达不到的。

另一方面人眼分辨率大约576兆像素,也就是所谓的32K分辨率,人脑大概以10兆BPS的速率接受和处理视觉数据,和机器相比这种采集速率和理解速率都是远远落后。

以视觉或者视频分析为例,我们现在可以做到Semantic Segmentation、Human Keypoint Deteclion、Depth Estimation、Object Delection等等,这些通常是用摄像头采集现场分析,不过通常没有足够的资源在摄像头上进行现场分析,Typically do not have sufficient resources for in-situ analytics这里包括数据中心也包括边缘上面的节点。在这里我们要做的是优化算法的感知,通常是深度神经网络感知而不仅仅简单是过去人类感知的QoE。

在这个过程中颗粒度精细化,以及放在边缘上面进行处理的机会是相当多的,因为在做了微服务之后我们可以看到调度单元是微服务,而不是整体的所谓大模块。中间数据像流水线向下流动实际上发生显著变化,比如说我们考虑车辆检测,最初我们看到是大量车辆在一个视频正中间这个数据量是非常大的,然后我们可以分割做到单个汽车,这个数据量已经极大减少。单个汽车可以进一步追踪车牌和车牌上的数字,数据量更进一步的减少,在整个流水线上流动的时候,我们可以随着数据量的减少把数据放到云上面,或者放到边缘上面进行处理,从而达到最快的速率。

这个是典型新一代的,基于云边协同的无服务器架构视频分析技术,所有的Cevas都不是长期分配在容器上面,或者说虚拟机上面的,而是随时调根据需求将分配相应资源。比如说我们的控制器上面人员可以查询作业人员,或者查询牌号,这种查询的信息会由控制器做分区策略,其中部分是在边缘上面进行执行,然后采集摄像头的信息,这些执行结果会得到立刻的返回,只有另外一些确实有必要的会送到云上面进行执行,而且也是无服务器功能,并及时作出响应,从而来达到快速响应的同时又尽量减少资源消耗。

这种微服务器架构也带来跨云分析的机遇,在这种情况下我们可能有不同的服务需求,可能我们需要把某些服务局限在我们私有云上面,比如说电网私有云上面,这里有服务质量的考虑,这里有数据合规的考虑。

但是另外一些服务,如果说在二区三区以外也许我们可以放到其他的公有云上面进行执行面对终端用户。另一方面不同云在不同的地理位置或者服务上面可能有不同的定价策略,有不同的硬件加速支持,例如TPU和GPU等等。而我们对数据分析应用的目标也是不同的,比如说有些是关键延迟或者有些是可以容忍延迟的,然后精度上面需求也各不一样,预算上面可能有大有小,所以不同云可能带来不同的机遇,跨云服务应该来说是有它的必要性和有效性的。

在架构精细化上面,进一步我们是需要做到行业上的精细化,因为在实际场景中有着更多特殊需求,比如说在输电线路上面,在戈壁滩上面,在热带雨林里面等等需求都是不一样的,在算法上面我们会有局部放电,我们会有线路腐蚀等等特定需求。这跟传统视觉分析也是不一样的,其中面临着很多算法的特殊性和数据标注的特殊性。

再比如说在变电智能巡视中我们需要做缺陷识别,需要做状态判别,需要做一键顺控等等,由工人或者专家来做识别,但是这需要长期的训练和经验。对于算法来说这里面也面临着大量数据不足等等挑战。比如说无人机智能巡检,我们采集到图像可能是非常不一样的,也可能是不同光谱的图像,在这里面做动态图像识别也面临着它的挑战。

我在这里举一些人工智能算法的能力总览,刚才的视频中可以看到现在模型的精细化程度以及其中对专业知识特殊的需求,另一方面我们现在也让2D的图像转移到3D的图像,提供全面无死角的监控,但这方面实际上也有巨大的挑战。

一方面,3D的图像比如说360球状的视频比起常规视频大4-6倍,计算和带宽的密集需求程度会更高,另一方面这种球状特殊的几何结构也带来新的挑战。一般而言我们需要把它投影到2D的平面上,比如是采用等距型投映从而进行2D图像分析。

在这个过程中,不可避免会带来很多失真,这种对象的大小会变成失真,大小有可能非常不均匀,另一方面会有不同的不连续性,比如说在边缘上,这个小车会分成两半,这种情况下,我们可以分析多个透视图像结合他们优点,但是这样资源消耗又会变得巨大。

另一方面,我们可以设计专门用于球面几何深度学习网络,但是考虑到大部分深度学习网络都是为2D图像做的优化,而且这种硬件加速设备也是为2D图像做的优化,专门设计3D的方案并不是一个太好的解决方案,我们仍然需要投影到2D上面,但是这种投影会带来大量的失真和其他计算强度方面的挑战。

所以这块仍然有大量的工作需要来做,那么再进一步的话,我们可以看看新一代智能算法在能源互联网中的应用和展望。比如说图神经网络和新一代Transformer被大量应用在大模型当中。

我们可以以新一代深度学习算法在电网负荷预测的性能为例,可以看到我们有很多传统的方法,比如说AR自回归、向量自回归和一些比较早期的深度学习网络,比如传感器网络等等。

它们虽然说没有达到非常理想的预测成果,应该来说有一定的实用性,但是仍然有比较大的误差。但是跟新一代网络比的话,其实它们的效果并不见得太差,因为新一代网络比如说带注意力机的Transformer In former,这种图神经网络可以结合地理信息来进行数据分析,实际上如果直接简单仅仅应用它们,误差在目前看来可能会更大,但是我们认为这不仅仅简单的是模型本身的问题,更主要是数据标注的问题。

有时候对新一代模型来说,我们需要更大量、更高质量的数据,而这些数据在能源互联网里或者电力互联网里,目前仍然是比较难以得到的,这需要一个长期的积累过程。

而且,深度学习网络或者即使新一代深度网络,他们基本上是一个黑盒模型,是不可解释或者从外部来说不可理解的,而传统上用的机理模型它是一个白盒模型,它有一定的局限,所以我们希望达到的是结合两者的灰盒模型,一方面既采用有效的数据驱动模型,另一方面又采用可解释的机理模型,提取海量数据的隐含相关性。

比如说我们希望通过Transformer带注意力机制的持续预测新一代算法,把一维序列转化成二维空间进行分析,我们也希望进一步采用任何通用的时序、基础模型,在长时、短时的预测,缺失填补异常检测,分类五大主流分析任务上能够达到比较好的效果。

再有在Transformer的基础上,进一步发展我们希望能够开始做到能源电力大模型,然后以电力设备运行状态的大数据和智能运维算法为基础建立故障预测的专家系统,从响应时维护、预防性维护进一步进化到基于AGI的预测性维护,减少传输设备维护保障成本,提升设备精准预警,故障诊断、状态评估的能力,从而保障电网的安全运行,这里需要从数据采集、数据治理、数据清洗、专家知识做到持续预测关联分析,从而进一步做到状态预测和缺陷故障的预测,并且做出决策与归因。

然后我们也在建立所谓的知识问答大模型,我们的江行电问知识问答大模型,基于语义理解、知识推理和人类反馈强化等学习技术建立而成,用户向电力文本大模型提供后10秒钟就能获得相应的回答,目前已经可以应用于安监、配电、技术标准的专业领域,而且这些回答的语料是普通的通用大模型底座所不能达到的。

我们采用专业语料里包括10万个问答信息和专家修正样本,我们可以做检索式、生成式和对话式的交互方式,可以做知识查询、故障研判、辅助生成任务等等,对电力和能源互联网非常重要的应用。

更近一步我们希望做到电力智能巡检大模型,面对电动智能巡检,场景复杂、设备种类多样化的特点,针对的算法需求目前呈现出高度碎片化、多样化的特点,从开发、调参、优化到迭代应用,智能巡检算法模型目前看来研发成本相对比较高,而且需要做大量定制化的优化。

为了解决这些需求多、模型调优迭代周期长的痛点,我们基于设备巡检中采集的海量数据构建了变电站智能巡检场景预训练大模型,实现“预训练大模型+下游任务微调”的项目交付实施方式。可以达到快速的迭代。

我们可以从大量标记和未标记的巡检数据中有效获取专家信息,通过专家知识存储到大量参数中,并对特定任务进行微调,极大扩展了模型的泛化能力。

上面就是我对边缘计算、边缘智能以及新一代智能算法在电力和能源互联网中应用的一些粗浅看法,希望能给大家带来一些启发,谢谢。

(北极星电力网根据现场速记整理,未经专家审核,转载请获取授权!)

原文链接:http://1guigang.com/industrialchain/transformer/51335.html,转载请注明出处~~~
0
广告位招租

站点公告

网站试运行,请大家关注本站公众号,多提宝贵意见!

显示验证码
没有账号?注册  忘记密码?