最近ChatGPT爆火,在文字和视觉内容的AIGC方向,确实达到了某种临界值,涌现出“智能”。
趁着这个热度,AI方向也很火,最近看了几个能源、电力方向的AI创业公司的BP,感觉就是“干啥都没想明白,就出来融资了”。
电力AI的春天真的来了吗?
(来源:微信公众号“鱼眼看电改” 作者:俞庆)
回归本质,AIGC的奇点突破,个人觉得是三个因素的结合:
1、GPT是人类神经元的仿生产物
NLP为代表的GPT类AI,是计算机神经元网络算法,其本质是对人类大脑皮层的神经元网络模拟。
而语言、音乐、图像,甚至味觉信息的处理和智能想象,都是人类大脑作为一种“蛋白质计算机”,在长期进化中积累出来的功能。
所以GPT作为仿生产物,自然最适合处理同类的信息,也就是非结构化的语言、音乐、图像。
其处理的机制,也不是意义的理解,而是一种提炼、识别、联想。这就是非常吊诡的一件事。
早期的语音语义识别算法,本质上是建立语法模型和语音库,然后把语音对应到词汇,再把词汇放到语法库里去理解词汇的意义,最后得到识别结果。
这种基于“逻辑机理”的语法识别,识别效率一直徘徊在70%左右,比如IBM在上世纪90年代推出的ViaVoice识别算法。
AIGC不是这么去玩,其本质是不去管什么语法,而是建立一个神经元网络算法,让计算机自己去统计不同词汇之间的概率联系,是神经元的联系,而不是语义的联系。
很像我们小时候学母语,我们自然就学会了,而不是一开始去学习“主谓宾、状定补”,然后去理解一段话。
这就是AI的思维模型,是识别,而不是理解。
这也是AI对所有经典机理模型的颠覆意义——计算机不用在逻辑层理解这件事,而是识别、认识到内在信息之间的关联关系,就知道了。
比如电网的潮流状态和潮流预测,基于经典电力网络仿真,是建立机理数学模型,然后用矩阵算法去收敛。未来可能不需要了,AI直接就根据每个节点的状态去识别和预测出某个模态班图(Pattern)。
节点越多,而经典矩阵算法越不喜欢,因为算法复杂度随节点数量增加,几何级数的增加,而AI偏偏喜欢超大规模的节点并发,因为识别和预测最可能的网络模态是AI擅长的。
无论是围棋的下一步预测(AlphaGO可以预测后面几十步,每一步都有无数种可能),还是天气复杂系统的模态预测,AI的精确度都比机理模型高很多。
电网之所以目前不需要AI,是因为省级调度管理的220kV及以上的电力网络,节点数量不多,而且设置了很多条件对矩阵线性化,稀疏化,极大降低了机理模型的计算复杂度。
但是到了配网潮流阶段,面对一个大型配电网里几万、几十万的电源节点、负荷节点、传统矩阵算法是无力的。
我认为未来AI在配网层面的模式识别将成为可能。
2、非结构化信息的积累、训练与生成
AIGC之所以获得突破,第二个原因是信息的积累程度。从语音的A/D转换(麦克风+PCM采样),到图像的A/D化(CMOS+色彩空间映射),人类过去几十年,用极低成本的方式,积累了视觉、听觉领域的全息数据。
尤其是摄像头、智能手机的大规模普及,人类在视听领域的,非结构化数据积累几乎零成本,互联网上文字信息的爆发性积累,是AIGC训练的关键——训练数据集不要钱。
上图是全球数据的增长趋势,明显呈现指数级趋势,这种数据积累的非线性增长,是AIGC能力非线性增长的基础。
BUT,这些数据大部分都是非结构化的视听数据,是零成本积累的。
在电力领域,这点是做不到的,首先电力行业绝大多数是结构化、半结构化数据,比如电压、电流,是时间序列的点数据集合,是半结构化的。
结构性数据集合,需要让计算机理解,是需要“对齐”的,比如设备对齐——一个开关的电压、电流、功率数据,都需要对齐到这个节点上。
还有更麻烦的是时间对齐,要根据时标去对齐电压、电流、有功无功,这样才能后续识别。还有正反向,是四象限的空间对齐。
不像文本数据,不用对齐,一段话扔给计算机就行了,它自己去识别出可能的信息关联。
为了对齐这件事,比如营配数据的设备对齐,而且是不断需要对齐,因为中低压配网每天都在增删改设备和线路,电网公司花费巨大的人工成本。
和“数据标注”一样,这件事计算机做不了。
其次,电力领域的数据获取成本很高,都要装传感器,而不是有个手机就能说话拍照。电压每降低一个等级(或者配电关系每降低一个层级),所需传感器投资至少增加一个数量级,要做到负荷侧(毛细血管末端)的感知,那更是天量的数字化投资。
如果要识别电网暂态模式,那需要高精度高频采样,那成本就更高。
因为数据获取和数据对齐的边际成本极高,导致电网目前无法积累足够的、呈非线性增长的数据信息,去训练一个达到AI奇点的算法。
更别说数据的开放性,一个电力AI创业公司,是不可能拿到这些数据的。
所以AI之前,必先解决数据集的问题,否则通用AI代码是训练不出一个好的AI的。
3、算力突破
AIGC的奇点突破,除了算法和数据,还有就是算力突破,传统CPU不适合做大规模并发的神经元计算的,恰好是GPU在3D游戏和影视方面的应用,使得大规模并行的浮点+流计算成为可能,摩尔定律更使得单位算力的计算成本下降。
电网AI,未来必然的趋势
随着大量分布式光伏、分布式储能的并网,以及负荷侧虚拟电厂的应用需求,客观上需要对公共配电网系统、用户配(微)电网系统,进行源、荷预测,以及配(微)网的实时潮流优化。
配网侧的计算复杂度其实高于输电网调度,即使一个商业综合体,负荷设备就可能几万几十万,开关成百上千,基于AI的微网/配网运行控制需求将会出现。
而传感器的低成本化,固态变压器、固态开关、逆变器(变流器)等功率电子设备大量使用,在电网边缘的感知-计算-控制融合也成为创新的趋势。
所以电网的AIGC,是未来。只不过,今天需要的,不是马上拿个AI算法出来圈钱,
而是先解决AI所需的数据基础构建问题
在AIGC的热潮中,对电力AI的应用水平与未来,需要有足够的冷静思考。
目前电力AI意义不大:比如一个预测精度90%的光伏算法,放到交易偏差门槛5%的现货市场里,算法偏差就把交易利润全部干完了。
数据是水,算法算力是渠,水到渠成。