智物联,引领工业物联

我们始终以技术创新创造价值,并夜以继日的将互联和工业智能的力量融入到各行各业
以前所未见的高度、速度、精度和深度,让关键所在 逐一实现。

咨询服务

技术干货丨Indass——无关设备机理的基础数据分析服务


【摘要】: 在我们的理解中,工业数据分析、工业智能势必要与行业知识和设备运行机理结合才能最大程度上的利用设备数据的价值和发挥数学算法的力量。但在今天的文章中,我们从不同的方向出发,换一个角度,看无关设备机理的基础分析服务如何成为工业智能和工业数据分析的“基石”。

在我们的理解中,工业数据分析、工业智能势必要与行业知识和设备运行机理结合才能最大程度上的利用设备数据的价值和发挥数学算法的力量。但在今天的文章中,我们从不同的方向出发,换一个角度,看无关设备机理的基础分析服务如何成为工业智能和工业数据分析的“基石”。

 

Indass工业数据分析服务,是MixIOT体系提供的基础数据分析服务组件,是所有与数据分析有关的服务组件/应用的基础。也就是说,其他的数据分析服务组件,都可以直接引用Indass里面的分析计算结果。

 

所谓基础数据分析,是指在不考虑物联网对象机理的前提条件下,对物联网对象客观运行数据进行的六种类型的计算和分析,分别是运行映像、运行指数、运行稳定性、运行相关性、运行趋势和运行风险。

 

一台工业设备(物联网对象)其实也是一样的,动辄上百个FV变量(或者说是参数),这些FV的数据时时刻刻都在变化。这么多参数,我们应该看哪一个?又能看出来什么名堂?

 

答案是看不出什么。

 

因为工业设备的机理非常复杂,FV之间的相互关系也非常复杂,即便能看到每一个参数,也很难弄明白这个设备整体到底是什么个状况。

 

图-1上数据不多,只有10多个,而且还是这个装置的主要参数,数据一秒钟变一次。即便你时时刻刻盯着看,也很难看出个什么门道。

indass机理

图-1 某工业设备运行状态实时监控图

 

运行映像:
Indass的映像(也叫映像图),就是一个把这些参数都综合起来,变成一个直观的画面,让这个画面能呈现出“满脸红光”“气色不错”或者“脸色不好”的特征,让我们一看就知道大概是怎么回事。除此以外,我们不仅要看到静态的,还要看到这个画面发生的变化。

 

我们先看图-2的四张图,假设现在并不知道这四张图代表什么意思。如果我问你,那张图最好看?让你从好看到难看排个顺序,我相信,我们的答案应该是一样的:1—3—4—2。

indass机理

图-2 四张不同的雷达图

 

所以,映像图就是把对象运行的数据进行一个综合的计算,并把这个计算结果形成若干个方向的指标,构成一个雷达图(也叫蜘蛛图),这个图越趋于对称,就表示这个状态越好,反之就越不好。当然,这个“好”“不好”“不那么好”,都是一个相对而言的“印象”而已。

 

如果一个对象的状态变化是下面这样的,说明状态在变坏,图-3所示。

indass机理

图-3 运行映像

 

◆ 这就是运行映像图。
 

指数水平、变化和变化速度:
运行映像图是一个可视化的宏观印象,是对对象的一种宏观表述方法。但我们必须承认,这是一种粗线条的表述方法,因为好看不好看这个表述还是有点主观。

 

对运行状态的描述,还有一种更加精确的方法,就是“运行指数”,以及围绕运行指数展开的一系列分析结果。

 

“指数”这个词我们都不陌生,不管你炒不炒股,你都应该知道有上证指数、恒生指数、道琼斯工业指数、纳斯达克指数等。指数就是一个数,比如上证指数3348,就是根据权重股的股价、各版块的成交量等因素算出来的一个数,是从股市开盘到收市期间不断变化的一个数。

 

如果单把指数的数字拿出来,比如今天的上证指数是3456,你会有什么感觉呢?你能说股市是好呢,还是不好呢?你能说经济是好呢还是坏呢?其实都不能,这只是算出来的一个数字而已,每个人的解读可能都不一样。

 

如果我告诉你说,今天的上证指数3456,是由2345涨上来的,你又会有什么感觉呢?你一定会觉得,股市应该变活跃了,股市在回暖。

 

如果我再告诉你,今天的上证指数3456,是由上礼拜的2345涨上来的,你现在又会有什么感觉呢?你一定觉得,股市在迅速回暖,是不是该买点儿了,或者赶紧把早前买的解套。

 

前面实际上解释了,什么是指数水平,什么是指数水平的变化,什么是指数水平变化的速度。所以,只有我们完整准确地掌握了指数水平、变化和变化速度,才是一件有意义的事情。

 

Indass不仅提供了实时计算物联网对象运行指数(水平)、指数变化、指数变化速度的计算,还提供了指数变化加速度的计算结果。这些计算结果,跟我们看到的股市指数一样,能帮助我们了解物联网对象(设备)当前是什么状态。

 

图-4是Indass中某设备的映像图,是指数、指数水平变化速度和指数加速度的一个呈现。

 

指数水平变化的速度上面我们已经解释过,我们通常把这个称为“指数梯度”,它反应的是指数变化的快慢。那么,指数水平变化的加速度又是什么含义呢?

indass机理

图-4 某设备的映像图

 

加速度在物理上的定义,就是变化速度的变化速度,是反映由于指数发生变化本身的快慢程度,而导致的在某些因素上可能产生的一个累积效应,又叫“增量因素”。在后面的文章中,我们还会介绍“增量”的估计计算,可供参考。

 

指数的变化速度(梯度)和加速度(累积效应)除了数值,也用雷达图来呈现。梯度的雷达图是为了看清楚,指数的变化主要是发生在哪一个因素上,是温度还是压力,是电流还是电压。而累积效应的雷达图则反映了这个变化可能导致的累积效应会在什么因素上。

 

运行稳定性和相关性:
我们先看Indass关于稳定性和相关性的呈现方式,如图-5所示。

indass机理

图-5 Indass中稳定性与相关性的呈现方式

 

 

稳定性这个概念就不用多解释了,稳定就是变化小。对工业设备来说,稳定是一件好事儿,不稳定总会带来麻烦。

 

Indass计算一个对象的稳定性,算出来的是0~100的一个数字,这就像给稳定性打分一样,最高分100分,稳定性很好;如果稳定性低于60分,就可以认为是晃晃悠悠,有可能随时都会倒;如果低于40分,那基本上就是上下颠簸,离散架不远了。

 

稳定性除了数值,同样也是把它化解成不同的因素方向,这样就很容易从图-5上看出来,导致不稳定的主要因素到底是温度还是压力,到底是电压还是电流。

 

右边的那个彩色点点的图,叫对象的“相关性图谱”,相关性是反映对象状态变化的时候,各因素之间的相互关联关系。

 

相关性里有三个概念,分别是正相关性、负相关性和无关性。所谓正相关性,是指一个因素增加的时候,另一个因素一定也是增加。负相关性是指一个因素增加的时候,另一个因素一定是减少。而无关性是指,无论一个因素增加或者减少,对另一个因素都不构成影响。如果一个增加得多,另一个也增加的多或者减少得多,那我们就说这个相关性强;否则,相关性就没那么强。

 

我们可以举出平时日常生活中很多的例子,比如买房子价格越高的时候,房子的租金就越贵;猪肉涨价的时候,青菜价格也跟着涨,这就是正相关性;

 

产品生产的量越大,成本就越低,这就是负相关性;而隔壁家老王家儿子考试的分数高高低低,跟今天羊肉卖多少钱一斤没啥关系,这就是无关性。

 

在Indass相关性图谱中,纵横是各种因素,而颜色就是相关性和相关程度。暖色代表正相关性,暖色颜色越深,相关性越强;冷色则代表负相关性,冷色颜色越深,负相关性就越强。

 

那么,我们研究相关性和相关性的强弱,在工业物联网中有什么特别的意义呢?

 

有!不仅有,而且这个意义还非常重大!就说两点。

 

首先,相关性并不是我们想象中的那么容易察觉或者被正确地认知。有些我们觉得相关的,其实未必相关;而有些我们并不认为有什么关联的,可能相关程度却很高。

 

对一个工业对象来说也是一样,FV太多,它们之前是什么关联关系,其实我们并不清楚,了解了相关性,才能明白为什么有时候会牵一发而动全身。

 

其次,相关性并不是一成不变的。相关性在某一个情况下是这样,到了另一个情况下可能就变了,原来正相关的可能变成弱相关,甚至无关了;而有些原来无关的因素,又变得相关了。

 

这种情况在工业对象中是一个非常普遍的现象,随着温度、压力的变化,到一定程度,很多FV之间的相关性关系都发生了改变,这种改变如果没有强大的计算,是很难准确知道的。

 

运行趋势:
运行趋势大家都容易理解。MixIOT Indass可以对多个FV做单参数预测计算。计算的结果大概如图-6所示。

图-6 Indass单参数预测计算的结果

 
这张图的意思是,压力现在是多少,5分钟后是多少,10~25分钟是多少。除此以外,还有一个指标,就是5分钟后压力是所对应值的概率会是多少。这有点像我们现在手机上看到的天气预报一样(见图-7),说7点、8点下雪的概率是多少。
indass机理

图-7 天气预报

 
预测的概率,实际上就是预测的可信度,概率越高,未来这个值的可能性就越大。
 
indass机理

图-8 Indass显示的压力运行趋势

 

运行风险:
运行风险也是一种趋势预测,只不过是一种极端的趋势预测。

 

我们前面说了,Indass是非机理数据分析,忽略了分析对象是锅炉、发动机还是压缩机,因此这里说的“风险”自然也不会是指什么爆炸、崩塌、断裂之类的具体事情。
 

那么,Indass说的“风险”指的是什么呢?是指状态的“突变”。所以Indass的风险分析,准确地说,应该是“非机理状态突变趋势预测”。什么是突变呢?突变是指对象的某些属性在变化过程中,在某一个瞬间出现的非连续变化特征。
 

这个名词听上去很学术,我们换个方式来解释。我们手里拿着一根竹子做的烤串儿竹签,手握竹签两端,慢慢的把竹签两端接近,这个时候,我们看到竹签慢慢发生弯曲。继续接近,竹签的弯曲程度会越来越大,但是当弯曲到某个程度的时候,咔嚓一声,竹签就被折断了。这就是竹签这个对象,从连续弯曲到折断的突变。

 

再举个例子,我们在海边沙滩上,堆起一个沙堆,不断往沙堆顶部加沙子,一开始,沙堆变大变高,但总有一个时刻,沙堆会突然坍塌,这也是突变。

 

突变现象是我们常见的,然而,对突变的研究又是非常复杂的。前面说的两个例子,是两个不同的突变模型:折叠模型和沙堆模型。当然还有很多其他模型。拿沙堆模型来说,据说每往沙堆上增加一粒沙子,整个沙堆里每一粒沙子的受力都会发生变化。

 

你可能在想,工业设备上的风险是很清楚的啊,比如锅炉,说压力不能超过多少,温度不能超过多少,那我们不超过就应该没风险啊。从风险分析的角度来看的话,这种说法是错的。

 

我们举个例子,比如你买了一个气球,这个气球说明书写得明明白白,气球能吹的最大直径是30cm。请问,你吹到30cm,或者超过30cm,气球一定会爆炸吗?再请问,你吹到28cm,气球就一定不会爆炸吗?

 

答案都是“不一定”。同理,压力容器上写着最大压力10kg/cm3,并不代表超过这个压力就会爆炸,更不代表低于这个压力就一定不爆炸,这里面相互影响的因素太多,各种因素变化积累下来的原因,都会导致各种意外风险的发生。

 

MixIOT中Indass风险分析是按另一种模型来计算的,叫风险针模型这个模型最符合非机理突变分析的情况,所以,应该会有比较准确的风险预测结果。

 

下面简单解释一下,风险是怎么算出来的(见图-9)。

图-9风险针模型

 

我们假设,上下两端的两条红线,是风险线,两条线之间的距离是确定的。两条风险线中间,有一根针在游走。这根针的长度L是会变的,这根针与风险线中线的距离C也会变,这根针与风险线之间的夹角α也会变。

 

这根游走的针的三个参数L、C和α,是根据设备的运行数据计算出来的,时刻在变化。这根针离两端的风险线越远,风险就越小;一旦这根针碰到了风险线,就出现风险,而且这根针超出风险线外面的部分越多,风险就越大。

 

具体参数L、C、α是怎么计算的,如果你有兴趣了解,可以参考智物联的相关技术资料,这里就不详细说了。

 

工业物联网不是一蹴而就的,面向复杂工业现场数据分析更是如此,智物联Mixlinker在数据的分析和高级应用上方面进行了探索,形成了一批数据分析的服务组件、计算模型和方法工具,它们是MixIOT的重要组成部分,也是MixIOT向着“解决问题”这一方向迈出的坚实一步。

图片名称
图片名称