让工业智能接地气的那些事儿

2018-02-09  |  作者:陈星  |  来源:天泽智云  |  浏览:

提到工业智能,总绕不开“大数据”、“云计算”、“人工智能”这样几个关键词。其实还有一个关键词也非常重要,它能够将上述几个关键词穿连起来,让工业智能可以真正实现落地。这个词,就是“边缘计算”。而这一切的起源都是大数据,我们先来看看工业大数据这件事。

大数据

 
提起大数据,不禁想起多年前的一个梗:
 
 
好吧,这是插播的一个笑话。现在大数据已经深入人心,而且也有了非常多的应用。据传,当下非常流行的手游“某某农药”就是用大数据的方式设计,它所具备的降维打击的精准性和力量已足以让人震撼。
 
大数据本质上是一个现象。在工业环境里大数据的“大”,甚至超乎想象:波音飞机每个发动机每秒钟产生的数据多达5G,一辆电动汽车每天会产生4000G数据。如此之大的数据量,是其他大数据场景所难以想象的。为了解决这种现象所带来的种种问题,云计算、边缘计算、人工智能等新兴技术纷纷兴起。云计算是处理大数据的传统方法,它使用超强的计算能力来分析海量的数据。带着这种思路过渡到工业大数据场景,我们首先想到的就是把所有数据都上云,借助强大的云来处理工业数据。边缘计算则是另外一种处理方法。与云计算不同,边缘计算似乎是反其道而行之。云计算强调的是数据和计算的集中,从而实现随时随地访问、读取数据;而边缘计算强调的是将计算分散,在数据产生端直接进行处理,实现分布式计算。
 
也许大家觉得边缘计算还有些“边缘”,但其实早在云计算兴起之时,就已经有人针对其缺点提出了“雾计算”,意指将计算沉浸在数据中间;此外还有爱开玩笑的人提出了“霾计算”,估计是个北京爷们儿。其实人们之前常说的“雾计算”就是边缘计算。在互联网上关于云计算和边缘计算的争论很是激烈,甚至还有人说边缘计算终将取代云计算。我觉得“取代”的可能性应该很小,但是两者之间的争议应该还会继续。
 
这里我们需要先停下来,不参与两者之间的争论,分析一下为什么工业场景会有这么海量的数据?我们怎么更好的处理这些数据?
 

工业大数据

 

工业数据的来源:

 
工业数据和日常的数据不同,日常的大数据来源于用户的每一次交互,每一次搜索的关键词、每一次共享单车的开锁等都会产生相应的数据,而这些原始数据本身就具有意义。
 
工业数据来自于传感器,以高速进行采集。以轴承为例,采集轴承的震动信号,需要20kS/s 以上或者50kS/s以上的采样率进行连续采集。然而,这些原始数据本身并没有直接的意义,需要经过频谱的分析、包络检波等过程,才可以提取出有价值的信息。分析的过程,需要多个同步采集的传感器采集上来的数据协同运算来完成。
 
数据量如此之大,就导致把数据完全上传到云之后再做处理的方式变得非常不现实,同时也不是最理想的数据处理方式。究其原因主要有以下三点:首先,如此海量的数据上传需要巨大的带宽资源,从传输成本上来看是非常庞大的一笔开销。其次,数据上传的过程会有很多的不稳定性,从数据上传到计算得出结果会有很大的延迟,并且这个延迟也有不确定性。最后,我们需要明确的是:数据本身并没有价值,有价值的是将数据处理后得到的信息。每处理一次信息,最终获得的价值就提升一次。
 
但是数据价值的时间曲线是衰退的,也就是说,随着数据获取时间的推移,其价值也在衰退,越早处理价值越高。比如在获取数据后的1秒内就告诉我未来一个星期设备出故障的概率会超过95%,它的价值远高于一个星期之后才告诉我设备出故障的概率是95%。因此我们需要尽可能早的处理数据。基于这种观点,我们需要将尽可能多的计算放在边缘端进行。
 
那么现在回答第二个问题:我们怎么更好地处理这些数据呢?
 
对于传统的互联网大数据,其数据本身是发散的,我们分析的主要目的是找到数据之间的相关性,根据相关性信息就可以直接得到决策。最成功的例子就是广告推送,比如淘宝会根据你的浏览、购买记录,为你推荐相关的产品,它有时甚至比你自己更了解你的需求。
 
但是工业大数据的分析并不是这样,工业大数据需要从中挖掘更多的因果性,从而根据当前的状况判断可能的原因或者预知故障发生的概率。而了解更多行业相关知识、加深对设备机理的认识是找到这种因果性的关键。
 

人工智能

 
最热的词汇了,在金融、消费电子、制造业等等各个领域,人们都在如火如荼地讨论人工智能。我们需要注意的是,人工智能的目的不是为了摒弃我们原来积累的知识,而是在传统知识解决问题有难度的时候,使用机器学习和人工智能来获取帮助。李杰教授提出的CPS架构中,有一个至关重要的元素M,就是建模(Modeling)。随着当前设备和系统越来越复杂,完全基于机理模型进行建模已变得非常困难,因此将传统学科的知识和机器学习相结合,借助人工智能手段来参与建模,就成为了一条非常可行的出路。美国IMS中心在过去的17年中,通过众多的实践案例,一次又一次印证了这种方法的可行性与高效性。因此,结合机理模型的人工智能,才是实现工业智能的合理路径。
 
既然这些模型使用了大量的人工智能方法,那么这些模型是否都要部署在云上呢?
 
提到人工智能,我们或多或少地会惯性联想到云计算。云计算的确是实现人工智能的一种手段,但很多模型确实也可以部署在边缘端,而且在实际应用中也取得了非常卓越的效果。阿尔斯通作为一个国际领先的轨道交通OEM厂商,很早的时候(2006年开始)就已经着手实践利用运行中产生的数据提供更好的服务。其中包含了大量的边缘计算系统的部署。例如Train Tracer、Track Tracer、Train Scanner等系统就可以在离开云的情况下解决90%的问题,这极大的释放了云端数据的存储和计算压力。
 
因此在边缘端实现人工智能的算法成为当前实现工业智能的重要的技术要素。
 

工业智能

 
人工智能已经成为了人们的共识,工业领域要实现智能化,也无法离开人工智能技术的应用。
 
为了实现工业智能,目前有很多公司已经从不同的方向出发尝试解决这个问题:ABB、Intel、霍尼韦尔等公司根据自己擅长的领域,从边缘计算端尝试实现工业智能、预测性维护;而微软、IBM、PTC等公司则从云和IoT架构的角度,尝试通过云计算来解决预测性维护的问题。但是云计算和边缘计算各自有各自的优势,偏废一方都有可能对实现工业智能造成障碍,这是由于工业场景和架构下的大数据要比互联网大数据复杂的多。
 
对于工厂,我们可能需要从设备级别、车间级别和集团级别分别进行分析和管理,这不仅需要实时的结果反馈,也需要从不同维度、不同历史时间进行分析得到的结果。并且,很多场景也需要随时、随地获取结果,比如在办公室、在车间、或者在出差的路上对工厂进行管控。
 
不同的技术有不同的特长:边缘计算可以尽早地获取有价值的信息,而云计算可以针对更广阔的维度和时间尺度分析。因此我们需要借助云计算、边缘计算、人工智能等多种技术手段,在合适的地方做合适的数据处理。这样,才会达到工业智能最终想要的效果。
 

总结

 
总之,云计算是个好东西,但是对于工业智能这个场景,稍微有点力不从心,有些“高高在上”,不够“接地气”,在结合边缘计算的情况下,能够更大地满足工业智能的需求。天泽智云

推荐文章