ET、ET数据及ET数据治理

近些年来,ET数据备受业界关注。那什么是ET数据?在讨论ET数据之前,我们不妨先了解下ET的概念。

一、ET的概念

ET是Engineering Technology的简称,也就是工程技术。工程技术(ET)是很宽泛一个概念,是指为了实现特定的制造工厂、基础设施等而涉及的一系列设计、功能、规程相关的技术;这些技术之间相互作用,相互关系,需要考虑各自特点、技术要求、资源限制等,而达到最优效果。工程技术所针对的实体对象也非常广泛,可以是制造工厂、基础设施,或者城市、建筑物等等。

以化工厂为例,工程技术就包含了工艺、机电仪等在内的一系列设计、功能、规程相关技术,可以保证工厂能够按照设计产能安全生产出合格产品,实现特定目标。工程技术(ET)与信息技术(IT)、操作技术(OT)三者各司其职,三者组合成了现代制造工厂、基础设施等的技术体系。

二、ET数据的概念

清楚了ET的概念后,ET数据就很容易理解了。

ET数据是指工艺、机电仪等工程门类的技术数据,包括功能要求、详细设计、技术规程等一系列内容,通常呈现结构化、非结构化数据混存的格局。ET数据属于基础类数据,能够全面、准确、细粒度地描述工厂、设施及设备、零件的属性及关联关系,也是工厂、设施运营与维护不可缺失的指导性数据。

ET数据与IT、OT数据是不同类型的数据。IT数据多为交易数据及业务过程数据;OT数据多为动态反映工厂生产现场工作状态的实时数据;ET数据则包括了设计成果数据、施工过程数据及采购的设备数据等。下图是基于ISA95架构,IT、OT、ET数据的分布区间。

物联技术的发展标志着大数据时代的到来。IT、OT数据一般定义为“大数据”,具有数据量大、多样性、价值密度低、速度快等特征。ET数据一般理解为“小数据”,此处的"小”更多是针对大数据的“大”而显示区分,并不意味着数据量小。

三、ET数据的价值日益凸现

近些年来,主数据管理受到业内重视。2018年中国信通院牵头编写的《主数据管理实践白皮书(1.0版)》中,对于主数据定义如下:“指满足跨部门业务协同需要的、反映核心业务实体状态属性的组织机构的基础信息。主数据相对于交易数据而言,属性更加稳定,准确度要求更高,唯一识别。”按照这一定义来理解,ET数据本质上归属于主数据,可以定义为工厂的工程主数据,包括了工艺、设备等关键性基础数据。

过往很长时间内,业界更多关注IT、OT数据及两者融合,乃至提及数字化转型,往往只谈IT、OT融合。但随着数字化转型的深入,及对于过往诸多失败或者未达预期的实践案例的反思,业界逐渐意识到ET数据的价值,ET对于IT、OT融合的粘合剂及催化剂作用。

Gartner为此总结为:“企业必须充分理解ET数据价值,及与IT、OT数据的关联与协同,才能成功实现数字化转型”。ARC Advisory Group也提出“IT与OT数据的高效融合必须发挥ET数据价值”。近些年来,在企业尤其是头部企业的数字化建设中,ET数据的治理与应用已成为必须考虑的投资。

四、ET数据治理的挑战性

ET数据具有几个显著特征:数量多、关系复杂、变更频繁、格式多样化、非结构化。这些特征意味着针对ET数据的治理非常具有挑战性,和IT、OT的治理差异性明显;同时,人工治理费时,难有成效,需要几何级数地提升治理环节的自动化程度。

ET数据治理需要较强的工程技术Know-how及信息技术领域的 AI 技术,才可以全面提升 ET 数据的质量、结构化程度以及可访问性,大幅提升ET数据治理的自动化程度,形成单一可信的数据源。

以P&ID图为例。现实中,P&ID图多为PDF或者DWG格式,为便于日常应用及效率提升需要转换为结构化格式。仅是这样一项看似简单的工作,就需要专业的绘制工具(CAD);而为提升工作效率,还需要导入AI技术及行业规则,需要非常专业的技术能力。

五、ET数据治理所需核心技术

数据治理离不开相关技术。下面是ET数据治理所需要的核心技术能力,关键内核要素是CAD与AI技术。

1.数字化设计软件格式解析

结构化程度最高、质量最好的数据源通常都是数字化设计软件的直接成果,也就是各种专业 CAD 软件的数据。现代制造工厂、基础设施等由于涉及到众多专业、子系统,设计成果不可避免会呈现为不同格式的CAD文件,需要应用多源异构数据解析工具将其转化为统一格式,以便于后期的数据治理与应用。

数据解析技术的关键需求包括:尽可能多的支持公开数据格式和私有数据格式的CAD文件解析;无需用户采购对应第三方CAD软件的前提下完成数据解析;私有格式无损解析,以支持深度应用需求。

2.AI技术

ET数据的数量巨大、关系复杂且非结构化格式占比高,之所以得不到有效治理,根本原因在于人工治理的时间成本极高以及对人员的工程技术能力要求过高。因此,只有几何级数地提升自动化程度,才能形成切实可行的 ET 数据治理解决方案。

AI技术被视为提升ET 数据治理自动化程度的核心技术。然而, AI 在 ET 数据治理领域存在两个问题:一方面,AI 通常基于“大样本”训练模型,而大规模复杂系统的 ET 数据特征是“小样本”;另一方面,AI 不擅长解决几何模型推理问题,而 ET 数据大量存在于图形中。因此,需要在 AI 基础上深度融合行业 Know-how,用于解决小样本问题,同时弥补 AI 推理缺陷。

3.信息模型构建

信息模型的基本思想是以对象为中心,基于一定的规则来描述对象的属性、状态及对象间的关联关系,形成一个集成、统一、带语义的数据模型,并通过该模型建立与各类应用场景之间的映射和分发关系,支持相关利益方的信息交换、集成和共享。信息模型可以理解为主数据模型,用来支撑面向其他应用场景的数据分发。

信息模型技术起步于上世纪 60 年代。2002年,Autodesk提出了建筑+信息模型的 BIM 技术(Builiding Information Modeling)并大力推广,信息模型技术从此广为人知。

信息模型有两个非常重要的属性。1)它是以对象为中心的,现实应用中,信息模型所描述的对象多为实体对象,可以小到一个零件,大到一条产线甚至一个工厂。2)信息模型的构建实现了数据基于模型的管理,以高效管理多源数据之间复杂的关联关系。 

信息模型构建需要体现出在全量、全要素、全粒度三个维度的数据需求。全量意味着能覆盖需要管理的所有实体对象,全要素意味着可描述实体对象的所有属性,全粒度意味着模型构建的颗粒度可精细化至焊缝、零件级,以充分满足生产运营环节对于数据的可能需求。

六、ET数据运营期的可持续治理

ET数据治理大致可以分为两个阶段。一是在新建工程项目建设期通过数字化交付,或者在役工厂通过数字化重建,实现ET数据的“一次性”集中治理,以保证原本多源异构的散乱数据转化为高质量、高可用的数据,以初始化运营期的ET数据底座。

二是在生产运营期,由于频繁发生技改技措,需要持续进行ET数据治理,以保证数据一致性、高质量。目前,国内业界主要关注点还在第一阶段,第二阶段运营期ET数据的持续治理需要引起更多的重视,以保证持续发挥ET数据价值。

 

ET数据数量大、变更频繁、关系复杂、格式多样,对数据处理人员的工程技术能力要求高,人工治理费时,难有成效。只有几何级数地提升自动化程度,才能切实可行的治理ET数据。

互时科技结合AI和工业Know-how,可大幅提升ET数据治理的自动化程度,全面提升ET数据的质量、结构化程度以及可访问性,形成单一可信的数据源和信息门户,帮助企业真正发挥数据价值。

010-67866136