大数据分析服务平台基于天津超算中心已经构建的高性能计算、云计算基础设施构建,围绕多源异构数据的集成、海量实时采集存储、异构数据格式的虚拟化整合与一体化管理、交互式异构数据分析、数据可视化、通用的数据服务接口以及领域大数据应用开发运行环境、构建通用跨行业的大数据分析服务平台。
1) 大数据分析引擎:集成了数据处理、数据采样、数据集成、开箱即用的机器学习算法库、基于内存的分布式计算、多级分布式存储等部分。能够有效支持多样性应用数据格式,包括结构化、非结构化、半结构化数据;提供CPU+GPU异构高效能力,以及多级动态可扩展的海量数据存储能力。
2) 大数据处理工具系统:支持无专业数据知识的业务人员通过界面即可对关系型与非关系型数据实现交互式统计分析、分类挖掘、回归预测、地理分析、关系分析、行为分析、实时分析、文本分析、聚类分析、推荐分析等多样化产业分析需求,比照IBM Watson增强我国产业人员的分析能力、降低大数据在各行业中应用的成本。
1) 简单易用,能在线对数据进行快速处理和分析。
2) 面向工业用户提供大数据集成和分析挖掘服务。
1) 可信度和影响力:国家超级计算天津中心是国家工信部工业大数据试点示范单位,拥有国家发改委批复组建的“大数据处理技术与应用”国家地方联合工程实验室,具有广泛的影响力和良好的声誉。
2) 先进的技术架构:基于超级计算、云计算、大数据处理与应用融合的体系架构,能够面向远程设备监管、故障分析与预测,工业产品供需市场分析,产品效益分析,工业产品用户行为分析等领域提供工业大数据分析服务。具备支持多源数据、支持时序数据、图化大数据编程、数据安全、可靠等特点。
1) 适合有一定数据积累的工业用户用来做数据集成处理和分析挖掘。
2) 适合具备行业背景的工业用户以不编程的交互方式进行快速的数据分析处理。
工业单位用户,对数据安全比较看重。
中国一汽积累了大量的测试车数据、试验数据以及部分实车数据,并且数据规模增长迅速。使用工业大数据产品后,完成以下工作内容:
1) 利用工业大数据快速构建基于车辆信号数据的分析挖掘能力及实践方法,帮助客户实现了数据分析能力自建;
2) 提高车辆分析算法的通用性,实现了模型的逻辑可视化,输出格式通用化,并且达到了模型一次开发,多环境部署的高效性。极大的提高了一汽智能化的效率,降低了上层业务使用车联网数据的成本。
3) 在工业大数据上建立试验数据预处理专用模型开发、特征工程技术专用模型开发、工况识别基础模型开发、驾驶行为模型开发和车辆画像模型开发等,为技术研发和决策提供数据依据。
中国一汽汽车行驶油耗分析图
恒润科技作为整车厂智能驾驶和车联网的电子电器的重要供应商, 积累了大量的测试和试验车数据,并且团队有着丰富的汽车电子电器的行业专业经验,通过使用工业大数据产品, 带来了如下的能力提升:
1) 已有团队在不需要任何IT团队支持的情况下,在工业大数据产品上独立创建模型;
2) 围绕工业大数据形成了数据处理服务,同时在工业大数据上开发驾驶行为特征、道路特征抓取模型以及车辆运行工况分析模型;
3) 围绕工业大数据形成多套车辆信号数据分析解决方案。
使用工业大数据平台进行弯道识别建模分析