基于HBase的工业大数据存储实战探索Can总线在物品追踪中的作用
随着工业4.0时代的到来,工业互联网和企业的智能化、信息化都将不断推进,传统的工业实时数据库和关系数据库已经难以完全胜任工业大数据的存储,以HBase为代表的NoSQL数据库正在蓬勃发展,其完全分布式特征、高性能、多副本和灵活的动态扩展等特点,使得HBase在工业大数据的存储上拥有强大的优势,打破了流程工业生产中的数据壁垒效应,能够促进工业生产水平和生产管理水平的大幅提高。本期格物汇,就来给大家介绍HBase数据库及格创东智相关实战案例。
了解HBase
HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,它利用Hadoop HDFS作为其文件存储系统。与Google Bigtable不同的是,后者使用GFS作为其文件存储系统,而前者则依赖于普通硬件配置处理海量结构化数据。Google Bigtable运行MAPREDUCE来处理Bigtable中的海量数据,而HBASE同样利用了这个框架来处理其自身的大量数据;Google Bigtable使用Chubby作为协同服务,而HBASE则采用Zookeeper提供协调服务。
与传统数据库相比,HBASE具备多重优势:1)线性扩展,可以通过节点扩展进行支撑;2)数据存储在hdfs上,有健全备份机制;3)通过zookeeper协调访问速度快。
基于Can总线在物品追踪中的作用
Can总线(Controller Area Network),是一种广泛应用于汽车行业中用于车辆控制器间通信的小型网络协议。在物品追踪场景中,该技术可以被集成至物品内部或附加设备中,以实现对物品状态或位置的一致跟踪。例如,在供应链管理体系中,一旦某个产品被标记并接入Can总线网络,那么所有参与该产品生命周期的人员或设备便能即时获取该产品当前状态信息,从而提高运输效率,并确保顺畅地完成订单履行过程。
关于Can总线如何结合进入我们的讨论,我们需要理解它是如何帮助我们更好地操作这些特征或者更多关于面板上的小对象,这些对象可能包含有各种类型的小文件,如图片短视频文档等,它们都是小于10MB范围内。这就引出了MOB(Medium-Sized Object)的概念,这一功能允许我们以低延迟读写方式保存这些类型的小文件,同时保持强一致性检索能力,以及水平易扩展性。这使得对于每个面板组id做为Rowkey设计表的时候打开MOB功能成为了一种理想选择,因为这样可以让我们的查询更加快速有效,不再需要像之前那样从MySQL读取大量行,然后再从OSS拿取特征,这样的链路会显著减少查询时间,从而满足现有的业务需求增长所需的一定标准。