关键字:供应链管理 Hadoop平台 大数据 科学实验模块
有时,尽管这些变化可能会对电子业OEM厂商如何有效、快速地管理海量数据提出挑战,目的是从中提取出有价值的信息,以满足他们的业务需求。但基于现代数据库结构的帮助,使得系统可以访问大多数业务相关的信息,从而有助于厂商在市场上获得更大的竞争优势,因此,建立一套高效的数据供应链是非常必要的。
不断变化的数据世界
过去,OEM制造商主要依赖单一数据库;而后,爆炸式的大数据及其随后的多数据源为厂商们带来了超过他们所想象的、更多的业务相关信息,于是,创建各种数据存储和数据分析的资料库成为焦点。
根据专业调研机构CITO Research题为《Hadoop 与现代供应链》的白皮书中指出,数据供应链正连接并汇入到各种不同的现代数据架构的数据源之中。现代数据架构一般包括多个存储库、Hadoop分布式计算平台、传统企业数据库(EDW) ,以及其它数据存储、云数据源、公众或开放式数据源、商业数据源、移动设备数据、传感器和物联网等等。
越来越多的企业开始采用现代数据架构,让实时数据能够及时、充分地被运用(如商业智能分析等),以确保投资的最大化。通过这些举措可以帮助厂商做出更明智的决策,从而捕捉到更多的市场商机,保证业务健康发展。
混合/匹配型解决方案
传统的单一数据库已经无法满足需要,它们不能有效地实现现有数据的快速传输,以满足当前业务的要求。而多个数据源需要跨部门之间的协调和整合,最后形成业务决策,同时也帮助企业降低成本,因此越来越多的厂商正在采用类似Apache Hadoop这样的解决方案。这是一个开源、可扩展的分布式计算平台,能够处理所有类型的数据库(如结构化、半结构化和非结构化),无论它的数据量大小或是复杂程度,且在数据供应链中扮演重要的角色。借助这一工具,企业现在可以同时使更多的数据库。
然而,它也带来了一些挑战。企业需要聘请具备专业知识的人员,或是投资于培训建立和管理Hadoop平台。不过,缺乏专业人才是不争的事实。根据CITO Research的调查发现,Hadoop专业人才与SQL专业人才的比例约为1:50或更多。找到合适的具有Hadoop平台和数据库专业知识的人才,可以避免一些挑战,因此,企业需要及早开始部署建设规划。
该报告还指出,将Hadoop平台与数据复制方案(如AttunityReplicate)结合起来,能够为企业带来最大益处。这些解决方案都是经过专业定制,使得数据进/出Hadoop平台更容易、传输速度更快,且更具成本效益,甚至跨越大量广泛的平台。它们允许用户在不同的数据库之间进行数据传输,并具有高可见度,不仅是在Hadoop平台上,而且是在企业内部的所有其它平台上实现数据的统一和整合。这将会保证数据供应链具备足够的灵活性,此外,还可以也用于和云平台之间的数据传输。
高速数据和规避风险
报告还提到,一部分企业可能会因为无法实现海量数据的传输,而面临巨大的风险。这些风险包括:
*不能执行关键业务的大数据项目;
*无法掌握所有业务及其信息,从而导致不明智的决定;
*需要人工指令实现数据传输;
*过期数据,如果不迅速利用,数据会失去价值;
*与原有或已存在的其它系统的集成度差,限制了可使用数据的范围;
*无法创建支持高级分析功能的数据库;
*缺乏有效的数据管理和控制,导致错误,或数据丢失;
*无法实现数据的可视化跟踪,以更好地了解数据供应链的使用价值和有效性。
综上所述,通过采用现代数据架构,可以允许企业创建支持简单数据传输的、高效而灵活的供应链。这种灵活性使企业本身能够实现自动化,并快速地将数据传输到支持整个供应链获益的及时决策中。选择正确的解决方案和选取用合适的人才,是创建可全面运作、且灵活敏捷的数据供应链的关键所在。