如果你想从你的大数据中获得可操作和有影响的洞察力,你必须有与评估它们的特定数据算法高度相关的数据聚合。 当这种情况发生时,就会出现数据突破。
这种洞察力的一个障碍是数据仓,它几乎存在于每个公司。 但对大多数组织来说,打破这些筒仓仍是一项重大工作。 以下是您的企业如何克服打破数据筒仓的四个关键挑战。
SEE:数据科学家工作面试:期望的问题和提出的问题(免费PD F)(技术共和国)
几乎每个用户业务部门都有通过现成数据库或该部门独立购买和安装的应用程序获取的数据。 通常,这种“脱离网格”的数据是对公司系统现有数据和处理限制的一种解决办法,这些限制未能使一个部门能够优化其生产力。 有时,内部阻力共享数据摊位的进展,也。
这就造成了数据筒仓,这使得公司难以对其所有信息资产进行核算。 数据筒仓限制了公司使用各种来源的数据进行分析的能力。
SEE:建立一个有效的数据科学团队:商业和技术领袖指南(免费PDF)(技术共和国)
在这种情况下,打破数据筒仓的一个好方法是实施一个全机构的IT资产管理和跟踪系统。 由于对所有数据和IT资产的核算涉及对每个部门拥有的所有数据和IT进行盘点,因此首席执行官和其他顶级管理层应在任何系统启动之前支持全公司的IT资产管理。 首席信息官的职责是确保这次收购从顶部。
随着影子IT的发展,供应商软件和数据库几乎可以通过任何部门的门。 部门独立购买的不同供应商的系统不一定能很好地相互作用。 当这种情况发生时,由于跨系统和数据集成失败,系统数据筒仓可能会出现.. 解决这一问题的最佳方法是,IT和各业务部门向供应商发出的招标书中需要互操作性和一整套应用程序编程接口。
确保系统和数据互操作性的一种方法是对RFP的头版要求,是IT创建一个标准的RFP,这是采购或任何部门授权技术采购所必需的。 此标准化表格可供IT部门和最终用户部门使用..
供应商销售的大多数系统和数据库都有某种类型的API用于数据集成;然而,完全无缝集成和轻松聚合来自不同系统的数据的能力是永远无法假定的。 信息技术和终端用户必须使用机器人流程自动化(RPA)等工具集,这主要是一个终端用户软件工具,用于实现业务流程自动化和更简单的数据传输,或提取、转换、加载(ETL),这是信息技术使用的一种更复杂的数据共享软件,通常需要编码逻辑将数据转换成所需的形式。
没有一个工具执行数据聚合所需的每一项集成任务,因此由IT来了解这些工具,测试它们,并确定一个可以解决公司内部任何数据集成和聚合问题的软件工具组。
大多数公司仍然有纸,电影的视频,照片和图纸,堆放在货架上,壁橱,或在场外储存。 在任何特定的时间,都可能有必要跟踪和汇总这些非数字数据,无论是用于发现诉讼程序还是审查纸质病历。 没有即时解决办法。 您必须识别所需的数据和文档,然后将它们数字化成一个可以很容易地聚合到您正在构建的数据存储库中的表单。
克服这些挑战将帮助您突破筒仓,并帮助您的组织取得良好的数据分析结果。