Alan Zeichick | 内容策略师 | 2023 年 5 月 31 日
要充分利用业务数据,就需要进行投资回报计算,就像投资于工厂、扩大办公室或研发工作一样。如果没有关于客户、产品、交易、员工、财务、经济和竞争对手的数据,我们的组织就无法运营。我们需要这些数据来增长和繁荣。然而,高质量的数据具有获取、存储、管理、保护和分析数据的价格标签。数据公司拥有的数据越多,就越能为客户提供服务和与合作伙伴协作,而且他们必须在整个数据生态系统中投入的时间、精力和资源也越多。企业可以从以这种投资回报率思维持续处理数据中受益。
本文将主要探讨数据 ROI 方程的成本方面,并重点讨论如何控制和尽可能降低获取、存储、保护和使用该数据的成本。
数据成本是与获取、维护、保护和利用业务数据相关的费用。其中许多数据成本是明确的。数据本身必须居住在某个地方,无论是本地部署在硬盘驱动器或存储阵列上,还是基于云技术的存储(本身由物理硬盘驱动器组成)。该软件可组织这些数据,例如内容管理系统、关系数据库、数据仓库或数据湖或其他结构;该软件在使用开源解决方案时具有商业许可成本或订阅/支持合同。必须备份数据,需要额外的存储和软件来管理这些备份,并在某些数据丢失或发生物理灾难时进行完全恢复时为可能的有限恢复做准备。
从第三方提供商获取数据可能还会产生许可费或其他成本。需要有安全和访问控制,也许是为了符合行业或政府法规,并解决隐私问题。与验证数据以及确保或提高数据质量(例如更正过时信息)相关的成本。
充分利用数据还可能产生成本,这需要用于用户界面、分析和报告的软件,甚至是深度学习或人工智能软件来发现洞察。
最后,还有与性能和可扩展性相关的成本。当数据从 MB 增长到 TB 或甚至 PB 时,它需要复杂的软件、精心规划和潜在的自动化工具来维护和使用这些数据,以及大规模存储和访问的硬件。对于上述每一项数据成本,公司必须聘请熟练的人员来管理和运营其数据管理工具。
关键要点
降低数据成本,首先要了解企业拥有哪些类型的数据。其中一些是关系性的,也就是说,数据可以被视为生活在行和列中。其他数据是非结构化的,可能由文档、图像、视频和二进制文件组成。一旦企业了解了现有的数据资产,下一步就是确定适合存储数据的格式(关系数据库、NoSQL 数据库、文档存储库等),并考虑整合数据库的机会。此外,还必须了解数据来自何处、数据位于何处以及数据将如何使用。
一旦企业了解其数据,并将其存储在何处,下一步就是采用灵活的数据架构,该架构能够对所有这些数据源和用途进行会计核算,并允许企业优化其获取、管理、存储和分析。该架构的一个关键要素是找到正确的数据治理模型,以确定数据的使用方式。另一个解决方案是选择合适的本地或云端数据管理系统来尽可能降低成本,同时尽可能提高性能、灵活性、安全性和实用性。所有这些步骤将使组织能够评估任何批次数据的价值和使用,并采取正确的步骤,以尽可能降低提供该值的成本。
无论企业现在拥有多少数据,每天甚至每秒都会有更多的数据涌入。大部分数据都需要用于推动业务运营、执行交易、为客户和合作伙伴提供服务、增强管理能力、推动财务报告以及确保合规性。然而,其中一些可能几乎没有价值。下面是 11 种尽可能降低获取、转换、存储、保护和使用所有这些数据的成本的方法。在某些情况下,由于业务敏捷性、员工生产力或其他效率的提高,这些步骤可能导致间接节省,而不是直接削减预算。
根据您的预期用例和数据量,确定最合适的数据管理系统,例如事务处理数据库、数据仓库、数据湖和机器学习工具。将数据和工作负载整合到更少的数据库中可以降低软件许可和数据管理的成本;选择合适的数据存储和管理技术可以通过简化创建和维护集成所需的工作量来降低成本。
基于云技术的数据管理系统可以提供超越本地系统的可扩展性和可管理性,降低总成本,并具有更好的弹性、连接性、安全性和管理服务的优势。云技术还可以降低基础设施管理的人员成本。
数据管理手动流程难以扩展且容易出现人为错误或应用策略不一致的情况。自动化流程(例如自治数据库中的流程)可提供可预测性和强大的安全性,并节省人工成本。
数据治理策略用于描述您的组织如何优化和保护其数据,以及如何利用这些数据来支持业务运营。强大的数据治理策略可以消除数据冗余以及其他优势,这意味着需要存储、备份和分析的数据更少。
使用主流的开源数据库系统可以带来许多优势,包括庞大的、多元化的开发人员社区;可靠性;广泛的工具和软件生态系统;定制软件的能力;当然,还可以降低软件许可成本。开源是否能降低总成本,需要仔细的财务分析。基于开源软件的托管云技术服务为利用这些优势提供了另一种选择。
数据是运行日常事务和操作所需的数据。这是一个重要的开始,但真正的竞争优势来自分析。分析将您的数据转化为洞察,帮助您发现趋势、降低运营成本、增加收入并更好地为客户提供服务。这可能包括使用 AI 从大型和多样化的数据存储中获取洞察的大数据计划。注意一点:数据分析应该增加投资回报率方程的“回报”,但它不太可能降低您的总数据管理成本,因为您正在增加分析工具的成本。
数据清理涉及根据行业标准和定制规则更正数据行和列中的错误和不一致。虽然原始、未校正的数据可能适合事务处理,但当数据清理干净时,数据分析更准确,也更有用。不仅如此,当数据干净时,分析所需的工作(和费用)可能更少。然而,对于过度销售数据卫生的成本节约优势持谨慎态度。移除的数据量可能并不庞大,清理数据的成本也很高,因此,这里的好处可能主要来自更好的分析,而不是更低的成本。
无论数据操作是本地部署还是云端部署,网络流量分析都会显示哪些方面可以高效工作,哪些方面存在不必要的瓶颈。监视使用情况和网络活动可帮助您确定配置更改可以提高性能和用户工作效率的方面。网络监视可能会发现数据访问消耗过剩的计算和存储资源的情况,因此有机会采用更有效的架构来降低成本。
您的数据来自哪里?从何处获取您所依赖的数据?分析并可视化关键数据的沿袭可帮助您优化数据治理,以更高效地利用这些数据,无论这些数据是内部生成的还是来自外部来源(尤其是大数据)。同样,这可能不会节省很多钱,但它可能会发现您所付费的不需要的或未充分利用的第三方数据。
您可以自己管理数据架构、服务器、资源和应用,也可以让专家为您处理这些技术需求。这让您能够以更高的效率和更低的风险专注于您的业务,而不是复杂的数据管理。此外,服务提供商使用的专业人员和工具可能能够以更低的成本完成这项工作。这值得计算一下。
您的某些业务部门非常依赖数据,但哪些数据至关重要?如何使用数据?在哪里以及何时使用它?谁在使用它?利用这些洞察来指导您充分利用技术资源和数据管理预算。
数据成本降低计划的目标是帮助您以更低的成本完成更多工作:从数据中获得更大的业务洞察和运营响应能力,同时减少管理这些数据的支出。
数据可帮助您的业务职能部门实现从计费到翻译日志、从文档到部件目录、从价目表到库存的全方位支持。更有效地利用这些运营数据,释放新的机遇。但是,这些数据每天都在增长,而且成本也随之增加。幸运的是,您可以采取措施尽可能降低数据成本,同时继续推动业务增长并提高效率。
HeatWave 让您能够在一个云技术服务中,使用自动化和集成的生成式 AI 和机器学习进行交易和湖仓一体规模分析。企业可以消除单独分析和向量数据库、机器学习服务和 ETL 流程的成本和复杂性,同时避免数据存储之间的数据移动延迟和安全风险。借助内置机器学习驱动的自动化功能,开发人员和 DBA 可以节省大量时间、进一步提高性能并降低成本。HeatWave 可在 Oracle Cloud Infrastructure (OCI)、Amazon Web Services (AWS)、Microsoft Azure 上使用,并在 OCI Dedicated Region 的客户数据中心内使用。
HeatWave Lakehouse 的查询性能和性价比显著提高。许多快速发展的组织使用 HeatWave 来简化数据基础设施并降低数据管理成本,同时提高性能、可扩展性、安全性和生产力。
关停数据中心的第一步是什么?
在制定数据中心关停计划时,首先请全面调查企业中的应用、数据、服务、用户和安全需求。后期,企业需要基于调查结果,事无巨细地制定迁移计划 — 无论是将现有应用和数据“直接迁移”到云端,部署新应用,还是从零创建新应用。
数据中心内部设备的使用寿命有多长?
HVAC(供暖、通风和空调)系统、配电和物理安全系统等主要基础设施可使用 10 年以上,前提是必须定期维护。计算设备(如服务器、路由器、交换机和存储)按照一般经验,使用寿命通常为 3 到 5 年。
谁负责云端安全?
云基础设施(服务器、网络基础设施等)的物理安全由云技术供应商负责,软件和服务的安全责任由云技术供应商和企业共同承担。
关停一个数据中心需要多长时间?
完全关停一个数据中心一般需要数月时间。对于较大规模的 IT 基础设施,这可能需要数年时间。具体的时间长短完全取决于数据中心的规模、复杂性和数据量。其中,全面清点、制定计划、创建和测试新软件(如有需要)以及培训工作将占用大部分时间。而一旦完成所有的规划工作,实际迁移和关停工作在短时间内就能完成 — 就像搬迁办公室一样。
了解如何利用生成式 AI、构建机器学习模型、在对象存储中查询数据,或者探索其他感兴趣的 HeatWave 主题。
注:为免疑义,本网页所用以下术语专指以下含义: