Alan Zeichick | Content Strategist | 2023년 5월 31일
비즈니스 데이터를 제대로 활용하려면 공장, 사무실 확장 또는 R&D 노력에 투자할 때와 같은 투자 수익 계산이 필요합니다. 기업은 고객, 제품, 거래, 직원, 재무, 경제 및 경쟁사에 대한 데이터 없이는 운영할 수 없습니다. 기업의 성장과 번영을 위해서는 그러한 데이터가 필요합니다. 그러나 고품질 데이터에는 획득, 저장, 관리, 보안 및 분석을 위한 가격이 수반됩니다. 기업이 더 많은 데이터를 보유할수록 고객에게 더 나은 서비스를 제공하고 파트너와 협업할 수 있지만, 동시에 전체 데이터 생태계에 더 많은 시간, 노력, 리소스를 투자해야 합니다. 기업은 이러한 종류의 ROI 사고방식으로 데이터를 일관되게 처리할 수 있습니다.
이 문서에서는 주로 데이터 ROI 방정식의 비용 측면을 살펴보고 해당 데이터를 획득, 저장, 보호 및 사용하는 비용을 제어하고 최소화하는 방법에 중점을 둡니다.
데이터 비용은 비즈니스 데이터의 획득, 유지 관리, 보안 및 사용과 관련된 비용입니다. 이러한 데이터 비용 중 상당수는 명확합니다. 데이터 자체는 온프레미스의 하드 드라이브 또는 스토리지 어레이, 또는 클라우드 기반 스토리지(물리적 하드 드라이브로 구성됨) 등 어딘가에 존재해야만 합니다. 콘텐츠 관리 시스템, 관계형 데이터베이스, 데이터 웨어하우스 또는 데이터 레이크 또는 다른 구조의 데이터를 구성하는 소프트웨어가 있습니다. 이러한 소프트웨어는 오픈 소스 솔루션을 사용할 때 상용 라이선스 비용 또는 구독/지원 계약을 체결합니다. 백업을 관리하고 물리적 재해가 발생한 경우 일부 데이터가 손실되거나 전체 복원이 발생하면 제한된 복구를 준비하기 위해 추가 스토리지 및 소프트웨어가 필요한 데이터를 백업해야 합니다.
또한 타사 제공업체로부터 데이터를 획득하기 위한 라이선스 비용이나 기타 비용이 있을 수 있습니다. 업계 또는 정부 규정을 준수하고 개인 정보 보호 문제를 해결하려면 보안 및 액세스 제어가 필요합니다. 오래된 정보를 수정하는 등 데이터 검증 및 데이터 품질 보장 또는 개선과 관련된 비용이 발생합니다.
데이터를 최대한 활용하기 위해서는 사용자 인터페이스, 분석 및 보고를 위한 소프트웨어, 그리고 인사이트를 발견하기 위한 딥 러닝 또는 인공 지능 소프트웨어까지 필요하기 때문에 그로 인한 추가 비용이 발생할 수도 있습니다.
마지막으로, 성능 및 확장성과 관련된 비용이 발생합니다. 데이터가 메가바이트에서 테라바이트 또는 페타바이트로 증가할 경우 정교한 소프트웨어, 신중한 계획 및 잠재적으로 해당 데이터를 유지 관리하고 사용하기 위한 자동화 도구와 대규모로 저장 및 액세스하기 위한 하드웨어가 필요합니다. 또한 위에 언급된 각 데이터 비용에 대해 기업은 숙련된 인력을 고용하여 데이터 관리 도구를 관리하고 운영해야 합니다.
주요 요점
데이터 비용을 최소화하는 것은 조직이 보유한 데이터의 종류를 이해하는 것에서 시작됩니다. 그 중 일부는 관계형입니다. 즉, 데이터를 행과 열에 있는 데이터로 간주할 수 있습니다. 다른 데이터는 구조화되지 않았으며 문서, 이미지, 비디오 및 이진 파일로 구성될 수 있습니다. 조직이 보유한 데이터 자산을 이해하면 다음 단계에서는 관계형 데이터베이스, NoSQL 데이터베이스, 문서 저장소 등 이를 저장하고 데이터베이스 통합 기회를 고려할 수 있는 최적의 형식을 결정합니다. 또한 데이터의 출처, 데이터 저장 위치, 데이터 사용 위치 및 방법을 파악하는 것도 중요합니다.
조직이 데이터를 이해하고 저장하기에 가장 적합한 위치를 파악하면 다음 단계는 모든 데이터 소스 및 용도를 고려할 수 있는 유연한 데이터 아키텍처를 채택하고 조직이 인수, 관리, 스토리지 및 분석을 최적화할 수 있도록 하는 것입니다. 이 아키텍처의 핵심 요소는 데이터의 사용 방식을 결정하는 데 적합한 데이터 거버넌스 모델을 찾는 것입니다. 또 다른 선택은 비용을 최소화하는 동시에 성능, 유연성, 보안 및 유용성을 극대화하는 데 적합한 온프레미스 또는 클라우드 데이터 관리 시스템을 선택하는 것입니다. 이 모든 단계를 통해 조직은 데이터의 가치와 사용을 평가하고 해당 가치를 제공하는 비용을 최소화하는 올바른 조치를 취할 수 있습니다.
오늘날 기업이 보유하고 있는 데이터의 양에 상관없이 매일, 매초마다 더 많은 데이터가 축적됩니다. 이러한 데이터의 대부분은 비즈니스 운영을 주도하고, 거래를 수행하고, 고객 및 파트너에게 서비스를 제공하고, 관리 역량을 강화하고, 재무 보고를 촉진하고, 규제 준수를 보장하는 데 필요합니다. 그러나 그 중 일부는 매우 작은 가치만을 가지고 있을 수 있습니다. 다음은 모든 데이터를 획득, 변환, 저장, 보안 및 사용하는 데 드는 비용을 최소화하는 11가지 방법입니다. 비즈니스 민첩성 향상, 직원 생산성 향상 또는 기타 효율성 향상으로 인해 이러한 단계가 직접 예산 절감이 아닌 간접적인 절감으로 이어질 수 있습니다.
트랜잭션 데이터베이스, 데이터 웨어하우스, 데이터 레이크, 머신러닝 도구 등을 고려하여 예상되는 사용 사례 및 데이터 볼륨을 기반으로 가장 적합한 데이터 관리 시스템을 결정합니다. 데이터 및 워크로드를 더 적은 수의 데이터베이스로 통합하면 소프트웨어 라이선스 및 데이터 관리 비용을 절감할 수 있습니다. 최고의 데이터 스토리지 및 관리 기술을 선택하면 통합을 생성하고 유지 관리하는 데 필요한 작업량을 단순화하여 비용을 절감할 수 있습니다.
클라우드 기반 데이터 관리 시스템은 더 나은 복원성, 연결성, 보안 및 관리 서비스의 장점을 통해 더 낮은 총 비용으로 온프레미스 시스템의 확장성과 관리 용이성을 제공할 수 있습니다. 또한 클라우드는 인프라 관리를 위한 인력 배치 비용을 절감할 수 있습니다.
데이터 관리를 위한 수동 프로세스는 확장이 어렵고 인적 오류 또는 일관성 없는 정책 적용 가능성이 높습니다. 자율운영 데이터베이스에 있는 것과 같은 자동화된 프로세스는 예측 가능성과 강력한 보안성을 제공하며 인건비를 절감합니다.
데이터 거버넌스 정책은 조직이 데이터를 최적화 및 보호하는 방법과 해당 데이터를 활용하여 비즈니스 운영을 지원하는 방법에 대해 설명합니다. 강력한 데이터 거버넌스 정책을 통해 데이터 중복을 방지할 수 있습니다. 즉, 저장, 백업 및 분석이 필요한 데이터가 줄어듭니다.
선도적인 오픈 소스 데이터베이스 시스템을 사용하면 다양한 대규모 개발자 커뮤니티, 안정성, 다양한 도구 및 소프트웨어 에코시스템, 소프트웨어를 커스터마이징할 수 있는 기능 등 다양한 이점을 제공할 수 있으며, 소프트웨어 라이선스 비용도 물론 절감할 수 있습니다. 오픈 소스가 총 비용을 낮추는지 여부는 신중한 재무 분석이 필요합니다. 오픈 소스 소프트웨어를 기반으로 하는 관리형 클라우드 서비스는 이러한 이점을 활용할 수 있는 또 다른 옵션을 제공합니다.
데이터는 일상적인 트랜잭션 및 운영을 실행하는 데 필요한 데이터입니다. 이는 중요한 시작이지만 진정한 경쟁 우위는 분석에서 나옵니다. 분석은 데이터를 인사이트로 전환하여 동향을 파악하고 운영 비용을 절감하며 수익을 높이고 고객에게 더 나은 서비스를 제공할 수 있도록 지원합니다. 여기에는 AI를 사용하여 다양한 대규모 데이터 저장소의 인사이트를 확보하는 빅 데이터 이니셔티브가 포함될 수 있습니다. 주의 사항: 데이터 분석은 ROI 방정식의 "이익"을 증가시켜야 하지만 분석 도구의 비용을 추가하기 때문에 총 데이터 관리 비용을 낮출 수는 없습니다.
데이터 정제에는 산업 표준 및 사용자정의 규칙에 따라 데이터의 행과 열에서 오류 및 불일치를 수정하는 작업이 포함됩니다. 정정되지 않은 원시 데이터는 트랜잭션에 적합할 수 있지만 데이터가 정제되었을 때 데이터 분석은 더 정확하고 더 유용합니다. 뿐만 아니라 데이터가 깨끗하면 분석하는 데 필요한 노력(및 비용)이 줄어들 수 있습니다. 그러나 데이터 위생의 비용 절감 이점을 과도하게 평가하는 것에 주의하십시오. 삭제된 데이터의 양은 아마도 크지 않을 것입니다. 데이터 정제에는 비용이 발생하기 때문에, 여기서 얻을 수 있는 이점은 주로 비용 절감보다는 더 나은 분석에서 비롯될 가능성이 높습니다.
데이터 운영이 온프레미스에서든 클라우드에서든 상관없이 네트워크 트래픽 분석은 상황이 효율적으로 작동하는 위치와 불필요한 병목 현상을 보여줍니다. 사용량 및 네트워크 활동을 모니터링하면 구성 변경으로 성능 및 사용자 생산성이 향상될 수 있는 영역을 식별할 수 있습니다. 네트워크 모니터링은 데이터 액세스가 과도한 컴퓨팅 및 스토리지 리소스를 소비하는 경우를 발견할 수 있으며, 이 경우 비용을 절감하는 보다 효과적인 아키텍처를 구축할 수 있습니다.
귀사의 데이터는 어디에서 왔습니까? 가장 신뢰할 수 있는 데이터는 어디에서 얻을 수 있습니까? 분석한 후 주요 데이터의 계보를 시각화하면 데이터 거버넌스를 최적화하여 내부적으로 생성되든 외부 소스에서 생성되든, 특히 빅 데이터를 통해 이 데이터를 가장 효율적으로 활용할 수 있습니다. 다시 말하지만, 이것은 아마도 엄청난 돈을 절약하지는 못하겠지만, 지불하고 있는 불필요하거나 미사용 중인 타사 데이터를 발견할 수 있습니다.
데이터 아키텍처, 서버, 리소스 및 애플리케이션을 직접 관리하거나 전문가가 이러한 기술적 요구 사항을 처리하도록 할 수 있습니다. 이를 통해 데이터 관리의 복잡성이 아닌 비즈니스에 집중하여 효율성을 높이고 위험을 줄일 수 있습니다. 또한 서비스 제공업체가 사용하는 전문 직원 및 도구는 더 낮은 비용으로 작업을 수행할 수 있습니다. 분석해 볼 가치가 있습니다.
비즈니스의 일부분은 데이터에 매우 의존하지만 중요한 데이터는 무엇입니까? 데이터 사용 방법은 어떻습니까? 언제 어디서 사용되나요? 누가 그것을 사용하고 있습니까? 이러한 통찰력을 활용하여 기술 리소스 및 데이터 관리 예산을 최대한 활용할 수 있습니다.
데이터 비용 절감 프로그램의 목표는 더 낮은 비용으로 더 많은 작업을 수행하는 데 도움을 주는 것입니다. 즉, 데이터를 관리하는 데 더 적은 비용을 지출하면서 데이터에서 더 큰 비즈니스 통찰력과 운영 응답성을 확보할 수 있습니다.
데이터는 청구서부터 번역 로그, 문서부터 부품 카탈로그, 가격 목록부터 재고 관리에 이르는 귀사의 모든 업무 운영을 지원합니다. 이 운영 데이터를 사용하면 새로운 기회를 더욱 효과적으로 활용할 수 있습니다. 그러나 데이터는 관련 비용과 함께 매일 증가하고 있습니다. 다행히도 비즈니스 성장을 주도하고 효율성을 개선하면서 데이터 비용을 최소화하는 조치를 취할 수 있습니다.
HeatWave는 트랜잭션과 레이크하우스 규모의 분석을 처리하기 위해 단일 클라우드 서비스에서 자동화된 통합 생성형 AI 및 머신러닝을 이용할 수 있게 해 줍니다. 기업은 별도의 분석 및 벡터 데이터베이스, 머신러닝 서비스 및 ETL 프로세스의 비용과 복잡성을 없애고 데이터 저장소 간 데이터 이동의 대기 시간과 보안 위험을 피할 수 있습니다. 내장된 머신러닝 기반 자동화를 통해 개발자와 DBA는 상당한 시간을 절약하고 성능을 향상시키며 비용을 절감할 수 있습니다. HeatWave는 Oracle Cloud Infrastructure(OCI), Amazon Web Services(AWS), Microsoft Azure 및 OCI Dedicated Region을 사용하는 고객의 데이터 센터에서 사용할 수 있습니다.
HeatWave Lakehouse의 쿼리 성능과 가격 대비 성능은 매우 우월합니다. 빠르게 성장하는 많은 조직은 HeatWave를 사용하여 데이터 인프라를 단순화하고 데이터 관리 비용을 절감하는 동시에 성능, 확장성, 보안 및 생산성을 향상시킬 수 있습니다.
데이터 센터 운영 종료를 위한 첫 번째 단계는 무엇인가요?
데이터 센터 운영 종료를 계획할 때에는 애플리케이션, 데이터, 서비스, 사용자, 보안 요구 사항을 면밀히 조사해야 합니다. 조사의 모든 내용에는 '리프트 앤 시프트' 방식으로 기존 애플리케이션과 데이터를 클라우드로 모두 옮길 것인지, 새로운 애플리케이션을 선택할 것인지, 처음부터 새로운 애플리케이션을 구축할 것인지 등 마이그레이션 방식에 대한 정보도 포함되어야 합니다.
데이터 센터 내 장비의 수명은 얼마나 긴가요?
HVAC(난방, 환기, 냉방) 시스템, 배전, 물리적 보안 시스템 등 데이터 센터 인프라의 주요 구성 요소들은 정기적인 유지 관리를 통해 10년 이상 사용할 수 있습니다. 그러나 서버, 라우터, 스위치, 스토리지 등 컴퓨태이션 장비가 구형 모델로 전락하기까지는 대략 3년에서 5년이 걸립니다.
클라우드 보안 책임은 누구에게 있나요?
클라우드 인프라의 물리적 보안(서버, 네트워크, 인프라 등)은 클라우드 제공업체가 관리합니다. 소프트웨어 및 서비스의 보안 책임은 클라우드 제공업체와 기업이 공동으로 집니다.
데이터 센터의 운영을 종료하기까지는 얼마의 기간이 걸리나요?
전체 데이터 센터 운영을 완전히 종료하기까지는 여러 달이 소요됩니다. 대규모 IT 인프라의 경우 수년이 걸리기도 합니다. 데이터 센터 운영 종료 기간은 데이터 센터의 크기, 복잡성, 데이터의 양에 따라 달라집니다. 그중 상당한 시간이 면밀한 재고 조사, 계획 수립, 새로운 소프트웨어 생성 및 테스트(필요 시), 교육에 소비됩니다. 사무실 이전과 마찬가지로, 모든 계획이 완료된 상태에서는 실제 마이그레이션 및 데이터 센터 운영 종료 그 자체는 상대적으로 단기간에 끝낼 수 있습니다.
전문가 워크숍을 통해 생성형 AI 활용하기, 머신러닝 모델 구축하기, 객체 스토리지에서 데이터 쿼리하기, 또는 그 외 관심있는 HeatWave 관련 주제를 탐색해 보세요.