당신은 아직 다른 데이터베이스가 필요하지 않은가?
빅 데이터 시대에, 당신은 새로운 데이터베이스가 필요하다 - 그리고 그건 '분석 데이터베이스'라고 불린다. 방대한 양의 데이터를 사용 가능한 어떤 지식으로 바꾸는 작업을 할 때 바로 이 도구를 사용해야 한다.
무엇보다, 빅 데이터 조직의 목적은 비즈니스 의사 결정에 필요한 데이터를 활용함에 있다. 이를 위해서는 질의마다 엄청나게 빠른 전환 속도가 필요하다. 하지만, 오늘날 기업에 누적되는 데이터의 크기를 생각해보면, 그런 전환 속도는 전통적인 데이터 웨어하우스로는 도달하기 어려워지고 있다.
관계형 데이터베이스가 분석과 비즈니스 인텔리전스(BI)를 위한 데이터 웨어하우스를 지원하는 것도 가능하지만, 분석 데이터베이스는 전통적인 데이터베이스 소프트웨어에 비해 성능과 확장성에서 더 이점이 있다. 특히, IT 예산보다 데이터 크기가 더 빨리 성장하고 있을 때.
물론, 엄청나게 많은 데이터가 범람하더라도 수용 가능한 하둡을 데이터 저장소로 사용할 수도 있다. 하지만 그 수많은 비트와 바이트 속에서 지식을 얻기 위해 분석을 수행하는 부분에 있어서는 별로 도움이 되질 못한다.
예를 들어, 하둡은 큰 용량의 구조화된, 혹은 그렇지 않은 데이터를 저장하고 처리하는데 가장 비용면에 있어서 효율적인 방법이다. 또한 하둡은 일괄 작업들을 최적화하도록 설계되었다. 하지만 속도에 있어선 그렇지 못하다. 시간이 중요하지 않다면, 하둡은 요긴하게 쓰일 수 있다. 하지만 더 시급한 비즈니스 분석 업무들에 있어서, 하둡은 빅 데이터 만병통치약이 아니다.
바로 이곳이 분석 데이터베이스가 필요한 곳이다. 분석 데이터베이스는 보통 데이터 저장 시스템 - 하둡, 오라클, 혹은 마이크로소프트 같은 - 옆에 있으면서, 빅 데이터를 빠르게 분석하는데 사용된다. 이것은 빠르고, 강력하고, 활용 가능한 분석을 수행하는데 적합한 도구다.
당신은 당신의 분석 데이터베이스를 다음의 세가지 점을 고려해서 선택해야 한다: 데이터의 구조, 데이터의 크기, 그리고 데이터를 통해 답을 얻으려는 질문들의 종류.
분석 데이터베이스를 선택하는 기준
이 기준들을 좀 더 자세히 살펴보자:
물론, 분석 데이터베이스를 선택할 때 고려할 다른 문제들도 있다. 당신은 테라바이트 단위로 총 소유 비용(TCO)을 고려하고 싶어 할 수도 있다. 중요한 점 중의 하나는, 당신의 스태프가 사용될 데이터베이스 기술을 얼마나 잘 알고 있는가 하는 점이다. (하둡은 새로운 사용자들에게 악명 높게 어렵고 친화적이지 못하다.) 마지막으로, 데이터베이스 질문에 대한 개방성, 사용자 커뮤니티의 크기나 그 데이터베이스 주변의 에코시스템 등을 고려하고 싶어질 것이다.
당신의 데이터베이스 투자 문제를 무엇이 결정해야 하는가
결국, 당신의 데이터베이스 투가 문제를 결정하는 것은 보통 IT 문제를 결정하는 것과 같은 힘을 가지고 있다. 당신은 아래와 같은 것들을 하고 싶을 것이다:
요약하자면, 제대로 분석 데이터베이스를 선택한다면, 당신의 비즈니스를 성공으로 이끌 것이다. 현명하게 선택하기를.
*****
원문 : Why you need another database
번역 : 한승균
이전 글 : 다리가 여러 개 달린 멋진 로봇 만들기
다음 글 : Slack : 11. 트렐로 연동하기
최신 콘텐츠