CnTech 사업부 솔루션/IBM Integrated Analytics System

IBM Integrated Analytics System(IIAS) 소개

안녕하세요 씨앤텍시스템즈 입니다.

이번 포스트는  IBM의 새로운  DW Appliance 인

"IBM Integrated Analytics System(IIAS)" 대해 알아보겠습니다.

 

 

효과적인 데이터 분석으로 더 신속한 의사 결정이 가능하며 그에 따라 업계 선두 주자와 경쟁 열위 그룹이 결정되기도 합니다. 그러나 기업에 분석 기능을 제공하는 일은 다음과 같은 여러 요인으로 인해 복잡해집니다.

 

머신 러닝을 비롯하여 복잡한 분석 요구 사항을 지원하기 위해 데이터 사이언티스트를 비즈니스에 참여시키는 것의 중요성
• 비정형 데이터 및 반정형 데이터를 포함하여 여러 데이터 타입을지원할 필요성
• 실시간 및 스트리밍 분석을 요구하는 사물 인터넷(Internet ofThings, IoT) 등 새롭게 등장하는 활용 사례
• 온프레미스 및 클라우드 환경에서 관리해야 하는 데이터의 폭발적인증가 및 그에 따른 데이터 사일로화(Data Silo)
• 데이터웨어하우스 인프라 내에서 SLA(service level agreement)에부합하기 위한 성능 및 확장성 필요

 

기존의 인프라에 대한 투자를 유지하면서 위 요구사항을 수용하기 위해서는 조직의 분석 및 데이터 웨어하우스 솔루션이 다음 조건을 충족해야 합니다.

 

• 고급 분석 모델의 개발 및 배포에 관련된 어려움도 최소화할 수 있는 솔루션을 데이터 사이언티스트에게 제공합니다.
• 다양한 데이터 타입과 위치, 기존 배치 처리 및 준 실시간 처리 또는혼합 워크로드를 지원합니다.
• 클라우드에 대한 연결 및 미아그레이션을 지원하는 하이브리드데이터 전략을 수용합니다.
• 워크로드의 규모와 유형에 상관없이 우수한 성능 및 확장성을제공합니다.
• 클라우드와 유사한 유연성과 확장성을 지원하되 데이터 센터 내에 위치합니다.

 

조직의 분석 요구 사항이 늘어남에 따라 올바른 솔루션에 투자하는 것이 무엇보다 중요합니다. 어떤 선택을 하느냐에 따라 SLA를 달성할수도, 성공의 장애물을 만날 수도 있습니다.

 

IBM Integrated Analytics System은 클라우드 환경에 최적화된 고성능 데이터 플랫폼으로 데이터 사이언티스트의 개발 및 배포 작업을 가속화하여 귀사의 경쟁력을 강화하는데 필요한 인사이트를 발굴합니다.

 

데이터 사이언티스트는 내장되어 있는 통합 데이터 사이언스 솔루션인 IBM Data Science Experience를 활용하여 귀사에 저장된 데이터를 최신의 데이터 사이언티스 툴에 적용할 수 있습니다. 이러한 연결을 통해 성능 최적화된 Common SQL 엔진과 임베디드 Apache Spark 프로세싱 기능을 활용하여 데이터 사이언티스트가 머신 러닝 분석을 개발하는 것이 가능합니다.

 

IBM Integrated Analytics System은 처음부터 튜닝 및 유지 보수를 거의 또는 전혀 필요로 하지 않으면서 고성능 및 타바이트급 확장성을 요하는 까다로운 워크로드도 관리하고 운영할 수 있습니다. IBM Integrated Analytics System은 임베디드 Apache Spark 프로세싱 엔진을 머신 러닝에 활용하면서 더 우수한 성능의 분석을 지원합니다. 뿐만 아니라 이 기능으로 다른 환경에 분석 및 데이터를 이동하는 작업이 불필요해지므로 복잡성을 줄일 수 있습니다. IBM 하이브리드 데이터 관리 전체 제품군의 기반이 되는Common SQL 엔진을 통해 기존 온프레미스 및 클라우드 애플리케이션과 연동할 수 있습니다. 이러한 유연성 덕분에 각 작업에 적합한 처리 환경을 선택하는 것이 가능합니다.

 

이 통합 아키텍처는 AMPP(asymmetric massively parallelprocessing)와 같은 고급 소프트웨어 기능을 IBM Power ®
기술 및 플래시 메모리 스토리지 하드웨어와 통합하여 제공합니다. IBM Integrated Analytics System은 기존 배치
워크로드와 혼합 워크로드를 처리합니다. 이 워크로드는 대개 방대한 데이터 볼륨을 대상으로 한 쿼리, 소규모 데이터
세트에 대한 빠른 질의, 다수의 동시 처리를 필요로 합니다. 이를 위해 IBM Integrated Analytics System은 단일
솔루션에서 각종 데이터 타입 및 위치를 처리하는 다양한 분석 활용 사례를 지원합니다. 이러한 유연성 덕분에 데이터
사이언티스트에게 무한한 가능성을 제공할 수 있습니다.

 

뿐만 아니라 간소화된 프로세스로 머신 러닝 기능을 포함한 분석 작업에 더 우수한 성능 및 유연성을 제공합니다. IBM
Data Science Experience Local에 포함된 5 Authorized User라이선스를 통해 데이터 사이언티스트가 곧바로 시스템의
데이터에 연결한 다음 모델 개발을 시작할 수 있습니다. 이 대화형 협업 클라우드 기반 환경은 데이터 사이언티스트가
인사이트를 발굴할 수 있도록 다양한 툴을 제공합니다. 또한 Jupyter Notebook 컨테이너가 시스템에 포함되어 있으므로
Jupyter Notebook에서 Python, R, Scala를 사용할 수 있습니다. Jupyter는 클릭 한 번으로 컴파일 및 Spark 애플리케이션으로 배포할 수 있어, 대화형 코드 실행에 사용할 수 있습니다.

 

데이터 마이닝, 예측, 변환, 통계, 지리 정보 데이터, 데이터 준비를 위한 함수들이 내장되어 있을 뿐 아니라 IBM Integrated Analytics System의 임베디드 Spark에서 오픈 소스 R 및 기타 프로그래밍 언어(Python, Java, C, C++, Lua 등)를 지원합니다.

 

IBM Integrated Analytics System은 선형 회귀, 의사 결정 트리 클러스터링, k-means 클러스터링, Esri 호환 지리 정보
확장 등의 다양한 알고리즘이 포함된 IBM Netezza ® Analytics 기술을 내장하고 있습니다. 이 시스템은 다양한 비즈니스 분석 및 시각화 툴, 즉 IBM Cognos ® , SAP BusinessObjects, Kognitio, Microsoft Excel, QlikView, SAS, Microsoft SQL Server Reporting Services(SSRS), Tableau 등과 함께 사용할 수 있습니다. IBM SPSS ® , Fuzzy Logix, 오픈 소스 R 및 SAS 등과 같은 모델 개발 및 평가 툴도 지원합니다.

728x90