인터넷의 사용이 대중화되어 가며 늘어나는 것 중의 하나가 사용자에게 실질적인 서비스를 제공하고 있는 역할을 담당하고 있는 WAS 이다. 시간이 흐를수록 늘어나고 있는 방대한 내용의 컨텐츠와 멀티미디어 서비스 등의 제공으로 WAS 의 비중이 많이 높아져 가고 있으며, 이에 따라 서비스 로그들은 기하급수적으로 증가하는 추세이다.
WAS 를 운영하는 목적 중의 하나가 클라이언트에게 정보를 제공하는 제공자 역할인데 서비스 운영자의 입장에서 단지 정보를 제공하는 것으로서 또는 정보를 제공할 수 있는 환경을 만들어 준 것으로써 운영자의 역할을 다 하는 것이 아니며 갈수록 늘어가는 서비스와 더불어 증가하는 사용자 등 좀 더 효율적인 운영을 위해 서비스 로그 분석의 중요성이 증가하게 된다. 서비스를 운영하는 대부분의 운영자들은 얼마나 많은 서비스 사용자가 방문했는지에 대해 많은 관심을 가지고 있으며 어떤 페이지가 가장 많이 방문되었고, 머무는데 얼마나 많은 시간을 소비했는지, 어느 도메인에서 접속을 많이 하였는지 등의 통계 정보를 중요시 하게 된다.
이에 더해 서비스를 제공하는 과정에서 발생 한 장애내역 역시 운영자에게 많은 고민을 안겨주는 부분이다. 운영자의 입장에서는 어떤 형태의 서비스가 가장 많이 이용되고 있느냐 하는 사실과 더불어 장애내역을 궁금해 할 것이고, 그에 대한 분석의 결과를 더 나은 서비스와 환경의 제공이라는 것에 활용하고 싶어한다. 하지만 최근 인터넷을 통한 WAS 기반의 서비스 발달로 인한 처리량이 급격히 증가함에 따라 서비스 내역을 기록한 로그의 양 또한 기하급수적으로 늘어나고 있으며 이렇게 방대해진 로그 데이터를 분석하여 의미 있는 결과를 얻기 위해서는 이를 효율적으로 관리하고 처리해줄 수 있는 별도의 데이터베이스를 필요로 하게 된다.
몇 백만 건 이하의 소규모 데이터이거나, 분석을 전담할 수 있는 전용 데이터베이스가 있다면 상대적으로 쉽게 결과를 만들어 낼 수 있으나, 대용량의 별도의 데이터베이스가 없는 상황이라면 데이터를 분석하는 방법은 결코 가볍지 않은 고민이 된다. 더불어 문장 형식으로 기록되는 로그 데이터들의 정형화되지 않은 특성 때문에 기존의 데이터베이스구조로 접근하기 쉽지 않은 부분을 가지고 있다. 이러한 문제점을 해결하기 위해 최근 빅데이터의 이슈와 함께 등장한 Hadoop, NoSQL 등의 기술이 가지는 데이터 저장비용 절감, 대용량 데이터의 준 실시간 조회, 기존의 버렸던 정보를 저장, 패턴 분석 룰 적용, 선 순환 실시간 분석 등의 특징은 이에 대한 새로운 솔루션이 될 수 있으며, 소프트웨어적인 구현을 통해 비용부분에 대한 문제도 해결 할 수 있다.
인터넷 환경의 발달과 스마트 디바이스의 출현, SNS 의 발전 등은 장애 없는 서비스 운영 측면의 발전을 요구하고 있다. 정기적인 모니터링등과 같은 장애예방을 위한 조치와 더불어 장애징후를 사전에 판단하여 장애를 예측하고 대비하여 장애 없는 서비스를 제공하고자 하는 노력이 끊임없이 요구되고 있다.
위의 요구사항을 추가 하드웨어나 특정 소프트웨어의 구매 없이 빅데이터 기반의 소프트웨어적인 구현을 통해 저비용으로 기존의 로그데이터 분석 방법을 강화시켜 장애예방에 활용하였다는 것에 의의가 있다. 특히 서비스가 이전보다 다양해지고 복잡해 지는 것에 착안하여, 기존의 장애대처 방법에 더해 새로운 유형의 장애에 대비하기 위해 NoSQL 방식의 로그 데이터베이스를 구축하여 추가되는 장애 유형이나, 상황에 유연하게 대처할 수 있는 방법을 제시하였다.
하지만 장애징후 예측에 의한 장애예방에 대한 표준화 된 정의가 이루어지지 않았고, 대상 항목 또한 서비스 중에 있는 모든 서비스에 동일한 기준으로 적용되지 못하고 있다는 점에서 개선이 필요하다. 일반적인 경우를 가정하여 장애 인지 항목을 설정하였고, 특별한 환경, 어플리케이션에서는 그에 맞는 항목이 추가되는 과정이 필요하기 때문에 장애징후 예측 프로세스에 대한 개선이 필요하다. 사용자가 간단한 조작만으로 장애 인지 항목을 추가 할 수 있도록 하는 등의 기능도 가능하도록 해야 할 것이다.
이러한 부분은 기계학습 기법을 활용한 빅데이터의 분석을 바탕으로 키워드적용의 자동화를 통한 성능 개선을 이루도록 해야 할 것이며, 장해징후 예측에 필요한 분석 로그의 양이 많아지는 경우에 데이터베이스의 분산환경 구성과 같은 성능상의 문제에도 주의해야 할 것이다.