네트워크 기술의 발달로 인해 네트워크 공격이 증가하고 있으며, 이에 따라 네트워크 공격을 사전에 탐지할 수 있는 네트워크 이상탐지 기술의 필요성이 대두되고 있는 상황이다. 이러한 네트워크 이상탐지 기술에 대표적인 방법으로 오토인코더 모델을 사용한 방법이 있다.
  오토인코더 모델이란 딥러닝 모델 중 하나로, 모델에 입력된 데이터를 저차원의 공간으로 축소하는 인코더와 축소된 데이터를 다시 입력 데이터의 차원으로 복원하는 디코더로 이루어져 있는 인공지능 모델이다. 여기서 모델에 입력된 입력 데이터와 모델을 통해 출력된 복원 데이터의 차이를 복원 오차라고 부른다. 오토인코더 모델은 학습을 통해 정상 데이터의 패턴을 학습하며 정상 데이터를 작은 복원오차로 복원할 수 있게 된다.
  오토인코더 기반 네트워크 이상탐지 시스템은 정상 네트워크 데이터에 대하여 작은 복원오차를 가지는 오토인코더 모델의 특성을 이용한 방법으로, 탐지를 위한 임계값을 설정하고 임계값 이하의 복원오차를 가지는 경우 정상 네트워크 데이터, 임계값을 초과하는 복원오차를 가지는 경우 네트워크 공격이라고 탐지해내는 이상탐지 시스템이다. 그러나 기존의 오토인코더 기반 네트워크 이상탐지 시스템은 오토인코더 모델의 은닉층 정보를 활용하지 않는다는 점과 이상탐지 시점이 한 순간으로 고정되어있다는 한계점을 가지고 있다. 기존 오토인코더 모델에서 사용하는 입력 데이터와 출력 데이터만으로는 학습된 오토인코더 모델의 모든 정보를 사용할 수 없으며 모델의 은닉층에도 학습 정보가 존재하기 때문에 은닉층 정보의 고려가 필요하다. 또한 네트워크 공격의 비정상 정도에 따라 비정상 정도가 심한 네트워크 데이터는 쉽게 알아볼 수 있으며, 이를 다른 비정상 데이터와 같은 시점에서 탐지한다는 것은 탐지 시간을 지연시킨다.
  이러한 한계점을 해결하기 위해 계층적 오토인코더(Hierarchical Autoencoder: HAE) 기반 이상탐지 시스템은 오토인코더 모델의 은닉층 정보를 활용하며, 이상탐지 시점을 인코더의 출력, 디코더의 출력, 인코더의 은닉층 단계로 나누어 단계적인 탐지를 진행하는 방법을 제안한다. 이러한 계층적 오토인코더 기반 이상탐지 시스템은 인코더의 출력 단계를 통해 이상정도가 큰 네트워크 공격을 신속하게 탐지해낼 수 있으며, 인코더의 은닉층 단계로 모델의 은닉층의 정보를 활용해 기존 방법보다 높은 성능의 이상탐지가 가능하다.

저작권자 © 숭대시보 무단전재 및 재배포 금지