이 글에서는 시계열 분해 기법인 EMD와 EMD의 앙상블 방식인 EEMD에 대해 소개해보려 한다.
EMD와 EEMD에 대한 알고리즘은 아래의 논문을 참고하였다.
Lei, Y., He, Z., & Zi, Y. (2009). Application of the EEMD method to rotor fault diagnosis of rotating machinery. Mechanical Systems and Signal Processing, 23(4), 1327-1338.
Yu, D., Cheng, J., & Yang, Y. (2005). Application of EMD method and Hilbert spectrum to the fault diagnosis of roller bearings. Mechanical systems and signal processing, 19(2), 259-270.
EMD (Empirical Mode Decomposition)
EMD는 시계열 데이터를 분석하는 데 사용되는 방법 중 하나이다.
어떠한 신호이든 몇 개의 고유진동함수(IMFs, Intrinsic Mode Functions)로 이뤄져있다는 가정을 기반으로 한 분해 기법이다.
푸리에 변환과 웨이블릿 변환은 미리 정의된 기저 함수(basis functions)를 사용하여 데이터를 분석한다. 이러한 기저 함수는 신호를 다양한 주파수 성분으로 분해하지만, 비정상적이거나 복잡한 신호를 분석할 때는 한계가 있다.
반면, EMD는 데이터 자체에서 기저 함수를 동적으로 생성한다. 즉, EMD는 데이터에 내재된 구조를 기반으로 IMF를 추출하므로, 데이터의 복잡성과 변화성을 보다 잘 반영한다. 이러한 점에서 EMD는 비정상적이거나 비선형적인 데이터를 분석하는 데 매우 유용하다.


EMD 알고리즘
EMD는어떠한 신호가 고유한 진동 함수들로 구성되어 있다는 것을 가정으로 한다.
원계열의 그래프를 n개의 IMF 들로 분해를 한다. 하나의 IMF 는 두 가지 조건을 만족해야 한다.
- 극값과 0을 지나는 점의 개수가 같거나 1개 이하 차이가 난다.
- 모든 지점에서 극댓값을 이은 선과 극솟값을 이은 선의 평균값이 0이다.
Shifting Process
신호 x(t)를 EMD 기법으로 분해하는 프로세스는 다음과 같다.
(Shifting Process 라고 한다. 그래프에서 shift 하면서 IMF를 추출하기 때문)
1) x(t): 원 신호, m: 극대, 극소 포락선을 이은 평균선, h: 신호와 평균선의 차이

2) IMF 추출 과정 (Shifting 과정)
- h1이 IMF 가정 만족 O -> c1 = h1 (c: IMF를 나타냄)
- h1이 IMF 가정 만족 X -> h1을 원 신호로 생각하고 다시 평균선(m11)을 계산

- 위 shifting 과정을 h가 IMF 조건을 만족할 때까지 k번 반복한다고 가정하고 수식을 일반화하면,


3) 원래의 원 신호에서 c(IMF)를 빼 준 차이를 r로 정의하고, r에서 (2) 과정을 반복하여 n번의 IMF 추출


4) 만약, rn 그래프가 최소한 2개의 극값을 갖는다면 (2)의 과정을 반복하고, 극값이 2개 미만이라면 프로세스는 종료된다.
5) 모든 과정이 종료되면, rn이 신호의 residue(잔차)가 된다.
위 과정을 통해 얻은 i개의 IMF, ci (i=1,2,...I)와 잔차의 합은 아래의 수식을 만족한다.

⇒ residue는 원래의 데이터에서 다양한 주파수 성분을 나타내는 IMFs가 모두 제거된 후의 기본적인 경향성 또는 추세를 나타낸다.
⇒ 분해가 진행될수록 IMF의 주기는 길어진다.

Shifting Process 쉬운 설명
수식이 불편한 사람들을 위해 위의 Shifting process를 말로 풀어서 써보겠다!
1) 원 신호에서 극댓값, 극솟값을 찾는다.
2) 극댓값을 연결한 극대 포락선과, 극솟값을 연결한 극소 포락선을 계산한다. (interpolation 방식)
3) (2)에서 구한 극대 포락선과 극소 포락선의 평균선을 계산한다.
4) (3)에서 구한 평균선을 원 신호에서 빼서 새로운 그래프를 추출한다. 이렇게 추출된 그래프가 IMF의 조건을 만족하면 내재모드함수 IMF 라고 정의한다. (만약, 조건을 만족 안한다면 새로운 시계열로 (1)부터 반복해서 IMF 조건 만족할 때까지 재귀적으로 반복한다.)
5) 추출된 IMF를 제거한 시계열 자료를 새로운 원 자료로 재설정하고, 원 자료의 극값이 2개 미만이 될 때까지 (2)~(5)의 과정을 반복하며, 각 과정에서 나오는 내재모드함수를 IMFi(i=1,2,3…I)으로 정의한다.