시계열 데이터의 통계적 분석 방법

시계열 데이터란?
시간에서 순차적으로 (Sequentially) 관측한 값들의 집합.
Continuous한 것이 아닌 Discrete한 시계열들에 관심을 가지는 듯하다.

f ( time_1) -> f ( time_2 ) -> f ( time_3 ) -> f ( time_4 ) -> f ( time_5) -> ...

시간간의 간격이 같다고 보는게 맞고 빠진 값이 없다고 보는 것이 맞다고 생각함.(그러하다)
만약 빠진 데이터가 있으면 ( 군데군데 ) EM 알고리즘으로 채워 넣는 다고 함.

시계열 데이터의 요소는 크게 2가지로 보는 듯 하다.
1. 패턴 요소 ( 트렌드 패턴, 시즈널 패턴, 주기 패턴, 기타 통계적 패턴)
2. 랜덤 요소

시계열 데이터의 응용은
 같은 시계열에서의 관계 분석 - A(timePoint) 와 B(timePoint)의 같은 시계열에서의 관계.
 하나의 프로세스를 관리하거나 표현하는 방법 ( ??? )
 예측 ( 필요하다... 당장! )

분석을 위한 접근 방법
 자체-추정 VS 원인 - 결과
 Self-Projecting은 적은 데이터로 초기 분석 용. Long-term예측 잼병, 외부 요소 고려 못함.
 Cause-and-Effect는 상대적으로 많은 데이터로 복잡한 과정을 필요로 한다.

댓글

이 블로그의 인기 게시물

실내공간 표준안 IndoorGML의 개념 및 활용(이기준, 이지영)('13.06.24 심사완료) 정리.

플랫폼과 에코시스템