시계열 데이터의 통계적 분석 방법
시계열 데이터란?
시간에서 순차적으로 (Sequentially) 관측한 값들의 집합.
Continuous한 것이 아닌 Discrete한 시계열들에 관심을 가지는 듯하다.
f ( time_1) -> f ( time_2 ) -> f ( time_3 ) -> f ( time_4 ) -> f ( time_5) -> ...
시간간의 간격이 같다고 보는게 맞고 빠진 값이 없다고 보는 것이 맞다고 생각함.(그러하다)
만약 빠진 데이터가 있으면 ( 군데군데 ) EM 알고리즘으로 채워 넣는 다고 함.
시계열 데이터의 요소는 크게 2가지로 보는 듯 하다.
1. 패턴 요소 ( 트렌드 패턴, 시즈널 패턴, 주기 패턴, 기타 통계적 패턴)
2. 랜덤 요소
시계열 데이터의 응용은
같은 시계열에서의 관계 분석 - A(timePoint) 와 B(timePoint)의 같은 시계열에서의 관계.
하나의 프로세스를 관리하거나 표현하는 방법 ( ??? )
예측 ( 필요하다... 당장! )
분석을 위한 접근 방법
자체-추정 VS 원인 - 결과
Self-Projecting은 적은 데이터로 초기 분석 용. Long-term예측 잼병, 외부 요소 고려 못함.
Cause-and-Effect는 상대적으로 많은 데이터로 복잡한 과정을 필요로 한다.
시간에서 순차적으로 (Sequentially) 관측한 값들의 집합.
Continuous한 것이 아닌 Discrete한 시계열들에 관심을 가지는 듯하다.
f ( time_1) -> f ( time_2 ) -> f ( time_3 ) -> f ( time_4 ) -> f ( time_5) -> ...
시간간의 간격이 같다고 보는게 맞고 빠진 값이 없다고 보는 것이 맞다고 생각함.(그러하다)
만약 빠진 데이터가 있으면 ( 군데군데 ) EM 알고리즘으로 채워 넣는 다고 함.
시계열 데이터의 요소는 크게 2가지로 보는 듯 하다.
1. 패턴 요소 ( 트렌드 패턴, 시즈널 패턴, 주기 패턴, 기타 통계적 패턴)
2. 랜덤 요소
시계열 데이터의 응용은
같은 시계열에서의 관계 분석 - A(timePoint) 와 B(timePoint)의 같은 시계열에서의 관계.
하나의 프로세스를 관리하거나 표현하는 방법 ( ??? )
예측 ( 필요하다... 당장! )
분석을 위한 접근 방법
자체-추정 VS 원인 - 결과
Self-Projecting은 적은 데이터로 초기 분석 용. Long-term예측 잼병, 외부 요소 고려 못함.
Cause-and-Effect는 상대적으로 많은 데이터로 복잡한 과정을 필요로 한다.
댓글
댓글 쓰기