출처: https://astrocosmos.tistory.com/202 [ASTROCOSMOS] '분류 전체보기' 카테고리의 글 목록 (2 Page)
본문 바로가기

분류 전체보기17

[시계열을 위한 머신러닝] 분류 및 클러스터링(Classification and Clustering) ML for Time Series 시계열을 위한 머신러닝¶ Clustering과 tree based method로 predict와 classification 문제를 다룬다. 시계열의 특징 생성은 tree based method에서 반드시 필요한 과정이다. 앞서 공부했던 ARIMA 모델과는 달리 '시간을 인식'하는 방법론이 아니기 때문이다. Clustering, 거리 기반 classification은 input으로 원본 시계열이나 특징을 사용할 수 있다. 시계열 자체를 input으로 사용하려면, dynamic time warping(DTW, 동적시간워핑)이라는 거리 평가 지표를 알아야 한다. 시계열에 직접적으로 적용되는 동적시간워핑은 데이터 전체에 대한 시간 정보를 보존한다. 제한된 특징 목록을 사용하는 .. 2022. 2. 13.
[시계열의 상태공간 모델] Hidden Markov model(HMM) 은닉 마르코프 모형(Hidden Markov model(HMM)) 은닉 마르코프 모형은 시계열 모델링에 유용하다. 또한 시계열 분석에 학습될 데이터에 올바르게 레이블링된 정-답이 존재하지 않는 비지도학습이 적용된 희귀한 경우이기 때문에 흥미롭다. HMM은 앞 게시글에서 살펴 본 칼만 필터의 실험에서 얻었던 직관, 즉 관측 가능 변수가 시스템을 가장 잘 묘사하지는 못한다는 개념에서 영감을 받았다. 선형 가우스 모델에 적용된 칼만 필터처럼, process에서는 state(상태)가 있으며, 관측이 그 상태에 대한 정보를 준다는 개념을 상정한다. 모델 동작 방식 HMM은 직접적으로 관측이 불가능한 상태를 가진 system을 상정한다. Markov process라 불리는 이 system은, 미래 사건의 확률이 s.. 2022. 2. 5.
[시계열의 상태공간 모델] Kalman Filter State Space Models for Time Series, 시계열의 상태공간 모델 일반적으로 사용되는 State space models는 다음과 같다. The Kalman filter applied to a linear Gaussian model (선형 가우스 모델에 적용된 칼만 필터) Hidden Markov Models (은닉 마르코프 모형) Bayesian structural time series (베이즈 구조적 시계열) 각 방법에 대한 모델은 이미 잘 구현되어 있으므로, 각 모델에 대한 수학적인 직관력을 키우고 어떤 데이터가 적합한지에 대한 내용을 살펴볼 것이다. 실제 코드 예제 또한 다룰 예정이다. 여기서 '관측한 것'과 '관측이 만들어낸 상태'를 구분할 것이다. 이때, 관측에 기반한 un.. 2022. 2. 5.
[MARKET MICROSTRUCTURE] Orderbook properties bid-ask spreads, turnover과 volume, volatility가 어떤 연관성을 띄는가? 600개의 Stocks 데이터를 이용해 분석해보자. 두 market variables 간의 관계 - Time series analysis: stocks와 variables 간의 차이는 무시하고, 시간의 경과가 두 variables에 미치는 영향에 집중 - Cross sectional analysis: 시간 경과에 따른 변수 변경은 무시하고 서로 다른 주식에서 두 변수의 차이에 집중 Q1: 일별 거래 수와 turnover가 어떻게 연관되어 있는가? - Turnover = number of trades * average trade size turnover 증가는 number of trades 또는 av.. 2022. 1. 23.