출처: https://astrocosmos.tistory.com/202 [ASTROCOSMOS] 헤지월드
본문 바로가기

전체 글17

[시계열 딥러닝] 신경망 학습 파이프라인 만들기 앞서 딥러닝의 전반적인 개념에 대해 간단하게 알아보았다. 다음 순서로 신경망 프로그래밍에 대해 알아보자. 데이터, 기호, 연산, 계층, 그래프 일반적으로 딥러닝 프레임워크는 그래프 개념, 그리고 그 그래프를 만드는 데에 집중한다. 즉, 모든 구조는 개별 요소와 그들 간의 관계로 설명될 수 있어야 한다는 뜻이다. 또한 변수와 대응되는 실젯값을 분리하는 개념도 매우 중요하다. 다음은 A와 B라는 기호를 정의하고, A와 B의 행렬곱 결과를 담은 기호 C를 정의하는 방법이다. # 의사코드 symbol A; symbol B; symbol C = matmul(A, B); # In python, np.matmul 참고: https://m.blog.naver.com/PostView.naver?isHttpsRedirec.. 2022. 3. 5.
[시계열 딥러닝] 딥러닝의 개념: 신경망, 순전파 네트워크(Neural Network, Feed Forward Network) 데이터 과학이나 AI에 조금이라도 관심이 있는 사람은 '딥러닝'이라는 단어를 한 번쯤은 들어보았을 것이다. 개념을 모르는 사람들의 입장에서는, 단순히 '머신러닝보다 더 나은 방법' 정도로 여겨질 수도 있다. 그런데 사실 딥러닝은 이미지 및 자연어 처리 이외의 분야에서는 아직 훌륭한 예측 능력을 보여주지 못했다. 물론, 딥러닝은 전통적인 예측 모델이 공통으로 갖는 획일성과 불안정한 가정에 대해 요구되는 필요 조건을 감소시킨다. 딥러닝의 장점 딥러닝 모델을 사용하면 모델의 가정에 데이터를 맞추기 위해 지금껏 수행한 여러가지 전처리 과정이 사라진다. 정상성을 요구하지 않는다. 계절형 ARIMA 모델의 차수, 계절성에 따른 평가와 같은 파라미터를 고르는 기술을 개발할 필요가 없다. 상태 공간 모델링에서 유용하게.. 2022. 2. 26.
[머신러닝] 특성공학과 규제 3-2. 특성공학과 규제¶ 다중회귀¶ 앞에서는 하나의 특성을 사용해 선형 회귀 모델을 훈련시킴. 여러 개의 특성을 사용한 선형 회귀를 다중 회귀(multiple regression)라고 부름. 즉, 1개의 특성을 사용한 선형 회귀는 직선을 학습하는 반면, 특성이 2개인 선형 회귀는 평면을 학습함. 3차원 이상은 상상하기 힘듦. 여기서는 생선 길이 * 생선 높이를 새로운 특성으로 만들 것임. 이렇게 기존 특성을 사용해 새로운 특성을 뽑아내는 작업을 특성 공학(feature engineering)이라고 부름. In [1]: import pandas as pd df = pd.read_csv("https://bit.ly/perch_csv_data") perch_full = df.to_numpy() perch_f.. 2022. 2. 24.
[머신러닝] 데이터 전처리와 회귀 알고리즘 Chapter 2. 데이터 다루기¶ 2.1 Train set과 Test set¶ In [ ]: # 도미 bream_length = [25.4, 26.3, 26.5, 29.0, 29.0, 29.7, 29.7, 30.0, 30.0, 30.7, 31.0, 31.0, 31.5, 32.0, 32.0, 32.0, 33.0, 33.0, 33.5, 33.5, 34.0, 34.0, 34.5, 35.0, 35.0, 35.0, 35.0, 36.0, 36.0, 37.0, 38.5, 38.5, 39.5, 41.0, 41.0] bream_weight = [242.0, 290.0, 340.0, 363.0, 430.0, 450.0, 500.0, 390.0, 450.0, 500.0, 475.0, 500.0, 500.0, 340.0, .. 2022. 2. 17.
[시계열을 위한 머신러닝] 분류 및 클러스터링(Classification and Clustering) ML for Time Series 시계열을 위한 머신러닝¶ Clustering과 tree based method로 predict와 classification 문제를 다룬다. 시계열의 특징 생성은 tree based method에서 반드시 필요한 과정이다. 앞서 공부했던 ARIMA 모델과는 달리 '시간을 인식'하는 방법론이 아니기 때문이다. Clustering, 거리 기반 classification은 input으로 원본 시계열이나 특징을 사용할 수 있다. 시계열 자체를 input으로 사용하려면, dynamic time warping(DTW, 동적시간워핑)이라는 거리 평가 지표를 알아야 한다. 시계열에 직접적으로 적용되는 동적시간워핑은 데이터 전체에 대한 시간 정보를 보존한다. 제한된 특징 목록을 사용하는 .. 2022. 2. 13.
[시계열의 상태공간 모델] Hidden Markov model(HMM) 은닉 마르코프 모형(Hidden Markov model(HMM)) 은닉 마르코프 모형은 시계열 모델링에 유용하다. 또한 시계열 분석에 학습될 데이터에 올바르게 레이블링된 정-답이 존재하지 않는 비지도학습이 적용된 희귀한 경우이기 때문에 흥미롭다. HMM은 앞 게시글에서 살펴 본 칼만 필터의 실험에서 얻었던 직관, 즉 관측 가능 변수가 시스템을 가장 잘 묘사하지는 못한다는 개념에서 영감을 받았다. 선형 가우스 모델에 적용된 칼만 필터처럼, process에서는 state(상태)가 있으며, 관측이 그 상태에 대한 정보를 준다는 개념을 상정한다. 모델 동작 방식 HMM은 직접적으로 관측이 불가능한 상태를 가진 system을 상정한다. Markov process라 불리는 이 system은, 미래 사건의 확률이 s.. 2022. 2. 5.
[시계열의 상태공간 모델] Kalman Filter State Space Models for Time Series, 시계열의 상태공간 모델 일반적으로 사용되는 State space models는 다음과 같다. The Kalman filter applied to a linear Gaussian model (선형 가우스 모델에 적용된 칼만 필터) Hidden Markov Models (은닉 마르코프 모형) Bayesian structural time series (베이즈 구조적 시계열) 각 방법에 대한 모델은 이미 잘 구현되어 있으므로, 각 모델에 대한 수학적인 직관력을 키우고 어떤 데이터가 적합한지에 대한 내용을 살펴볼 것이다. 실제 코드 예제 또한 다룰 예정이다. 여기서 '관측한 것'과 '관측이 만들어낸 상태'를 구분할 것이다. 이때, 관측에 기반한 un.. 2022. 2. 5.
[MARKET MICROSTRUCTURE] Orderbook properties bid-ask spreads, turnover과 volume, volatility가 어떤 연관성을 띄는가? 600개의 Stocks 데이터를 이용해 분석해보자. 두 market variables 간의 관계 - Time series analysis: stocks와 variables 간의 차이는 무시하고, 시간의 경과가 두 variables에 미치는 영향에 집중 - Cross sectional analysis: 시간 경과에 따른 변수 변경은 무시하고 서로 다른 주식에서 두 변수의 차이에 집중 Q1: 일별 거래 수와 turnover가 어떻게 연관되어 있는가? - Turnover = number of trades * average trade size turnover 증가는 number of trades 또는 av.. 2022. 1. 23.
[MARKET MICROSTRUCTURE] Trading algorithms의 성과 측정 이 챕터에서는 거래 알고리즘의 성능을 측정하는 방법과 투자자에게 가장 중요한 주제 중 하나인 시장 영향에 대해 논의할 예정이다. Buyer 측면에서 주문집행의 성과는 average credit price와 execution benchmark의 차이로 측정된다. 이 차이를 다른 말로 'Market impact'라고도 부른다. Market impact는 liquidity의 비용을 시사한다. market impact가 더 작을 수록, execution의 성과는 더 좋은 것으로 판단한다는 것이다. 여기서 TCA(transaction cost analysis)라는 것을 통해 투자자의 execution quality를 가늠할 수 있다. Market impact modelling Market impact model을.. 2022. 1. 23.