datacamp 2

[Visualizing Time Series Data in Python] Seasonality, Trend and Noise, Work with Multiple Time Series

Datacamp의 [Visualizing Time Series Data in Python] 강의를 듣고 해당 내용과 추가적으로 공부한 내용을 정리한 포스팅입니다. Autocorrelation and Partial autocorrelation Autocorrelation 자기상관 지연된 자기 자신과의 상관관계를 측정 자기상관이 없는 경우를 백색잡음(white noise)이라고 부름 Auto correlation function Partial autocorrelation 편자기상관 자기상관과는 다르게 이전 시점들의 영향을 제거하여 계산한 상관계수 해당 시점에서 이전 시점들과 연관된 것을 제거한 결과물인 잔차들에 대한 상관계수 Partial auto correlation function Autocorrelat..

[Visualizing Time Series Data in Python] Line Plots, Summary Statistics and Diagnostics

좋은 기회가 생겨서 DataCamp의 시계열 입문 강의를 수강할 수 있게 되었다. 되도록 매주 강의를 듣고, 해당 강의를 정리하고자 카테고리를 하나 개설했다. Working with dates pandas에서 시계열 데이터로 작업을 할 때, 날짜의 형식은 datetime64로 지정하는 것이 좋으며, 판다스의 to_datetime을 이용해서 지정할 수 있다. # 기본 pd.to_datetime(컬럼) 기본적으로는 위와 같이 사용하면 되지만, 날짜가 아닌 요소들이 해당 컬럼에 섞여 있는 경우 "ValueError : Unknown string Format"과 같은 오류가 나게 된다. 어느 곳에서 뭐가 섞였는지 파악이 가능하다면 알아서 처리하면 되는데 그러기 힘든 경우에는 errors를 이용하면 된다. pd...