본문 바로가기
WBS - 2024 Fall/포트폴리오 매니지먼트

(PF Mgmt #4) (4) 시계열 데이터와 데이터베이스 접근

by fastcho 2024. 10. 25.
반응형

(4) 시계열 데이터와 데이터베이스 접근

  • 시계열 데이터(월간, 분기, 연간)
  • 데이터베이스 접근
    • RODBC
    • Microsoft EXCEL, Access
    • RDB (SQL Server, Oracle, MySQL 등)
  • 기여 패키지
    • RODBC (데이터베이스 접근)
    • linprog, quadprog (수리 계획법)
    • xts (Extended Time Series, 일일 데이터 등)

 

시계열 데이터

  • 벡터, 행렬에 시계열로서의 속성을 부여할 수 있다.
  • 자기 상관, 시계열 예측 모델 등의 함수를 적용 가능하다.
  • `ts(data, start=c(  ,  ), freq=   )`
  • 데이터 빈도 → 연간: 1, 분기: 4, 월간: 12

 

 

 

시계열 데이터에 대한 함수 적용 규칙

  • 동일한 시점의 요소 간에 연산이 수행된다.

 

 

 

예: 변화율 계산 방법

  • 시계열 객체의 특성과 `lag(x, -1)`의 조합으로 계산이 가능하다.

 

 

시계열 데이터에 적용되는 함수

  • ts.plot, lag, ts.intersect, ts.union, acf 등
    • ts.plot(x): 시계열의 추이를 그래프로 표시
    • lag(x, k): 랙(lag) 또는 리드(lead)
      • k = -1일 때 이전 시기의 데이터, +1일 때 다음 시기의 데이터
    • ts.intersect(x, y): x와 y의 공통 부분을 결합
    • ts.union(x, y): 모든 부분에서 다변량 시계열로
    • monthplot(x): 월별 경향을 파악
    • acf: 자기 상관 계수

 

단일 변수, 다변량 시계열의 그래프화

  • ts.plot(x)

 

 

ts.intersect

  • 시계열의 공통 부분을 결합하여 새로운 다변량 시계열을 생성한다.

 

 

monthplot(  )

 

 

자기 상관 계수 `acf()`

 

 

 

window(  ), tsp(  ), aggregate(  )

 

 

 

ODBC 연결 기능을 사용한 EXCEL 데이터 읽기

  • ODBC (Open Data Base Connectivity)
  • RODBC 패키지가 설치되어 있어야 합니다!

주의: 이전 버전의 EXCEL 파일을 읽을 때는 `odbcConnectExcel()` 함수를 사용해야 합니다. 
2007이 붙지 않은 함수입니다.

 

 

 

RDBMS에서 데이터 가져오기

  • RDBMS = 관계형 데이터베이스 관리 시스템(Relational Data Base Management System)
  • RDBMS를 이해하고 SQL(Structured Query Language)을 사용할 수 있게 되면 분석용 데이터를 효율적으로 준비할 수 있다.

 

 

과제(3) 시계열 데이터, 데이터베이스 접근

  1. 제3주 강의에서 사용한 Fama-French 3요인을 그래프로 그린다.
  2. 각 요인의 평균, 표준 편차, 상관계수 행렬을 계산한다.
  3. 위 (2)의 작업을 1977-1989년, 1990-2000년, 2001-2009년, 2010-2021년의 부분 기간에 대해 수행한다.
  4. 샘플 EXCEL 파일을 읽어본다.
  5. MS Access를 이용할 수 있다면, 샘플 재무 데이터베이스 ‘FSSample.accdb’ (MS Access)에 ODBC 채널을 열고 데이터를 읽어본다.
  6. 자신이 보유하고 있는 MS Excel 또는 Access 파일에서 데이터를 읽어본다. (어느 것이든 상관없음. Excel 또는 Access 중 하나.)

 

 

 

 

 

 

 

 

 

 

 

 

 

반응형