본문 바로가기
반응형

WBS - 2023 Winter/기업 데이터 분석7

(기업데이터 #13-14) 패널데이터, 회귀분석 정리 기업 데이터 분석 가을학기 제13, 14회 패널데이터, 회귀분석 정리 2024년 1월 27일 (토) 상학학술원 비즈니스-파이낸스연구센터 오노 카시오리 연습4 변수 설정 각 가설을 검증할 때 피설명변수와 설명변수가 어떻게 되는지 간단히 설명하시오. 또한 그 결과를 수식으로 표현하시오. (1) 우리는 주택담보대출이 어떻게 결정되는지 분석하려고 합니다. 은행에 주택담보대출을 신청한 사람의 정보와 주택담보대출을 받을 수 있었는지를 나타내는 데이터가 있다고 가정하자. 이 데이터를 이용하여 여성이 주택담보대출 심사에서 합리적으로 설명할 수 없는 불리한 대우를 받고 있는지 주목하고 있다. 가설 1: 주택담보대출을 신청했을 때 연봉이 낮은 사람은 거절당할 가능성이 높을 것이다. 가설 2: 여성이 남성보다 거절당할 가능.. 2024. 1. 27.
(기업데이터 #11-12) 더미 변수, 교차항, 로지스틱 회귀 분석 기업 데이터 분석 가을학기 11, 12회 더미변수, 교차항, 로지스틱 회귀분석 2024년 1월 20일(토) 상학학술원 비즈니스금융연구센터 오노 카오리 Email: kaori.ono@aoni.waseda.jp 연습문제 3 회귀분석을 통해 가설을 검증해 봅시다. 가설 에너지 소비량은 그 나라의 부의 정도에 따라 결정되지 않을까? 데이터 정부 통계 국내총생산(GDP) 1인당 에너지 소비량 설명변수를 추가해 보자. 단계 데이터 수집, 정리 예: World Bank, EIA (Energy Information Administration), 환경부...등... 산포도 그리기 다중회귀분석의 경우, 설명변수 간의 상관관계 분석을 한다. 회귀분석을 실시한다. 결과 해석 더미 변수 지금까지의 설명변수는 모두 수량 전용면적.. 2024. 1. 20.
(기업데이터 #9-10) 다중회귀분석 9, 10회 다중회귀분석 지난번의 후속편 기술통계 : 얻은 데이터에서 그 특징을 추출(정리)한다. 추측통계 : 부분으로부터 전체를 추측하는 것 통계적 추정 : 표본 데이터로부터 모집단 추정 방법 : 점추정, 구간추정 통계적 가설검정 : 모집단에 대한 가설이 성립하는지 여부를 검정하는 것 방법 : t검정, F검정... 회귀분석 : Y(종속변수)가 H(독립변수)에 얼마나 영향을 미치는지 관계를 설명 (혹은 예측에 사용하고자 하는 경우) 방법 : 선형회귀모형, 이항로짓모형... 통계적 추정 모집단의 평균이나 표준편차를 알 수 없을 때 표본의 통계량으로 모집단 수(모집단의 값)를 추정하는 방법 점 추정 표본 → 모평균 표본분산 → 불균형분산 → 모분산 구간 추정 신뢰 구간에 따라 "모평균은 표본 평균값 ±〇〇의.. 2024. 1. 13.
(데이터 #7-8) 연구 방법, 논문 작성 기업 데이터 분석 가을학기 7, 8회 연구 방법, 논문 작성 전체 강의 아젠다 ◆ 연구방법 연구 주제 결정 선행연구 검토 데이터 탐색 연구윤리 ◆ 논문 작성 연구계획서 작성 논문 구성 참고 문헌에 대하여 학술논문이란? 논문과 보고서의 차이점 보고서 주어진 과제에 대해 조사한 결과를 정리하고 자신의 의견을 서술한다. 논문 스스로 질문(가설)을 세우고, 연구 결과와 고찰을 이론적으로 기술한다. Standing on the shoulders of giants. 거인의 어깨 위에 서다 참신성이 중요 연구방법 연구에서 사용되는 용어 연구주제 : 모든 과제 중에서 '무엇을 중점적으로 연구할 것인가'를 나타내는 것. 예: '00에 대해 연구한다' 질문 : 막연한 의문을 "?"로 끝나는 의문문 형태. 로 끝나는 의문문.. 2023. 12. 23.
(데이터 #5-6) 데이터 간의 관계 파악 | 상관관계, 인과관계, 단회귀 분석 기업 데이터 분석 가을학기 제 1 회 토요일 상학학술원 비즈니스금융연구센터 오노 카오리 이메일: kaori.ono@aoni.waseda.jp 지난번의 후속편 표준 정규분포 (Standard Normal Distribution) 특징 1 : 평균값 = 0, 표준편차 = 1 특징 2 : 대부분의 데이터가 2 SD 이내로 들어간다. 평균 ± 1 표준편차 68.3% 평균 ± 2 표준편차 95.4% 평균 ± 3 표준편차 99.7% 신뢰계수 or 신뢰도 표준 정규 분포 데이터 세트 -∞ ~ +∞의 데이터 세트 정규분포 (normal distribution) 정규분포의 성질 1. 표준정규분포에 σ 를 곱하고 μ 를 더한다. 2. 평균에서 S.D. 1 개 이내의 범위의 데이터 = 0.6826 평균에서 S.D. 2 개 .. 2023. 12. 16.
(데이터 #3-4) 일부 데이터로 전체 추정하기 | 정규분포, 표준정규분포, 확률, 추정과 t검정 지난번의 후속편 히스토그램: 계급 수 결정 방법 기준은 있지만 결정적인 것은 없다. 최대값과 최소값, 데이터 범위, 데이터 수 등을 참고한다. 스타제스 공식 계급의 수 = 1 + log₂n 엑셀에서 계산하기 셀: = log ( C13 , 2 )+1 예: 셀의 C13에 데이터 수가 들어있는 경우 정규분포에 가까운 히스토그램을 만드는 것과 같은 계급수를 도출하도록 계산합니다. 히스토그램: 3단계 1. 미세값(이 경우 G5)을 클릭한 후 Ctrl + C 키를 눌러 복사한다. 2. 붙여넣을 셀 범위 'F7:F13'을 드래그한다. 3. 홈 탭의 '붙여넣기' - > '형식 선택 후 붙여넣기'를 클릭한다. 4. '값'과 '빼기'를 클릭하고 OK 버튼을 클릭한다. 연습문제 4와 5의 답변 예시 히스토그램 생성 기능 데.. 2023. 12. 9.
(데이터 #1-2) Introduction 기업 데이터 분석 1,2회 2023년 12월 2일 (토) 상학학술원비즈니스・금융연구센터오노 카오리 강의 소개 본 강의 개요 데이터 분석이란, 통계학 개요 전체 강의의 개요 도달 목표 연구의 관점 실무의 관점 최종 보고서 과제와 프레젠테이션에 대하여 논문 작성 연구 주제 결정 질문(연구질문) 설정 선행연구를 읽고 가설 설정 필요한 데이터 수집 수집한 데이터를 사용하여 적절한 방법으로 가설 검증 논문 작성 데이터 분석이란? 수집하다 정리하다 해석하다 - 기업 HP에서 재무제표 - 기업 홈페이지에서 중장기 계획 - 도쿄증권거래소 홈페이지에서 상장기업 정보 - 기업 관계자 인터뷰 - 기업인에게 설문조사 - 분류하기 - 연대순으로 정렬하기 - 산포도로 그리기 - 상관 계수 계산하기 - 개념도 구축하기 - 원인(독.. 2023. 12. 4.
반응형