선형모형 2019년 1학기
강의평가 방법 : 강의시간 제출리포트(+homework) 60%, 중간고사 20%, 기말고사 20%
강의노트 강의 내용
선형모형 개요  
산점도 개념, 해석
단순회귀모형 | 3월 12일 강의 모형, 가정, 추정, 가설검정, 분산분석적 접근
행렬대수 Matrix Algebra 선형대수
상관분석 상관계수, 버블산점도
전처리 정규성, 등분산성, 독립성, 이상치, 영향치 진단 및 해결 방법
다중회귀추론 설명변수 2개 이상 [중간고사 이후]
범주형설명변수 지시변수(이진형, 가변수(dummy)), 공분산분석, 적합성 결여
변수선택 통계량 이용, 전진, 단계, 후진제거
다중공선성 설명변수 높은 상관관계, 주성분분석, 능형회귀분석
회귀진단 시계열(주가) 데이터 가져오기, 시차변수 만들기, 그룹 상관분석
로지스틱회귀분석  
빅데이터_선형모형  

import pandas as pd
mise=pd.read_csv('http://203.247.53.31/Stat_Notes/example_data/mise/2018Q1.csv')

list(mise)

mise.columns
mise.info()
mise.describe()

# dropping null value columns to avoid errors
mise.dropna(inplace=True)

# new data frame with split value columns
new = mise['지역'].str.split(' ', n = 1, expand = True)

new['시도'] = new[0]

date = mise['측정일시'].astype(str)
mise['연도'] = date.str.slice(start=0, stop=4).astype(str)
mise['월'] = date.str.slice(start=4, stop=6).astype(str)
mise['일'] = date.str.slice(start=6, stop=8).astype(str)
mise['시각'] = date.str.slice(start=8, stop=11).astype(str)

mise0=mise.groupby(by=['시도','월','일']).max()
mise0.info()