통계적방법 2019년 2학기
강의평가 방법 : 강의시간 제출리포트 40%, 중간고사 30%, 기말고사 30% [구글드라이브 계정 http://drive.google.com] '통계적방법19_홍길동' 폴더공유 doyun2516@gmail.com | on_going
실습데이터 : SeanLahman.com 사이트 다운로드(1871~2018) -> csv포멧| 선수정보 | 팀 정보 | 연봉 | 타자 | 투수
Bulletin Board : 9월23일(월)~27일(금) Noclass (out of Office)
강의노트 강의 내용
통계_통계적 방법론 통계 기초, 통계적 방법론
데이터 데이터 개념, 종류
확률표본 표본데이터
표본추출 확률적표본추출방법
데이터 요약 그래프, 숫자 요약(통계량) - 예제데이터 (1986 미국MLB연봉_능력SAS예데이터)
확률 확률변수와 데이터, 확률분포함수
확률변수기대값 | 포트폴리오 기대값, 평균, 분산
추정과 검정 추정, 검정
정규변환 치우친 데이터 좌우 대칭의 필요성
일변량 분석 모평균, 모비율, 모분산 검정
두 모집단 비교 독립/짝진 두 표본 평균, 비율 차이 검정 (독립인 두 모집단 분산 차이 검정) [중간고사문제20191017]
일원분산분석 | 이원분산분석 분산분석 개념, 일원(요인1) 이원(요인2, 상호작용) 공변량분석
상관분석 측정형(순서형) 척도 이변량 직선관계
회귀분석 Y=a+bX+e 목표변수(종속변수), 예측변수(독립, 설명변수) 간 직선 함수관계
빅데이터 방법론  

import pandas as pd
fn='링크주소복사'
pd.read_csv(fn).head(3)

import rpy2
%load_ext rpy2.ipython

from google.colab import drive
drive.mount('/content/drive')

df=pd.read_csv('/content/drive/My Drive/파일이름.csv')

salary.info() #data frame information

salary.describe() #elementary statistics

salary['salary'].hist(bins=10) #histogram

salary.boxplot(column=['salary']) #Boxplot

salary['salary'].plot.kde(bw_method=0.3) #probability density function kernel-density estimate

모평균 구글코렙 [코드only] [예제분석포함]