pandas 2

[e스포츠 데이터분석 전문인력 양성과정] 4일차(머신러닝)

오늘의 주제: 데이터 분석 [1. 전통적 프로그래밍 vs 기계학습.] 결국은 비용을 비교해보고 적게 드는걸 사용해야한다. ex) 연필 12다스 계산. 규칙이 쉽다, 컴퓨팅power 낮아도된다, 연산 금방한다. 개 vs 고양이. 규칙이 어렵다, 컴퓨터 사양 좋아야한다, 전기 많이든다, 연산 하는데 오래걸린다, 개랑 고양이 데이터가 많아야한다.(라벨링 하는 인건비도 많이든다) 근데 그걸 프로그래밍 하는거 보다는 훨신 덜든다. [2. ai와 머신러닝] y=ax+b의 그래프를 찾는 과정. *머신러닝의 분류 인공지능>머신러닝>인공신경망>딥러닝 strong ai - 자비스, weak ai - 알파고, 자율주행. *머신러닝의 종류 **지도학습(supervised learning) - 문제와 답(label)을 함께 제..

[e스포츠 데이터분석 전문인력 양성과정] 2일차(넘파이, 판다스)

1. 길이, 평균, 분산, 비편향 분산, 표준편차, 최소값, 최대값, 중앙값(짝수이면 가운데 두 수의 평균을 사용), 사분위수 등을 볼 수 있다. 2. 한꺼번에 통계를 볼려면 from scipy.stats import describe describe(x) 근데 판다스 쓰면 describe로 한번에 볼 수 있다. 시드: 경우의 수 같은 느낌. 시드를 설정하면 그 시드에 해당하는 경우만 나온다. 그 경우 자체가 랜덤으로 생성된 것이긴 하다. 1. 데이터 샘플링 np.random.choice(5, 3, replace=False) # replace True면 한번 선택한 데이터 다시 선택 가능함 0~4중에 3개 뽑기 np.random.choice(5, 10, p=[0.1, 0, 0.3, 0.6, 0]) # 확률..