pandas

    Pandas 주가 데이터 cheat sheet

    import pandas as pd from pandas_datareader import data #삼성전자 주가 데이터 df = data.get_data_yahoo('005930.KS',start = '2020-01-01',end='2021-02-11') # 데이터프레임 평균, 표준편차, 사분위수 df.describe() # 종가 기준 최대값 df.Close.max() # 종가 기준 최소값 df.Close.min() # 종가 기준 평균값 df.Close.mean() # 총 데이터 개수 df.shape[0] # 특정 컬럼 선택 df.Close # 상위 3개의 로우만 선택 df.iloc[:3] # 시작가 대비 종가가 높았던 날 데이터 df[df.Open < df.Close] # 종가 기준 가장 주가가 높았..

    -8일차- 데이터 시각화

    오늘의 노드는 데이터 시각화와 관련된 부분이었다 주로 사용하게 되는 라이브러리는 matplotlib figure 객체 생성 fig = plt.figure(figsize=(5,2)) ax1 = fig.add_subplot(1,1,1) 이때 빈 출력값이 나오게 되는데 위의 코드는 시각화를 하기 위한 일종의 그림판의 역할을 해줄 친구들이다 여러개의 객체 생성(subplot) fig = plt.figure() ax1 = fig.add_subplot(2,2,1) ax2 = fig.add_subplot(2,2,2) ax3 = fig.add_subplot(2,2,4) 서브플롯의 순서를 보면 좌측 상단이 1, 우측 상단이 2, 다시 좌측하단의 순서로 배치가 되는 것을 알 수 있다 간단한 시각화 예제 subject = ..

    -6일차- 데이터 전처리 by pandas

    예제데이터 관세청 수출입 무역 통계 가공 데이터 결측치(Missing Data) 구하기 데이터 수집 과정에서 누락된 데이터가 존재할 수 있다 이를 처리하는 예제 #전체 데이터 개수 - 실제 데이터양 len(trade) - trade.count() 기타사항의 경우 데이터가 아예 존재하지않음. # 결측치만 존재하는 컬럼 제거 trade = trade.drop('기타사항', axis=1) #ex) df.drop('column name', axis= 1 for column) 결측치가 존재하는 행 찾기 isnull() 함수와 any()의 조합 isnull : 데이터마다 결측치 여부를 True, False로 반환 any : 행마다 하나라도 True가 있으면 True, 아니면 False를 반환 #trade 데이터 프..