안녕하세요.
오늘은 분석에 필요한, 또는 SQL 연습에 필요한 새로운 데이터를 추가해보겠습니다.
바로, 수출입 통계 데이터입니다.
수출 데이터를 분석하면, 수출이 증가한 업종에 대해 투자 전략을 세워볼 수 있겠죠.
수출입 무역 통계는 아래 사이트에서 다운로드 할 수 있습니다. 아래 사이트 외에도 KITA.NET에서도 비슷한 정보를 얻을 수 있습니다. (저희 주변에는 생각보다 무료로 얻을 수 있는 데이터가 많습니다.)
- https://unipass.customs.go.kr/ets/
해당 사이트의 상단 메뉴에서 아래 메뉴를 찾아 들어갑니다.
- 무역통계조회 > 수출입통계 > 품목별 수출입실적
여기서는 메모리 품목 관련 수출입 데이터만 다운로드해서 DB화할 예정입니다. 아래와 같이 조건을 설정해 조회를 합니다.
- 조회기간 : 2018.01~2021.07
- 품목코드: 85, 42, 32 까지 입력
- 조회 버튼으로 조회한 후에 다운로드 버튼 클릭
위와 같은 과정을 반복해 2010년부터 현재 2021년 7월까지의 데이터를 엑셀로 다운로드합니다.
다운로드한 세 개의 파일을 DB로 한 번에 업로드 처리하기 위해 다운로드한 엑셀 파일 세 개를 하나로 합칩니다.아래와 같이 불필요한 내용은 정리하고 세 개 엑셀을 하나의 엑셀 파일로 만들어야 합니다.
다운로드한 파일의 '기간'의 값은 원래 '2010.01'과 같이 년과 월 사이에 '.'이 붙어 있습니다. 엑셀의 SUBSTITUTE 함수를 사용해 '.'을 제거해서 '201001'과 같이 만들어 놓아주세요.
마지막으로 합쳐진 하나의 엑셀 파일을 CSV 형태 파일로 저장합니다. DBeaver에서는 CSV파일을 올릴 수 있기 때문입니다.
위 데이터를 업로드할 테이블을 만듭니다. 원래는 업로드용 임시 테이블에 올린 후에 실제 사용할 테이블에 적용하는게 일반적이지만 여기서는 바로 실제 사용할 테이블을 만드록 업로드하도록 하겠습니다.
아래와 같이 설계를 먼저 진행합니다.
위 내용은 아래의 ERD CLOUD에 접속하면 볼 수 있습니다.
- https://www.erdcloud.com/d/uLkbGXNcGu7HkvJXa
이제 설계된대로 테이블을 생성합니다. 아래 스크립트를 사용합니다.
CREATE TABLE DB_DTECH.TRADE_YM
(
YM VARCHAR(6) NOT NULL COMMENT '연월'
,HS_CD VARCHAR(40) NOT NULL COMMENT '품목코드'
,HS_NM VARCHAR(200) NOT NULL COMMENT '품목명'
,OUT_WT DECIMAL(18,3) NULL COMMENT '수출중량(톤)'
,IN_WT DECIMAL(18,3) NULL COMMENT '수입중량(톤)'
,OUT_AMT DECIMAL(18,3) NULL COMMENT '수출금액(천USD)'
,IN_AMT DECIMAL(18,3) NULL COMMENT '수입금액(천USD)'
,DIF_IN_OUT DECIMAL(18,3) NULL COMMENT '무역수지(천USD)'
,PRIMARY KEY(YM ,HS_CD)
) COMMENT '수출입정보';
주의할 점은 엑셀 파일은 기간, 품목명, 품목코드 순서이지만 생성한 테이블은 기간, 품목코드, 품목명 순서입니다.
이제, DBeaver의 데이터 가져오기 기능을 사용해 위에서 저장한 CSV 파일을 TRADE_YM으로 업로드합니다.
DBeaver의 데이터 가져오기 기능은 이전 글을 참고해주세요.
- https://sweetquant.tistory.com/263?category=1163308
메모리 수출 정보를 업로드할때는 아래와 같이 컬럼을 매핑하면 됩니다.
업로드가 완료되면 아래와 같이 간단히 조회를 해봅니다. 메모리 세부 품목별로 수출금액을 조회합니다.
SELECT HS_NM, SUM(OUT_AMT) OUT_AMT
FROM DB_DTECH.TRADE_YM
GROUP BY HS_NM
ORDER BY 2 DESC;
[결과]
HS_NM OUT_AMT
=========================================================================== ===============
디램 189563001.000
복합구조칩 집적회로 170826060.000
플래시 메모리 49402623.000
제8517호의 기기에 전용되거나 주로 사용되는 것 42578781.000
기타 2167554.000
에스램 313599.000
제8425호ㆍ제8426호ㆍ제8428호ㆍ제8429호ㆍ제8430호ㆍ제8443.99호ㆍ8470호ㆍ제 30226.000
제9031호의 기기에 전용되거나 주로 사용되는 것(반도체 제조용으로 한정한다) 133.000
제9032호의 기기에 전용되거나 주로 사용되는 것(항공기용으로 한정한다) 36.000
제9301호ㆍ제9306호의 물품에 전용되거나 주로 사용되는 것 10.000
제8528.42호ㆍ제8528.52호ㆍ제8528.62호ㆍ제8531.20호의 기기에 전용되거나 주 2.000
오늘은 여기까지입니다.~! 이어서는 수출 정보를 사용해 간다난 차트도 그려보고 주가 정보와 연계해서 분석하는 과정도 설명할 예정입니다.
감사합니다.
위와 같이 데이터를 마음대로 분석해볼 수 있는 SQL을 공부하고 싶다면 아래 책을 참고해주세요~!
※ 책 소개: https://sweetquant.tistory.com/243
※ 책 미리보기: https://sweetquant.tistory.com/257
※ 완전판 E-Book
▶ 유페이퍼: https://www.upaper.net/ryu1hwan/1142997
▶ 알라딘: https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=273701425
▶ Yes24: http://www.yes24.com/Product/Goods/102264444?OzSrank=1
'데이터분석 > D-Tech 데이터로 하는 재테크' 카테고리의 다른 글
데이터 분석 - 오라클의 CORR 집계함수 (0) | 2021.09.17 |
---|---|
복합구조칩 수출과 상관 관계가 가장 높은 종목은? (0) | 2021.09.08 |
메모리 수출과 하이닉스와 삼성전자의 주가 (0) | 2021.09.04 |
파이썬과 SQL로 메모리 수출입 차트 만들기 (0) | 2021.09.03 |
수출이 급증한 300215 품목의 정체는? (0) | 2021.09.03 |
수출 통계로 투자 업종 찾기 (0) | 2021.09.02 |
2021.08.31 종목별 최적의 골든크로스! (0) | 2021.09.01 |
골든크로스 - 종목마다 다르게 SK하이닉스편 (0) | 2021.08.27 |