안녕하세요.
오늘은 분석에 필요한, 또는 SQL 연습에 필요한 새로운 데이터를 추가해보겠습니다.
바로, 수출입 통계 데이터입니다.
수출 데이터를 분석하면, 수출이 증가한 업종에 대해 투자 전략을 세워볼 수 있겠죠.
수출입 무역 통계는 아래 사이트에서 다운로드 할 수 있습니다. 아래 사이트 외에도 KITA.NET에서도 비슷한 정보를 얻을 수 있습니다. (저희 주변에는 생각보다 무료로 얻을 수 있는 데이터가 많습니다.)
- https://unipass.customs.go.kr/ets/
수출입 무역통계
구분 전월(누계) 당월 (8.1~8.31) 년간 누계 금액 증감율 금액 증감율 금액 증감율 수출 358,652 26.6 53,229 34.9 411,880 27.6 수입 338,903 26.1 51,561 44.0 390,464 28.2 증감율 : 전년동기대비증감율 조업일수[(’20)
unipass.customs.go.kr
해당 사이트의 상단 메뉴에서 아래 메뉴를 찾아 들어갑니다.
- 무역통계조회 > 수출입통계 > 품목별 수출입실적
여기서는 메모리 품목 관련 수출입 데이터만 다운로드해서 DB화할 예정입니다. 아래와 같이 조건을 설정해 조회를 합니다.
- 조회기간 : 2018.01~2021.07
- 품목코드: 85, 42, 32 까지 입력
- 조회 버튼으로 조회한 후에 다운로드 버튼 클릭
위와 같은 과정을 반복해 2010년부터 현재 2021년 7월까지의 데이터를 엑셀로 다운로드합니다.
다운로드한 세 개의 파일을 DB로 한 번에 업로드 처리하기 위해 다운로드한 엑셀 파일 세 개를 하나로 합칩니다.아래와 같이 불필요한 내용은 정리하고 세 개 엑셀을 하나의 엑셀 파일로 만들어야 합니다.
다운로드한 파일의 '기간'의 값은 원래 '2010.01'과 같이 년과 월 사이에 '.'이 붙어 있습니다. 엑셀의 SUBSTITUTE 함수를 사용해 '.'을 제거해서 '201001'과 같이 만들어 놓아주세요.
마지막으로 합쳐진 하나의 엑셀 파일을 CSV 형태 파일로 저장합니다. DBeaver에서는 CSV파일을 올릴 수 있기 때문입니다.
위 데이터를 업로드할 테이블을 만듭니다. 원래는 업로드용 임시 테이블에 올린 후에 실제 사용할 테이블에 적용하는게 일반적이지만 여기서는 바로 실제 사용할 테이블을 만드록 업로드하도록 하겠습니다.
아래와 같이 설계를 먼저 진행합니다.
위 내용은 아래의 ERD CLOUD에 접속하면 볼 수 있습니다.
- https://www.erdcloud.com/d/uLkbGXNcGu7HkvJXa
DB_DTECH
Draw ERD with your team members. All states are shared in real time. And it's FREE. Database modeling tool.
www.erdcloud.com
이제 설계된대로 테이블을 생성합니다. 아래 스크립트를 사용합니다.
CREATE TABLE DB_DTECH.TRADE_YM
(
YM VARCHAR(6) NOT NULL COMMENT '연월'
,HS_CD VARCHAR(40) NOT NULL COMMENT '품목코드'
,HS_NM VARCHAR(200) NOT NULL COMMENT '품목명'
,OUT_WT DECIMAL(18,3) NULL COMMENT '수출중량(톤)'
,IN_WT DECIMAL(18,3) NULL COMMENT '수입중량(톤)'
,OUT_AMT DECIMAL(18,3) NULL COMMENT '수출금액(천USD)'
,IN_AMT DECIMAL(18,3) NULL COMMENT '수입금액(천USD)'
,DIF_IN_OUT DECIMAL(18,3) NULL COMMENT '무역수지(천USD)'
,PRIMARY KEY(YM ,HS_CD)
) COMMENT '수출입정보';
주의할 점은 엑셀 파일은 기간, 품목명, 품목코드 순서이지만 생성한 테이블은 기간, 품목코드, 품목명 순서입니다.
이제, DBeaver의 데이터 가져오기 기능을 사용해 위에서 저장한 CSV 파일을 TRADE_YM으로 업로드합니다.
DBeaver의 데이터 가져오기 기능은 이전 글을 참고해주세요.
- https://sweetquant.tistory.com/263?category=1163308
2021년 1분기 DART 재무제표 데이터베이스화하기
본 자료는 '평생 필요한 데이터 분석'의 오프라인 강의 자료의 일부입니다. 오늘은 DART의 2021년 1분기 재무제표 데이터를 다운로드해서 데이터베이스화하는 작업을 진행하겠습니다. 이후에는 데
sweetquant.tistory.com
메모리 수출 정보를 업로드할때는 아래와 같이 컬럼을 매핑하면 됩니다.
업로드가 완료되면 아래와 같이 간단히 조회를 해봅니다. 메모리 세부 품목별로 수출금액을 조회합니다.
SELECT HS_NM, SUM(OUT_AMT) OUT_AMT
FROM DB_DTECH.TRADE_YM
GROUP BY HS_NM
ORDER BY 2 DESC;
[결과]
HS_NM OUT_AMT
=========================================================================== ===============
디램 189563001.000
복합구조칩 집적회로 170826060.000
플래시 메모리 49402623.000
제8517호의 기기에 전용되거나 주로 사용되는 것 42578781.000
기타 2167554.000
에스램 313599.000
제8425호ㆍ제8426호ㆍ제8428호ㆍ제8429호ㆍ제8430호ㆍ제8443.99호ㆍ8470호ㆍ제 30226.000
제9031호의 기기에 전용되거나 주로 사용되는 것(반도체 제조용으로 한정한다) 133.000
제9032호의 기기에 전용되거나 주로 사용되는 것(항공기용으로 한정한다) 36.000
제9301호ㆍ제9306호의 물품에 전용되거나 주로 사용되는 것 10.000
제8528.42호ㆍ제8528.52호ㆍ제8528.62호ㆍ제8531.20호의 기기에 전용되거나 주 2.000
오늘은 여기까지입니다.~! 이어서는 수출 정보를 사용해 간다난 차트도 그려보고 주가 정보와 연계해서 분석하는 과정도 설명할 예정입니다.
감사합니다.
위와 같이 데이터를 마음대로 분석해볼 수 있는 SQL을 공부하고 싶다면 아래 책을 참고해주세요~!
※ 책 소개: https://sweetquant.tistory.com/243
※ 책 미리보기: https://sweetquant.tistory.com/257
※ 완전판 E-Book
▶ 유페이퍼: https://www.upaper.net/ryu1hwan/1142997
▶ 알라딘: https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=273701425
▶ Yes24: http://www.yes24.com/Product/Goods/102264444?OzSrank=1
'데이터분석 > D-Tech 데이터로 하는 재테크' 카테고리의 다른 글
데이터 분석 - 오라클의 CORR 집계함수 (0) | 2021.09.17 |
---|---|
복합구조칩 수출과 상관 관계가 가장 높은 종목은? (0) | 2021.09.08 |
메모리 수출과 하이닉스와 삼성전자의 주가 (0) | 2021.09.04 |
파이썬과 SQL로 메모리 수출입 차트 만들기 (0) | 2021.09.03 |
수출이 급증한 300215 품목의 정체는? (0) | 2021.09.03 |
수출 통계로 투자 업종 찾기 (0) | 2021.09.02 |
2021.08.31 종목별 최적의 골든크로스! (0) | 2021.09.01 |
골든크로스 - 종목마다 다르게 SK하이닉스편 (0) | 2021.08.27 |