안녕하세요.

오늘은 분석에 필요한, 또는 SQL 연습에 필요한 새로운 데이터를 추가해보겠습니다.

바로, 수출입 통계 데이터입니다.

수출 데이터를 분석하면, 수출이 증가한 업종에 대해 투자 전략을 세워볼 수 있겠죠.

수출입 무역 통계는 아래 사이트에서 다운로드 할 수 있습니다. 아래 사이트 외에도 KITA.NET에서도 비슷한 정보를 얻을 수 있습니다. (저희 주변에는 생각보다 무료로 얻을 수 있는 데이터가 많습니다.)

 

  - https://unipass.customs.go.kr/ets/

 

수출입 무역통계

구분 전월(누계) 당월 (8.1~8.31) 년간 누계 금액 증감율 금액 증감율 금액 증감율 수출 358,652 26.6 53,229 34.9 411,880 27.6 수입 338,903 26.1 51,561 44.0 390,464 28.2 증감율 : 전년동기대비증감율 조업일수[(’20)

unipass.customs.go.kr

 

해당 사이트의 상단 메뉴에서 아래 메뉴를 찾아 들어갑니다.

- 무역통계조회 > 수출입통계 > 품목별 수출입실적

여기서는 메모리 품목 관련 수출입 데이터만 다운로드해서 DB화할 예정입니다. 아래와 같이 조건을 설정해 조회를 합니다.

- 조회기간 : 2018.01~2021.07

- 품목코드: 85, 42, 32 까지 입력

- 조회 버튼으로 조회한 후에 다운로드 버튼 클릭

위와 같은 과정을 반복해 2010년부터 현재 2021년 7월까지의 데이터를 엑셀로 다운로드합니다.

다운로드한 세 개의 파일을 DB로 한 번에 업로드 처리하기 위해 다운로드한 엑셀 파일 세 개를 하나로 합칩니다.아래와 같이 불필요한 내용은 정리하고 세 개 엑셀을 하나의 엑셀 파일로 만들어야 합니다.

다운로드한 파일의 '기간'의 값은 원래 '2010.01'과 같이 년과 월 사이에 '.'이 붙어 있습니다. 엑셀의 SUBSTITUTE 함수를 사용해 '.'을 제거해서 '201001'과 같이 만들어 놓아주세요.

마지막으로 합쳐진 하나의 엑셀 파일을 CSV 형태 파일로 저장합니다. DBeaver에서는 CSV파일을 올릴 수 있기 때문입니다.

위 데이터를 업로드할 테이블을 만듭니다. 원래는 업로드용 임시 테이블에 올린 후에 실제 사용할 테이블에 적용하는게 일반적이지만 여기서는 바로 실제 사용할 테이블을 만드록 업로드하도록 하겠습니다.

아래와 같이 설계를 먼저 진행합니다.

위 내용은 아래의 ERD CLOUD에 접속하면 볼 수 있습니다.

  - https://www.erdcloud.com/d/uLkbGXNcGu7HkvJXa

 

DB_DTECH

Draw ERD with your team members. All states are shared in real time. And it's FREE. Database modeling tool.

www.erdcloud.com

 

이제 설계된대로 테이블을 생성합니다. 아래 스크립트를 사용합니다.

CREATE TABLE DB_DTECH.TRADE_YM
(
	YM              VARCHAR(6) NOT NULL COMMENT '연월'
	,HS_CD          VARCHAR(40) NOT NULL COMMENT '품목코드'
	,HS_NM          VARCHAR(200) NOT NULL COMMENT '품목명'
	,OUT_WT         DECIMAL(18,3) NULL COMMENT '수출중량(톤)'
	,IN_WT          DECIMAL(18,3) NULL COMMENT '수입중량(톤)'
	,OUT_AMT        DECIMAL(18,3) NULL COMMENT '수출금액(천USD)'
	,IN_AMT         DECIMAL(18,3) NULL COMMENT '수입금액(천USD)'
	,DIF_IN_OUT     DECIMAL(18,3) NULL COMMENT '무역수지(천USD)'
	,PRIMARY KEY(YM ,HS_CD)
) COMMENT '수출입정보';

주의할 점은 엑셀 파일은 기간, 품목명, 품목코드 순서이지만 생성한 테이블은 기간, 품목코드, 품목명 순서입니다.

이제, DBeaver의 데이터 가져오기 기능을 사용해 위에서 저장한 CSV 파일을 TRADE_YM으로 업로드합니다.

DBeaver의 데이터 가져오기 기능은 이전 글을 참고해주세요.

  - https://sweetquant.tistory.com/263?category=1163308 

 

2021년 1분기 DART 재무제표 데이터베이스화하기

본 자료는 '평생 필요한 데이터 분석'의 오프라인 강의 자료의 일부입니다. 오늘은 DART의 2021년 1분기 재무제표 데이터를 다운로드해서 데이터베이스화하는 작업을 진행하겠습니다. 이후에는 데

sweetquant.tistory.com

 

메모리 수출 정보를 업로드할때는 아래와 같이 컬럼을 매핑하면 됩니다.

업로드가 완료되면 아래와 같이 간단히 조회를 해봅니다. 메모리 세부 품목별로 수출금액을 조회합니다.

SELECT  HS_NM, SUM(OUT_AMT) OUT_AMT
FROM    DB_DTECH.TRADE_YM
GROUP BY HS_NM
ORDER BY 2 DESC;
[결과]
HS_NM                                                                       OUT_AMT         
=========================================================================== =============== 
디램                                                                        189563001.000   
복합구조칩 집적회로                                                         170826060.000   
플래시 메모리                                                               49402623.000    
제8517호의 기기에 전용되거나 주로 사용되는 것                               42578781.000    
기타                                                                        2167554.000     
에스램                                                                      313599.000      
제8425호ㆍ제8426호ㆍ제8428호ㆍ제8429호ㆍ제8430호ㆍ제8443.99호ㆍ8470호ㆍ제   30226.000       
제9031호의 기기에 전용되거나 주로 사용되는 것(반도체 제조용으로 한정한다)   133.000         
제9032호의 기기에 전용되거나 주로 사용되는 것(항공기용으로 한정한다)        36.000          
제9301호ㆍ제9306호의 물품에 전용되거나 주로 사용되는 것                     10.000          
제8528.42호ㆍ제8528.52호ㆍ제8528.62호ㆍ제8531.20호의 기기에 전용되거나 주   2.000

오늘은 여기까지입니다.~! 이어서는 수출 정보를 사용해 간다난 차트도 그려보고 주가 정보와 연계해서 분석하는 과정도 설명할 예정입니다.

감사합니다.

 

위와 같이 데이터를 마음대로 분석해볼 수 있는 SQL을 공부하고 싶다면 아래 책을 참고해주세요~!

 

※ 책 소개: https://sweetquant.tistory.com/243

※ 책 미리보기: https://sweetquant.tistory.com/257

※ 완전판 E-Book

  ▶ 유페이퍼: https://www.upaper.net/ryu1hwan/1142997

  ▶ 알라딘: https://www.aladin.co.kr/shop/wproduct.aspx?ItemId=273701425

  ▶ Yes24: http://www.yes24.com/Product/Goods/102264444?OzSrank=1

  ▶ 교보문고: https://digital.kyobobook.co.kr/digital/ebook/ebookDetail.ink?selectedLargeCategory=001&barcode=4801167630019&orderClick=LAG&Kc=

 

+ Recent posts