| 中, 24개 분야 데이터셋 구축 추진…토큰(Token) 거래 방식 모색 | ||
|
||
|
□ 최근 중국 국가데이터국은 AI 활용에 필요한 고품질 데이터 공급 체계를 마련하기 위해 「산업 고품질 데이터셋 구축 행동 실시방안」을 발표(26.6.8)
* 데이터셋은 수집·가공 등 표준화 처리를 거쳐 AI 모델 개발에 바로 활용할 수 있는 산업 데이터 묶음을 의미함
○ (배경) 중국 정부는 「데이터산업 질적 발전 지도의견」(24.12)에서 ‘고품질 데이터셋’ 개념을 처음 제시했으며, 이번 「산업 고품질 데이터셋 구축 행동 실시방안」(26.6)을 통해 이를 국가 차원의 실행계획으로 구체화
![]() ○ (목표) 28년까지 중점 분야를 대상으로 활용 가능성이 검증된 고품질 데이터셋을 구축할 계획
- AI 혁신을 이끄는 대표 응용 시나리오를 만들고, 경쟁력 있는 데이터 기업과 전문 인력을 육성하며, 데이터셋 구축에 필요한 도구와 표준 체계를 마련할 계획
□ 이번 방안의 핵심은 산업별 고품질 데이터셋의 공급, 유통, 활용을 중심으로 하는 ▲기반 확충 ▲데이터 라벨링 ▲품질 개선 ▲활용 촉진 ▲관리·서비스 ▲가치 창출 등 6대 행동임
![]() 1) 24개 분야에서 고품질 데이터셋 구축 추진
○ 중국은 19개 중점 분야와 5개 혁신 분야 등 총 24개 분야에서 산업 고품질 데이터셋 구축할 계획
- (19개 중점 분야) 과학연구, 산업제조, 농업·농촌, 스마트에너지, 교통·운송, 금융서비스, 의료·보건, 교육, 전자상거래, 인적자원, 문화관광, 응급관리, 기상서비스, 녹색·저탄소, 공공안전, 도시관리, 주택건설, 자연자원, 사회신용
- (5개 혁신 분야) 저고도경제, 임바디드 AI, 자율주행, 스마트 해양, 바이오제조
2) 데이터 플라이휠(Data Flywheel) 구조 형성
○ 현장에서 데이터를 모아 AI 모델을 개선하고, 개선된 모델을 다시 현장에 적용해 새로운 데이터와 가치를 계속 만들어내는 데이터 플라이휠(Data Flywheel) 구조 형성
![]() 3) 토큰(Token) 기반 거래 방식 모색
- (신형 거래 방식) 중국은 구독형·마켓형·맞춤형 서비스 등 기존 데이터 거래 모델을 확대하는 동시에, AI 모델의 실제 사용량을 토큰(Token) 단위로 측정해 데이터 가치를 정량화하고 가격을 산정하는 새로운 거래 방식을 모색
* 2026년 3월 기준 중국의 일평균 토큰(Token) 호출량은 140조 회를 넘어섰으며, 일부 기관은 2030년에는 현재보다 400배 이상 증가할 것으로 전망
- 토큰(Token) 거래는 원본 데이터셋을 일괄 판매하는 방식에서 벗어나, AI 모델이 학습·추론 과정에서 실제로 사용한 데이터의 양과 품질을 기준으로 가치를 산정하는 방식임
![]() <참고자료>
(26.06.08,国家数据局) 关于印发《关于推进行业高质量数据集建设行动的实施方案》的通知
(26.06.09, 首页大数据) “词元”开启数据要素新纪元:从国家政策落地透视AI时代的“石油”革命
(26.06.11, 国家数据局) 《关于推进行业高质量数据集建设行动的实施方案》解读
작성자: 우만주 연구원(yumanshu@kostec.re.kr)
|



