close
PRESS
[AI로 퀀텀점프] 산업 AI 전환에 쓸만한 데이터가 없다…정부의 체계적 지원 필요
작성일 2025.11.12 조회수 47

"2028년, 텍스트 데이터 소진"…편향성·공정성·저작권 문제 부각

"제조 데이터 많아도 쓸 수 없어"…산업별 표준화 미흡 문제도

정부의 단계별 맞춤 지원 체계 필요…법제도적 기반 마련도


 

인공지능(AI) 인프라 핵심 중 하나인 데이터가 중요 자산으로 떠오르고 있다. 산업 AI전환(AX)을 실현하려면 산업별 특화 지식을 학습해야 하는데, AI 학습에 쓸만한 데이터가 턱없이 부족한 현실이다. 데이터 표준화를 비롯해 저작권 이슈, 공정성 문제 등 기술·제도적 장애물이 AI 고도화를 가로막고 있다. 이러한 문제를 통합적으로 지원할 수 있는 정부의 체계적인 지원이 필요하다는 지적이 나온다. 

10일 정보통신기획평가원(IITP) 보고서에 따르면, 현재 데이터 소비 속도가 유지되면 2028년에는 전체 활용 가능한 텍스트 데이터가 모두 소진될 것이라고 경고했다. 기존 AI 활용 학습에 이용되는 데이터의 구조적 문제를 짚었다. 학습 중복으로 인한 비효율성, 데이터 노이즈, 데이터 편향성, 데이터 공정성 등이 대표적이다. 

데이터 품질 부족의 이면에는 '공정성' 문제가 있다. 해외에서는 흑인이나 아시아계 여성을 인식하지 못하는 얼굴인식 알고리즘이 논란이 된 바 있다. 국내에서도 지역(경상도·전라도), 학력, 성별 등 사회적 편견이 데이터에 은연중에 녹아든다는 우려가 크다.

 

 

(중간 생략)

 

 

강성은 한국무역협회 수석연구원은 "정부는 'AI 도입 진단-AI 기반 구축-AI 솔루션 기업 탐색-AI 내재화'로 이어지는 단계별 맞춤 지원체계를 구축해 민관 협력 생태계를 조성해야 한다'"면서 "산업별 특화 AI 생태계를 조성하여 자국의 데이터와 인프라를 활용해 디지털 주권과 데이터 안보를 확보하는 '소버린 AI' 전략이 필요하다"고 강조했다. 

이와 함께 저작권 이슈와 공정성 문제를 다루기 위한 법제도적 기반 마련을 위한 논의도 필요하다. 다만, 그 과정에서 정부는 산업 활성화와 제도적 규제 간 균형점을 찾는 역할이 요구된다. 최재식 카이스트 AI대학원 교수는 “사전에 데이터를 얼마나 세밀하게 걸렀는지까지 규제하는 것은 현실적으로 과도하다”며 “AI가 데이터를 생성·학습·서비스하는 전 과정을 투명하게 관리하고, 문제가 발생했을 때 사후 규제하는 방식이 보다 실효적”이라고 강조했다.

 

 

기사 전문 확인 (URL 클릭)

 

[출처] 박진영·백서현 기자 |  아주경제  


당사 웹사이트에 공유된 모든 보도 자료는 부분적으로 발췌되었습니다. 콘텐츠는 정보 제공의 목적으로만 제공되며 원래 게시자의 재산으로 유지됩니다.

원본 게시자의 허가 없이 공유 콘텐츠를 무단으로 복사, 복제 또는 재배포하는 것은 엄격히 금지됩니다.