⊙ 과학기술정보통신부와 한국지능정보사회진흥원은 인공지능(AI) 학습용 데이터 구축사업을 통해 구축한 학습용 데이터셋 310종, 약 15억 건의 데이터를 7월말까지 'AI허브' 사이트에 순차 개방할 예정임.
⊙ 'AI 허브'는 2020년부터 민간·공공 수요에 맞춰 매년 약 200 종 데이터를 구축하였으며, 올해 개방하는 데이터는 역대 최대 규모임.
⊙ 데이터 구축 분야는 기존 6대 분야에서 제조·로보틱스·교육·금융·스포츠 등 14대 분야로 확장함.
⊙ 'AI 허브'에 공개되는 데이터는 국제 표준에 맞는 품질기준 달성과 개인정보 비식별화를 거친 경우에 한하며, 기업·기관이 실제 사용하는 AI 모델에 직접 데이터를 학습시켜 유효성, 정확성 등을 확인하는 활용성 검토를 받음.
⊙ 또한 해당 데이터는 개방 이후 약 3개월 동안 사용자로부터 데이터 품질 요구사항, 오류 등 의견을 반영해 데이터 품질 제고를 위한 보완 과정을 거칠 예정임.
[참고]
AI허브 사이트: https://aihub.or.kr/