인공지능(AI) 전문 기업 비투엔(대표이사 조광원)이 과학기술정보통신부가 주관하고 한국지능정보사회진흥원(NIA)이 추진하는 '2022년 인공지능(AI) 학습용 데이터 구축 사업'에서 총 8개 컨소시엄의 품질 점검을 완료했다고 밝혔다.
'인공지능(AI) 학습용 데이터 구축 사업'은 인공지능(AI) 연구, 기술 및 서비스 개발을 위한 학습용 데이터를 구축하고 누구나 활용할 수 있도록 개방하여 인공지능(AI) 산업 활성화에 기여하는 국가 데이터 댐 사업이다.
이번에 비투엔이 품질 점검을 완료한 인공지능(AI) 학습용 데이터는 ▲이미지 272만 건 ▲텍스트 19만 건 ▲교통 12만 건 ▲음성 18000시간 등 총 9종, 474만 건이다. 음성ㆍ자연어, 비전, 헬스케어, 교통, 축산업, 지역 특화, 데이터 고도화 등 광범위한 분야의 학습용 데이터의 품질을 지원함으로써 기술력을 다시 한번 입증했다.
특히 반려견, 반려묘 건강 정보 데이터 과제에서는 '구문 정확성', '통계 다양성' 검사와 더불어 구축된 학습용 데이터의 인공지능(AI) 알고리즘을 활용한 품질 점검 항목인 '모델 유효성'까지 업무 영역을 확장했다.
이를 통해 모델 유효성 검증 지표 설정, 구축된 학습용 데이터 기반의 모델 학습 및 목표 달성 여부 점검, 모델 유효성 관련 TTA 협의 및 분석 결과 제출 등 세부 업무를 완벽하게 수행하는 성과를 거뒀다.
또한, 비투엔의 인공지능(AI) 학습용 데이터 품질관리 솔루션 'SDQ for AI'를 활용하여 대량의 학습 데이터에 대한 처리 속도를 보장하고, 단순 통계뿐만 아니라 빅데이터 분석을 통한 다양성 검사까지도 지원함으로써 강화된 품질관리 요건들을 완벽하게 충족했다.
비투엔 박순혁 AIX 그룹장은 "인공지능(AI) 학습용 데이터 구축 컨소시엄 내 품질 검사 도구를 확보하고 있지 않은 과제들을 대상으로 품질 검증 서비스와 'SDQ for AI' 도구를 제공하는 등 다양한 형태로 데이터 구축 사업에 참여하고 있다"라며 "앞으로도 뛰어난 기술적 역량과 지속적인 연구개발을 바탕으로 디지털 플랫폼 정부에 기여할 것"이라고 말했다.
한편 비투엔은 2022년 인공지능(AI) 학습용 데이터 구축 사업에서 '방송콘텐츠 대화제 음성인식 데이터(솔트룩스 컨소시엄)', '한국어 SNS 데이터 고도화(와이즈넛 컨소시엄)', '디스플레이 안구 움직임 영상 데이터(피씨엔 컨소시엄)', '반려견, 반려묘 건강정보 데이터(이노그리드 컨소시엄)', '산업용 헴프 생육 이미지 및 환경 데이터(데이터헌트 컨소시엄)', '전문분야 심층 인터뷰 데이터(솔트룩스 컨소시엄)', '의료 음성 데이터(타이거컴퍼니 컨소시엄)', '교통수단판별 데이터(모토브 컨소시엄)' 등 과제에 품질관리 전담 기업으로 참여했다.