광운대-㈜에버트란·㈜디엠티랩스, 산학협력 업무협약 체결

광운대학교 AI번역산업연구센터는 최근 ㈜에버트란, ㈜DMT랩스와 번역데이터 감수·통계관리 관련 4년 연속 수주 성과를 달성하며 각 기관과 1억원 씩, 총 2억원의 용역계약을 체결했다고 17일 밝혔다.

이번 계약은 과학기술정보통신부 산하 한국지능정보사회진흥원(NIA)에서 추진하는 '2022 인공지능 학습용 데이터 구축 사업' 중 '9번·10번 과제: 방송콘텐츠 한국어-영어 및 유럽어 통·번역 말뭉치 데이터' 분야에 ㈜에버트란과 ㈜디엠티랩스가 각각 주관기관으로 컨소시엄에 참여하며 이뤄졌다.

전체 참여기관은 Saltlux 이노베이션, SYSTRAN, IC글로벌, 윤즈정보개발, 온아시아 등이며, 통·번역 데이터 구축과 품질관리 자문을 위해 사이버한국외국어대학교가 참여대학으로 나선다.

이청호 에버트란 대표(광운대 겸임교수)는 "올해 과제는 한국어 방송콘텐츠를 영어, 러시아어, 프랑스어, 독일어, 스페인어, 이탈리아어 등 6개 언어로 통·번역데이터를 구축해 오는 11월 말까지 완성해야 한다"며 "1000여 시간의 한국 방송 콘텐츠를 전사한 후 6개의 언어로 동등한 내용이 되도록 자체 개발한 'AIKE' 툴을 이용해 번역한다. 이후 이를 6개의 언어 발화데이터로 만드는 것으로, '정신일도하사불성' 자세로 임해야 양질의 결과를 얻을 수 있는 고난도 과제"라고 말했다.

김운 디엠티랩스 대표는 "이번 과제는 약 50명의 운영진과 각 언어 별 130~150명의 번역가능자가 참여하는 대규모의 다국어 통·번역데이터 구축 사업이다. 모든 참가자에게 번역과 기계번역툴 교육을 제공하는 등 다양한 지원 작업이 많다"며 "첫 단계인 한국어 방송콘텐츠 전사부터 다국어 발화까지 데이터 품질관리에 있어 관리자는 물론 언어 데이터 구축 참여자 모두가 '호시우보' 해야 한다"고 강조했다.

이일재 AI번역산업연구센터장(광운대 영어산업학과)은 "우리 대학원 졸업자 및 타 대학 출신 언어 전공 석·박사급을 연구원으로 고용한다. 이들은 가공되는 통·번역 결과물의 일정한 분량을 샘플로 추출해 데이터 감수·통계 검증을 실시한다. 이러한 과정을 지속적으로 진행하며 전체 통번역의 오류율이 일정한 수준을 유지하도록 모니터링하는게 주 역할"이라며 "번역된 문장을 바탕으로 번역가의 번역 능력도 추론통계적으로 수치화해 모든 참여기관에게 관련 정보를 공유·지원한다"고 설명했다.

사이버한국외국어대 윤호숙 교수는 "언어 분야 풍부한 인적 자원을 바탕으로 올해 컨소시엄에 적극 참여할 것"이라며 "우리 대학은 언어 관련 사업체와 국가에 필요한 전공자 양성을 목표로 한다. 이를 위해 광운대 영어산업학과 및 여러 언어 관련 산업체와 유기적인 관계를 이어나가겠다"고 전했다.