본문 바로가기

광고

광고닫기

광고

본문

광고

문화 문화일반

한-영 자동번역 ‘성공률 85%’의 벽을 넘어라

등록 2008-12-04 18:33수정 2008-12-04 19:02

한겨레말글연구소 학술발표회
번역에 대한 수요가 급증하고 있다. 세계화와 정보기술(IT) 혁명에 힘입어 국경을 넘는 정보의 교류와 소통이 급격히 늘어난 덕분이다. 이런 상황에서 정보의 신속한 획득과 확산을 가로막는 언어장벽을 극복하는 것은 국가 경쟁력을 높이는 문제와도 직결된다. 한겨레말글연구소(소장 최인호)는 4일 서울 공덕동 한겨레신문사 3층 회의실에서 국내에서 개발된 번역기의 성능과 문제점을 점검하고, 자동번역의 기초가 되는 전자 국어사전의 됨됨이를 살펴보는 학술발표회를 열었다.

아직 70~80% 수준…영→한 보다 한→영이 떨어져
85% 넘어야 사용자 만족…“정부 외면이 발전 막아”

정보기술(IT) 산업의 성장에 따른 자동번역 기술의 발전에도 불구하고, 자동번역기의 한국어-영어 번역 성공률은 사용자들이 만족할 만한 수준에 미치지 못하는 것으로 나타났다. 또 정확도와 효용성이 상대적으로 높은 일본어-한국어 자동번역 시스템도 관용어와 동음이의어 등을 번역할 때 오역 사례가 잦아 후편집(교정)을 위한 체계적 매뉴얼 작성이 시급한 것으로 드러났다.

한국전자통신연구원의 박상규 박사는 이날 ‘한-영 자동번역 현황’이란 발표문에서 “한-영 자동번역 시스템의 번역률을 분석한 결과 70~80%에 머물렀다”며 “특히 한국어를 영어로 옮기는 것이 영어를 한국어로 옮기는 것보다 번역률이 떨어졌다”고 진단했다.

박 박사는 “특허문서의 경우 2005년 ㅅ사가 개발한 소프트웨어가 83%로 번역률이 가장 높았다”며 “영어 웹신문 번역률은 ㅋ사의 것이 77%, 기술문서 자동번역은 지난해 ㄹ사가 개발한 시스템이 80% 수준이었다”고 전했다. 전자통신원은 최근 1000개의 특허문서에서 (비교 가능한) 100개의 문장을 뽑아내 국내에서 사용되는 자동번역시스템을 이용해 번역한 뒤, 이것을 외부 번역전문가 7명에 의뢰해 평가기준에 따라 점수를 매겨 번역률을 산출했다.

그는 “한국어와 어순·문법체계가 유사한 일본어를 제외하면, 영어·중국어 등 다른 외국어의 경우 획기적인 번역률의 향상은 당분간 기대하기 어렵다”며 “지금 수준의 번역률로도 실용성을 발휘할 수 있는 응용분야를 개발하는 것이 필요하다”고 주문했다.


박 박사는 국내 자동번역 기술의 발전을 가로막는 요인으로 △정부의 근시안적 연구개발 지원정책 △전문인력 부족에 따른 기술개발의 어려움 △자동번역 서비스는 공짜라는 소비자들의 그릇된 인식 등을 꼽았다.

한겨레말글연구소가 4일 서울 공덕동 한겨레신문사에서 ‘쉬운 소통-기계번역기 점검·평가’를 주제로 개최한 학술발표회에서 임종남 엘엔아이소프트 대표가 의견을 발표하고 있다.  정용일 기자 <A href="mailto:yongil@hani.co.kr">yongil@hani.co.kr</A>
한겨레말글연구소가 4일 서울 공덕동 한겨레신문사에서 ‘쉬운 소통-기계번역기 점검·평가’를 주제로 개최한 학술발표회에서 임종남 엘엔아이소프트 대표가 의견을 발표하고 있다. 정용일 기자 yongil@hani.co.kr
토론자로 나선 임종남 엘엔아이소프트 대표는 “정보 습득을 위한 접근성을 높여주는 자동번역 기술은 국가경쟁력 제고와도 밀접한 관계가 있다”며 “국내 업체들은 10년 남짓한 기간에 세계가 주목할 기술적 성취를 이뤘지만, 자동번역 기술에 대한 정부의 외면으로 이제는 개발투자조차 이뤄지지 않는 사양산업이 되고 있다”고 꼬집었다.

‘기계번역기의 문제와 전망’을 주제로 발표한 이종혁 포스텍 교수는 기계(자동)번역기에서 사용되는 언어변환 방식을 비교한 뒤 각각의 장단점을 분석했다. 언어변환 방식은 △규칙기반방식(RBMT) △예제기반방식(EBMT) △통계기반방식(SBMT) △다중엔진방식(Hybrid MT) 네 가지가 있다. 이 교수는 “어떤 변환방식도 어휘의 중의성이나, 문법적 이질성에 따른 번역의 난점을 모두 해결하기 어렵다”며 “다만 알비엠티는 원문 분석에, 디비엠티는 언어 변환에, 에스비엠티는 번역어 생성에서 상대적으로 강점을 보인다”고 설명했다.

현재 기계번역은 다중엔진 방식의 번역기와 정교한 평가시스템이 만들어지면서 지속적으로 품질이 향상되는 추세다. 게다가 인터넷 상에서 웹브라우징과 채팅, 전자메일, 정보검색 등에 기계번역을 활용하거나 번역메모리와 문맥색인기 등 오프라인 번역지원 소프트웨어를 사용하는 사람도 늘고 있다.

이 교수는 “당분간은 범용이 아닌 특수목적용으로 활용되겠지만, 장기적으론 기계번역이 음성언어 번역으로까지 확대될 것”이라며 “자동번역·통역이 글로벌 정보화 시대의 핵심기술로 부상하고 있는 만큼 경쟁력 확보에 힘써야 한다”고 말했다.

수용자 처지에서 한-일 번역기를 점검 평가한 오상현 연세대 박사는 “기계번역이라도 사용자가 오역을 최대한 경계하면서 후편집(교정)을 꼼꼼하게 수행한다면, 인간번역의 한계인 느린 속도와 번역어 선택의 비일관성을 극복할 수 있는 보조수단으로 충분히 유효하다”고 결론지었다.

기계번역이 완전성을 갖추려면 의미·등가성·정확성·기교 등을 충족시켜야 하지만 기계번역은 텍스트 밖의 중요 정보인 ‘배경지식’이 없기 때문에 근본적인 한계를 지닌다는 게 오 박사의 진단이다. 그는 “일본어와 한국어는 어순이 동일하고 문법적 활용과 기능이 유사해 기계번역에 어려움이 거의 없음에도, 모호성과 동음이의어, 관용어 등의 특이요소가 섞인 문장은 오역 소지가 다분해 반드시 후편집 과정을 거쳐야 한다”고 강조했다.

이에 대해 토론자로 나선 이경일 솔트룩스 대표는 “상용화된 일-한 기계번역은 96%, 한-일 기계번역은 92%의 번역 품질을 보이고 있다”며 “더 완벽한 품질을 확보하려면, 한층 다양한 상용어구와 복잡한 용언 활용에 대처할 수 있도록 부분 구문 분석과 부분 변환 방식이 채용돼야 한다”고 조언했다.

이세영 기자 monad@hani.co.kr
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기
언론 자유를 위해, 국민의 알 권리를 위해
한겨레 저널리즘을 후원해주세요

광고

광고

광고

문화 많이 보는 기사

신라 태자 살던 ‘동궁’, 월지 동편서 유력 건물 터 발견 1.

신라 태자 살던 ‘동궁’, 월지 동편서 유력 건물 터 발견

괴물이 되어서야 묻는다, 지금 내 모습을 사랑해 줄 수는 없냐고 2.

괴물이 되어서야 묻는다, 지금 내 모습을 사랑해 줄 수는 없냐고

이승환, ‘대관 취소’ 구미시장 상대 헌법소원…“끝까지 갈 것” 3.

이승환, ‘대관 취소’ 구미시장 상대 헌법소원…“끝까지 갈 것”

로미오와 줄리엣 속 ‘티볼트 & 머큐쇼’ 동성 로맨스 4.

로미오와 줄리엣 속 ‘티볼트 & 머큐쇼’ 동성 로맨스

구준엽 아내 서희원 숨져…향년 48 5.

구준엽 아내 서희원 숨져…향년 48

한겨레와 친구하기

1/ 2/ 3


서비스 전체보기

전체
정치
사회
전국
경제
국제
문화
스포츠
미래과학
애니멀피플
기후변화&
휴심정
오피니언
만화 | ESC | 한겨레S | 연재 | 이슈 | 함께하는교육 | HERI 이슈 | 서울&
포토
한겨레TV
뉴스서비스
매거진

맨위로
뉴스레터, 올해 가장 잘한 일 구독신청