기계 번역
시리즈의 일부 |
번역 |
---|
종류 |
이론 |
기술 |
지역화 |
기관 |
관련 주제 |
기계 번역(機械飜譯, 영어: machine translation, MT[1])은 인간이 사용하는 자연 언어를 컴퓨터를 사용하여 다른 언어로 번역하는 일을 말한다. '자동 번역'이라고도 한다.
일관성과 통일성이 있게 번역되는 장점이 있으나, 자연스러운 번역을 보장할 수 없다는 점이 단점으로 제기된다. 하지만 딥 러닝이 상용화되고 트랜스포머 모델이 나타나는 등 인공지능 분야의 진보가 계속해서 이루어지고 있으며, 컴퓨터 처리 능력의 발전으로 점점 더 빠르게 성장하고 있다.
기계 번역의 개념 자체는 컴퓨터의 존재 이전부터 존재하기 때문에 기계 번역은 번역 소프트웨어와 동의어는 아니지만 현재 기계 번역은 대부분 번역 소프트웨어로 구현된다. 예를 들어, 영어 문장을 입력하면 그것을 번역하는 한국어 문장을 출력하는 영한 번역 소프트웨어 등이 있다.
역사
[편집]초창기 기계 번역은 규칙 기반(RBMT Rule-Based MachineTranslation) 기술을 이용한 것이 주류였다. 규칙기반 기술은 언어의 문법을 규칙화해 번역하는 방법으로, 개발 과정에서 언어학자가 중심이 되어야 구축이 가능한 번역 기술이었다. 규칙기반 기계 번역은 알고리즘의 기초를 문법에 두기 때문에 정확성이 매우 높다는 장점이 있었으나, 개발 시간과 비용이 많이 들기 때문에 시스트란과 같은 번역 전문 대기업만 할 수 있는 분야였다.[2]
이후 1988년 IBM이 통계방식(SMT, Statistical Machine Translation) 기술을 기계번역에 도입하면서 혁신적인 변화가 일어났다. 통계기반 기술은 방대한 양의 연구 자료, 즉 빅데이터를 이용해 통계적으로 규칙을 생성해 번역하는 방법이다. 통계기반의 기계 번역은 언어학자 없이도 개발을 할 수 있고 데이터가 많이 쌓일수록 번역의 품질이 높다는 장점이 있으며, 반대로 대량의 데이터가 쌓이기 전까지는 번역의 품질이 떨어진다는 단점이 있다.[2]
통계방식의 기계번역이 도입된 이후, 언어 데이터를 다루는 검색 엔진 기업 등의 글로벌 IT 기업들이 기계 번역 개발에 뛰어들 수 있게 됐다. 최근에는 규칙기반 기계번역도 통계기반 기술을 함께 사용하는 하이브리드 방식으로 진화 중이다.[2]
기계 번역기의 종류
[편집]같이 보기
[편집]각주
[편집]- ↑ Stephen Budiansky (December 1998). “Lost in Translation”. 《Atlantic Magazine》. 81–84쪽.
- ↑ 가 나 다 “[지식충전소] “얼라 했더니 Kid…3년 내 사투리까지 자동번역””. 중앙일보. 2016년 10월 19일. 2016년 10월 19일에 확인함.[깨진 링크(과거 내용 찾기)]