main

Home > 언론보도 >

언론보도

2003년 이전 게시판 보기

제목 [기타소식] “한국어 너무 어려워요” 진땀 빼는 AI[동아일보 2018-10-31]
글쓴이 webmaster 조회 66 등록일 2018.10.31

“한국어 너무 어려워요” 진땀 빼는 AI


AI 스피커, 우리말 배우기 어디까지
올해로 훈민정음 반포 572돌을 맞은 가운데 세종대왕이 2년 전 공물로 바쳐진 인공지능(AI) 스피커의 한국어 학습을 살피러 상의원(임금의 보물을 맡던 관서)을 향했다. 

▽세종=인공지능 스피커가 우리말을 배우고자 한다 들어 기특해 찾아왔다. 저 희귀한 물건들이 우리말을 잘 깨치고 있는가.

▽장영실=2016년 9월 에스케이텔레콤을 시작으로 케이티, 네이버, 카카오 등 국내 상인과 구글 같은 외국 상인이 인공지능 스피커를 바쳐 오기 시작했습니다. 

▽세종=우리말을 가르치는 데 어려움은 없는가.

▽장영실=몇 가지 애로사항이 있사옵니다. 첫 번째는 구조상의 문제이옵니다. 우리말은 주어 다음 서술어가 오는 영어와 달리 주어 다음 목적어와 같은 체언이 옵니다. 체언의 수는 서술어(용언)에 비해 많습니다. 그렇다 보니 인공지능 스피커가 우리말을 인식할 때 ‘의도’를 예측하기가 무척 어렵습니다.

▽세종=그렇기에 ‘우리말은 끝까지 들어봐야 안다’고 하지 않던가.

▽장영실=두 번째는 소리글자에서 비롯되는 문제입니다. 예컨대 개 짖는 소리를 한글로는 ‘멍멍’, ‘왈왈’ 등 소리 나는 대로 다양하게 표기할 수 있습니다. 반면 영어는 ‘바우와우(bowwow)’ 정도이옵니다. 우리말은 단어의 변형이 다채로운 점도 인공지능에게는 까다로운 부분입니다. 예컨대 가다, 가시다, 가고 계시다 등 상황에 따라 다양해 인공지능이 익히기가 무척 어렵습니다. 

▽세종=그럼 이런 문제들을 어떻게 해결하고 있는가.

▽장영실=소리글자의 애로사항을 해결한 사례를 들어보겠습니다. 인공지능에게 “‘임우 형’에게 전화해줘”라고 부탁하면 ‘이무영’으로 인식하는 사태가 벌어지기 일쑤였습니다. 하지만 제 스마트폰에 있는 주소록을 서버에 전송해, 주소록에 저장된 이름(임우 형)을 우선 인식하도록 조치했습니다. 이런 사례는 다양하옵나이다.

▽세종=인공지능 스피커를 가르치며 보람은 없는가.

▽장영실=요즘 무분별한 ‘줄임말’로 언어 파괴 현상이 문제화되고 있습니다. 하지만 음성인식 스피커에는 줄임말로 의사를 전달하지 않습니다. 인공지능이 알아들을 수 있도록 ‘또박또박’ 말을 해야 합니다. 그런 측면에서 인공지능 스피커가 우리말이 정제되는 효과로 이어질 수 있다는 기대입니다.

▽세종=짐이 도울 일이라도 있는가.

▽장영실=한국어로 된 ‘말뭉치’가 턱없이 부족합니다. 말뭉치는 인공지능이 인식할 수 있도록 말을 어절 단위로 모아둔 데이터베이스로, 컴퓨터의 언어 학습 시 필요한 원재료입니다. 우리의 말뭉치는 2억 어절로 미국(2000억 어절), 일본(40억 어절)에 비하면 초라합니다. 말뭉치를 확보하기 위한 ‘21세기 세종계획’이 진행되고 있지만, 좀 더 속도를 내야 할 것 같습니다. 

※이 기사는 SK텔레콤 AI기술 유닛의 이현아 유닛장(상무)의 도움을 받았습니다.

신무경 기자 yes@donga.com

번호 제목 글쓴이 날짜 조회 수
1066 [한국알리기 국내외 행사] Learning About Hanbok [코리아헤럴드 2018-11-13] file webmaster 2018.11.13 25
1065 [한국알리기 국내외 행사] “삼권분립 이뤄지면 한복 세계화될 것”[한국일보 2018-11-07] webmaster 2018.11.07 49
» [기타소식] “한국어 너무 어려워요” 진땀 빼는 AI[동아일보 2018-10-31] webmaster 2018.10.31 66
1063 [한국알리기 국내외 행사] Ambassadors discuss merits of Hangeul[The Korea Herald 2018-10-29] webmaster 2018.10.29 217
1062 [한국알리기 국내외 행사] [김지수의 인터스텔라] "집값은 존재값... 졸지에 부자되면 삶도 버블될 것" 건축가 승효상 [조선일보 2018-10-27] webmaster 2018.10.29 75
1061 [한국알리기 국내외 행사] Korea CQ Forum holds special lecture for opinion leaders [코리아타임즈 2018-10-24] file webmaster 2018.10.26 123
1060 [기타소식] 77세 도밍고가 부릅니다, 그리운 금강산 [조선일보 2018-10-25] webmaster 2018.10.25 79
1059 [기타소식] 요즘 프랑스 1020세대 "한국말 알아야 세련돼 보여요"[조선일보 2018-10-09] webmaster 2018.10.25 79
1058 [기타소식] "너도 배우니?" 美·유럽, 한글에 빠져들다 [조선일보 2018-10-09] webmaster 2018.10.25 86
1057 [한국알리기 국내외 행사] “사회기반시설이 된 AI … 기업에만 맡기면 미·중과 경쟁 안 돼”[중앙일보 2018-10-16] webmaster 2018.10.16 111
1056 [한국알리기 국내외 행사] [Choi Jung-wha] Person-to-person approach important in promoting Korea [코리아헤럴드 2018-10-14] webmaster 2018.10.15 105
1055 [기타소식] 삼성전자 이름값 68조 원 세계 6위… 美기업 빼면 맨 앞자리[동아일보 2018-10-05] webmaster 2018.10.05 176
1054 [문화소통 포럼 CCF] Ant-Man' author to write comic about Seoul [코리아 타임즈 2018-08-31] webmaster 2018.09.10 5998
1053 [문화소통 포럼 CCF] Cultural Leader of 10 Countries Visits Changdeok Palace[동아일보 2018-08-30] webmaster 2018.09.10 176
1052 [문화소통 포럼 CCF] Chinese-American author committed to fixing images of Asians, women in key comic stories [연합뉴스 2018-08-29] webmaster 2018.09.10 160
1051 [문화소통 포럼 CCF] “예술은 과거를 돌아보고 미래를 내다보는 망원경이죠” [한국일보 2018-09-05] webmaster 2018.09.06 160
1050 [문화소통 포럼 CCF] “꿈도 꾸지 못한 것, 만들고 싶다”, 은행 꿈 접고 아시아 최고 파티시에로 [JobsN 2018-09-03] webmaster 2018.09.06 172
1049 [문화소통 포럼 CCF] "한국 전통 육포, 스페인 하몽처럼 세계인이 즐겼으면"[매일 경제 2018-09-03] webmaster 2018.09.04 170
1048 [문화소통 포럼 CCF] 싱가포르 비첸향·미국 저키보다 순하고 부드러운 맛에 감탄 전통육포 제조 딸에게 전수[매일 경제 2018-09-02] webmaster 2018.09.04 176
1047 [문화소통 포럼 CCF] [김지수의 인터스텔라] "잘 잊고 잘 기억해야 행복감 커져... 뇌는 우리 말 잘 듣는다" [조선일보 2018-09-01] webmaster 2018.09.04 140

HOME SITEMAP CONTACT US ENGLISH goMain facebook twitter youtube