main

Home > Press Release >

Press Release

View old bulletin board

Title [News] "Korean is too difficult" AI has hard time acquiring Korean[Donga Ilbo 2018-10-31]
Posted by webmaster Hit 3396 Date 2018.10.31

The article indicates that AI speakers have difficulties in acquiring Korean because of several reasons, such as grammar differences, lots of variations in words, and the existence of phonetic alphabets. Unlike English, where predicate comes after the subject, object or substantive comes after the subject in Korean. Since substantives have much more variations compared to predicates, it makes it challenging to acquire Korean. Numerous variations in words also make it hard to acquire. In addition, because there are many words that are composed of phonetic alphabets, AI would have to take a long time learning it. To make AI acquire Korean efficiently, procuring enough corpora is necessary.



"Korean is too difficult" AI has hard time acquiring Korean


AI 스피커, 우리말 배우기 어디까지
올해로 훈민정음 반포 572돌을 맞은 가운데 세종대왕이 2년 전 공물로 바쳐진 인공지능(AI) 스피커의 한국어 학습을 살피러 상의원(임금의 보물을 맡던 관서)을 향했다. 

▽세종=인공지능 스피커가 우리말을 배우고자 한다 들어 기특해 찾아왔다. 저 희귀한 물건들이 우리말을 잘 깨치고 있는가.

▽장영실=2016년 9월 에스케이텔레콤을 시작으로 케이티, 네이버, 카카오 등 국내 상인과 구글 같은 외국 상인이 인공지능 스피커를 바쳐 오기 시작했습니다. 

▽세종=우리말을 가르치는 데 어려움은 없는가.

▽장영실=몇 가지 애로사항이 있사옵니다. 첫 번째는 구조상의 문제이옵니다. 우리말은 주어 다음 서술어가 오는 영어와 달리 주어 다음 목적어와 같은 체언이 옵니다. 체언의 수는 서술어(용언)에 비해 많습니다. 그렇다 보니 인공지능 스피커가 우리말을 인식할 때 ‘의도’를 예측하기가 무척 어렵습니다.

▽세종=그렇기에 ‘우리말은 끝까지 들어봐야 안다’고 하지 않던가.

▽장영실=두 번째는 소리글자에서 비롯되는 문제입니다. 예컨대 개 짖는 소리를 한글로는 ‘멍멍’, ‘왈왈’ 등 소리 나는 대로 다양하게 표기할 수 있습니다. 반면 영어는 ‘바우와우(bowwow)’ 정도이옵니다. 우리말은 단어의 변형이 다채로운 점도 인공지능에게는 까다로운 부분입니다. 예컨대 가다, 가시다, 가고 계시다 등 상황에 따라 다양해 인공지능이 익히기가 무척 어렵습니다. 

▽세종=그럼 이런 문제들을 어떻게 해결하고 있는가.

▽장영실=소리글자의 애로사항을 해결한 사례를 들어보겠습니다. 인공지능에게 “‘임우 형’에게 전화해줘”라고 부탁하면 ‘이무영’으로 인식하는 사태가 벌어지기 일쑤였습니다. 하지만 제 스마트폰에 있는 주소록을 서버에 전송해, 주소록에 저장된 이름(임우 형)을 우선 인식하도록 조치했습니다. 이런 사례는 다양하옵나이다.

▽세종=인공지능 스피커를 가르치며 보람은 없는가.

▽장영실=요즘 무분별한 ‘줄임말’로 언어 파괴 현상이 문제화되고 있습니다. 하지만 음성인식 스피커에는 줄임말로 의사를 전달하지 않습니다. 인공지능이 알아들을 수 있도록 ‘또박또박’ 말을 해야 합니다. 그런 측면에서 인공지능 스피커가 우리말이 정제되는 효과로 이어질 수 있다는 기대입니다.

▽세종=짐이 도울 일이라도 있는가.

▽장영실=한국어로 된 ‘말뭉치’가 턱없이 부족합니다. 말뭉치는 인공지능이 인식할 수 있도록 말을 어절 단위로 모아둔 데이터베이스로, 컴퓨터의 언어 학습 시 필요한 원재료입니다. 우리의 말뭉치는 2억 어절로 미국(2000억 어절), 일본(40억 어절)에 비하면 초라합니다. 말뭉치를 확보하기 위한 ‘21세기 세종계획’이 진행되고 있지만, 좀 더 속도를 내야 할 것 같습니다. 

※이 기사는 SK텔레콤 AI기술 유닛의 이현아 유닛장(상무)의 도움을 받았습니다.

신무경 기자 yes@donga.com

No. Title Posted by Date Hit
735 [CICI Korea] Trot Men, Delphine O and 'Baby Shark' win Korea Image Awards [Korea Times 2020-12-17] webmaster 2020.12.18 1424
734 [CICI Korea] CICI announces 2021 award winners [Korea Herald 2020-12-16] webmaster 2020.12.18 1570
733 [CICI Korea] Corea Image Communication Institute announces annual award winners [Korea Joongang Daily 2020-12-16] webmaster 2020.12.18 1470
732 [CICI Korea] Delphine O parmi les lauréats des prix décernés par le CICI dédié à la promotion de l'image de la Corée [Yonhap French 2020-12-17] webmaster 2020.12.18 2051
731 [Events] Influenza during Covid [Korea Joongang Daily 2020-11-29] webmaster 2020.11.30 1495
730 [Events] [Serendipity] Light at the end of the tunnel, for everyone [Korea Herald 2020-11-27] webmaster 2020.11.27 1497
729 [Events] Is COVID-19 like the flu? [Korea Herald 2020-11-25] webmaster 2020.11.26 3393
728 [Events] Vaccine expert underscores significance of equal access to COVID-19 vaccines [Korea Times 2020-11-25] webmaster 2020.11.26 1458
727 [Events] Magician Ed Kwon performs at Singaporean Ambassador's residence [The Korea Times 2020-10-21] webmaster 2020.10.26 17359
726 [News] Quitted Samsung to become a Pansori singer... I changed my life [Chosun Ilbo 2020-09-26] webmaster 2020.09.28 1541
725 [CCF] From magic to enlightenment, the unforgettable performance in front of Copperfield [JoongAng Sunday 2020-09-05] webmaster 2020.09.07 1755
724 [CCF] Forum on cultural communication discusses life after Coivd [Korea JoongAng Daily 2020.08.27] webmaster 2020.08.28 1548
723 [CCF] How will COVID-19 transform culture? [Arirang 2020-08-27] webmaster 2020.08.28 24474
722 [CCF] CCF 2020: experts dissect how COVID-19 has changed cultural content delivery [The Korea Times 2020.08.27] webmaster 2020.08.28 1726
721 [CCF] CCF 2020 from August 26th to August 27th at the Grand Hyatt Seoul Hotel [Newsis 2020-08-20] webmaster 2020.08.21 1674
720 [CCF] "The changes in the delivery method of cultural contents in the post corona era" video conferencing forum [Yonhap News 2020-08-18] webmaster 2020.08.20 1687
719 [News] "The vaccine should be cheap so that even underdeveloped countries can have it, but if it is too cheap, who will produce it during the next pandemic?"[Chosun Ilbo 2020-08-17] webmaster 2020.08.17 2814
718 [CCF] CICI's Culture Communication Forum to take place on Aug. 26-27 [The Korea Times 2020-08-14] webmaster 2020.08.14 1874
717 [CCF] CCF 2020 : Cedric O, Jacques Attali and more will participate through video conferencing [ChosunBiz 2020-08-14] webmaster 2020.08.14 2098
716 [CCF] Culture Communication Forum inviting the world's intellectuals [Maeil Business Newspaper 2020-08-13] webmaster 2020.08.14 3183

HOME SITEMAP CONTACT US KOREAN goMain instagram facebook youtube