#1. “지니야, 음악 꺼.”
아침 6시, 거실에서 음악이 흘러나와 잠을 깨웠다. “지니야, 음악 끄라구.” 투덜대며 일어나 거실로 나왔다. 알람을 끄고 지니에게 “지니야, 모짜르트 음악 들려줘”라고 말했다. 아내의 태교음악에는 ‘클래식’이 좋다는 건 주워들었다. 지니는 ‘알아서’ 모짜르트 피아노 협주곡 21번 C악장 작품번호 467번 2악장을 틀었다.
#2. “아리아, 회사까지 얼마나 걸리지?”
출근 준비를 하며 얼마나 차가 막히는지 물었다. “현재 회사까지 45분이 걸릴 예정입니다.” 평소보다 5분 정도 더 걸릴 예정이라 조금 일찍 집을 나서기로 했다.
대화를 나눈 ‘지니’와 ‘누구’는 음성인식 인공지능 스피커다. 이전에는 없었던 아이티(IT) 제품이다. 미국 온라인 상거래업체 아마존이 2014년 ‘에코’를 첫 선보였고, 구글이 ‘구글홈’으로 뒤따랐다. 올 초 열린 미국 소비자가전전시회(CES)에서 전자업체들이 앞다퉈 인공지능 스피커와 연동을 미래 개발 방향 중의 하나로 꼽았다. 국내에서는 에스케이텔레콤(SKT)이 지난해 9월 ‘누구’를 처음으로 내놨다. 지니는 케이티(KT)가 올해 2월 출시한 것이다.
음성인식 인공지능 스피커를 기자들이 나눠 2주 정도 써봤다. 사용하려면 먼저 스마트폰에 음성인식 인공지능 스피커와 연동된 어플리케이션을 깔아야한다. 무선 와이파이 또는 유선 인터넷과 연결도 필요하다. 기가지니와 누구는 각각 자사의 올레TV, Btv와 연동돼 텔레비전과 연결된다. 리모콘을 찾을 필요 없이 음성으로 채널을 돌릴 수 있을 뿐만 아니라 콘텐츠 검색도 가능하다.
설정이 끝나면 이름을 부르면 된다. 기가지니는 “지니야” 또는 사용자가 정한 호칭으로, 누구 역시 “아리아” 또는 사용자 지정 호칭을 부른 뒤 날씨, 운세, 뉴스 등을 묻는 명령어를 추가하면 된다. 음성호출 신호가 있는 것은 인공지능 스피커가 어디서부터 인간의 명령을 들어야하는지 판단하기 위해서다. 이름을 불러주었을때 스피커는 내게로 와 ‘인공지능 서비스 기기’가 된다.
“아리아, 여자친구 노래 틀어줘.” 2주 동안 주로 사용한 기능은 음악 재생이었다. ‘누구’는 에스케이텔레콤의 음악서비스 ‘멜론’과 연동되고, ‘기가지니’는 케이티의 ‘지니뮤직’과 연동된다. 돈을 내고 해당 음악서비스에 가입하지 않으면 전곡 재생이 안된다고 스피커는 안내한다. 케이티는 “하만카돈과 손잡고 20와트(W) 출력의 와퍼(저음 전용스피커)와 15와트 출력의 트위터(고음 전용스피커)를 장착해 고출력을 낸다”고 자랑한다. 일부 채널이지만 라디오도 들려준다. 다만, 항상 전원이 필요해 손쉽게 안방에서 거실로, 작은방으로 이동하기는 어렵다.
음악재생만 쓴다면 굳이 음성인식 인공지능 스피커를 사용할 필요가 없다. “지니야, 너는 누구야?”라고 물어보면, 지니는 “대화를 통해 사용자의 의도를 파악해 홈네트워크를 제어하고 필요한 정보를 제공하는 인공지능 비서입니다”고 말한다. 지니의 친절한 설명처럼 인공지능 스피커가 넘보는 것은 소비자가 사용하는 정보와 사물인터넷의 중심(허브)이다.
문제는 사용자가 얼마나 스마트기기를 갖추고 있느냐다. 집에 있는 전등이나 에어컨을 켜고 끄거나 가스밸브를 잠글 때 스마트기기와 연동돼 있지 않고서는 소용이 없다. 스마트기기와 연동을 체험하려고 서울 광화문 KT스퀘어에 있는 기가지니 체험존을 찾았다. “지니야, 현재 공기가 어때?”라고 묻자 지니는 센서를 통해 공기 질을 파악하고 “실내에 이산화탄소가 많아졌네요”라는 응답했다. 지니에게 공기청정기를 켜라고 하자 공기청정기를 켰고, 조명을 끄라고 하자 불을 껐다. 이를 집에서 이용하려면 사물인터넷 기능이 장착된 가전제품을 구입하고, 가스밸브·현관문 여닫기 등을 원격으로 조종하는 서비스에 가입해야 한다. 이들 서비스를 온전히 이용하려면 각 서비스의 사용료를 내야한다.
온라인 구매 및 주문 영역으로까지 범위를 넓히고 있다. 누구는 지난 3월부터 온라인상거래 ‘11번가’의 추천상품을 알려주고 구매까지 진행하는 서비스를 시작했다. 생수 등 추천상품을 듣고 “결제해줘”라고 말하면 미리 입력된 카드 정보로 결제되고 집으로 배송된다. 책도 카테고리별로 추천해준다. 지니는 아직 모바일상품권을 구매할 수 있는 ‘기프티쇼’ 이용정도만 가능하다. 배달 서비스는 누구의 경우 스마트폰에 주소를 등록한 뒤 BBQ치킨과 도미노피자를 주문할 수 있다. 대신 한번 주문하면 취소는 안된다. 지니는 사용자 지역의 배달업체를 검색해 알려준다. 아직 음성만으로는 처음부터 끝까지 해결하기는 어렵다.
스피커의 가능성은 사람의 음성을 인식해 대화하는데 있다. 스마트폰 업체들이 차례로 인공지능 음성인식 기능을 탑재하는 것은 사용자들의 다음 플랫폼이 ‘엄지 손가락’이 아닌 ‘음성’을 통해 이뤄질 것으로 내다보기 때문이다. 인공지능 스피커 ‘아마존 에코’를 쓰는 미국 사용자들은 스피커에 대고 음성으로 상품을 주문하거나, 차량공유서비스 ‘우버’를 부른다.
하지만 아직 음성인식 스피커가 대중화되기까지는 과제가 많다. 국내에서 음성인식 스피커 출시가 소비자에게 크게 관심을 끌지 못하는 건 스피커 이용형태 분석에서 나타난다. 케이티가 분석한 결과를 보면, 기가지니 이용형태의 46%는 감성채팅이었고 음악감상(19%)과 텔레비전이용(18%)이 뒤를 이었다. 상업적인 이용이 가능한 통합추천 활용은 6%에 그쳤다. 에스케이텔레콤 역시 누구 이용형태가 “소비자들이 누구를 친구처럼 생각하고 말을 거는 감성대화 사용 비중이 높아지고 있다”고 분석했다. 누구 소비자 가운데 감성대화를 이용하는 비중은 일주일간 전체 이용자의 약 45%에 이른다. 삶을 편리하게 하는 기기보다 호기심 많은 사용자나 대화가 필요한 누군가에게 ‘말벗’ 역할로 주로 쓰이고 있는 셈이다.
그럼에도 스피커는 사용자와 대화를 잇는데 한계가 있다. 앞선 이야기와 계속 연결해 문맥을 파악하기보다, 직전 말에만 맞추어서 대화를 한다. 스피커에게 몇번 말을 붙여보다가 흥미를 잃기 쉽상이다. “지니야, 너는 쓸모있니?” 물었다. “죄송한데 무슨 말씀인지 잘 이해하지 못하겠습니다.” 지니는 딴청이다. 누구도 “원하시는 답변을 찾지 못했습니다”, “죄송해요. 제가 할 수 없는 일이에요”라며 크게 다르지 않다.
2주 동안 써보니 인공지능 스피커는 신기함을 익숙함으로 바꿀 수 있어야 쓸만한 기기다. 스마트폰을 열어보는 대신 음성으로 검색하고 음악과 뉴스를 주문하며, 버스나 택시를 찾는게 익숙해져야 한다. 굳이 이런 걸 사용할 필요가 있나 싶기도 하다. 이전에 인공지능 스피커가 없었어도 음악을 듣고, 버스를 타고, 자장면을 주문해 먹었다. 사람이 직접 움직이거나, 손가락을 움직이던 것에서 앉아서 말로 하는 것으로 더 손쉽게 상품과 서비스를 살 뿐이다.
그래서 함께 시장을 넓혀야 하는 걸 누구와 기가지니도 이를 안다. “지니야, 누구 어때?” “저와 같은 가상 비서입니다.” “지니야, 누가 더 똑똑해?” “우린 친구죠.”
이완 이정훈 기자
wani@hani.co.kr
아마존·구글 이어 애플까지 가세…2020년 시장 규모 21억 달러
미국 올 판매량 2450만대 예측
지난해보다 330% 급성장 전망
SKT·KT 이어 카카오·네이버도 준비
사물인터넷 제품과 연계 박차도
세계를 호령하는 아이티(IT) 기업 아마존·구글·애플이 인공지능 음성인식 스피커 시장에 뛰어들었다. 국내에서는 에스케이텔레콤과 케이티가 인공지능 음성인식 스피커를 내놨다.
이들이 주목하는 이 시장의 전망은 밝다. 시장조사 전문기관인 가트너는 전세계 음성인식 스피커 시장의 규모가 2015년 3억6000만달러에서 2020년 21억달러까지 성장할 것으로 전망했다. 2020년에는 전세계 3.3% 가정이 1대 이상의 음성인식 스피커를 사용할 것으로 예측했다.
음성인식 스피커가 앞서 출시된 미국에선 가능성이 확인되고 있다. 2014년 ‘에코’를 내놓은 아마존은 지난해말까지 780만대를 팔았다. 아마존은 ‘에코 닷’ 등 제품군을 늘리고 있고, 구글도 이에 질세라 2016년말 ‘구글홈’을 출시했다. 미국의 2016년 음성인식 스피커 판매량은 570만대로 추정되며, 올해는 지난해보다 329.8% 성장한 2450만대가 판매될 것으로 예측되고 있다.
애플도 올해 음성인식 스피커 ‘홈팟’을 내놓고 추격을 시작했다. 애플은 스피커 성능으로 차별화를 꾀했다. 팀 쿡 애플 최고경영자(CEO)는 지난 15일 외신과 인터뷰에서 “아이팟이 처음 나왔을 때도, 아이폰이 처음 나왔을 때도 사람들은 누가 그 많은 돈을 주고 그 물건을 사겠느냐고 말했었다”며 “내가 성장할 때 오디오는 희망 리스트의 1위였고, 모든 세대에서 오디오는 지금도 정말 중요하다”고 말했다.
음성인식 스피커의 효과는 단순히 기기를 판매하는 데서 그치지 않는다. 정지수 메리츠종금증권 연구원은 “온라인 쇼핑을 통한 상품 구매에 따른 수수료를 받고, 음원 및 영상 스트리밍 패키지 판매를 통한 구독 서비스가 가능하며, 파트너십 확대를 통한 결제서비스 제공 등이 수익모델로 가능하다”고 설명했다. 아마존은 엘지(LG)전자와 손을 잡고 사물인터넷 제품에도 음성인식 기술을 연계하고 있다. 이밖에 사용자들이 어떤 음악과 정보를 선호하는지 확인할 수 있는 등 사용자의 데이터 수집에도 유용하다.
국내에는 아직 아마존 에코와 구글 구글홈이 판매되지 않고 있다. 케이티 등 국내업체는 한국어 인식률은 국내 기기가 앞선다고 주장한다. 이밖에 카카오와 네이버도 음성인식 스피커를 개발 중이다.
이완 기자 wani@hani.co.kr
◎ Weconomy 홈페이지 바로가기: https://www.hani.co.kr/arti/economy◎ Weconomy 페이스북 바로가기: https://www.facebook.com/econohani