언론재단의 뉴스 아카이브 ‘카인즈’
26년치 뉴스와 빅데이터 기술 접목
오늘부터 일반인·전문가용 서비스
언론사 새로운 수익모델 될까 관심
26년치 뉴스와 빅데이터 기술 접목
오늘부터 일반인·전문가용 서비스
언론사 새로운 수익모델 될까 관심
한국언론진흥재단(언론재단)의 뉴스 아카이브 ‘카인즈’가 기존 기사를 단순 검색했던 기능에서 뉴스를 분석하고 데이터 저널리즘을 지향하는 ‘빅카인즈’ 시스템으로 진화한다. 선정적인 어뷰징 기사 범람 속에 심층 분석기사 등 고품질 뉴스콘텐츠 발굴로 뉴스에 대한 흥미 유도와 언론사 등에 새로운 수익모델을 제시할 수 있을지 주목된다.
언론재단은 1990년부터 전국 60개 언론사에서 제공받아 26년 동안 축적한 3000여만건의 뉴스콘텐츠를 바탕으로 빅데이터 기술과 접목시켜 분석하는 ‘빅카인즈’ 시스템을 19일 출범시킨다.
빅카인즈는 일반인과 전문가용으로 나뉘어 서비스될 예정이다. 일반인용은 기사 내 키워드 검색을 기반으로 한다. 설정하는 조건에 따라 기사 속의 인물·장소·기관 등에 대한 관계 분석을 시각화된 화면으로 제공한다. 예를 들어 ‘기준금리’라는 키워드를 입력하면 언급 빈도수가 높은 ‘이주열 한국은행 총재’ ‘한국은행’ ‘미 연방준비제도’ ‘미국’ ‘북한’ 등 관계도가 함께 펼쳐진다. 이에 따라 이용자는 특정 키워드가 뉴스 속에서 어떤 인물과 장소와 함께 언급되는지 재맥락화된 정보를 얻을 수 있다. 정치인에 대한 관계도도 간편하게 살펴볼 수 있다.
특정 주제와 관련해 어떤 인물이 얼마나 발언했는지 등 관심사를 보여주는 ‘정보원 분석 서비스’도 있다. ‘세월호’ 단어를 넣어 분석하면 박근혜 대통령의 세월호 언급 빈도수를 확인할 수 있다. 또 인용문 검색이나 특정 시기의 기사 트렌드도 파악할 수 있다.
빅카인즈의 빅데이터 분석은 기본적으로 언어의 형태소나 구문 분석으로 진행한다. ‘유승민’을 입력했을 때 정치인 유승민과 스포츠인 유승민 같은 동명이인이나 중의어는 구문의 맥락으로 파악한다고 언론재단은 설명했다.
언론인·학자 등의 전문가용인 ‘빅카인즈 프로’는 상세 조건을 설정하고, 분석 자료를 엑셀 데이터로 내려받아 통계분석 프로그램으로 추가 분석할 수 있다. 언론재단은 언론사의 심층보도나 학계의 연구뿐 아니라 기업의 소비환경 분석, 공공기관의 정책 개발, 스마트업의 새로운 콘텐츠 개발 등에도 유용할 것으로 보고 있다. 전문가용은 일정 기간 홍보 뒤 회원을 받아 유료로 전환한다는 방침이다.
언론재단의 조영현 뉴스빅데이터팀장은 “지금은 41개 언론사의 실시간 뉴스를 받는 것으로 출발하지만 데이터 처리가 안 된 20여곳도 하반기에 추가된다. 또 공공기관의 데이터까지 연계해 키워드 분석 확장과 시스템 고도화로 서비스를 안정화시켜 나갈 예정”이라고 밝혔다.
문현숙 선임기자 hyunsm@hani.co.kr
항상 시민과 함께하겠습니다. 한겨레 구독신청 하기