네이버 뉴스 라이브러리 vs 조선 뉴스 라이브러리...

23
네이버 뉴스 라이브러리 vs 조선 뉴스 라이브러리 100 Final Team Project 2020 SS Search Engine Professor: Kiduk Yang 문헌정보학과 2018114507 이영선 문헌정보학과 2018110406 이유진 문헌정보학과 2018113135 임화영

Upload: others

Post on 07-Aug-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

  • 네이버 뉴스 라이브러리

    vs

    조선 뉴스 라이브러리 100

    Final Team Project 2020 SS Search Engine Professor: Kiduk Yang

    문헌정보학과 2018114507 이영선

    문헌정보학과 2018110406 이유진

    문헌정보학과 2018113135 임화영

  • 목차

    Ⅰ 서론

    1. 주제 선정 배경 p.1

    2. 신문 아카이브 소개 p.2

    Ⅱ 본론

    1. 메인화면 인터페이스 p.3

    2. 검색기능 p.6

    가. 검색 기능 소개 p.6

    나. 검색어 p.12

    다. 검색 결과 정렬 p.13

    라. 검색 결과 평가 p.14

    3. 접근성 p.15

    Ⅲ 결론

    1. 결과 p.17

    2. 개선 방향 제안 p.18

  • - 1 -

    Ⅰ. 서론

    1. 주제 선정 배경

    신문은 발행 시점에는 ‘새로운 뉴스’와 정보를 신속하게 전달하는 1차 가치를 지니지만, 날짜가 지나 ‘구문(舊聞)’이 되면 역사적, 사회적, 문화적인 사실을 증명하는 2차 가치를 지니게 된다. 이런 2차 가치를 보존하고 이용할 수 있는 것이 바로 신문 아카이브이다. 신문 아카이브는 기자들이 새로운 기사를 작성하는데 참고하는 것 외에도 다양한 학문 분야에서 연구를 위한 자료로 사용하거나 영화, 드라마, 소설과 같은 문화 콘텐츠에도 소재를 제공하며 학습자료로도 이용할 수 있다. 하지만 이런 신문 아카이브를 물리적으로 구축하기에는 검색의 불편함이나 신문을 보관할 공간 부족 등의 한계가 명확하기 때문에, 대부분은 온라인 신문 아카이브를 구축하고 활용한다. 현재의 신문은 신문 제작의 전 과정이 디지털화되었기 때문에 생산과 동시에 온라인 DB로 이관되어 DB를 구축하는 데 큰 어려움이 없지만, 과거의 신문, 특히 신문의 역사 중 초기에 만들어진 고(古)신문은 다방면으로 가치가 높으나 일일이 사람이 디지털화하여 DB에 저장하는 노력이 필요하다. 우리 조는 이러한 신문 DB가 현재 어떻게 구축되어 있고 어떻게 서비스가 제공되고 있으며 어떤 방식으로 활용할 수 있는지 궁금증을 가졌고 이에 대해 자세히 알아보고자 주제로 선정하였다.

    유형 개별형 통합형대상 신문 1종 다수

    구축 주체 해당 언론사 등 민간기업도서관, 언론, 역사

    관련 기관 등 공공기관

    포털 등 민간기업

    이용 요금 유료 무료/유료

    [표 1] 신문 아카이브 유형별 구분

    신문 아카이브의 유형은 위과 같이 나눌 수 있다. 우리 조는 여기서 개별형에 해당하는 “조선 뉴스 아카이브 100”과 통합형에 해당하는 “네이버 뉴스 라이브러리”를 선정하였고, 이 두 가지의 신문 아카이브를 조사하고 비교할 것이다.

  • - 2 -

    2. 신문 아카이브 소개

    ① 네이버 뉴스 라이브러리(https://newslibrary.naver.com/search/searchByDate.nhn): 네이버에 연동된 통합형 뉴스 아카이브

    Ÿ 주요기능- 과거 기사를 날짜 및 키워드로 검색- 신문 원문 제공- 네이버 로그인 후 마이스크랩 기능 이용 가능

    Ÿ 특징- 제 55회 신문의 날을 맞이하여 네이버가 2011년 4월 7일부터 제공하는 서비스- 무료로 이용이 가능함- 1920~1999년까지의 신문 기사 제공- , , , 총 4종류의 신문을 볼 수 있음- 각 구성요소 별로 속성값을 부여하고, 추출된 개별 문자마다 좌표값 지정함 (실제 신문을 펼쳐보듯 기사의 위치와 구성 영역을 파악할 수 있음)

    ② 조선 뉴스 라이브러리 100(https://newslibrary.chosun.com/): 조선일보의 기사만을 수집한 개별형 신문 아카이브

    Ÿ 주요기능- 과거 기사를 날짜 및 키워드로 검색- 신문 원문 제공- 조선일보 로그인 후 스크랩 기능 이용 가능

    Ÿ 특징- 조선일보 창간 100주년을 맞아 2020년 3월 5일부터 제공되는 서비스- 무료로 이용이 가능함- 1920년부터 1999년까지의 기사 295만여 건을 디지털화했음- 연세대 언어정보연구원과 협력하여 만듦

    https://newslibrary.chosun.com/

  • - 3 -

    Ⅱ. 본론

    1. 메인화면 인터페이스 소개 및 비교

    가. 네이버 뉴스 라이브러리(Naver News Library)

    네이버 뉴스 라이브러리 메인화면 인터페이스

    네이버 뉴스 라이브러리의 메인화면은 과 같다. 메인화면을 5개의 구역으로 나누어 소개해보도록 하겠다.

    ① 로고: 화면의 좌측 상단에는 “NAVER(네이버 로고)”와 “뉴스 라이브러리”라는 글자가 적혀져 있고 각각 다른 페이지로 이동할 수 있는 링크가 포함되어 있다. “NAVER”를 클릭하면 네이버 포털 사이트의 메인 페이지로, “뉴스 라이브러리”를 클릭하면 네이버 뉴스 라이브러리의 메인 페이지로 이동한다.② 로그인 및 개인 서비스: 우측 상단에서 로그인을 할 수 있는데, 네이버 아이디로 로그인할 수 있으며 네이버 포탈의 서비스와 연계되어 내 정보, 알림, 메일 등을 확인할 수 있다.③ 메뉴 탭: 날짜 검색, 키워드 검색, 상세검색, 마이스크랩 - 총 4개의 메뉴로 구성되어있다. 처음 사이트에 들어오면 기본적으로 날짜 검색 페이지가 나타난다. ④ 검색 옵션 및 검색 결과: 다양한 옵션을 통해 검색 결과의 범위를 좁힐 수 있다.

  • - 4 -

    ⑤ 하단 바: 페이지 제일 하단에는 네이버 뉴스 라이브러리의 공지사항을 확인할 수 있다.

    나. 조선 뉴스 라이브러리 100

    조선 뉴스 라이브러리 100 메인화면 인터페이스(1)

    ① 메뉴: 최상단에는 옛 기사 검색, 하이라이트, 발자취 등의 버튼이 있는 바가 있고 ② 웹페이지 제목: “조선 뉴스 라이브러리 100”이라는 웹페이지의 제목이 적혀져 있으며, 이것을 누르면 메인 페이지로 이동한다.③ 100년의 기사 찾기(검색창): 검색어를 입력하여 원하는 내용을 담은 뉴스 기사를 검색할 수 있다.④ 그때 그 뉴스: 오늘로부터 100년 전의 조선일보 1면엔 어떤 내용이 들어갔는지 사진과 기사의 제목을 보여준다. 기사의 제목을 클릭하면 해당 기사의 내용을 볼 수 있다.⑤ Chosun News Library 100 Video: 클릭하면 조선일보 창간 100주년 기념 영상을 볼 수 있는 유튜브 채널로 연결된다. ⑥ 한국을 뒤흔든 특종: 조선일보에서 낸 특종 기사들을 소개하고 있다. 날짜와 사건 키워

  • - 5 -

    드 그리고 관련된 기사의 수까지 나와 있고 사진을 누르면 관련 기사의 목록들과 해당 기사가 들어가 있는 지면을 더 자세히 볼 수 있다.

    조선 뉴스 라이브러리 100 메인화면 인터페이스(2)

    ⑦ 기획 시리즈: 조선일보가 기획한 기사의 시리즈를 볼 수 있다. 클릭하면 해당하는 기사를 볼 수 있다.⑧ 스타 기자: 한용운, 이육사, 이광수 등 유명한 기자들을 소개하고 있다. 클릭하면 해당 인물에 대한 정보를 볼 수 있다.⑨ 페이지의 마지막 부분에는 조선일보의 지금까지 행보를 “발행한 지면을 쌓아 올린 높이”, “발행한 지면 세로로 이어붙인 길이” 등으로 수량화하여 재미있게 표현하였다.

  • - 6 -

    2. 검색기능

    가. 검색 기능 소개

    1) 네이버 뉴스 라이브러리

    네이버 뉴스 라이브러리의 검색은 날짜 검색, 키워드 검색, 상세검색으로 크게 3가지 기능을 이용할 수 있다.

    가) 날짜 검색

    네이버 뉴스 라이브러리의 날짜 검색 방법은 다음과 같다.

    ① 직접 날짜를 입력, 양 옆의 화살표로 이전날/다음날, 이전주/다음주로 바로 이동할 수도 있음

    ② 달력에서 날짜를 연/월/일별로 선택

    ③ 막대 바에서 연도/날짜 선택

    [표 2] 네이버 뉴스 라이브러리 날짜 검색 방법

  • - 7 -

    네이버 뉴스 라이브러리 ‘날짜 검색’ 페이지

    Ÿ 검색일 날짜의 신문이 연도와 상관없이 TOP 기사보기로 먼저 뜬다. 클릭하면 신문의 내용을 확인할 수 있다.

    Ÿ 경향신문, 동아일보, 매일경제, 한겨레의 창간일 이후의 신문을 각각 확인할 수 있다.Ÿ 이미지형, 요약형, 제목형, TOP 기사보기 등으로 보는 방법을 선택할 수 있다.

    나) 키워드 검색

    Ÿ 원하는 키워드를 직접 입력하여 검색할 수 있다.Ÿ 검색 시 해당 키워드가 나온 신문의 수를 연도/월별 그래프로 보여준다.Ÿ 요약형이 기본형식으로 설정되어 있으며, 해당 키워드가 제목으로 들어간 신문 기사를

    경향, 동아, 매일, 한겨레 신문으로 각각 나눠서 보여준다. 해당 신문 기사의 이미지와 기사 제목, 날짜, 몇 면에 있는지, 내용의 일부를 간략하게 나타내고 있다.

    Ÿ 이미지형과 제목형으로 보는 방법을 선택할 수도 있다. (이미지형: 해당 신문 기사의 이미지만 보여줌 / 제목형: 제목만 보여줌)

    Ÿ 검색 결과를 정확도순, 최신순, 과거순에 따라 정렬할 수 있다.Ÿ 전체, 정치, 경제, 사회, 생활/문화, IT/과학, 연예, 스포츠, 광고로 카테고리를 나눠서

    각 카테고리에 맞는 기사를 살펴볼 수도 있다. (각 카테고리에 맞지 않는 기사들도 다

    네이버 뉴스 라이브러리 ‘키워드 검색’ 페이지 (요약형, 이미지형, 제목형 순)

  • - 8 -

    수 있음)

    다) 상세 검색

    네이버 뉴스 라이브러리 ‘상세 검색’ 페이지

    Ÿ 상세 검색은 ① 기한 ② 언론사(경향, 동아, 매일, 한겨레) ③ 지면(전체/1면만 보기) ④ 섹션(정치,경제,사회,생활/문화,IT/과학,연예,스포츠,광고) ⑤ 유형(전체선택, 기사, 뉴스, 발표 명단, 통계, 프로필, 사설, 텍스트, 사망, 용어해설, 인터뷰, 가십, 칼럼/논단, 사고, 기획/연재, 좌담/대담, 소설, 만평, 표, 광고, 시, 만화, 휘호, 그래픽, 사진, 날씨, 서화)과 같이 총 5가지의 범위를 선택하여 검색할 수 있다.

    Ÿ 검색 결과는 키워드 검색과 동일하다.

  • - 9 -

    라) 네이버 뉴스 라이브러리 검색 결과

    네이버 뉴스 라이브러리에서 ‘한글변환기능’을 사용한 결과페이지

    네이버 뉴스 라이브러리에서 ‘원문보기기능’을 사용한 결과페이지

    Ÿ 기사의 제목 및 본문에 표기된 한자는 한글과 병기하여 나오거나 원문을 볼 수 있다. 기사를 클릭하면 기사가 있는 면의 이미지를 볼 수 있고, 각각의 기사를 구별해서 확인할 수 있다. 텍스트 보기를 통해 기사의 전문을 확인할 수 있다. 원문을 그대로 보거나 한자를 한글로 변화해서 볼 수 있으며 일부 글자는 텍스트화에 실패하여 보이지 않는

  • - 10 -

    글자도 있다.Ÿ 신문의 기사뿐 아니라 지면에 있는 면 정보, 기사, 소설, 시, 사진, 만평, 만화, 날씨,

    표, 휘호, 서화, 돌출광고, 전단 광고, 소형광고, 광고 군집, 그래픽, 기타 등 17개의 신문 구성요소를 구별하여 디지타이징했고, 기사 글자 하나하나에 신문 지면에 따른 위치 값이 반영되어 있다.

    Ÿ 구성요소별 본문 검색이 가능하여 경제면 기사만 보기, 특정 키워드의 광고만 검색하기 등이 가능하다. 또한, 네이버 뉴스 라이브러리 자체의 뷰어를 통해 종이신문 느낌으로 신문 펼쳐보기, 확대/축소, 스크랩 등이 가능하다.

    Ÿ 상세검색(매체/섹션/기사유형별 검색 등)은 네이버 계정에 로그인한 후 가능하다.Ÿ 저작권 등의 문제로 텍스트 복사 기능은 제공하지 않고 있으며, PC가 아닌 모바일에서

    는 이용할 수 없다.

    2) 조선 뉴스 라이브러리 100

    조선 뉴스 라이브러리 100의 검색은 검색어로 찾기, 날짜로 찾기로 2가지 기능을 이용할 수 있다.

    가) 검색어로 찾기

    조선 뉴스 라이브러리 100 ‘검색어로 찾기’ 기능

    Ÿ 기간, 영역, 유형, 기고자(寄稿者)를 설정하고 검색할 수 있다.Ÿ 기사 제목과 내용 일부, 기사 이미지, 날짜와 면수, 기사 카테고리, 기자 이름 등이 뜨

    고 클릭하면 기사가 실린 신문 페이지와 텍스트를 확인할 수 있다. 기사에 따라 원문, 원문+한글, 현대어로 변환하여 텍스트를 읽을 수 있다. 텍스트 전부를 데이터화하지 못하여 일부 글자는 보이지 않거나 삭제되어있다.

  • - 11 -

    나) 날짜로 찾기

    조선 뉴스 라이브러리 100 ‘날짜로 찾기’ 기능

    Ÿ 연도월일을 전부 숫자로 입력해야만 검색할 수 있다.Ÿ 당일 신문의 면이 개별적으로 나열되어있으며, 면마다 페이지 이미지와 해당 면의 기사

    의 제목이 표시된다. 표 제목을 눌러 해당 기사를 확인할 수 있다.Ÿ 결과는 ‘검색어로 찾기’와 동일하다.

    다) 조선 뉴스 라이브러리 100 검색 결과

    Ÿ 조선 뉴스 라이브러리 100에서는 기사를 원문 그대로 표기(한자표기), 원문과 한글을 병기, 현대어 표기 총 3가지 방식 중 하나를 선택해 볼 수 있다.

    조선 뉴스 라이브러리 100 결과 페이지 (원문, 원문+한글, 현대어 순)

  • - 12 -

    3) 네이버 뉴스 라이브러리 검색과 조선 뉴스 라이브러리 100 검색 기능 비교

    나. 검색어

    1) 한국어 검색어 비교 네이버 뉴스 라이브러리는 한국말로 “도서관”을 검색했을 시 총 27,820건의 결과가 나왔고, 그중 도서관과 관련된 기사의 비율이 높은 편이다. 조선 뉴스 라이브러리 100은 총 12,718건이 검색되었고 첫 페이지에 도서관과 관련된 기사가 거의 검색되지 않는다. (이 같은 결과는 네이버 뉴스 라이브러리는 4개의 신문사의 기사를 하나로 모아놓은 종합 라이브러리이고, 조선 뉴스 라이브러리 100은 조선일보의 기사만 다루기 때문에 나온 결과일 수도 있다)

    2) 잘못된 검색어 “도서관” 대신 오탈자가 포함된 “도사관”으로 검색을 해 보았다. 네이버 뉴스 라이브러리 같은 경우 정상적인 단어로 검색했을시 27,820건의 결과가 떴는데, 오탈자가 포함된 검색어로 했더니 단 3건의 검색 결과가 나타났으며 검색된 결과는 모두 도서관과 관련된 결과였다. 조선 뉴스 라이브러리 100은 정상적인 단어로 검색했을시 12,718건의 결과가 떴었는데 오탈자가 포함된 단어로 검색을 하니 에 꽤 줄어든 수치인 1,020건의 결과가 나왔다. 검색된 결과는 역시 도서관과 관련된 기사는 거의 없는 것으로 보인다. 잘못된 검색어를 입력했을 때 기존에 쓰던 검색포털이 네이버나 구글처럼 검색어를 보완해 주거나 제안해 주는 기능은 없었고, 입력한 글자 그대로 입력이 되었다.

    3) 영어 검색어

    네이버 뉴스 라이브러리 조선 뉴스 라이브러리 100신문 페이지 이미지 각 기사 및 기타 영역별로

    구분되어 있음구분되어있지 않음

    텍스트 원문/한자(한글) 병기 원문/한글(한자)병기/현대어 변환 (단, 모든 기사가 그렇지는 않음)

    해당 날짜의 신문 한 부 전체

    신문 전체의 원본 이미지를 제공하며, 이미지 또는 텍스트 목록으로 해당 신문 면에 속하는 기사를 확인할 수 있음

    신문 전체가 이미지+제목의 모습으로 나열되어있고 한 면씩 내용을 확인할 수 있음

    영역별 검색 가능함 구분은 되어있으나 영역별로 검색을 할 수는 없음

    [표 3] 뉴스 라이브러리 검색 기능 비교

  • - 13 -

    영어로 된 검색어인 “library”를 검색했을 때, 두 곳 다 검색 결과의 양은 현저히 적었으며, 네이버 뉴스 라이브러리의 경우 도서관과 관련된 기사가 한 페이지에 2~3건 정도 떴고, 조선 뉴스 라이브러리 100은 거의 뜨지 않았다. 우리나라 옛 신문의 특성상 영어를 거의 쓰지 않고 한글이나, 한자로 된 경우가 많아 검색이 잘 안 되는 것으로 보인다.

    4) 한자 검색어 한자로 “圖書館(도서관)”을 검색했을 때, 네이버 뉴스 라이브러리는 641건의 기사가 검색되었고 조선 뉴스 라이브러리 100은 16,360건이 검색되었다. 내용은 네이버 뉴스 라이브러리 같은 경우 첫 페이지의 거의 모든 검색 결과가 도서관과 연관되어 있었다. 한글로 도서관을 검색했을 때보다 오히려 더 정확한 결과가 나온다. 반면, 조선 뉴스 라이브러리 100은 한자로 검색했을 때와 한글로 검색했을 때 검색 결과로 뜨는 기사들의 차이가 그렇게 크지 않았으며 결과의 관련된 기사도 네이버와 비교해 아주 적었다.

    5) 검색 결과로 나온 기사 건수

    다. 검색 결과 정렬

    Ÿ 네이버 뉴스 라이브러리: 기본정렬이 정확도순 (정확도, 최신순, 과거순 중 선택할 수 있음)

    네이버 뉴스 라이브러리 정렬기능

    Ÿ 조선 뉴스 라이브러리 100: 기본정렬이 최신순 (최신순, 오래된순, 관련된순 중 선택할 수 있음)

    한글 검색어 잘못된 검색어 영어 검색어 한자 검색어

    네이버 뉴스 라이브러리 27,820건 3건 225건 641건

    조선 뉴스 라이브러리 100

    12,718건 1,020건 32건 16,360건

    [표 4] 검색어별 결과 비교

  • - 14 -

    조선 뉴스 라이브러리 100 정렬기능

    둘 다 검색 결과가 나오는 부분 오른편에서 정렬을 선택할 수 있다. 네이버 뉴스 라이브러리는 정확도 순으로 기본정렬 되어 있어, 앞서 다양한 유형의 검색어로 검색했을 시 비교적 정확도가 높았고, 조선 뉴스 라이브러리 100은 정확도가 낮았던 이유가 최신순으로 정렬이 되어 있기 때문으로 보인다.

    라. 검색 결과 평가

    Ÿ 검색어: “종강”Ÿ 네이버 뉴스 라이브러리 검색 결과 수: 전체 407건 (경향신문 152건, 동아일보 183건,

    매일경제 43건, 한겨레 29건)Ÿ 조선 뉴스 라이브러리 100 검색 결과 수: 263건Ÿ Nrel= 네이버 뉴스 라이브러리의 관련 기사수 + 조선 뉴스 라이브러리 100의 관련 기

    사수

    1) 네이버 뉴스 라이브러리의 정밀도 및 재현율

    Ÿ Rank 30 이후로는 관련 문서 없음

    rank article relevant precision recall1 여름방학시작 大學街(대학가) 「어수선

    한1學期(학기)」終講(종강)yes 1/1=1 1/38=0.03

    2 여름방학시작 大學街(대학가) 「어수선한1學期(학기)」終講(종강)

    y 2/2=1 2/38=0.05

    3 새마을學校(학교) 終講(종강) 4千(천)6百(백)명 修了(수료)

    y 3/3=1 3/38=0.08

    4 '합의종강'으로 유급 모면 n 3/4=0.75 3/38=0.085 서울大(대) 모두終講(종강)·放學(방학)"

    法大(법대)는 리포트代朁(대체)키로"y 4/5=0.8 4/38=0.1

    6 길고 지루했던 1學期(학기) 終講(종강) 캠퍼스에 할짝「여름의꿈」

    y 5/6=0.83 5/38=0.13

    7 서울대학法大(법대) 終講(종강) 文理大 y 6/7=0.86 6/38=0.16

    [표 5] 네이버 뉴스 라이브러리 정밀도 및 재현율

  • - 15 -

    Ÿ Average Precision=0.79Ÿ R-Precision=0.86Ÿ Reciprocal Rank=1

    2) 조선 뉴스 라이브러리 100의 정밀도 재현율

    Ÿ Average Precision=0.60Ÿ R-Precision=0.69Ÿ Reciprocal Rank=1

    3. 접근성

    가. 네이버 뉴스 라이브러리

    Ÿ 2011년부터 서비스를 제공하였다. Ÿ 표준화된 플랫폼인 만큼 어느 신문에도 적용할 수 있다. Ÿ 해상도 등 신문의 이미지 품질과 앞서 살펴본 이용자 편의성, 검색 툴, 인터페이스 등 분

    rank article relevant precision recall1 종강(終講)선물 yes 1/1=1 1/38=0.032 의정(議政)"종강(終講)" n 1/2=0.5 1/38=0.033 치대(齒大)—음대(音大)

    도종강(終講)y 2/3=0.67 2/38=0.05

    4 서울법대(法大) 종강(終講)

    y 3/4=0.75 3/38=0.08

    5 교수—학생 종강(終講)잔치

    y 4/5=0.8 4/38=0.1

    6 종강록(終講錄) 출판기념회

    n 4/6=0.67 4/38=0.1

    7 「나의 종강록(終講錄)」펴내

    n 4/7=0.57 4/38=0.1

    8 수도여사대(首都女師大) 종강(終講)

    y 5/8=0.63 5/38=0.13

    …30 라디오 18일방송 n 16/30=0.53 16/38=0.42

    [표 6] 조선 뉴스 라이브러리 100의 정밀도 및 재현율

    (문리대)도 하루休講(휴강)후 與否(여부)결정

    8 大學(대학) 今週(금주)중 終講(종강) y 7/8=0.88 7/38=0.18…30 라디오 18일방송 n 22/30=0.73 22/38=0.58

  • - 16 -

    야 대부분에서 우수하다. Ÿ 네이버는 대형 포털이기에 많은 이용자가 손쉽게 접하고, 이용할 수 있다.Ÿ 로그인 없이도 무료로 이용할 수 있다. Ÿ 사기업에서 구축, 서비스하고 있다는 점에서 지속가능성이나 활용성이 낮을 수 있다.

    나. 조선 뉴스 라이브러리 100

    Ÿ 2020년부터 서비스를 제공하였다. Ÿ 로그인 없이도 무료로 이용이 가능하다. Ÿ 다른 각 신문사의 뉴스 아카이브 사이트보다 다양한 검색 결과 및 본문을 텍스트로 제공

    한다.Ÿ 이용자 편의성, 검색 툴, 인터페이스가 우수하다. Ÿ 언론사에서 직접 구축하여 서비스하고 있으므로 지속 가능성과 활용성이 높을 것이라 기

    대할 수 있다. Ÿ 이 서비스에 대해 알지 못하는 사람들이 많기 때문에, 더 많은 홍보 등을 통해 알릴 필요

    가 있다.

  • - 17 -

    Ⅲ. 결론

    1. 결과

    ① 검색기능 소개 및 비교: 네이버 뉴스 라이브러리는 신문 한 부 전체가 하나의 이미지 뷰어로 되어있어 손수 클릭하며 찾아야 하고 조선 뉴스 라이브러리 100은 1면, 2면, 3면… 이런 식으로 나누어져 있어 가독성이 더 좋다. 또한, 네이버 뉴스 라이브러리의 신문의 한 면 안에서는 기사, 광고 등 영역별로 구분되어있고, 조선 뉴스 라이브러리 100은 구분되어있지 않다. 텍스트는 두 곳 다 원문/한자·한글 병기로 제공되고 추가로 조선 뉴스 라이브러리 100에서는 현대어로 볼 수 있는 기사도 일부 있다. 또 다른 특징적인 부분으로 네이버 뉴스 라이브러리는 섹션(정치, 경제, 사회, 생활/문화, IT/과학, 연예, 스포츠, 광고)별로 검색이 가능하다는 점이 있다. 조선 뉴스 라이브러리 100은 섹션별로 구분은 되어있으나 검색은 제공하지 않는다.

    ② 검색어 비교: 전반적으로, 네이버 뉴스 라이브러리에서 더 정확한 검색이 된다. 두 곳 모두 잘못된 검색어에 대해 보완해 준다거나 검색어는 제안하는 시스템은 없는데 이 부분은 개선이 되면 더 좋을 것 같다.

    ③ 검색 결과 정렬 비교: 네이버 뉴스 라이브러리는 정확도 순으로 기본정렬 되어있고, 조선 뉴스 라이브러리 100은 최신순으로 정렬이 되어있다. 날짜별 검색이 따로 있으므로, 검색의 효율성을 높이기 위해 조선 뉴스 라이브러리 100도 정확도 순 정렬을 기본으로 설정하면 여러 번 클릭하지 않고 원하는 기사를 더 쉽게 찾을 수 있다. ④ 검색 결과 평가:

    ⑤ 접근성 비교: 둘 다 웹상에서 접근할 수 있고 로그인 없이 기본적인 기능은 이용할 수 있다. 네이버 뉴스 라이브러리 같은 경우 언론사도 아닌 사기업에서 구축, 서비스하고 있다는 점에서 수익이 없고, 이용자가 줄어들면 없어질 가능성도 충분히 있다. 조선 뉴스 라이브러리 100은 언론사에서 직접 구축하여 서비스하고 있으므로 지속 가능성과 활용성이 높을 것이라 기대할 수 있다. 다만 이에 대해 알지 못하는 사람들이 많으므로 지속적인 홍보 등을 통해 많은 사람에게 알려

    네이버 뉴스 라이브러리 조선 뉴스 라이브러리 100Average Precision 0.79 0.60

    R-Precision 0.86 0.69Reciprocal Rank 1 1

    [표 7] 뉴스 라이브러리 검색 기능 비교

  • - 18 -

    야 할 것이다.

    전반적으로 보았을 때, 온라인 신문 아카이브의 특성에 맞게 검색 필터 등은 잘 되어있다. 다만, 검색 결과의 정확성 측면에서 보면 4개 신문사의 신문을 제공하는 네이버 뉴스 라이브러리가 비교적 데이터의 양이 많기 때문에 더 정확하게 나왔다. 이점은 우리가 자료조사를 하면서도 실제로 느꼈던 부분이고 객관적인 수치(Average Precision)를 보아도 네이버 뉴스 라이브러리가 0.79로 조선 뉴스 라이브러리 100의 0.60 보다 더 높게 나와서 이를 뒷받침 해주고 있다. 또한, 둘 다 로그인이 필요하지 않은 무료 서비스란 점에서 사용이 편리하고, 인터페이스 및 원문의 현대어 해설 등이 잘 갖춰져 있기에 다양하게 활용하기 쉽다는 장점을 갖추고 있다

    2. 개선 방향 제안

    마지막으로 우리는 네이버 뉴스 라이브러리와 조선 뉴스 라이브러리 100을 조사하면서 느꼈던 아쉬운 점이나 부족한 점을 살펴보고 개선 방향을 제안해보고자 한다.

    가. 공통

    1) 아카이브의 데이터 범위 확장

    현재 두 뉴스 라이브러리는 1920~1999년까지의 신문 기사만을 제공하고 있다. 현재는 2020년으로, 약 20년 치의 기사가 업데이트되지 않았는데, 그 이후의 뉴스 기사는 네이버나 구글과 같은 검색 포털이나 각 신문사의 홈페이지를 이용하면 볼 수 있겠지만 번거롭게 일일이 따로 찾는 것보단 꾸준히 뉴스 라이브러리를 관리하고 업데이트하는 것이 이용자 입장에서는 편리할 것이다. 인력이나 예산 부족 등의 이유로 가장 최근의 기사까지 업데이트하기 힘들다면 2010년까지라도 데이터의 범위를 확장하는 것을 제안하는 바이다.

    2) 검색어 제안

    Ÿ 오탈자 수정

    네이버의 오탈자를 수정한 검색어 제안

    검색어에 오탈자가 있을 때 검색 결과의 질이 떨어지는 것은 본론에서 다양한 검색어를

  • - 19 -

    통해 두 뉴스 라이브러리의 검색 기능을 비교하였을 때 명백히 드러난 사실이다. 이미 네이버는 포털 사이트에 사용자가 잘못된 검색어로 검색을 시도했을 때 오탈자를 수정한 검색어를 제안하는 기능이 있는데, 이 기능을 뉴스 라이브러리에도 도입하는 것을 제안한다.

    Ÿ 주제 관계 서비스

    국립중앙도서관 주제 관계 서비스 검색 결과

    국립 중앙도서관의 대한민국 신문 아카이브에서는 주제 관계 서비스를 제공하고 있다. 주제 관계 서비스는 검색 키워드와 연관된 키워드를 인물, 사건, 장소, 단체로 구분하여 분석한 결과를 네트워크 관계도로 제공하는 것이다. 주제 관계 서비스를 제공한다면 관련 주제로의 접근성이 용이하여 편리하고, 재검색하는 번거로움을 피할 수 있어 이용자의 시간을 절약할 수 있다. 따라서 네이버 뉴스 라이브러리와 조선 뉴스 라이브러리 100에도 주제 관계 서비스를 도입하는 것을 제안한다.

    나. 네이버 뉴스 라이브러리 개선방향

    Ÿ 현대어로 해석기능 추가 네이버 뉴스 라이브러리는 한자를 한글로 변환하여 보여주는 기능이 존재하는데 이는 이용자가 옛말을 현대식으로 다시 해석해야 하는 어려움을 겪게 된다. 조선 뉴스 라이브러리 100이 본문을 현대어로 해석해주는 것처럼 네이버 뉴스 라이브러리도 해당 서비스를 도입하여 이용자들이 옛 기사들을 원만히 읽을 수 있도록 돕는 것을 제안한다.

  • - 20 -

    다. 조선 뉴스 라이브러리 100 개선방향

    Ÿ 기본정렬이 정확도 순이 아니라서 검색어와 관련이 없는 기사가 상위에 떴다. 따라서 기본정렬을 정확도 순으로 변경하는 게 이용자 입장에서 더 직관적일 것으로 보인다. 또한, 본문에서 정밀도 및 재현율을 계산했던 결과를 보면 네이버 뉴스 라이브러리보다 낮은 값이 나왔다. 이런 결과의 부정확함을 개선하여 검색의 질을 높이는 것을 제안하는 바이다.

  • 참고문헌

    Song, Z. H. (2016). 온라인 신문 아카이브 연구 국내외 구축 사례를 중심으로. 기록학연구, (48), 93–139. https://doi.org/10.20923/KJAS.2016.48.093

    조선 뉴스 라이브러리 100 https://newslibrary.chosun.com/ (2020.06.17)

    네이버 뉴스 라이브러리https://newslibrary.naver.com/search/searchByDate.nhn (2020.06.17)

    네이버뉴스라이브러리 https://blog.naver.com/hej0509/221682642504 (2020.06.17)

    [조선일보 기사] 새 100년을 향한 힘찬 첫발 http://news.chosun.com/site/data/html_dir/2020/03/05/2020030500137.html (2020.06.17)

    신문을 통해 바라보는 대한민국 역사 https://blog.naver.com/mcstkorea/221973123308 (2020.06.17)

    국립중앙도서관 대한민국 신문 아카이브 https://nl.go.kr/newspaper/index.do (2020.06.17)

    https://doi.org/10.20923/KJAS.2016.48.093https://newslibrary.chosun.com/https://newslibrary.naver.com/search/searchByDate.nhnhttps://blog.naver.com/hej0509/221682642504http://news.chosun.com/site/data/html_dir/2020/03/05/2020030500137.htmlhttps://blog.naver.com/mcstkorea/221973123308https://nl.go.kr/newspaper/index.do

    검색엔진 찐최종개요1. 주제 선정 배경2. 신문 아카이브 소개가. 네이버 뉴스 라이브러리(Naver News Library)나. 조선 뉴스 라이브러리 1001) 네이버 뉴스 라이브러리가) 날짜 검색나) 키워드 검색다) 상세 검색라) 네이버 뉴스 라이브러리 검색 결과

    2) 조선 뉴스 라이브러리 100가) 검색어로 찾기나) 날짜로 찾기다) 조선 뉴스 라이브러리 100 검색 결과

    3) 네이버 뉴스 라이브러리 검색과 조선 뉴스 라이브러리 100 검색 기능 비교4) 한자 검색어 5) 검색 결과로 나온 기사 건수

    다. 검색 결과 정렬라. 검색 결과 평가1) 네이버 뉴스 라이브러리의 정밀도 및 재현율2) 조선 뉴스 라이브러리 100의 정밀도 재현율