• 제목/요약/키워드: Newspaper indexing

검색결과 9건 처리시간 0.025초

신문기사(新聞記事) 자동색인(自動索引)에 관한 고찰(考察) (A Study on Automatic Indexing System for Newspaper Articles)

  • 조선희
    • 정보관리연구
    • /
    • 제23권3호
    • /
    • pp.19-44
    • /
    • 1992
  • 최근 국내(國內) 대부분의 신문사(新聞社)에서 CTS시스템을 도입함에 따라 기사전문(記事全文)이 컴퓨터에 입력되는 장점을 고려한 자동색인(自動索引) 시스템의 필요성이 대두되고 있다. 본 연구에서는 선행연구(先行硏究)와 국내외(國內外) 사례(事例)들을 통해 신문기사 자동색인 시스템의 문제점(間題點)과 앞으로의 전망(展望)을 고찰하였다.

  • PDF

신문 시소러스 개발의 이론과 실제 (Newspaper Thesaurus Construction in Theory and Practice)

  • 정영미
    • 한국문헌정보학회지
    • /
    • 제25권
    • /
    • pp.51-82
    • /
    • 1993
  • Effective indexing systems are required to enhance the performance of full-text retrieval systems. The result of the analysis of index terms selected by human indexers without a newspaper thesaurus indicates that controlled indexing language is necessary for effective and consistent indexing of newspaper articles. In this paper, basic principles are established for keyword selection from Korean newspapers and significant problems identified in the process of developing a newspaper thesaurus are discussed in depth.

  • PDF

시소러스를 이용한 신문기사 데이타베이스 색인시스템에 관한 연구 (A study of indexing system based on thesaurus for newspaper database)

  • 한상길
    • 정보관리학회지
    • /
    • 제11권1호
    • /
    • pp.125-144
    • /
    • 1994
  • 신문기사 색인을 위한 시소러스에 대한 논의는 오래전부터 있어 왔다. 특히 CTS에 의한 신문제작 전산화 이후 대부분의 신문사가 신문기사 DB구축과 자동색인에 많은 관심을 기울이고 있으나 아직 국내에서는 이렇다할 성과가 없었다. 본 논문은 중앙일보사가 국내 최초로 구축한 JOINS시소러스에 대해서 살펴보고 시소러스를 이용한 신문기사 데이타베이스 온라인 자동색인 및 후통제 수작업색인의 효율성을 비교하고 바람직한 색인방안을 모색해 본다.

  • PDF

언어학적 분석기법에 의한 신문기사 자동색인시스팀 설계에 관한 연구 (A Study of automatic indexing based on the linguistic analysis for newspaper articles)

  • 서경주;사공철
    • 정보관리학회지
    • /
    • 제8권1호
    • /
    • pp.78-99
    • /
    • 1991
  • 본 연구는 전자신문인 한경 KETEL의 기사 전문을 대상으로 키워드를 자동 추출하는 자동색인 시스팀을 구축한 것으로서 한글의 형태적 특성을 이용한 언어학적 분석기법을 적용해서 키워드 화일을 생성하는 법을 제시하였으며, 불용어리스트 조사표 용언인식표의 작성법을 상세히 기술했다. 본 연구에서 얻어진 결론은 다음과 같다. 첫째, 형태소 분석을 통한 자동색인 기법으로 만족할 만한 키워드를 추출할 수 있었다. 둘째, 아직까지는 컴퓨터에 의한 한글의 구문분석과 의미분석이 완전하지 못하므로 자동색인으로 추출된 색인어를 색인자가 조절함으로써 색인의 성능을 향상시킬 수 있었다. 셋째, 이 시스팀에서 만들어진 약 20,000어 정도의 키워드 화일은 향후 디소러스 작성에 기본 자료로 사용할 수 있다. 넷째, 본 시스팀에서는 역순사전을 활용해 조사표와 용언인식표 작성법을 제시하였는데, 이는 여러 자동색인 시스팀 설계에 적용될 수 있을 것이다.

  • PDF

신문 시소러스의 평가에 관한 연구 : 신문기사 종합시소러스를 중심으로 (A Study on the Evaluation of Newspaper Thesaurus)

  • 이인애
    • 정보관리학회지
    • /
    • 제12권1호
    • /
    • pp.99-113
    • /
    • 1995
  • 본 연구는 신문 시소러스의 평가에 관한 연구의 일환으로서, 신문기사 종합시소러스의 경제.산업분야를 대상으로 시소러스의 표현력과 포괄성을 평가하였다. 평가는 시소러스를 사용하여 신문기사에 대해서 색인작업을 하고, 신문기사와 용어사전에서 수집한 신문용어를 시소러스와 대조하는 두가지의 방법으로 하였다. 평가를 통하여, 신문 시소러스의 구축과 이용에 있어서 중요한 문제로 주제개념의 특정성, 복합어의 분리, 디스크립터와 도입어간의 우선관계, 고유명사의 수록방법 그리고 주제분야간의 용어배분 문제가 고찰되었다.

  • PDF

"뉴스 코어 시소러스"의 구축 및 활용 방안에 관한 연구 (A Study on the Establishment and Applications of the "News Core Thesaurus")

  • 장인호
    • 한국도서관정보학회지
    • /
    • 제44권3호
    • /
    • pp.489-512
    • /
    • 2013
  • 본 연구는 뉴스 정보의 효율적인 색인 작성과 검색을 위한 뉴스 코어 시소러스를 구축하고 활용 방안을 제시한다. 뉴스 코어 시소러스는 뉴스의 모든 주제를 커버할 수 있는 매크로시소러스로 구축하여, 향후 정치, 경제사회, 문화 등의 마이크로시소러스를 부분집합으로 가질 수 있도록 하였다. 뉴스 코어 시소러스는 디스크립터 2,012어, 비디스크립터 74어를 SKOS(Simple Knowledge Organization System)로 구현하였다. 일간신문이 아닌 주간이나 격주간 등의 정보량이 적고, 특수한 주제를 다루는 신문은 특수 주제영역만 상세히 다루고, 대형의 뉴스 아카이브나 포털 사이트에서는 각각의 마이크로시소러스를 병합 또는 통합하여 활용할 수 있는 방안을 제시한다.

독자 중심의 신문 제작과 독자의 실제 열독률 (What did They Read in the Newspapers?: A New Method of Measuring Readership)

  • 박재영;전형준
    • 한국언론정보학보
    • /
    • 제35권
    • /
    • pp.211-249
    • /
    • 2006
  • 이 연구는 독자가 어떤 기사를 얼마나 읽는지를 구체적으로 탐색했다. 설문 응답 형태로 열독 의식이나 태도를 조사한 과거 연구와 달리, 이 연구는 독자에게 신문을 보여주면서 각 기사에 대한 열독 여부와 열독 정도 등 '행태'를 측정했다. 최근 국내 신문사들이 독자 중심의 제작을 표방하는 것과 대조적으로 독자의 구체적인 열독행태는 제대로 알려지지 않았다는 것이 이 연구의 문제의식이었다. 신문 종합섹션 전체 기사의 절반 이상을 열독하는 독자는 6.2%였으며 경제섹션의 이 비율은 4.1%였다. 종합섹션에서 단 1개의 기사도 열독하지 않는 독자는 1.1%였으며 경제섹션의 이 비율은 26.5%였다. 종합1, $3{\sim}5$면, 사회 $1{\sim}2$면, 여론 $2{\sim}3$면의 열독률은 상대적으로 높은 반면 문화1면, 국제 2면, 경제섹션 4면, 스포츠 2면, 피플 1면의 열독률은 낮았다. 또 사회면 4개의 머리기사 열독률은 종합면 6개의 열독률보다 높았고, 특히 사회 2면 머리기사 열독률은 종합1면 머리기사 열독률보다 높았다. $20{\sim}30$대 젊은 독자는 40대 이상의 장년층 독자보다 종합 $1{\sim}4$면과 사설면의 머리기사를 현저히 덜 읽는 것으로 밝혀졌다.

  • PDF

거리 제한을 이용한 색인 시스템 (An Index System using Restrictive Distance)

  • 박찬이;김상복
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권1호
    • /
    • pp.273-282
    • /
    • 2006
  • 한본 논문에서는 단어 가중기법에 거리 개념을 도입한 색인 기법을 제안한다. 본 색인 기법은 질의어와 문서를 대표하는 색인의 대부분은 복합명사 혹은 인접한 두개 이상의 명사 또는 명사구가 많으며 이들 명사간의 거리가 멀면 멀수록 색인으로 선택되는 비율이 줄어드는 점을 착안하여, 이를 기존의 가중치 부여 기법으로 색인어 후보를 선정하고, 후보들 간의 거리가 3어절 이내의 후보를 최종 색인으로 선정하였다. 이 방법을 이용하여 신문기사, 학술논문, 웹문서 등 100여종의 문서를 대상으로 실험한 결과 신문기사 92.03%, 학술논문 95%, 웹문서는 73..33%의 정확율을 보였다.

  • PDF

본문 데이타베이스 연구에 관한 고찰과 그 전망 (Future and Directions for Research in Full Text Databases)

  • 노정순
    • 한국문헌정보학회지
    • /
    • 제17권
    • /
    • pp.49-83
    • /
    • 1989
  • A Full text retrieval system is a natural language document retrieval system in which the full text of all documents in a collection is stored on a computer so that every word in every sentence of every document can be located by the machine. This kind of IR System is recently becoming rapidly available online in the field of legal, newspaper, journal and reference book indexing. Increased research interest has been in this field. In this paper, research on full text databases and retrieval systems are reviewed, directions for research in this field are speculated, questions in the field that need answering are considered, and variables affecting online full text retrieval and various role that variables play in a research study are described. Two obvious research questions in full text retrieval have been how full text retrieval performs and how to improve the retrieval performance of full text databases. Research to improve the retrieval performance has been incorporated with ranking or weighting algorithms based on word occurrences, combined menu-driven and query-driven systems, and improvement of computer architectures and record structure for databases. Recent increase in the number of full text databases with various sizes, forms and subject matters, and recent development in computer architecture artificial intelligence, and videodisc technology promise new direction of its research and scholarly growth. Studies on the interrelationship between every elements of the full text retrieval situation and the relationship between each elements and retrieval performance may give a professional view in theory and practice of full text retrieval.

  • PDF