• 제목/요약/키워드: 주제 분류

검색결과 990건 처리시간 0.026초

문헌적 근거에 기반한 한국십진분류법(KDC) 활용현황에 대한 연구 (A Research on Utilization of KDC Based on Literary Warrant)

  • 김성원
    • 한국문헌정보학회지
    • /
    • 제55권2호
    • /
    • pp.25-50
    • /
    • 2021
  • 범용의 문헌분류체계는 모든 주제분야를 포괄한다. 전체적인 분류체계는 문헌정보학 전문가가 구성하더라도, 개별 주제영역의 분류항목 구성과 전개는 해당 주제영역의 그것을 참고하는 것이 효율적이다. 전체 주제를 포괄하는 문헌분류체계가 각 주제분야에서 개발한 분류체계의 단순한 모음이 아닌 실용적인 분류체계가 되기 위해서는 각 항목에 배정되는 문헌량의 다과를 반영한 항목 설정과 세분이 필요하다. 분류항목의 설정에 있어 문헌량의 다과에서 항목 설정의 타당성과 근거를 찾는 것을 문헌적 근거(literary warrant)라 부른다. 본고에서는 한국십진분류법(KDC)에 전개된 각각의 분류항목에 어느 정도의 정보자원이 배정되고 있는지를 실증적으로 확인하고 이를 기반으로 향후 개정방안을 제시하고자 한다.

온라인목록 주제접근점 확장을 위한 분류표 지식베이스 설계에 관한 연구 (A Study on a DDC Knowledgebase Design for Subject Access in Online Catalog)

  • 이용민;정영미
    • 정보관리학회지
    • /
    • 제6권2호
    • /
    • pp.87-103
    • /
    • 1989
  • 온라인목록은 최소한 카드목록이 제공해주는 접근방식을 지원해 주어야 한다. 본 연구에서는 온라인목록 검색환경에서 주제접근의 유용성을 논하고, 기존 이용자들에게 익숙한 접근방식인 분류표 접근을 구현하기 위하여 분류표를 프레임구조의 지식베이스로 설계하였다. 지식베이스는 DDC20 판의 새로 추가된 전산과학 분야에 해당되는 004-006 번의 주제영역과 상관색인 부분을 대상으로 실험하였다. 이 시스템은 이용자로 하여금 원하는 주제영역의 분류표에 접근하게 함으로써 그 분야의 체계적인 기념배열을 살펴 볼 수 있게 하고 관련분야의 문헌을 검색할 수 있게 하였다. 이러한 작업은 모두 이용자의 검색능력을 확장시키기 위한 것으로 분류표를 출력하여 봄으로써 이용자는 해당 주제의 분류영역에 대한 보다 확실한 개념 및 범위 파악이 가능하였다.

  • PDF

주제 및 기능을 고려한 대통령기록물 분류체계 제안 (A Study on the Classification System of Presidential Records according to Subjects and Functions)

  • 정광훈;남영준
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2012년도 제19회 학술대회 논문집
    • /
    • pp.161-165
    • /
    • 2012
  • 이 연구에서는 대통령기록물을 효율적으로 관리 활용하기 위한 분류체계가 없는 실정에서 대통령이 가지는 초법적 지위 및 위상과 대통령기록물의 특성을 반영한 분류체계(안)을 설계하였다. 설계기본원칙은 국가기록원 분류표의 주제별 분류원칙과 행정안전부 공공정보 분류체계의 기능별 분류원칙을 미국 백악관기록관리실 주제적 관점을 수용하였다. 이에 따라 이 연구에서는 25개의 대분류항과 109개의 중분류항을 대통령기록물 분류체계(안)를 제안하였다.

  • PDF

정책분야 주제가이드 개발에 관한 연구 (A Study on Developing the Policy Areas Subject Guide)

  • 노영희;박양하
    • 한국도서관정보학회지
    • /
    • 제45권3호
    • /
    • pp.63-92
    • /
    • 2014
  • 본 연구에서는 정책정보서비스의 고도화를 위한 정책 분야별 가이드를 개발하고 관련 정보원 구축을 위한 시스템을 설계하며, 이를 기반으로 시범적으로 정책정보원을 구축하고자 하였다. 정책분야 주제별 가이드 개발 및 구축을 위하여 첫째, 수집된 정보자료의 유형을 상위 9개로, 세부 유형을 총 19개로 구분하였다. 둘째, 정부기능분류체계인 BRM분류체계를 기준으로 주제별 가이드 서비스를 위한 콘텐츠를 구축하였고, BRM 서비스 주제 단계는 3단계, 총 133개 세부 주제 분야로 가이드 구축범위를 확정하였다. 셋째, 133개 BRM 주제분야별로 개발된 주제가이드에 따라 총 6,305건의 콘텐츠를 구축하였다. 결론적으로 본 연구에서 개발된 정책분야 주제가이드는 실험적 데이터 구축을 통해 그 실효성을 검증하였다고 할 수 있다.

비음수 행렬 분해와 동적 분류 체계를 사용한 자동 이메일 다원 분류 (Automatic Email Multi-category Classification Using Dynamic Category Hierarchy and Non-negative Matrix Factorization)

  • 박선;안동언
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권5호
    • /
    • pp.378-385
    • /
    • 2010
  • 이메일 사용의 증가로 수신 메일을 효율적이면서 정확하게 분류할 필요성이 점차 늘고 있다. 현재의 이메일 분류는 SVM, 베이지안 분류자, 규칙 기반 분류자 등을 이용하여 스팸 메일을 필터링하기 위한 이원 분류가 주를 이루고 있다. 그러나 이러한 지도 학습 방법들은 적합한 이메일을 인식하기 위하여서 사용자가 규칙이나 색인어 목록을 작성해야 한다. 비지도 학습 방법으로 군집을 이용한 다원 분류 방법은 메일의 분류 주제를 설정해주어야 한다. 본 논문에서는 비음수 행렬 분해(NMF, Non-negative Matrix Factorization)를 기반으로 한 자동 분류 주제 생성 방법과, 동적 분류 체계(DCH, Dynamic Category Hierarchy) 방법을 이용한 분류 주제 내에 이메일을 재구성하는 방법을 결합한 새로운 이메일 다원 분류 방법을 제안한다. 이 방법은 수신되는 이메일을 자동으로 다원 분류하여 대량의 메일을 효율적으로 관리할 수 있으며, 사용자가 분류 결과를 만족하지 못하면 분류 주제 내의 이메일을 동적으로 재구성하여 분류의 정확률을 높인다.

심층 주제, 지역, 장르를 모두 분류할 수 있는 다면적 뉴스 기사 자동 분류 모델 연구 (Research on Multi-facted News Article Classification Models Classifying Subjects, Geographies and Genres)

  • 이효진;최성필
    • 한국문헌정보학회지
    • /
    • 제58권3호
    • /
    • pp.65-89
    • /
    • 2024
  • 본 연구는 한국어 사전학습 모델을 활용하여 뉴스 기사를 주제, 장르, 지역별로 각각 분류하는 모델을 구축하였다. 이를 위해 국내 언론사의 분류체계를 참고하여 새로운 뉴스 기사 분류체계를 설계하였다. 주제 및 장르 분류 모델은 대분류와 중분류 모델을 연결한 계층적 구조의 분류 모델로 구현하여 카테고리 통합 모델의 성능과 비교하였다. 평가 결과, 계층적 구조의 분류 모델은 모호하거나 중복된 카테고리에서 카테고리 통합 모델보다 더 명확한 분류를 수행할 수 있다는 이점이 있었다. 뉴스 기사의 지역적 분류를 위해서는 18개의 카테고리에 대하여 분류를 수행하는 모델을 구축하였으며 지역 관련 뉴스 기사의 경우, 지역적 특성이 본문에 명확히 드러나 높은 성능을 기록할 수 있었다. 본 연구는 주제, 장르, 지역의 다각적인 측면에서 뉴스 기사를 효과적으로 분류할 수 있음을 보여주었으며, 이를 통해 사용자 요구에 부합하는 다차원적 뉴스 기사 분류 서비스의 가능성을 제시한 점에서 의의가 있다.

주제 분류를 활용한 국립국어원 질의응답 게시판 유사 질문 검색 시스템 (Similar Question Search System for Q&A board of The National Institute of the Korean Language using Topic Classification)

  • 문정민;송영호;진지환;이현섭;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.201-205
    • /
    • 2014
  • 국립국어원의 온라인 가나다 서비스는 한국어에 대한 다양한 질문과 정확한 답변을 제공한다. 만일 새롭게 등록되는 질문에 대해 유사한 질문을 자동으로 찾을 수 있다면, 질문자는 빠른 시간에 답변을 얻을 수 있고 서비스 관리자는 수동 답변 작성의 부담을 덜 수 있다. 본 논문에서는 국립국어원 질의응답게시판의 특성을 분석하여 질문의 주제를 6가지로 분류하고, 주제 분류 정보와 벡터 유사도, 수열 유사도를 결합하여 유사한 질문을 검색하는 시스템을 제안한다. 평가에서는 본 논문에서 제시한 주제 분류 정보를 활용한 결과 1위 정답 검색 정확률이 향상되는 결과를 얻었다. 최종 실험에서는 MRR이 0.62, 정답이 1위, 5위내에 검색될 확률은 각각 54.2%, 78.2%를 보였다.

  • PDF

한국 주제명 표목의 패싯 유형 개발에 관한 연구 (A Study on Developing Facets for Subject Headings in Korea)

  • 최윤경;정연경
    • 한국문헌정보학회지
    • /
    • 제49권4호
    • /
    • pp.179-201
    • /
    • 2015
  • 주제명 표목은 키워드 검색 환경에서 정교한 주제 브라우징과 검색을 제공할 수 있는 도구이다. 본 연구의 목적은 기존 주제 접근 도구에서 적용된 다양한 패싯 유형을 분석하여, 우리나라 주제명 표목에 적용 가능한 패싯을 제안하는 것이다. 먼저, 문헌 연구에서는 지금까지 혼재된 주제와 패싯에 대한 개념을 종합적으로 고찰하고 정의하였다. 다음으로 사례 연구에서는 OCLC FAST와 PRECIS 제2판과 시소러스의 구축 지침인 "Thesaurus construction and use", 콜론 분류법 제7판, 블리스 서지 분류법 제2판, 국제십진분류법 제3판의 패싯 유형을 분석하였다. 분석 결과를 바탕으로 우리나라 주제명 표목에 적용 가능한 22개 패싯을 제안하였다. 상위 패싯으로 토픽, 사건, 장소, 시대, 개인명, 단체명, 표제명, 형식, 장르, 언어, 인물인 11개 패싯을 정의하고, 토픽 패싯은 하위에 토픽-사물/개체와 토픽-행동, 그리고 이 두 패싯의 하위로 부분, 종류, 전체, 속성, 물질, 수혜자, 산물, 부산물, 주체 패싯을 정의하였다.

확률 분포와 추론에 의한 이메일 분류 및 정리 방법 (Classification and Allocation method of e-mail using possibility distribution and prediction)

  • 고남현;김지윤;최만규
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2016년도 제54차 하계학술대회논문집 24권2호
    • /
    • pp.95-96
    • /
    • 2016
  • 본 논문에서는 디리클레 분포와 베이즈 추론 모델을 활용하여 전자우편을 분류하고 정리하는 방법을 제안한다. 과거 원치 않는 광고성 이메일인 스팸 탐지에서 시작한 전자우편 분류는 지속적인 송수신 량의 증가와 내용의 다양화로 인해 광고성과 정보성의 판단 기준이 모호해진 상태이다. 스팸 탐지와 같은 이분법적 분류 방식이 아닌 내용의 주제 별로 자동 분류할 수 있는 방법이 필요하다. 본 논문에서 다루는 제안 기법은 전자우편의 내용에서 다뤄질 수 있는 주제의 종류를 예측하기 위한 방법을 제공한다. 발신하거나 수신된 전자우편이 속한 주제를 자동으로 정할 수 있다. 본 제안 기법의 활용을 통해 전자우편의 분류만이 아닌 업무 및 시장 동향 분석과 정보보안 분야에서는 악성코드 분류에 사용될 수 있을 것으로 기대된다.

  • PDF

단서표현 기반의 인물관련 질의-응답문 문장 주제 분류 시스템 (A Topic Classification System Based on Clue Expressions for Person-Related Questions and Passages)

  • 이경호;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권12호
    • /
    • pp.577-584
    • /
    • 2015
  • 일반적으로 질의응답 시스템은 입력된 질문에 대한 정답을 찾기 위해 질문과 관련된 문서 또는 단락 단위의 검색을 수행한다. 그렇지만 단어 기반의 검색만으로는 정답을 포함하는 단락을 찾기 어려운 경우가 있다. 본 논문에서는 이러한 문제를 각 문장이 가지고 있는 주제를 통해 해결할 수 있다고 판단하고 이를 위한 질의-응답문의 주제 분류 시스템에 대해 연구하였다. 이러한 시스템을 위해 필요한 인물과 관련한 주제 유형을 소개하고, 주제를 찾기 위한 단서표현을 정의하였다. 또한 단서표현기반으로 문장의 주제를 파악하는 시스템의 구성에 대해 소개하고, 이 시스템의 구성요소들에 대한 성능 평가를 수행하였다.