• 제목/요약/키워드: 문헌분류

검색결과 1,231건 처리시간 0.027초

학교도서관을 위한 KDC 분류체계에 관한 연구 - 초등학생관련 문헌의 어휘분석을 중심으로 - (A Study on the Classification System of KDC for School Libraries - Focused on Vocabulary Analysis of Elementary Materials -)

  • 김정현
    • 한국도서관정보학회지
    • /
    • 제35권4호
    • /
    • pp.171-191
    • /
    • 2004
  • 이 연구는 KDC 사회과학류(300)와 순수과학류(400)를 중심으로 분류표의 분류명사와 초등학생관련 자료의 실제적인 어휘분석을 바탕으로 초등학교 도서관을 위한 분류표의 수정 전개방안을 제시하고자 시도되었다. 이를 위해 국내$\cdot$외 학교도서관이나 어린이도서관에서 초등학생관련 자료의 분류를 위한 분류표 개발 사례 및 문제점에 대해 살펴보고, 초등학교도서관을 대상으로 실제로 소장된 문헌의 KDC 유별 현황을 분석하여 각 분류항목의 실제적인 문헌의 유별 분포도를 분석하였다. 그리고 KDC 사회과학류와 순수과학류에서 사용되고 있는 분류항목과 초등학교교과서나 초등학생용 학습백과사전 등의 초등학생관련 문헌에서 추출한 용어에 대해 초등학교 4, 5, 6학년 학생들을 대상으로 용어의 이해도를 분석하였으며 이를 바탕으로 분류표 수정전개의 원칙과 방법을 마련한 후, 유별로 학교도서관을 위한 KDC 분류항목의 수정전개 방안을 제시하였다.

  • PDF

목차, 책 소개를 이용한 단행본 문서 범주화에 관한 기초연구 (A preliminary Study on Text Categorization of Book using Table of Contents and Book Description)

  • 도현호;이용구
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.127-130
    • /
    • 2014
  • 이 연구에서는 도서관의 주요 장서에 해당하는 단행본 도서에 대한 자동 분류를 적용가능한지 알아보고자 하였다. 분류자질로 메타데이터인 서명, 목차, 책 소개를 사용하였으며, 다양한 자질 가중치를 적용하여 581건의 단행본 도서를 통해 kNN 분류기의 분류성능을 파악하였다. 실험 결과 이들 메타데이터를 모두 사용하였을 때 가장 좋은 분류성능을 가져왔으며, 실험문헌집단의 규모가 작은 한계가 있지만 로그 TF를 취한 가중치 방법이 좋은 성능을 가져왔다.

  • PDF

정보통신기술 분야 인터넷자원의 분류체계에 관한 연구 (A Study on the Classification Schemes of Internet Resources in the Fields of the Information & Telecommunications Technology)

  • 이창수
    • 한국도서관정보학회지
    • /
    • 제31권4호
    • /
    • pp.111-138
    • /
    • 2000
  • 이 연구는 인터넷자원의 분류를 위한 새로운 정보통신기술 분야 분류체계를 작성하는데 필요한 기초자료를 제공하고자, 첫째, 정보통신의 개념과 정보통신 기술의 구분을 관련 문헌을 조사하여 분석하고, 둘째, 정보통신기술 분야 인터넷 자원을 분류함에 있어서 기존의 문헌분류체계의 적용과 관련하여 십진분류표, 비십진분류표 민 특수분류표로 나누어 그 분류체계를 파악하며, 셋째, 디렉토리 검색엔진을 이용한 분류에 대해서 국내외의 관려 웹사이트를 조사·분석하였다. 아울러 분석결과를 토대로 정보통신기술 분야의 새로운 분류체계의 구성 방안을 제시하였다.

  • PDF

토픽모델링과 딥 러닝을 활용한 생의학 문헌 자동 분류 기법 연구 (A Study of Research on Methods of Automated Biomedical Document Classification using Topic Modeling and Deep Learning)

  • 육지희;송민
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.63-88
    • /
    • 2018
  • 본 연구는 LDA 토픽 모델과 딥 러닝을 적용한 단어 임베딩 기반의 Doc2Vec 기법을 활용하여 자질을 선정하고 자질집합의 크기와 종류 및 분류 알고리즘에 따른 분류 성능의 차이를 평가하였다. 또한 자질집합의 적절한 크기를 확인하고 문헌의 위치에 따라 종류를 다르게 구성하여 분류에 이용할 때 높은 성능을 나타내는 자질집합이 무엇인지 확인하였다. 마지막으로 딥 러닝을 활용한 실험에서는 학습 횟수와 문맥 추론 정보의 유무에 따른 분류 성능을 비교하였다. 실험문헌집단은 PMC에서 제공하는 생의학 학술문헌을 수집하고 질병 범주 체계에 따라 구분하여 Disease-35083을 구축하였다. 연구를 통하여 가장 높은 성능을 나타낸 자질집합의 종류와 크기를 확인하고 학습 시간에 효율성을 나타냄으로써 자질로의 확장 가능성을 가지는 자질집합을 제시하였다. 또한 딥 러닝과 기존 방법 간의 차이점을 비교하고 분류 환경에 따라 적합한 방법을 제안하였다.

『사고전서총목제요』 문헌 출처의 분석 (An Analysis of the Literature Sources of Sikuquanshuzongmoktiyao)

  • 한미경
    • 한국문헌정보학회지
    • /
    • 제53권2호
    • /
    • pp.295-312
    • /
    • 2019
  • 이 논고는 "사고전서총목제요" 문헌 출처의 분류와 종류의 조사 및 분석을 목적으로 진행하였으며, 결과는 다음과 같다. 첫째, "사고전서총목제요" 문헌 출처의 분류를 크게 국가본, 지방본, 개인본과 관원본 및 사회유통본의 5종으로 분류하였다. 둘째, 내부본과 칙찬본 등은 국가본으로 분류하고 각 지방과 지역의 각성채진본을 지방본으로 분류하였다. 셋째, 가장본(家藏本)으로 명명하여 구별이 명확하지 않았던 개인본과 관원본은 전자는 성명(省名)과 장서가의 이름으로 조합된 경우, 후자는 관직명과 성명으로 조합한 경우로 분류하였다. 넷째, 사회유통본은 당시 사회에서 유통되던 통행본 외에 구입본을 포함하였다. 다섯째, "사고전서"에 채록된 문헌은 전국적 규모이며, 문헌수는 지방본, 국가본, 개인본, 관원본, 사회유통본의 순으로 많음을 밝혔다. 여섯째, 1) 관원본의 관직명, 2) 개인본 중의 상호명, 3) 방각본 대신 통행본 명칭을 취하고 있는 점을 통해 "사고전서총목제요" 문헌 출처 명명에 다소 명분을 중시하고 있음을 발견하였다.

기독교 분야 웹문서 분류체계 설계를 위한 비교 분석적 고찰 (A Comparative Study on the Design of Classification System for Christian Information Resources on the Internet)

  • 김명옥
    • 한국문헌정보학회지
    • /
    • 제41권3호
    • /
    • pp.127-144
    • /
    • 2007
  • 이 연구는 기독교 분야 인터넷 정보자원을 효율적으로 조직. 활용하기 위하여 기독교 분야 웹문서 분류체계의 모형을 제시하기 위한 것이다. 이를 위하여 (1) 문헌분류표인 KDC 4판, DDC 22판, LCC 2000년판의 기독교 분야의 강목을 비교 분석하고. (2) 국내 종합포털사이트 중 기독교 분야의 웹사이트 수가 많은 다음, 엠파스, 네이버의 기독교 분류항목을 비교 분석하며, (3) 기독교 종합포털사이트 중 가장 많이 이용되는 갓피플, 기독정보탐색 갓피아의 분류항목을 비교 분석하고, (4) KDC, DDC와 갓피플의 강목을 비교 분석한다. (5) 분석 결과를 토대로 웹문서를 위한 기독교 분야 분류체계(안)을 제시한다. 본 연구 결과, 1차구분은 10개 항목을 배정하고, 그 하위항목으로 2차 구분하여 세분한 2단계 계층구조를 설계하였다.

한은도서분류법에 관한 연구 (A Study on the Han-Un Decimal Classification)

  • 여지숙;오동근
    • 한국도서관정보학회지
    • /
    • 제37권1호
    • /
    • pp.329-352
    • /
    • 2006
  • 이 연구는 우리나라 근대문헌분류사의 중요한 분류표의 하나인 한은도서분류법의 편찬 및 개정 경위를 살펴보고 편찬당시 참조한 각종 분류표와 이를 비교하고 분류표 자체를 구체적으로 분석하였다. 한은도서분류법은 한국은행정보자료실에서 사용할 목적으로 초판을 간행하였고, 이후 한차례 수정판을 간행하였다. 그리고 편찬 당시 주요 주류와 조기표에서 NDC를 참조한 것으로 나타났으며, 종교와 어학, 문학에서는 KDCP를 참조한 것으로 나타났다.

  • PDF

용어의 문맥활용을 통한 문헌 자동 분류의 성능 향상에 관한 연구 (A Study on Improving the Performance of Document Classification Using the Context of Terms)

  • 송성전;정영미
    • 정보관리학회지
    • /
    • 제29권2호
    • /
    • pp.205-224
    • /
    • 2012
  • 자동 분류에서 문헌을 표현하는 일반적인 방식인 BOW는 용어를 독립적으로 처리하기 때문에 주변 문맥을 반영하지 못한다는 한계가 있다. 이에 본 연구는 각 용어마다 주제범주별 문맥적 특징을 파악해 프로파일로 정의하고, 이 프로파일과 실제 문헌에서의 문맥을 비교하는 과정을 통해 동일한 형태의 용어라도 그 의미나 주제적 배경에 따라 구분하고자 하였다. 이를 통해 주제가 서로 다름에도 불구하고 특정 용어의 출현만으로 잘못된 분류 판정을 하는 문제를 극복하고자 하였다. 본 연구에서는 이러한 문맥적 요소를 용어 가중치, 분류기 결합, 자질선정의 3가지 항목에 적용해 보고 그 분류 성능을 측정했다. 그 결과, 세 경우 모두 베이스라인보다 분류 성능이 향상되었고 가장 큰 성능 향상을 보인 것은 분류기 결합이었다. 또한 제안한 방법은 학습문헌 수가 많고 적음에 따라 발생하는 성능의 편향을 완화하는데도 효과적인 것으로 나타났다.

텍스트 분류를 위한 자질 순위화 기법에 관한 연구 (An Experimental Study on Feature Ranking Schemes for Text Classification)

  • 김판준
    • 정보관리학회지
    • /
    • 제40권1호
    • /
    • pp.1-21
    • /
    • 2023
  • 본 연구는 텍스트 분류를 위한 효율적인 자질선정 방법으로 자질 순위화 기법의 성능을 구체적으로 검토하였다. 지금까지 자질 순위화 기법은 주로 문헌빈도에 기초한 경우가 대부분이며, 상대적으로 용어빈도를 사용한 경우는 많지 않았다. 따라서 텍스트 분류를 위한 자질선정 방법으로 용어빈도와 문헌빈도를 개별적으로 적용한 단일 순위화 기법들의 성능을 살펴본 다음, 양자를 함께 사용하는 조합 순위화 기법의 성능을 검토하였다. 구체적으로 두 개의 실험 문헌집단(Reuters-21578, 20NG)과 5개 분류기(SVM, NB, ROC, TRA, RNN)를 사용하는 환경에서 분류 실험을 진행하였고, 결과의 신뢰성 확보를 위해 5-fold cross validation과 t-test를 적용하였다. 결과적으로, 단일 순위화 기법으로는 문헌빈도 기반의 단일 순위화 기법(chi)이 전반적으로 좋은 성능을 보였다. 또한, 최고 성능의 단일 순위화 기법과 조합 순위화 기법 간에는 유의한 성능 차이가 없는 것으로 나타났다. 따라서 충분한 학습문헌을 확보할 수 있는 환경에서는 텍스트 분류의 자질선정 방법으로 문헌빈도 기반의 단일 순위화 기법(chi)을 사용하는 것이 보다 효율적이라 할 수 있다.

통계학의 학문적 특성에 따른 KDC 문헌분류의 개선방안 (Suggestions for KDC Improvement According to Academic Characteristics of Statistics)

  • 박재혁;김비연
    • 한국도서관정보학회지
    • /
    • 제44권2호
    • /
    • pp.399-422
    • /
    • 2013
  • 이 연구는 KDC에서의 통계학 주제가 사회과학 통계학과 자연과학 수리통계학에 교착분류되는 문제점을 개선하고 세부영역의 체계적 전개방안을 제시하는데 있다. 이를 위해 통계학의 학문적 특성, 국내 대학 통계학과의 현황 및 학과명의 변천과정, 교과과정을 분석하였으며, DDC, LCC, NDC의 문헌분류법과 한국연구재단의 연구분야분류표를 비교 분석하였다. 그 결과 관련학과와 연구분야분류표의 학문적 배경에 따라 사회과학의 통계학을 자연과학 아래로 이치 및 통합하였다. 기존의 사회통계학 주제는 사회과학 연구방법을 보완하여 통계적 연구방법으로 세분하여 전개하였다. 또한, 자연과학의 '확률, 수리통계학'의 표목을 '통계학'으로 수정하고 세부영역의 주제를 체계화하여 확대 전개하였다.