• 제목/요약/키워드: 문헌분류

검색결과 1,226건 처리시간 0.027초

용어 가중치부여 기법을 이용한 로치오 분류기의 성능 향상에 관한 연구 (A Study on the Performance Improvement of Rocchio Classifier with Term Weighting Methods)

  • 김판준
    • 정보관리학회지
    • /
    • 제25권1호
    • /
    • pp.211-233
    • /
    • 2008
  • 로치오 알고리즘에 기반한 자동분류의 성능 향상을 위하여 두 개의 실험집단(LISA, Reuters-21578)을 대상으로 여러 가중치부여 기법들을 검토하였다. 먼저, 가중치 산출에 사용되는 요소를 크게 문헌요소(document factor), 문헌집합 요소(document set factor), 범주 요소(category factor)의 세 가지로 구분하여 각 요소별 단일 가중치부석 기법의 분류 성능을 살펴보았고, 다음으로 이들 가중치 요소들 간의 조합 가중치부여 기법에 따른 성능을 알아보았다. 그 결과, 각 요소별로는 범주 요소가 가장 좋은 성능을 보였고, 그 다음이 문헌집합 요소, 그리고 문헌 요소가 가장 낮은 성능을 나타냈다. 가중치 요소 간의 조합에서는 일반적으로 사용되는 문헌 요소와 문헌집합 요소의 조합 가중치(tfidf or ltfidf)와 함께 문헌 요소를 포함하는 조합(tf*cat or ltf*cat) 보다는, 오히려 문헌 요소를 배제하고 문헌 집합 요소를 범주 요소와 결합한 조합 가중치 기법(idf*cat)이 가장 좋은 성능을 보였다. 그러나 실험집단 측면에서 단일 가중치와 조합 가중치를 서로 비교한 결과에 따르면, LISA에서 범주 요소만을 사용한 단일 가중치(cat only)가 가장 좋은 성능을 보인 반면, Reuters-21578에서는 문헌집합 요소와 범주 요소간의 조합 가중치(idf*cat)의 성능이 가장 우수한 것으로 나타났다. 따라서 가중치부여 기법에 대한 실제 적용에서는, 분류 대상이 되는 문헌집단 내 범주들의 특성을 신중하게 고려할 필요가 있다.

미국 문헌정보학 교과과정 주제에 대한 분석 연구 (An Analysis on Curriculum of Library and Information Science in U.S.)

  • 최상희;하유진
    • 정보관리학회지
    • /
    • 제36권1호
    • /
    • pp.53-71
    • /
    • 2019
  • 최근 대학에서는 다양하게 변화하고 있는 실무현장과 학술연구분야를 반영하여 교과과정을 개편하자는 요구가 다양하게 나타나고 있다. 이에 이 연구에서는 교육과정 개편에 필요한 해외 문헌정보학 교육과정의 동향을 파악하고자 세 가지 측면에서 미국 문헌정보학 교과과정에 개설되어 있는 교과목을 분석하였다. 교과목 분석에 적용된 기준은 국가직무능력표준(NCS)의 문헌정보관리 직무단위, 한국연구재단의 국가과학기술표준분류와 학술연구분야 분류표에 나타난 문헌정보학 주제 분류이다. 세 가지 측면으로 분석한 결과 공통되게 나타난 현상은 시스템 구축설계 및 정보기술분야의 교과목 수가 많은 것이며 도서관 및 정보센터 경영과 이용자서비스도 교과목이 많은 주제 분야인 것으로 조사되었다.

DDC21의 우선순위표에 관한 연구 (An Analysis of the Tables of Preference of DDC21)

  • 배영활;오동근
    • 한국문헌정보학회지
    • /
    • 제36권1호
    • /
    • pp.187-209
    • /
    • 2002
  • 이 연구는 분류기호를 통해 복합주제를 합성할 수 없는 경우의 합리적이고 일관성 있는 분류기호를 부여하기 위해 문헌분류표에 설정되어 있는 우선순위(preference order)의 개념과 활용 등 그 이론적 배경을 고찰하고, DDC를 중심으로 문헌분류표에서의 우선순위표 활용을 보조표와 본표의 각 유별로 구분하여 추출한 후, 이를 실제적으로 적용하면서 우선순위표를 분석하였다.

분석적 합성식 문헌분류법에 관한 연구 (A Study on the Analytico-Synthetic Classification)

  • 오동근
    • 한국문헌정보학회지
    • /
    • 제32권2호
    • /
    • pp.55-76
    • /
    • 1998
  • 이 논문의 전반부는 분석적 합성식 분류법의 일반적인 특성과 장단점을 열거식분류법과 대비하여 분석하고 있다. 후반부에서는 분석적 합성식 분류표의 일반적인 작성단계와 그에 따르는 문제점과 고려사항을 분석하고, 이를 결혼상담소용 분류표의 작성이라는 실예를 통하여, 패싯분석과 주류의 순서 및 열거순서, 배열구조상의 순서 등 각종 순서의 결정, 분류기호의 선택과 적용의 순서로 고찰하고 있다.

  • PDF

Shakespeare 관련자료 분류상의 문제점과 개선방안 (Suggesting an Analytico-Synthetic Classification System for Classifying Materials by and about Shakespeare or His Works)

  • 오동근;황일원
    • 한국도서관정보학회지
    • /
    • 제34권1호
    • /
    • pp.217-237
    • /
    • 2003
  • 이 연구에서는 Shakespeare에 관련된 문헌의 분류에 있어서의 실태와 문제점을 살펴보고, 해당주제의 확장전개를 위해 DDC, LCC, CC 등의 주요분류표와 관련분야의 전개표 등을 참고하여, 새로운 분석합성 식 분류시스템을 제안하였다. 새로운 전개방식은 기본적으로 Shakespeare라는 주제아래에서 4개의 패싯을 “일반적 특성(generalities) + 문학형식(form) + 개별작품(works) + 언어(language)”순으로 전개하도록 하고, 각 패싯에 대해 별도의 구체적인 배열구조(away)를 제시하였다.

  • PDF

녹색기술문헌 자동 범주화를 위한 문서 분류기 개발 (Document Classification of Green Technology Literature based on Support Vector Machines)

  • 주원균;박민우;최기석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1762-1763
    • /
    • 2012
  • 최근에 이슈화되고 있는 녹색기술문헌의 중요성에 부합하여 녹색기술 문헌을 자동으로 분류해주는 문서 분류시스템 개발하였다. 분류체계로는 14개의 관심 녹색기술 분류 체계를 선택하였고, 다양한 문서 분류 기법 중 SVM(Support Vector Machine)에 기초를 둔 방법을 이용하였다. 문서 벡터를 생성할 때 제목과 본문에 동일한 가중치를 적용하는 방법을 벗어나서 제목의 키워드에 좀 더 높은 가중치를 부여하는 방식을 적용하여 성능평가를 수행하였다.

한식 분야의 듀이십진분류법 수정 전개 방안에 관한 연구 (A Study on Developing Modifications to the Dewey Decimal Classification for Korean Foods)

  • 정연경;최윤경
    • 한국문헌정보학회지
    • /
    • 제45권1호
    • /
    • pp.29-49
    • /
    • 2011
  • 한식은 세계화의 충분한 잠재력과 가능성을 갖고 있으며 한식의 다양성과 특수성이 국가경쟁력을 제공하는 국가 홍보 전략의 하나가 될 수 있다. 이를 위해서 가장 먼저 바탕이 되어야하는 것이 한식과 관련해서 쏟아져 나오는 정보의 조직화이다. 따라서 본 연구는 한식에 관한 자료의 분류 현황 및 사례 분석을 바탕으로 한식이 문헌분류표에 반영된 정도와 앞으로 개선되어야할 사항을 파악하고 DDC의 수정 전개안의 제안을 통해 DDC 22판 개정의 근거와 국내 도서관의 DDC 수정 전개 활용을 제공하고자 하였다.

신학 용어 분류를 위한 패싯 설계에 관한 연구 (Establishing Facet for Classifying Theological Terms)

  • 유영준
    • 한국문헌정보학회지
    • /
    • 제42권3호
    • /
    • pp.259-279
    • /
    • 2008
  • 신학 분야의 시소러스를 구축하는 전 단계로서, 패싯을 이용하여 신학 용어를 분류하였다. 영어로 된 신학 사전에서 1.031개의 용어를 선정하였고, 이 중에서 실제로 분류한 용어의 수는 984개이다. 용어를 분류하기 위해서 전개한 패싯은 기본 패싯 7개와 하위 패싯 14개이었다. 분류한 용어들을 분석해 본 결과, 신학 분야의 특성에 맞게 물리적 형태를 갖는 구체적인 용어의 수보다 추상적인 용어의 수가 많았으며. 전체 용어 수의 70% 정도를 차지하였다. 문헌 분류를 위한 십진 분류 체계에 대한 연구가 한계에 이른 상황에서. 이러한 특정 주제 분야의 용어를 분류하고 시소러스를 구축하는 연구가 더 활발해져야 한다고 생각한다.

자동 분류 기법과 지적 구조 분석 기법을 융합한 처방적 분석 시스템 구현 방안 연구 (Prescriptive Analytics System Design Fusing Automatic Classification Method and Intellectual Structure Analysis Method)

  • 정도헌
    • 정보관리학회지
    • /
    • 제34권4호
    • /
    • pp.33-57
    • /
    • 2017
  • 본 연구는 새로운 분석법으로 떠오르는 처방적 분석 기법을 소개하고, 이를 분류 기반의 시스템에 효율적으로 적용하는 방안을 제시하는 것을 목적으로 한다. 처방적 분석 기법은 분석의 결과를 제시함과 동시에 최적화된 결과가 나오기까지의 과정 및 다른 선택지까지 제공한다. 새로운 개념의 분석 기법을 도입함으로써 문헌 분류를 기반으로 하는 응용 시스템을 더욱 쉽게 최적화하고 효율적으로 운영하는 방안을 제시하였다. 최적화의 과정을 시뮬레이션하기 위해, 대용량의 학술문헌을 수집하고 기준 분류 체계에 따라 자동 분류를 실시하였다. 처방적 분석 개념을 적용하는 과정에서 대용량의 문헌 분류를 위한 동적 자동 분류 기법과 학문 분야의 지적 구조 분석 기법을 동시에 활용하였다. 실험의 결과로 효과적으로 서비스 분류 체계를 수정하고 재적용할 수 있는 몇 가지 최적화 시나리오를 효율적으로 도출할 수 있음을 보여 주었다.

한국십진분류법 기록관리학 분야 분류체계 개선에 관한 연구 (A Study on the Improvement of the Classification System on Archives and Records Management Studies in KDC)

  • 박수현;이명규
    • 한국비블리아학회지
    • /
    • 제27권3호
    • /
    • pp.25-50
    • /
    • 2016
  • 기록관리학이 독자적인 학문영역으로 발전해가고 있다. 하지만 KDC를 비롯한 기존의 문헌분류표에서는 분류 항목 배열이 기록관리학의 특성을 제대로 반영하지 못하여 분류항목의 전개가 불합리한 부분이 있으며, 주제영역별 세목전개의 재배치가 필요하다. 따라서 이 연구에서는 기록관리학의 학문 특성에 따라 주제영역을 기록관리 일반, 기록관리 법 정책, 기록물의 수집 선별 평가, 기록물의 조직, 기록정보서비스, 기록물 관리 및 보존, 기록관 운영, 기록관리 기관 등 8개 영역으로 설정하고, 현대 주요 문헌분류표인 KDC, DDC, NDC, UDC, LCC의 분류체계를 분석한 후, "대한민국 국가서지"의 기록관리학 분야 유별 자료현황 및 주제어 분석 결과를 반영하여 KDC 기록관리학 분야의 분류체계 수정 전개 방안을 제시하였다. 기록관리학 관련 주제영역 8개 분야의 내용은 KDC 028로 통합할 수 있도록 변경하였다.