• 제목/요약/키워드: 문헌분류

검색결과 1,226건 처리시간 0.026초

한국십진분류법과 듀이십진분류법에 나타난 주기의 다양성에 관한 비교 연구 (A Comparative Study of Notes in KDC and DDC)

  • 정연경
    • 한국비블리아학회지
    • /
    • 제19권2호
    • /
    • pp.129-146
    • /
    • 2008
  • 문헌분류표에서 주기는 분류기호의 생성과 합성에 있어서 필수적인 도구이다. 본 연구는 문헌분류표에서 사용되고 있는 다양한 주기의 유형을 살펴보고 한국십진분류법의 주기와 비교함으로써 보다 나은 주기를 개발하고 좀 더 적합한 분류 기호를 부여할 수 있도록 하였다. 이를 위해 듀이십진분류법에서 사용되고 있는 주기의 유형을 살펴보고 한국십진분류법에서 사용되고 있는 주기를 듀이십진분류법의 주기와 비교 분석하였다. 이를 바탕으로 한국십진분류법에 추가적으로 필요한 주기와 다양한 형식을 제시하였다.

바이오 문헌에서의 단백질, 유전자 객체 인식을 위한 특징 추출 (Feature Selection for Bio Named Entity Recognition from Biological Literature)

  • 김태욱;이미정;;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.166-168
    • /
    • 2012
  • 바이오 문헌으로부터의 의미 있는 객체 추출 및 상호작용 관계 추출은 수 많은 바이오 문헌으로부터 유용한 정보를 얻기 위한 필수적인 과정이다. 특히 문헌으로부터 유전자 또는 단백질 이름과 같은 바이오 객체를 정확하게 인지하는 것은 새로운 객체인식의 어려움과 객체를 찾기 위한 특징 패턴의 다양성으로 인해 도전적인 과제로 남아있다. 본 논문에서는 전처리 과정을 거친 문헌 데이터로부터 12개의 의미 있는 속성들을 선택하였다. 선택된 속성에 데이터마이닝 기법중 하나인 속성 추출 기법을 적용하여 객체를 분류하는데 있어 의미 있는 속성들을 추출하였다. 특징 추출 방법과 분류 알고리즘이 분류 성능에 미치는 영향을 평가하기 위해 각 방법의 정확도를 사용하여 분류 성능을 비교였으며, Gain Ratio Attribute Evaluation과 Symmetrical Uncertainty Attribute Evaluation 기법에 의해 추출된 속성이 가장 정확한 분류 성능을 보여주었다.

문헌범주화에서 학습문헌수 최적화에 관한 연구 (Optimization of Number of Training Documents in Text Categorization)

  • 심경
    • 정보관리학회지
    • /
    • 제23권4호
    • /
    • pp.277-294
    • /
    • 2006
  • 본 연구는 실재 시스템 환경에서 문헌 분류를 위해 범주화 기법을 적용할 경우, 범주화 성능이 어느 정도이며, 적정한 문헌범주화 성능의 달성을 위하여 분류기 학습에 필요한 범주당 가장 이상적인 학습문헌집합의 규모는 무엇인가를 파악하기 위하여 kNN 분류기를 사용하여 실험하였다. 실험문헌집단으로15만 여건의 실제 서비스되는 데이터베이스에서 2,556건 이상의 문헌을 가진 8개 범주를 선정하였다. 이들을 대상으로 범주당 학습문헌수 20개(Tr-20)에서 2,000개(Tr-2000)까지 단계별로 증가시키며 8개 학습문헌집합 규모를 갖도록 하위문헌집단을 구성한 후, 학습문헌집합 규모에 따른 하위문헌집단 간 범주화 성능을 비교하였다. 8개 하위문헌집단의 거시평균 성능은 $F_1$ 값 30%로 선행연구에서 발견된 kNN 분류기의 일반적인 성능에 미치지 못하는 낮은 성능을 보였다. 실험을 수행한 8개 대상문헌집단 중 학습문헌수가 100개인 Tr-100 문헌집단이 $F_1$값 31%로 비용대 효과면에서 분류기 학습에 필요한 최적정의 실험문헌집합수로 판단되었다. 또한, 실험문헌집단에 부여된 주제범주 정확도를 수작업 재분류를 통하여 확인한 후, 이들의 범주별 범주화 성능과 관련성을 기반으로 위 결론의 신빙성을 높였다.

국가지식정보 자원 분류 체계 표준화 연구 (A Study on the Developing Standard Classsification of the National Knowledge and Information Resources)

  • 고영만;서태설;조순영
    • 한국문헌정보학회지
    • /
    • 제40권3호
    • /
    • pp.151-173
    • /
    • 2006
  • 본 연구의 목적은 지식정보자원 데이터베이스를 구축하고 관리하고 서비스하는 국내의 모든 공공 기관과 민간 기관에서 공동으로 활용될 수 있으며 다양한 자료유형과 매체유형을 포괄할 수 있는 국가지식정보 분류표준(안)을 개발하는 것이다. 연구의 기초 작업으로서 문헌분류 체계와 지식정보자원 분류 체계의 차이, 지식정보자원의 분류사례 및 지식정보자원 분류에 대한문헌분류 체계의 적용 가능성을 분석하였다. 기초 분석에 이어 국가지식정보 표준분류 체계 개발에 필요한 지식의 분야별 분포, 분류의 계층과 유연성 확보 방안, 지식정보 자원의 자료유형과 매체유형, 국가지식정보의 포털서비스 방안 등이 분석되었다. 이러한 분석을 토대로 본 연구에서는 주제 분류표, 자료유형 분류표, 매체유형 분류표로 구성된 다원적 국가지식정보 분류 표준(안) 모형을 제시하였다.

기술용어 분산표현을 활용한 특허문헌 분류에 관한 연구 (A Study on Patent Literature Classification Using Distributed Representation of Technical Terms)

  • 최윤수;최성필
    • 한국문헌정보학회지
    • /
    • 제53권2호
    • /
    • pp.179-199
    • /
    • 2019
  • 본 연구의 목적은 특허 문헌 분류에 가장 적합한 방법론을 발견하기 위하여 다양한 자질 추출 방법과 기계학습 및 딥러닝 모델을 살펴보고 실험을 통해 최적의 성능을 제공하는 방법론을 분석하는데 있다. 자질 추출 방법으로는 전통적인 BoW 방법과 분산표현 방식인 워드 임베딩 벡터를 비교 실험하고, 문헌 집합 구축 방식으로는 형태소 분석과 멀티그램을 이용하는 방식을 비교 검토하였다. 또한 전통적인 기계학습 모델과 딥러닝 모델을 이용하여 분류 성능을 검증하였다. 실험 결과, 분산표현 방법과 형태소 분석을 이용한 자질추출 방법을 기반으로 딥러닝 모델을 적용하였을 경우에 분류 성능이 가장 우수한 것으로 판명되었으며 섹션, 클래스, 서브클래스 분류 실험에서 전통적인 기계학습 방법에 비해 각각 5.71%, 18.84%, 21.53% 우수한 분류 성능을 보여주었다.

지식분류에 대한 동서양의 비교 - 베이컨의 분류와 사고전서를 중심으로 - (A Comparative Study on the Bacon의s Knowledge Classification and SAGOJEONSEO Classification)

  • 이명규
    • 한국비블리아학회지
    • /
    • 제11권2호
    • /
    • pp.25-38
    • /
    • 2000
  • 지식 분류는 그 대상 목적 시대, 지역, 학자에 따라 각기 다른 지식 체계의 유형을 제시하고 있다. 그러나 지식분류의 내용을 살펴보면, 지식의 표현 방식이 다르고 지식표현의 배열이 우선 순위로 차이가 있을 뿐이지, 그 시대나 지역에서 내용의 류구분은 별다른 차이가 없음을 알 수 있다. 지식분류나 문헌분류는 그 시대의 사회적 구조를 반영하는 형태를 취하며 그 시대의 사회철학에 의하여 결정된다고 볼 수 있다. 과거의 지식 체계의 기본 골격은 고대에 형성된 후 계속해서 변화해 왔다. 이 변화의 과정에서 학문의 발전은 다른 학문 분야를 형성시켜 전체 학문 체계의 변천에 중요한 역할을 하였다. 앞으로도 이러한 발전은 계속해서 일어나 많은 새로운 분야의 지식이 나타날 것이며 지식분류의 한자리를 차지하게 될 것이다.

  • PDF

식물학문헌을 위한 자동분류시스템의 개발 (Developing an Automatic Classification System for Botanical Literatures)

  • 김정현;이경호
    • 한국도서관정보학회지
    • /
    • 제32권4호
    • /
    • pp.99-117
    • /
    • 2001
  • 본 연구는 분류자동화를 위해 이미 연구된 바 있는 농학 및 의학분야의 AutoBC 시스템에 대한 계속적인 연구의 일환으로 식물학분야의 문헌에 대해 분류자동화가 가능한지의 여부를 CC의 원리를 응용하여 실험 및 검증한 것이다. 분류자동화를 위한 데이터베이스는 원통형과 행렬식의 원리에 의해 설계되었으며, 문헌의 표제나 키워드를 입력하여 자동적인 주제인지 및 분류기호가 생성될 수 있는 윈도우용 자동분류시스템을 새로이 개발하여 실험하였다.

  • PDF

북한 문헌분류표 <분류-검색어사전>의 특징 분석 (A Study on the Features of the <Classification-Search Term Dictionary>, the Library Classification Scheme in North Korea)

  • 최재황
    • 한국도서관정보학회지
    • /
    • 제53권4호
    • /
    • pp.123-142
    • /
    • 2022
  • 북한은 2000년 2권 8책의 <분류-검색어사전>을 개발하여 발표하였고, 이 문헌분류표는 북한 전역에서 현재 사용되고 있다. 본 연구의 목적은 해방 이후 북한도서관의 문헌분류표 발전과정을 통시적으로 살펴보고 2000년에 발표되고 2014년에 개정된 <분류-검색어사전>의 내용, 구성, 원리를 파악해 보는 데 있다. 지금까지 북한의 문헌분류표에 대한 연구는 1964년 북한에서 발표된 <도서분류표>에 대한 논의가 전부이며, 이후 북한의 문헌분류표에 대한 연구는 없었다. <분류-검색어사전(2000)>의 제1권은 '분류기호-검색어', 제2권은 '검색어-분류기호'로 구성된다. 제1권은 1996년에 발표된 <도서 및 서지 분류표>에 기초하고 있으며 다섯 부문에 걸쳐 총 41개의 류문으로 전개된다. 혁명사상과 이론'에 1개(11/19) 류문, '자연과학'에 8개(20~27), '공학기술 및 응용과학'에 가장 많은 19개(30~60/69), '사회과학' 부문에 12개(70~85), 그리고 '총류'에 1개(90)의 류문을 배정하고 있다. 제2권은 주제명표목표와 유사하다. 북한의 <분류-검색어사전>은 국내에 처음 소개되는 문헌분류표이며, 본 연구는 향후 남북간 표준통일분류표 제정 연구를 위한 기초 연구에 활용될 수 있을 것이다.

북한의 군중도서관용 '도서분류표' 연구 (A Study on the Library Classification System of North Korean)

  • 남태우
    • 한국문헌정보학회지
    • /
    • 제34권1호
    • /
    • pp.71-92
    • /
    • 2000
  • 본 논문은 북한의 국립중앙도서관에서 편찬하여 1964년에 발행한 군중 도서관용 '도서 분류표'에 대한 연구이다. 이는 북한에서 표준분류표로 사용되고 있는 대표적인 문헌분류표로서 그 중요성이 인정된다. 그래서 이에 대한 내용적 분석연구이다. '도서 분류표'의 입수가 그 동안 불가능한 관계로 남한에서는 전혀 연구되어진 바가 없다. 이 '도서 분류표'의 연구는 처녀림에 해당된다. 군중도서관용 북한의 '도서 분류표'를 분석대상으로 하여 분류의 원칙, 학문의 분류 그리고 기호법의 원칙과 보조 기호법들을 중점적으로 연구하여 그 분류법의 특성을 규명하고자 하였으며, 또한 북한의 문헌분류표가 남한에 전혀 소개되지 못한 점을 감안하여 처음으로 소개하는 데에도 의의가 있다. 그리고 이 분류표에 나타난 주제를 기반으로 북한의 학문적 발전 분화과정도 규명하였다. 또한 이것은 차후 문헌분류법에 있어서도 남북의 통일을 대비한 시도이기도 하다.

  • PDF

자동문헌분류를 위한 대표색인어 추출에 관한 연구 (A Study on the Feature Selection for Automatic Document Categorization)

  • 황재영;이응봉
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.55-64
    • /
    • 2003
  • 인터넷 학술정보자원이 급증하고 있는 가운데 자동문헌분류에 대한 관심과 필요성도 늘어가고 있다. 자동문헌분류에 관한 실험은 전처리 단계인 대표색인어 추출과 추출된 대표색인어의 분류성능 평가 실험으로 구분 할 수 있는데, 본 연구에서는 우선 대표색인어 추출을 위해 다양한 대표색인어(자질) 추출 방법에 따른 색인어 성능평가 실험 및 최적의 대표색인어 개수 선정 실험을 수행하였다.

  • PDF