• 제목/요약/키워드: Automated Subject Indexing

검색결과 5건 처리시간 0.019초

A One-Size-Fits-All Indexing Method Does Not Exist: Automatic Selection Based on Meta-Learning

  • Jimeno-Yepes, Antonio;Mork, James G.;Demner-Fushman, Dina;Aronson, Alan R.
    • Journal of Computing Science and Engineering
    • /
    • 제6권2호
    • /
    • pp.151-160
    • /
    • 2012
  • We present a methodology that automatically selects indexing algorithms for each heading in Medical Subject Headings (MeSH), National Library of Medicine's vocabulary for indexing MEDLINE. While manually comparing indexing methods is manageable with a limited number of MeSH headings, a large number of them make automation of this selection desirable. Results show that this process can be automated, based on previously indexed MEDLINE citations. We find that AdaBoostM1 is better suited to index a group of MeSH hedings named Check Tags, and helps improve the micro F-measure from 0.5385 to 0.7157, and the macro F-measure from 0.4123 to 0.5387 (both p < 0.01).

비디오 콘텐츠를 위한 색인 온톨로지 저장소 (Index Ontology Repository for Video Contents)

  • 황우연;양정진
    • 한국멀티미디어학회논문지
    • /
    • 제12권10호
    • /
    • pp.1499-1507
    • /
    • 2009
  • 나날이 방대해지는 디지털 콘텐츠들의 홍수 속에서 원하는 정보를 찾아내는 데 필요한 정밀한 색인 기술의 필요성은 날로 증대되어 가고 있다. 이러한 요구 수용을 위해서는 지능형 개체가 정보의 검색 주체가 되어야 하며, 지능형 개체간의 상호 운용성이 뒷받침되어져야 한다. 본 논문에서는 Snoek, Worring들이 제안한 다중 형상 색인을 위한 통합 기반구조를 분석하고 콘텐츠 기반의 자동화된 색인 기법에서 색인정보의 신뢰성을 높이기 위한 방법을 살펴본다. 그리고 이를 통해 시맨틱 웹 기술의 온톨로지 개념을 적용하여 추상화된 색인 정보의 생성과 제어를 지원하고 사람과 기계간, 기계와 기계간의 의미적 상호 운용성이 보장되는 기반 모델을 제시하고자 한다. 온톨로지의 메모리 상주 모델 처리 방식은 방대한 색인 정보를 수용하기에 부적절하기 때문에 온톨로지 저장소의 사용을 필요로 하며, 논리적으로 표현된 지식의 일관성과 추론을 위해 추론엔진의 사용이 요구된다. 본 논문에서는 온톨로지 저장소의 기능 및 성능적인 요구사항을 모두 만족시키는 Minerva 온톨로지 저장소를 이용하여 비디오 콘텐츠를 표현한 설계 지식을 저장하고 회수하는 실험을 하였다. 또한 마지막으로는 다른 연구과제들과 연계한 효율적인 색인 가능성에 대해 고찰해 본다.

  • PDF

BERT 모형을 이용한 주제명 자동 분류 연구 (A Study on Automatic Classification of Subject Headings Using BERT Model)

  • 이용구
    • 한국문헌정보학회지
    • /
    • 제57권2호
    • /
    • pp.435-452
    • /
    • 2023
  • 이 연구는 딥러닝 기법의 전이학습 모형인 BERT를 이용하여 주제명의 자동 분류를 실험하고 그 성능을 평가하였으며, 더 나아가 주제명이 부여된 KDC 분류체계와 주제명의 범주 유형에 따른 성능을 분석하였다. 실험 데이터는 국가서지를 이용하여 주제명의 부여 횟수에 따라 6개의 데이터셋을 구축하고 분류 자질로 서명을 이용하였다. 그 결과, 분류 성능으로 3,506개의 주제명이 포함된 데이터셋(레코드 1,539,076건)에서 마이크로 F1과 매크로 F1 척도가 각각 0.6059와 0.5626 값을 보였다. 또한 KDC 분류체계에 따른 분류 성능은 총류, 자연과학, 기술과학, 그리고 언어 분야에서 좋은 성능을 보이며 종교와 예술 분야는 낮은 성능을 보였다. 주제명의 범주 유형에 따른 성능은 '식물', '법률명', '상품명'이 높은 성능을 보인 반면, '국보/보물' 유형의 주제명에서 낮은 성능을 보였다. 다수의 주제명을 포함하는 데이터셋으로 갈수록 분류기가 주제명을 제대로 부여하지 못하는 비율이 늘어나 최종 성능의 하락을 가져오기 때문에, 저빈도 주제명에 대한 분류 성능을 높이기 위한 개선방안이 필요하다.

GIS(Geographic Information System ) 을 이용한 응급의료 진료관리 시스템 개발 (Emergency Medical System based on GIS)

  • 이태식;구지희
    • Spatial Information Research
    • /
    • 제4권1호
    • /
    • pp.43-54
    • /
    • 1996
  • 응급의료체계의 있어서 가장 중요한 분야중의 하나는 응급환자를 병원단계까지 후송하는 응급 후송체계의 개선이라 할 수 있는데 이와 같은 응급후송체계의 개선을 위하여 GIS기법을 이용하여 시스템을 개발하였다. 본 연구에서 시범 지역으로 강남구과 송파구를 대상으로 PC ARC/INFO를 이용하여 스시템을 구축하였는데 시스템의 기본기능은 환자발생신고가 접수되면 환자의 위치 및 가장 가까운 응급출동기관의 위치, 후송예정 병원의 위치를 분석하여 지도상에 표시하고, 표시된 위치들의 최단경로를 찾을 수 있는 기능과 선정된 응급출동기관과 병원의 상세정보를 볼 수 있는 기능을 갖고 있다.

  • PDF

한국문헌정보학 교과과정 운영모형 및 표준교과목 개발에 관한 연구 (A Study of the Curriculum Operating Model and Standard Courses for Library & Information Science in Korea)

  • 노영희;안인자;최상기
    • 한국문헌정보학회지
    • /
    • 제46권2호
    • /
    • pp.55-82
    • /
    • 2012
  • 본 연구에서는 국내외 문헌정보학과의 교과과정 운영모형을 조사하여 국내 현실에 맞는 운영모형을 제안하고자 하며, 운영모형에 기반하여 한국문헌정보학 표준교과목도 제안하고자 한다. 이를 위해 국외 교과과정 분석결과, 국내 교과과정 분석결과, 국내 현장사서를 대상으로 한 설문조사 결과, 그리고 현장사서를 대상으로 한 관종별 직무분석결과를 종합적으로 분석하여 문헌정보학 필수교과목, 핵심교과목, 그리고 선택교과목을 선정하여 제시하였다. 최종 제안된 문헌정보학 필수과목은 6개 과목으로서, 문헌정보학개론, 정보조직학, 정보서비스론, 도서관경영론, 정보검색론, 사서실습이다. 핵심과목은 6개 과목으로서, 정보자료분류목록실습, 주제별정보원(참고정보원), 장서개발론, 디지털도서관론, 서지학개론, 기록관리학개론이다. 선택과목은 총 20개 과목으로서, 문헌정보학 영역 4개 과목(도서및도서관사, 지식정보사회와 도서관, 도서관과저작권, 문헌정보학연구방법론), 정보조직학 영역 2개 과목(메타데이터의 이해, 한국문헌자동화목록실습), 정보조사제공학 영역 3개 과목(정보활용교육론, 독서지도론, 정보이용자연구), 도서관 정보센터경영학 영역 4개 과목(도서관협력론, 관종별도서관운영론, 도서관마케팅, 비도서자료관리론), 정보학 영역 6개 과목(데이터베이스운영론, 색인초록론, 정보학개론, 정보시스템론, 도서관시스템자동화, 도서관정보네트워크), 기록관리학 영역 1개 과목(기록보존론)이다.