• 제목/요약/키워드: automatic indexing

검색결과 138건 처리시간 0.026초

웹 정보의 자동 의미연계를 통한 학술정보서비스의 확대 방안 연구 (A Exploratory Study on the Expansion of Academic Information Services Based on Automatic Semantic Linking Between Academic Web Resources and Information Services)

  • 정도헌;유소영;김환민;김혜선;김용광;한희준
    • 정보관리연구
    • /
    • 제40권1호
    • /
    • pp.133-156
    • /
    • 2009
  • 이 연구에서는 KISTI NDSL의 학술논문 정보를 웹 학술자원과 연계하는 실험적 연구를 수행함으로써 KISTI의 정보 유통 서비스의 확대 가능성을 살펴보고자 하였다. 이를 위해 웹 학술자원을 수집하여 STEAK 시스템을 이용한 자동 의미 연계를 생성하고 이를 학술논문 검색결과와 결합하였다. 시스템의 검색 정확률을 평가한 결과 매크로 정확률은 62.6%, 마이크로 정확률은 66.9%를 보였으며, 자동연계 성능에 대한 전문가 평가는 76.7점을 보였다. 주제 범주별 전문가 평가는 본 연구를 통해 의미연계를 잘 수행하는 경우에 높게 측정되어 시스템적 성능과 동일한 경향을 보였다. 이 연구는 다양한 웹 학술자원의 서비스 연계를 위하여 논문정보로부터 생성한 언어자원을 의미색인에 사용한 것으로 이를 통해 지속적인 웹 자원의 학술적 활용에 대한 가능성을 제시하고자 하였다.

자연어를 이용한 자동정보검색시스템 구축에 관한 연구 (A Study of Designing the Automatic Information Retrieval System based on Natural Language)

  • 서휘
    • 한국문헌정보학회지
    • /
    • 제35권4호
    • /
    • pp.141-160
    • /
    • 2001
  • 본 연구에서는 자연어를 이용하여 자동으로 정보검색을 수행하는 시스템을 구축하였다. 구현 시스템은 Delphi 4.0(PASCAL)으로 프로그래밍 하였으며, 자동색인, 클러스터링 기법, 자연어 계층관계의 구축과 표현, 자동정보탐색이 가능하도록 구성했다. 이 시스템을 이용하여 질의어의 표현, 생성, 확장, 탐색식의 구성, 피드백 탐색 등 정보탐색의 전과정을 자동으로 수행할 수 있었다.

  • PDF

국한문 혼용 텍스트 색인어 추출기법 연구 『시사총보』를 중심으로 (An Experimental Approach of Keyword Extraction in Korean-Chinese Text)

  • 정유경;반재유
    • 정보관리학회지
    • /
    • 제36권4호
    • /
    • pp.7-19
    • /
    • 2019
  • 본 연구는 국한문 혼용 텍스트를 대상으로 한글 형태소 분석 기법과 한문 어조사를 반영한 색인어 추출기법을 제안하였다. 국한문 혼용체로 작성된 『시사총보』 논설을 대상으로 해당 시기에 사용된 고유명사 및 한자어 사전을 보완하였으며 한자어 불용어 리스트를 고려하여 색인어를 추출하였다. 본 연구에서 제안한 국한문 색인 시스템은 수작업 색인 결과를 기준으로, 중국어형태소 분석기에 비해 재현율과 정확률 측면에서 상대적으로 높은 성능을 보였으며, 어문법이 확립되지 않은 근현대 시기의 국한문 혼용체를 대상으로 한 첫 번째 색인어 추출기법을 제안하였다는 데에서 연구의 차별점이 있다.

MPEG 압축된 비디오의 자동 분할 기법 (Automatic Parsing of MPEG-Compressed Video)

  • 김가현;문영식
    • 한국정보처리학회논문지
    • /
    • 제6권4호
    • /
    • pp.868-876
    • /
    • 1999
  • 본 논문에서는 MPEG으로 압축된 비디오(MPEG-compressed video)를 대상으로 내용기반 색인(content-based indexing)에 기초가 될 동영상 자도 d분할에 관한 효과적인 방법을 제안한다. 제안하는 방법은 MPEG 시퀀스의Ⅰ(Intra), P(Predictive), B(bidirectional) 픽쳐 구성에 구애받지 않고 장면 전환점(scene change)을 검출해 낸다. 컷(cut) 검출을 위해서는 Ⅰ픽쳐의 dc 계수와 P, B 픽쳐의 매크로 블록 참조 특성을 이용하여 차이 측도(difference measure)를 설정한다. 그리고 점진적인 (gradual)장면 전환에서는 p, B 픽쳐의 참조 블록 비율을 이용하여 정확하게 장면 전환 지점을 검출한다. 이때 MPEG 시퀀스를 완전히 복원하지 않고 필요한 데이터만을 추출해 내어 전체 데이터 처리 과정을 좀 더 효율적으로 구성한다. 차이 척도의 성능과 검출 결과는 정확도(precision)와 완전추출도(recall)를 기준으로 비교분석하고, 제안한 방법을 다양한 MPEG 시퀀스에 적용시켜 검출 결과와 수행 시간 측면에서 그 효율성을 확인하였다.

  • PDF

자동 색인을 위한 한국어 형태소 분석기의 실제적인 구현 및 적용 (Practical Development and Application of a Korean Morphological Analyzer for Automatic Indexing)

  • 최성필;서정현;채영숙
    • 정보처리학회논문지B
    • /
    • 제9B권5호
    • /
    • pp.689-700
    • /
    • 2002
  • 본 논문에서는 정보검색 시스템에서 필수적인 자동 색인을 위한 한글 형태소 분석기를 구현하였다. 현존하는 대용량의 데이터에 대한 자동 색인을 효율적으로 수행하기 위해서 새로운 개념이나 아이디어의 도입 및 적용에 초점을 맞추기보다는 기존에 연구되었던 다양한 어절 분석 기법들을 바탕으로 어절분석 속도의 최대화, 형태소 분석기의 모듈화 및 구조화에 초점을 맞추었다. 따라서 본 논문에서 개발된 시스템의 특징은 이론적인 측면보다는 소프트웨어 공학적인 측면이 훨씬 더 강조된다 품사 사전의 구조화가 우선적으로 수행되었으며, 이에 따라서 체언 및 용언 분석 모듈, 수사 분석 모듈 둥이 구현되었다. 또한 형태소의 패턴을 이용한 미등록어 분석 기능이 개발되었다. 개발된 전체 시스템은 정보 검색 엔진인 K-2000 시스템의 색인 모듈로 장착되어서 적용되었다.

한국어 폐쇄자막을 이용한 지식기반 비디오 검색 시스템 (Knowledge-based Video Retrieval System Using Korean Closed-caption)

  • 조정원;정승도;최병욱
    • 전자공학회논문지CI
    • /
    • 제41권3호
    • /
    • pp.115-124
    • /
    • 2004
  • 저 수준의 특징정보를 사용하는 내용기반 검색만으로 지능형 정보검색을 위한 사용자의 개념적인 요구에 부합하는 검색결과를 제공하기 어렵다. 일반적으로 비디오 데이터에는 동영상 정보와 함께 음성, 음향 등의 오디오 정보와 폐쇄자막 등의 정보가 포함되어 있다. 지식기반 비디오 검색은 그러한 다양한 정보를 사용하여 자동색인을 수행하고 색인 데이터베이스를 구축한다. 이로써 사용자는 보다 개념적인 검색 요구에 부합하는 검색 결과를 얻을 수 있다. 본 논문에서는 비디오 내의 한국어 폐쇄자막을 이용한 지식기반 비디오 검색 시스템을 제안한다. 한국어 폐쇄자막은 형태소 분석 수준에서 자동색인되며, 색인 데이터베이스를 이용하여 키워드 질의를 통해 비디오를 검색할 수 있다. 실험에서 한국어 속기시스템으로 제작된 폐쇄자막이 포함된 뉴스비디오에 적용하여, 제안하는 방법이 사용자의 보다 의미 있는 개념적인 요구에 부합하는 검색 결과를 얻을 수 있음을 확인하였다.

XML 태그를 분류에 따른 가중치 결정 (An XML Tag Indexing Method Using on Lexical Similarity)

  • 정혜진;김용성
    • 정보처리학회논문지B
    • /
    • 제16B권1호
    • /
    • pp.71-78
    • /
    • 2009
  • 보다 효과적인 색인어 추출 및 색인어 가중치 결정을 위하여 문서의 내용뿐 아니라 구조를 이용하여 색인을 추출하는 연구가 이루어지고 있는데, 대부분의 연구들이 XML 태그의 중요도가 아닌, 문맥상의 단락에 대한 중요도를 계산하는게 일반적이다. 이러한 기존 연구들은 대부분이 객관적인 실험을 통해서 중요도를 입증하기보다는 상식적인 관점에서 단순한 수치로 중요도를 결정하고 있다. 본 논문에서는 웹 문서 관리를 위한 표준으로 자리잡아가고 있는 XML 문서의 태그 정보를 이용한 자동색인을 위하여, 논문을 구성하는 주요 태그를 중요도에 따라 분류하고, 낮은 태그에서 추출된 용어 가중치를 계산하고, 그 가중치로 높은 가중치의 태그에서 추출된 용어의 가중치를 갱신해 가면서 최종 가중치를 계산하는 방법을 제안한다. 보다 객관적인 가중치 결정을 위하여 사용자가 중요하게 생각하는 태그를 실험해 보고 그에 따라 중요도를 분류하여 가중치 계산에 반영한다. 그리고 기존 태그 중요도 결정 방법을 적용하여 계산된 색인어 가중치를 이용한 검색성능과 비교함으로써 본 논문에서 제안한 방법을 적용하여 계산된 색인어 가중치의 효과를 검증한다.

학문의 주제별 특성에 따른 자동 색인 기법의 비교 연구 - 약학분야와 도서관. 정보학 분야를 중심으로 - (A Comparative Study of Automaic Indexing Techniques in Pharmacology and Libray & Infomation Science)

  • 조수련;사공철
    • 정보관리학회지
    • /
    • 제5권2호
    • /
    • pp.99-126
    • /
    • 1988
  • 본 연구는 서로 다른 주제를 갖는 장서내의 통계적 용어 특성에 따라 적합한 자동 색인 기법을 제시하는데 그 목적이 있으며 약학분야와 도서과.정보학분야를 대상으로 하여 두개의 자동 색인 기법을 비교. 평가하였다. 사용된 자동 색인 기법은 역문헌 빈도 가중 기 법과 문헌 분리가 가중 기법이며 총 장서 빈도와 문헌 빈도로 정의되는 용어 특성과 자동 색인 기법으로 할당된 가중치들 간의 관계를 분석하였다.

  • PDF

압축 도메인 상에서 메크로 블록 타입과 DC 계수를 사용한 급격한 장면 변화 검출 알고리즘 (Abrupt Scene Change Detection Algorithm Using Macroblock Type and DC Coefficient in Compressed Domain)

  • 이흥렬;이웅희;이웅호;정동석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1527-1530
    • /
    • 2003
  • Video is an important and challenge media and requires sophisticated indexing schemes for efficient retrieval from visual databases. Scene change detection is the first step for automatic indexing of video data. Recently, several scene change detection algorithms in the pixel and compressed domains have been reported in the literature. However, using pixel methods are computationally complex and are not very robust in detecting scene change detection. In this paper, we propose robust abrupt scene change detection using macroblock type and DC coefficient. Experimental results show that the proposed algorithm is robust for detection of most abrupt scene changes in the compressed domain.

  • PDF

KWIC색인(索引)과 Descriptor색인(索引)의 검색(檢索) 효율성(效率性) (A Study on the Retrieval Effectiveness of KWIC Index versus Descriptor Index)

  • 최상기
    • 정보관리학회지
    • /
    • 제2권1호
    • /
    • pp.96-107
    • /
    • 1985
  • 본 연구는 자동색방법에 의해 작성된 KWIC색인과 수작업색인 방법에 의해 작성된 Descriptor색인의 검색효율성을 비교하는데 그 목적이 있다. 실험의 절차와 방법은 먼저 281건의 원자력분야의 연속간행물의 논문기사를 표본으로 하여 KWIC색인과 Descriptor색인방법에 의해 색인한 다음 컴퓨터에 각각의 서지 및 색인파일을 만들어 놓고 10건의 이용자 질문서를 근거로 검색을 수행하는 것으로 이루어졌다. 실험결과, KWIC색인과 Descriptor색인의 평균 재현율은 각각 54.89%와 64.42%로 나타났다.

  • PDF