• 제목/요약/키워드: keyword retrieval

검색결과 236건 처리시간 0.03초

문자 별 특징 모델을 이용한 한글 문서 영상에서 키워드 검색 (Keyword Spotting on Hangul Document Images Using Character Feature Models)

  • 박상철;김수형;최덕재
    • 정보처리학회논문지B
    • /
    • 제12B권5호
    • /
    • pp.521-526
    • /
    • 2005
  • 본 논문에서는 저 품질의 한글 문서 영상에서 OCR 기반 검색 시스템의 대안으로 키워드 검출 시스템(Keyword Spotting)을 제안하고 OCR 기반 문서 검색 시스템과 비교한다. 제안 시스템은 문자 분할, 키워드 특징 추출 그리고 단어 매칭으로 구성된다. 문자 분할 단계에서는 인접한 두 문자간의 연결을 효과적으로 분리하면서 문자 넓이 값의 분산이 최소가 되도록 하는 문자 분할 방법을 제안한다. 키워드 특징은 서체별 문자 모델의 결합으로 구성한다. 단어 매칭 단계에서는 문자 매칭에 기반한 단어 대 단어 매칭 방법을 적용한다. 본 논문에서 제안한 키워드 검출 시스템의 성능을 평가하기 위해 한글 문서 영상을 대상으로 OCR 기반 문서 검색 시스템과 비교하였다. 그 결과 한글 글자 크기가 작고 문서의 상태가 좋지 않은 경우 제안한 키워드 검출 시스템에 의한 검색 성능이 OCR 기반 검색 시스템 보다 우수함을 입증하였다.

한국어 폐쇄자막을 이용한 지식기반 비디오 검색 시스템 (Knowledge-based Video Retrieval System Using Korean Closed-caption)

  • 조정원;정승도;최병욱
    • 전자공학회논문지CI
    • /
    • 제41권3호
    • /
    • pp.115-124
    • /
    • 2004
  • 저 수준의 특징정보를 사용하는 내용기반 검색만으로 지능형 정보검색을 위한 사용자의 개념적인 요구에 부합하는 검색결과를 제공하기 어렵다. 일반적으로 비디오 데이터에는 동영상 정보와 함께 음성, 음향 등의 오디오 정보와 폐쇄자막 등의 정보가 포함되어 있다. 지식기반 비디오 검색은 그러한 다양한 정보를 사용하여 자동색인을 수행하고 색인 데이터베이스를 구축한다. 이로써 사용자는 보다 개념적인 검색 요구에 부합하는 검색 결과를 얻을 수 있다. 본 논문에서는 비디오 내의 한국어 폐쇄자막을 이용한 지식기반 비디오 검색 시스템을 제안한다. 한국어 폐쇄자막은 형태소 분석 수준에서 자동색인되며, 색인 데이터베이스를 이용하여 키워드 질의를 통해 비디오를 검색할 수 있다. 실험에서 한국어 속기시스템으로 제작된 폐쇄자막이 포함된 뉴스비디오에 적용하여, 제안하는 방법이 사용자의 보다 의미 있는 개념적인 요구에 부합하는 검색 결과를 얻을 수 있음을 확인하였다.

비감독 학습 기법에 의한 키워드 추출 (Keyword Extraction Using Unsupervised Learning Method)

  • 신성윤;백정욱;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.165-166
    • /
    • 2010
  • 명사 추출이란 문서 내에 존재하는 모든 명사를 찾아내는 작업으로서, 한국어 정보검색에서는 문서를 대표하는 색인어 또는 키워드로서 명사를 사용한다. 본 논문에서는 기 구축된 사전을 이용하여 키워드를 추출하는 방법을 제시한다. 이 방법은 불필요한 연산을 줄여서 수행 시간을 단축시켰다. 그리고 대용량의 문서에서도 정확도에 크게 영향을 미치지 않으면서 명사를 추출할 수 있다. 본 논문에서는 명사의 출현 특성을 이용한 명사 추출 방법 및 비감독 학습 기법에 의한 키워드 추출 방법을 제시한다.

  • PDF

적합성 피드백을 통해 결정된 가중치를 갖는 시각적 특성에 기반을 둔 이미지 검색 모델 (A Image Retrieval Model Based on Weighted Visual Features Determined by Relevance Feedback)

  • 송지영;김우철;김승우;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.193-205
    • /
    • 2007
  • 디지털 이미지의 양이 증가함에 따라 원하는 이미지를 정확하고 빠르게 찾을 수 있는 방법의 필요성이 증가하고 있다. 이미지 검색 방법으로는 이미지의 색상이나 명암과 같은 시각적 특성을 검색 조건으로 이용하는 내용 기반 검색과 이미지를 설명하는 키워드를 검색 조건으로 이용하는 키워드 기반 검색이 있다. 하지만 이러한 방법만으로는 사용자가 원하는 이미지를 정확하게 찾기 힘들다는 문제점이 제기되어 왔다. 따라서 최근에는 검색 도중 사용자의 응답을 받아 사용자의 요구를 파악함으로써 향상된 검색 결과를 제공하는 적합성 피드백에 대한 연구가 많이 진행되고 있다. 하지만 적합성 피드백을 이용하는 방법들도 원하는 결과를 얻기 위해서는 여러 번의 피드백을 필요로 하고 질의 수행이 완료된 후에는 얻어진 피드백 정보를 재사용하지 못한다는 단점이 있다. 따라서 본 논문에서는 이미지에 키워드를 연결한 후 사용자의 피드백 정보를 반영하여 키워드의 신뢰도를 조절함으로써 키워드 기반 이미지 검색의 정확도를 높일 수 있는 모델을 제안한다. 제안된 모델에서는 사용자로부터 피드백을 받은 이미지뿐만 아니라 긍정적 피드백을 받은 이미지들이 공통적으로 가지는 시각적 특성과 유사한 시각적 특성을 가지는 다른 이미지들까지도 키워드의 신뢰도를 조정함으로써 좀 더 빠른 시간 내에 검색 결과의 정확도를 높이도록 한다. 제안한 방법의 정확성을 검증하기 위한 실험 결과에 따르면, 같은 횟수의 피드백을 받으면서도 재현율과 정확률은 빠른 증가를 보이는 것으로 나타났다.

온톨로지 기반 법률 검색시스템의 구축 및 평가에 관한 연구 (Developing and Evaluating an Ontology-based Legal Retrieval System)

  • 장인호
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.345-366
    • /
    • 2011
  • 법은 실생활에 직접 영향을 미치는 중요한 정보원이다. 법률 정보가 전자적으로 접근할 수 있게 되었음에도 불구하고, 현행 키워드 기반 검색시스템은 법률용어와 일상용어의 불일치, 생략형의 용어 사용, 법률용어의 다의성, 법률 정보의 대량 생산 그리고 질의-응답 형식의 검색 욕구 등의 문제를 잘 해결하지 못하고 있는 실정이다. 이러한 문제를 해결하기 위한 하나의 방식으로 온톨로지 기반 검색시스템이 제시되고 있다. 본 연구자는 법률 온톨로지와 그 온톨로지를 기반으로 하는 법률 검색시스템(실험시스템)을 구축하는 연구와, 실험시스템의 평가를 위하여 현존하는 키워드 기반 법률 검색시스템(비교시스템)과 비교 실험을 통해 검색 성능과 이용자 만족도를 평가하는 연구를 수행하였다.

법령 정보검색 시스템 구현에 관한 연구 (A Study on the Implementation of Law Information Retrieval System)

  • 민재홍;조평동;양진혁;박평구;정인정
    • 한국정보처리학회논문지
    • /
    • 제7권11S호
    • /
    • pp.3702-3713
    • /
    • 2000
  • 정보통신 표준은 기술기준과 권고표준으로 구성된다. 기술기준은 강제표준으로서 정부가 이의 준수를 의무화하는 표준을 말하며, 권고표준은 국가 또는 표준화 단체가 표준을 제정하여 이를 권고하는 것으로서 이에 대한 준수의 강제성은 없다. 기술기준은 공통된 판단과 평가근거가 되는 조건, 수준, 한계 등을 규정함으로써 엄격히 준수되어야 할 규칙으로 정의된다. 본 논문은 기술기준의 제·개정과 관련된 업무의 생산성을 높이고, 기술기준 정보의 대국민 서비스를 지원하기 위하여 법규의 제·개정과 관련된 정보의 데이터 베이스화를 통한 정보의 연속성 및 공용성을 확보하고, 법규 제정과 관련된 국내·외 웹사이트의 최신정보를 분류하여 제공할 수 있는 정보검색 및 관리 시스템의 구현에 관한 논문이다. 본 논문에서 구현된 정보검색 및 관리 시스템은 온라인 정보검색 시스템으로서 정보통신 기술기준에 관련된 법령정보를 조항별 키워드 검색, 계층적 검색, 법령별 키워드 검색 및 제·개정 연혁별 검색이라는 네 가지의 다양한 검색방법을 제공할 뿐만 아니라, 법률 제·개정과 관련한 사이버 공동작업 공간에서는 정보의 공용성을 확보하고 있다. 마지막으로, 본 논문에서 구현된 정보시스템의 가장 두드러진 특징은 인터넷상에서 실시간으로 법령 정보를 갱신할 수 있다는 것이다.

  • PDF

강의자원 검색시스템에 관한 연구 (A Study on Retrieval System of Course Materials)

  • 남영준;임영선
    • 한국비블리아학회지
    • /
    • 제21권4호
    • /
    • pp.205-215
    • /
    • 2010
  • 이 연구는 강의지원서비스에 대한 사례분석을 통해 강의지원서비스의 기본 구성요소를 추출하였고, 강의자원의 공유를 위한 OCW현황을 살펴보았다. 각 대학에서 개설되는 교과목과 관련한 강의자원들에 대한 의미기반 검색이 가능한 온톨로지 기반 검색시스템의 모형을 설계하고 구축하였다. 구축된 시스템의 평가를 위해 기존 키워드 시스템과의 검색결과를 비교 분석하였다. 이를 통해 온톨로지 기반시스템이 단순 키워드 검색에 비해 적합한 검색결과를 나타냈고, 대학간 자원 공유에도 더 효과적임을 제시하였다.

정보검색에서의 어의 중의성 해소를 위한 자동 키워드망의 이용 (Resolving the Ambigities in World Sense by using Automatic Keyword Network in Information Retrieval)

  • 김정세;장덕성
    • 한국정보처리학회논문지
    • /
    • 제7권12호
    • /
    • pp.3855-3865
    • /
    • 2000
  • 문서 검색 시스템에서 자동 색인은 필수적이다. 그러나 자동 색인만으로 최적합 문서들을 상위에 위치시키기 불가능하다. 뿐만 아니라 동음이의어를 갖는 부적합한 문서들이 상위에 위치되는 것을 막을 길이 없다. 본 논문에서는 이런 문제를 해소하고 검색 효과를 높이기 위해 2차 검색에 자동 키워드망을 이용하는 두 단계 검색시스템을 연구하였다. 1차 검색은 자동색인으로 만들어진 역색인 파일을 이용하며, 2차 검색은 단어 연관성을 기초로 만든 자동 키워드망을 이용한다. 2차 검색을 위한 문서 순위 재조정 식들을 여러 개 만들어 비교하였으며, 이 식들이 동음이의어 어의 중의성 해소에 얼마나 효과가 있는지 성능을 평가하였다.

  • PDF

클라우드 환경에서 전사적 정보 연계를 위한 개념 망 기반의 검색 프레임워크 (Retrieval Framework for Enterprise Information Integration based on Concept Net in Cloud Environment)

  • 정계동;문석재
    • 한국정보통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.453-460
    • /
    • 2013
  • 본 연구에서는 클라우드 환경에서 기하급수적으로 증가하는 전사적 정보 연계를 위한 시맨틱 기반 개념 망을 이용하여 전사적 데이터들의 효율적 연계와 활용이 가능하도록 프레임워크를 제안한다. 개념 망은 기존 온톨로지에 접근하는 방식은 유사하지만, 사용자가 보다 효율적으로 정보 연계 검색을 하고자 객체와 개념 사이의 연관성을 구축 한다. 본 논문에서는 개념 망을 3가지로 구분하여 제안 프레임워크에 적용한다. 본 연구의 개념 망은 마스터 정보 개념 망, 키워드 개념 망, 그리고 비즈니스 프로세스 개념 망을 기반으로 온톨로지 형태로 구축된다. 이 개념 망은 사용자 요구사항에 따라 데이터들 간의 연관성을 기준으로 하여 검색 및 활용을 가능하게 한다. 그리고 마스터 정보 개념과 키워드 개념이 결합되어 검색 키워드의 빈도 및 카테고리의 빈도 추적을 제공함으로써, 사용자의 검색의 편의성과 신속성을 향상시킬 수 있도록 하였다.

인터넷을 이용한 하이퍼텍스트 기반 서지정보검색 시스템에 관한 연구 (A Study on Hypertext-based Bibliographic Information Retrieval System Using Internet)

  • 박지연
    • 정보관리학회지
    • /
    • 제12권2호
    • /
    • pp.171-192
    • /
    • 1995
  • 본 연구는 하이퍼텍스트에 기반을 둔 서지정보검색 시스템을 구현하여 하이퍼텍스트 시스템이 구조화된 서지데이터의 브라우징 및 검색에 유용함을 보여주었고, 키워드검색기법을 적용하여 이용자의 방향상실문제를 보완하였다. 또한 WWW를 이용하여 시스템을 구현함으로써, 본 시스템의 장점 및 잠재력을 제시하였다.

  • PDF