• 제목/요약/키워드: 유사도 질의

검색결과 1,856건 처리시간 0.03초

온톨로지를 통한 추론형 시멘틱 검색 시스템에 관한 연구 (Ontology Based Semantic Search System Using Inference)

  • 하상범;박영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.625-627
    • /
    • 2004
  • 시멘틱 웹의 등장으로 온톨로지를 통하여 에이전트가 이해할 수 있는 의미(semantic)를 갖는 문서를 생성하는 것이 가능해졌다. 이러한 시멘틱 웹의 영역은 비즈니스 업무 효율을 증가시키고 이를 통해 이윤을 극대화시키는 방법으로 시멘틱 검색을 통한 정보검색시스템으로 확대적용 될 수 있다. 데이터베이스를 활용하여 문서를 저장하고 데이터베이스의 질의문물 사용하거나 일반적인 키워드기반의 정보검색 기법을 사용하여 자료를 검색하는 기존의 시스템은 다양한 분야에서 많이 연구되어 왔다. 본 논문에서는 온톨로지를 기반으로 추론을 적용한 시멘틱 검색시스템에 대하여 문서검색에 초점을 맞추어 연구 결과를 제안한다. 본 논문에서 제안하는 방식은 기존의 데이터베이스 질의문으로 검색이 불가능하거나 정보관리 시스템에서 단순히 키워드 매칭으로 검색되지 않는 문서에 대해서 본 시스템이 온톨로지라 추론을 통하여 문서의 검색에 가능함을 보인다. 이러한 방식은 자연어처리 검색과 유사한 검색영역을 갖는다. 이는 문서의 검색에 있어 단순히 키워드의 유사도에 의존하지 않고 Description Logic을 바탕으로 구성된 온톨로지에 미리 정의 되어있는 의미를 바탕으로 생성된 메타데이타를 가지고 추론을 하기 때문에 가능하다 또한 기존의 정보관리 시스템에서 채용한 데이터베이스를 통한 질의응답 시스템을 적용하여 온톨로지 표현언어에 대해 질의 응답이 가능한 DQL 인터페이스와 연동을 통하여 본 시스템의 속도와 효율성을 극대화시킨다.

  • PDF

문장-질의 유사성을 이용한 웹 정보 검색의 성능 향상 (Performance Improvement of Web Information Retrieval Using Sentence-Query Similarity)

  • 박의규;나동열;장명길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.406-415
    • /
    • 2005
  • 인터넷의 발전으로 웹 상에 수많은 문서 및 정보가 존재하는 상황에서 사용자가 원하는 정보를 담은 웹 문서를 검색하여 주는 웹 정보 검색 기술은 매우 중요하게 되었다. 본 논문에서는 웹 정보 검색 시스템의 성능 향상에 효과적인 몇 가지 주요한 기술을 제안하였다. 기존 시스템들은 주로 문서와 질의의 유사도를 계산하여 이를 주요 정보로 이용하였다. 그러나 본 논문에서는 여기에서 한 걸음 더 나아가 문서 안의 각 문장들이 질의와 얼마나 유사한가를 계산하여 이를 이용하는 기법을 제안하였다. 이러한 문장-질의 유사도를 성숙된 자연어 처리 기술 없이 근사적으로 계산하는 방법을 소개하였다. 그리고 이계산 작업은 문서 수의 증가에 선형적인 계산량의 증가를 가져 옴을 보임으로써 실용적인 대용량 시스템에서도 사용할 수 있음을 보였다. 그 다음으로 제안된 주요한 기술은 출력 문서의 순위화에 계층적인 개념을 도입하는 것이다. 이 기법을 사용함으로써 상당한 성능 향상을 이룰 수 있음을 보였다. 그 외에도 웹 문서의 특징인 하이퍼 링크 정보와 타이틀 정보를 이용하여 어느 정도의 성능 개선을 가져올 수 있음을 보였다. 이러한 기술들의 타당성을 입증하기 위해 대용량 웹 정보검색 시스템을 개발하고 실험하였다.

복합적인 영상 특성을 이용한 영상 검색 시스템 구현 (Implementation of Image Retrieval System using Complex Image Features)

  • 송석진;남기곤
    • 한국정보통신학회논문지
    • /
    • 제6권8호
    • /
    • pp.1358-1364
    • /
    • 2002
  • 현재 방송 및 인터넷분야에서는 멀티미디어 정보가 급격히 증가하고 있다. 본 논문에서는 멀티미디어 정보 중에서 정지영상 검색을 위해 사용자가 질의(query)를 원하는 물체영역을 선택한 후 유사물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상으로부터 우선 컬러특성을 추출하기 위해 제안한 방법으로 색상을 HSV 변환한 후 히스토그램을 구해 데이터베이스영상과 히스토그램 인터섹션을 통해 유사치를 구한다 또한 질의영상을 그레이영상으로도 변환시켜 웨블릿 변환한 후 밴디드 오토코릴로그램과 GLCM을 통해 공간적 그레이분포와 질감특성을 추출하여 유사치를 구한다. 그리고 2개의 유사치를 더하여 최종 유사도를 결정하는데 이때 각 유사치에 가중치를 적용하였다. 질의영상으로부터 컬러영상 특성뿐만 아니라 그레이영상 특성도 파악하여 단점을 보완하였고 실험결과에서도 소환성(recall) 및 정확성(precision)이 향상됨을 볼 수 있었다. 또한 가중치를 적용함으로써 검색효율이 개선되었다.

가중치에 따른 질의확장의 검색효율성 (Retrieval Effectiveness of Query Expansion depending on Term Weights)

  • 최성환
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.259-264
    • /
    • 2002
  • 기존의 질의확장 혹은 적합성 피드백 연구에서 코사인 정규화를 사용하여 검색성능을 향상시킨 연구들이 많다. 본 논문에서 실험한 결과를 근거로 하였을 때 이는 낮은 검색성능을 보였던 것이 검색공간의 확장으로 성능이 크게 향상되었을 가능성이 있다. 실험결과 가중치 유사도 모델간의 커다란 차이는 보이지 않고 코사인정규화 가중치 알고리즘에서 상당한 성능향상이 있었다. 그러나 기존의 코사인정규화 가중치 알고리즘을 이용한 전역적 질의확장의 경우 성능 향상률은 높으나 원질의어를 이용하여 가장 좋은 성능을 보였던 가중치 알고리즘들의 검색성능과 비교하면 오히려 낮은 성능을 보였다.

  • PDF

주제 분류를 활용한 국립국어원 질의응답 게시판 유사 질문 검색 시스템 (Similar Question Search System for Q&A board of The National Institute of the Korean Language using Topic Classification)

  • 문정민;송영호;진지환;이현섭;이현아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.201-205
    • /
    • 2014
  • 국립국어원의 온라인 가나다 서비스는 한국어에 대한 다양한 질문과 정확한 답변을 제공한다. 만일 새롭게 등록되는 질문에 대해 유사한 질문을 자동으로 찾을 수 있다면, 질문자는 빠른 시간에 답변을 얻을 수 있고 서비스 관리자는 수동 답변 작성의 부담을 덜 수 있다. 본 논문에서는 국립국어원 질의응답게시판의 특성을 분석하여 질문의 주제를 6가지로 분류하고, 주제 분류 정보와 벡터 유사도, 수열 유사도를 결합하여 유사한 질문을 검색하는 시스템을 제안한다. 평가에서는 본 논문에서 제시한 주제 분류 정보를 활용한 결과 1위 정답 검색 정확률이 향상되는 결과를 얻었다. 최종 실험에서는 MRR이 0.62, 정답이 1위, 5위내에 검색될 확률은 각각 54.2%, 78.2%를 보였다.

  • PDF

질의문의 구문정보를 이용한 키워드 추출 (Keyword Extraction Using Syntactic Information of Question)

  • 양수정;서영훈
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 추계종합학술대회 논문집
    • /
    • pp.190-194
    • /
    • 2003
  • 자연언어 질의문에서 추출된 키워드들은 정답추출에 미치는 비중이 다른 경우가 많지만 키워드들에 대해 상대적인 가중치를 부여하기가 어렵다. 본 논문에서는 이러한 문제점을 해결하기 위하여 질의 문장의 구문 정보를 이용하여 중심키워드와 일반키워드들로 구분하였으며 이를 기반으로 키워드들 간의 가중치 부여 방법을 제안한다. 질의문 코퍼스로부터 질문 유형을 분석하여 구문을 추출하고 추출된 구문정보를 이용하여 질의문에서 키워드들을 추출한다. 이렇게 얻어진 키워드들을 이용하여 다량의 문서들 속에서 중심키워드와 일반키워드들 간의 불린 검색을 통해 질의문의 정답이 포함되었을 가능성이 큰 단락을 추출하고, 질의문과 추출된 단락간의 유사도 측정을 통해 단락을 순위화 한다. 본 논문에서 제안하는 시스템은 질의문의 정답이 포함된 단락추출에 대한 정확도를 향상시킬 것으로 기대된다.

  • PDF

SIFT를 이용한 문서 영상에서의 단어 검색 알고리즘 (Word Spotting Algorithms Using SIFT in Document Images)

  • 이득용;전효종;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.488-490
    • /
    • 2011
  • 본 논문에서는 문서 영상에서 글자 분할 및 인식이 필요 없는 단어 검색 알고리즘을 제안한다. 글자 분할을 하지 않고 검색하기 위해 영상 검색에 사용되는 SIFT특징을 이용하였다. 제안하는 알고리즘은 사용자가 입력한 질의어를 질의 영상으로 변환하고, 질의 영상에서 SIFT특징을 추출한다. 추출된 특징은 문서영상에서 추출한 특징과 매칭을 통해 매칭점 쌍을 생성한다. 생성된 매칭점 쌍들을 군집화 조건에 따라 군집화 한다. 군집화는 질의 영상과 지리적 분포가 유사하게 군집화 되도록 설계되었다. 생성된 군집은 군집에 포함된 특징점의 개수가 많을수록 질의 영상과 유사하다. 따라서 N개 이상의 원소를 가지는 군집을 결과로 출력한다. 실험한 결과 제안하는 알고리즘의 가능성을 확인할 수 있었다.

영역 기반 이미지 검색을 위한 영역 매칭 방법에 관한 연구 (A Study on Region matching method for Region-based Image Retrieval)

  • 추연웅;최기호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.155-158
    • /
    • 2002
  • 본 논문은 영역기반의 영상 검색을 위해 향상된 영역 매칭 알고리즘을 구현하고자 한다. 최근의 Mpeg-7표준은 객체 기반의 영상처리를 특징으로 하고 있으며, 객체 기반의 영상 처리방법들에서 가장 대표적인 방법인 영역기반 검색 방법은 영역 분할과 특징 추출, 그리고 영역매칭을 통한 유사도 측정에 따른 검색으로 나뉘어 진다. 본 논문에서는 영상을 분할한 후 분할된 영역들에 대한 특징을 추출 하고, 추출된 특징들을 다차원 특징 공간에서의 클러스터로 구성한다. 그리고 구성된 클러스터들을 인접한 중심을 가진 특징 그룹화 하여 특징 그룹 중심간의 거리차를 이용하여 질의 이미지와 검색 이미지의 유사도를 측정하는 영역 매칭 방법을 제안한다.

  • PDF

EHD와 Lookup Table를 이용한 내용기반 이미지 검색 기법 (Content-based Image Retrieval Technique Using EHD and Lookup Table)

  • 신수연;김택곤;김우생
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.367-370
    • /
    • 2003
  • 최근 급속하게 증가하는 멀티미디어 정보를 효율적으로 다루기 위하여 멀티미디어 데이터에 대한 표현을 표준화하는 MPEG-7 표준안이 제정되었다 본 논문에서는 표준안의 Visual Descriptor 중 Edge Histogram Descriptor(EHD)에 기반한 효과적인 내용기반 이미지 검색 시스템을 설계한다. EHD의 경우 질의 이미지와 데이터베이스의 이미지 간의 유사도 연산을 통해 검색을 하는데 모든 이미지에 대해 연산을 수행하는 것은 비효율적이다. 저장된 에지 히스토그램 정보를 ‘이미지 당 빈 값’에서 ‘빈 값 당 이미지’ 정보로 매핑하는 Lookup Table를 이용하여 유사도 연산을 수행할 이미지 범위를 한정함으로써 검색 효율을 높일 수 있는 검색 방법을 제안한다.

  • PDF

색상과 texture 특징을 이용한 내용 기반 영상 정보 검색 시스템 (Content-Based Image Retrival System Using Color and Texture Feature)

  • 정미영;이원호;정미영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.506-508
    • /
    • 1998
  • 본 논문에서는 경치 영상들에 대해 영상의 내용(색상, texture)에 기반하여 검색하는새로운 방법을 제안한다. 경치 영상들은 색상이 주 특징이며 결합되는 texture 특징들에 의해 영상 정보간의 유사성의 파악이 더 용이하다. 색상 특징은 HSV 색상 히스토그램에 의해 특징을 나타내며 영상의 전역적 색상 특징과 지역적 색상 특징으로 세분화되고 texture 특징은 2차원 Garbor filter에 의해 영상별 특징을 나타낸다. 시스템의 검색은 예제 영상에 의한 질의 방식으로 예제 영상을 주면 이와 유사한 영상들이 유사도가 높은 순위대로 출력하게 된다.

  • PDF