• Title/Summary/Keyword: 유사도 질의

검색결과 1,856건 처리시간 0.028초

Mean Shift Clustering을 이용한 영상 검색결과 개선

  • 권경수;신윤희;김영래;김은이
    • 한국산업정보학회:학술대회논문집
    • /
    • 한국산업정보학회 2009년도 춘계학술대회 미래 IT융합기술 및 전략
    • /
    • pp.138-143
    • /
    • 2009
  • 본 논문에서는 감성 공간에서 mean shift clustering과 user feedback을 이용하여 영상 검색 결과를 개선하기 위한 시스템을 제안한다. 제안된 시스템은 사용자 인터페이스, 감성 공간 변환, 검색결과 순위 재지정(re-ranking)으로 구성된다. 사용자 인터페이스는 텍스트 형태의 질의 입력과 감성 어휘 선택에 따른 user feedback에 의해 개선된 검색결과를 보인다. 사용된 감성 어휘는 고바야시가 정의한 romantic, natural, casual, elegant, chic, classic, dandy, modern 등의 8개 어휘를 사용한다. 감성 공간 변환 단계에서는 입력된 질의에 따라 웹 영상 검색 엔진(Yahoo)에 의해 검색된 결과 영상들에 대해 컬러와 패턴정보의 특징을 추출하고, 이를 입력으로 하는 8개의 각 감성별 분류기에 의해 각 영상은 8차원 감성 공간으로의 특징 벡터로 변환된다. 이때 감성 공간으로 변환된 특징 벡터들은 mean shift clustering을 통해 군집화 되고, 그 결과로써 대표 클러스터를 찾게 된다. 검색결과 순위 재지정 단계에서는 user feedback 유무에 따라 대표 클러스터의 평균 벡터와 user feedback에 의해 생성된 사용자 감성 벡터에 의해 검색 결과를 개선할 수 있다. 이때 각 기준에 따라 유사도가 결정되고 검색결과 순위가 재지정 된다 제안된 시스템의 성능을 검증하기 위해 7개의 질의의 각 400장, 총 2,800장에 대한 Yahoo 검색 결과와 제안된 시스템을 개선된 검색 결과를 비교하였다.

  • PDF

인터넷에서 잠재적 의미 분석을 이용한 지능적 정보 검색 (Intelligne information retrieval using latent semantic analysis on the internet)

  • 임재현;김영찬
    • 한국통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1782-1789
    • /
    • 1997
  • 인터넷에서 분산 정보를 검색하는 대부분의 시스템들은 사용자가 요구하는 검색 용어의 의미를 반영하지 못해 관련된 정보를 정확히 찾지 못하고 있다. 본 논문에서는 정보 검색 성능을 향상시키는 방안으로 검색 용어의 의미를 반영할 수 있는 용어 분포에 기반한 자동화된 질의어 확장을 제안한다. 먼저, 사용자가 부여한 질의어와 전체 문서에서 용어의 중요도를 반영한 가중치(weight)를 계산하고, LSI의 SVD기법을 이용해 모든 문서에서 질의어와 유사하게 출현하는 용어의 분포를 측정하여, 이들 수치와 질의어 용어의 유사성을 측정하였다. 또한 자동적으로 추가할 용어를 줄이기 위한 방안을 연구하였으며 본 논문에서 제안한 방법을 사용해 검색 성능을 평가하였다.

  • PDF

고유영상 투영거리를 이용한 얼굴영상 검색 (Face Image Retrieval by Using Eigenface Projection Distance)

  • 임길택
    • 한국산업정보학회논문지
    • /
    • 제14권5호
    • /
    • pp.43-51
    • /
    • 2009
  • 본 논문에서는 PCA(principal component analysis)기반의 특징을 이용한 효율적인 얼굴검색 방법을 제안한다. coarse-to-fine 전략을 사용하여 저차원 고유얼굴 공간에서 검색 결과들을 1차 정렬한 후 상위 후보들을 확장된 차원의 고유얼굴 공간에서 재정렬하는 방식으로 검색 순위를 재조정한다. 질의 영상과 클래스간의 유사도의 측정을 위해 PD(projection distance), MQDF(modified quadratic distance function), MED(minimum Euclidean distance)를 사용한다. 실험 결과 $32{\times}32$ 크기의 질의 영상에 PD를 활용하여 점진적으로 검색 결과를 조정하는 제안하는 방법이 얼굴검색에 효율적임을 알 수 있었다.

영상검색을 위한 다중 영상특징 추출과 결합 방법에 관한 연구

  • 송석진
    • 방송과미디어
    • /
    • 제8권2호
    • /
    • pp.149-159
    • /
    • 2003
  • 현재 사회 전반에 걸쳐 급격히 증가하고 있는 멀티미디어 정보를 효율적으로 관리, 활용할 수 있는 방법이 다양하게 연구되고 있다. 본 연구에서는 내용기반 영상검색을 위한 다중 영상특징 추출방법과 특징결합 방법을 제시한다. 우선 전처리 및 캐니 에지 검출법으로 질의영상내 물체영역의 에지를 검출한다. 그 다음에 제안한 볼록 다각형 알고리즘을 통해 분할된 물체영상을 획득한다. 분할된 물체영상은 HSV 공간으로 변환되고 히스토그램 인터섹션 방법으로 유사도가 측정된다. 또한 분할된 물체영상은 웨블릿 변환 영상으로도 변환된다. 이러한 변환후 웨블릿 부밴드의 LL 영역에 제안하는 거리 밴드 평균 오토코릴로그램 알고리즘을 적용하여 오토코릴로그램 유사도를 측정한다. 그리고 GLCM을 이용한 엔트로피와 콘트라스트 유사도는 LH, HL 영역에서 측정된다. 전 과정을 통해 얻은 4개의 다중 영상특징은 수정된 보다 카운트 방법으로 결합되고 최종 유사도가 결정된다. 실험결과 제안한 다중 영상특징을 사용한 검색 방법이 단일 영상특징을 사용하는 검색 방법보다 소환성과 정확성의 성능에 있어 우수함을 보였다. 그리고 NMRR 측정에서도 개선된 성능을 보였다.

문자기반 유사상표 검색을 위한 가중치 부여 근사매칭 (Weighted Approximate Matching for Character-based Similar Trademark Retrieval)

  • 서창덕;김회율
    • 전자공학회논문지CI
    • /
    • 제37권1호
    • /
    • pp.43-54
    • /
    • 2000
  • 본 논문에서는 특허청에 등록된 상표들 중에서 90%를 차지하는 문자기반 상표를 대상으로 질의상표와 유사한 상표들을 보다 정확하게 검색하기 위한 방법을 제안한다. 제안한 방법은 상표 칭호에 대한 근사매칭으로 1차 유사도를 계산하며 동일 유사도 그룹에 대해 상표 외형에 대한 영상 처리로 2차 유사도를 계산하여 순위를 부여한다. 전체 시스템의 한 부분으로 기존 도형상표와 함께 구현하였으며, 성능평가시 기존 근사매칭보다 16.2%의 정확도 향상을 보였다.

  • PDF

교차언어 문서검색에서 다국어 온톨로지에 기반한 한영 질의어 변환 (Korean-to-English Query Translation based on Multilingual Ontology in Cross-Language Text Retrieval)

  • 천정훈;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.43-49
    • /
    • 1999
  • 본 논문에서는 교차언어 문서검색(CLTR: Cross-Language Text Retrieval)에서의 한-영 질의어 변환을 다룬다. 질의어 변환시 영어 대역어 획득과정에서는 다음 두 가지를 고려한다. 첫째, 한국어 질의어를 구성하는 단어가 한가지 개념을 기호화하지만 이에 대응되는 영어 대역어들이 하나 이상인 경우이다. 둘째, 질의어 구성 단어가 둘 이상의 개념들을 기호화하는 다의성을 지닌 경우이다. 전자의 경우는 영어 대역어들이 모두 동일한 개념, 또는 유사한 개념을 나타내므로 그대로 검색에 이용한다 해도 검색 성능을 크게 좌우하지 않지만, 후자의 경우는 모든 개념을 다 검색에 이용하게 되면 정확률(precision)이 크게 떨어지게 된다. 이에 본 연구에서는 개념 선택단계와 선택된 개념의 영어 대역어들에 가중치를 주는 가중치 부가단계로 나누어 질의어 변환을 수행한다. 본 논문의 질의어 변환에서 영어 대역어는 대역사전 대신 다국어 온톨로지인 KAIST 분류어휘표와 한영 음차복원 모듈을 통해 얻어진다.

  • PDF

퍼지 질의 처리를 위한 근접관계의 생성방법 (Generation Method of a Proximity Relation for Fuzzy Query Processing)

  • 김창석;김대수;이상조
    • 한국지능시스템학회논문지
    • /
    • 제4권1호
    • /
    • pp.13-23
    • /
    • 1994
  • 실용적인 퍼지 데이타베이스 시스템을 구축하는데 장애 요인중의 하나는 근접관계와 같은 의미 데이타를 습득하는 것이다. 근접관계란 어떤 도메인에서 데이타들간의 근사 혹은 유사한 정도를 정량적으로 표현한 것이다.퍼지 데이타베이스 시스템은 부정확한 질의를 처리할때 이런 근접관계를 이용한다. 지금까지 근접도를 측정하는 체계적인 방법은 별로 알려진 것이 없고 대부분은 근접관계는 미리 주어진다는 가정하에 퍼지 데이타베이스를 연구하여 왔다. 본 논문에서는 퍼지 질의 처리에 필요한 근접관계 생성 방법을 제안한다. 제안된 방법은 퍼지 잡합의 퍼지척도 측정 이론에 기반을 두었기 때문에 간단하고 체계적이며, 각 데이타에 특정값만 부여함으로써 해당 도메인내의 데이타들과의 근접도를 자동적으로 구할 수 있다. 특히 조정 변수를 이용하여 도메인내의 근접도 간격을 조절할 수 있어 실제 응용분야에 맞게 조절할 수가 있다.퍼지 질의 처리를 위한 근접도 생성방법이 별로 발표되어 있지 않은 현 상황에서 본 논문에서 제시한 방법은 실용적인 퍼지 데이타베이스를 구현할때에 필요한 근접관계 관리 모듈에 사용될 수 있다.

  • PDF

질의기반 사용자 프로파일을 이용하는 개인화 웹 검색 (Personalized Web Search using Query based User Profile)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제17권2호
    • /
    • pp.690-696
    • /
    • 2016
  • 사용자 입력 질의와 웹 문서에 포함된 단어들의 형태적 일치를 검사하여 관련 문서를 검색하는 검색엔진은 사용자의 개인별 관심 분야를 반영하는 검색 결과를 생성하기 어렵다. 본 논문에서는 개인별 관심사를 파악하여 질의 의도에 적합한 내용의 문서를 검색하는 개인화된 웹 검색 방법을 제안한다. 개인화 검색의 성능은 사용자의 개인적 관심사를 정확하게 표현하는 우수한 사용자 프로파일을 생성하는 전략에 좌우된다. 본 연구에서 개인 프로파일은 사용자가 최근 입력한 질의어들과 검색에서 클릭했던 문서들에 나타나는 주제어들이 출현 빈도를 반영한 가중치와 함께 등록된 데이터베이스이다. 특히 중의적 질의어의 정확한 의미를 결정하기 위해 워드넷을 기반으로 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 기존 웹 검색 시스템의 사용자 측에 질의확장 모듈과 순위재계산 모듈을 추가하는 확장모듈을 구축하여 비교 실험하였으며, 본 연구의 방법을 적용한 개인화 웹 검색의 결과는 특히 10위 이내 상위의 결과 문서들에 대해 92%의 정확률과 82%의 재현율을 보여 향상된 성능을 검증하였다.

관계형 데이터베이스에서의 시맨틱 기반 키워드 탐색 시스템 (Semantic-based Keyword Search System over Relational Database)

  • 양영휴
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.91-101
    • /
    • 2013
  • 키워드의 모호성은 효율적인 키워드 탐색에 있어서 일반적인 이슈가 되어왔는데, 이 모호성은 탐색결과의 신뢰성에 큰 영향을 줄 수 있으며, 기본적으로 질의에 사용된 용어 자체가 가지는 문맥상 의미의 모호함에 기인한다. 질의 자체의 모호함뿐만 아니라, 사용자들이 그 탐색 결과를 적절하게 해석하기 위해 결과에 나타나는 키워드간의 관계도 중요하므로 명확하게 명시 되어야 한다. 이 논문에서는 기존의 질의 용어와 스키마 용어/인스턴스간의 키워드 매핑기법을 적용하여 키워드 탐색의 모호성을 해결한다. 용어간의 매핑에서는 질의 키워드와 스키마 용어간의 구문적 유사성은 물론 시맨틱 유사성까지 고려하기 때문에 기존의 시스템에 비해 매핑과 정밀도가 50% 이상 상승하는 결과를 얻을 수 있다. 탐색결과에 나타나는 용어간의 불분명한 관계를 점 더 명확하게 나타내기 위하여 시맨틱 웹 기술을 적용하여 키워드간의 의미 있는 관계를 더 많이 지식베이스 내에서 찾을 수 있도록 하였다.

사용자 개인 프로파일을 이용한 개인화 검색 기법 (Personalized Search Technique using Users' Personal Profiles)

  • 윤성희
    • 한국전자통신학회논문지
    • /
    • 제14권3호
    • /
    • pp.587-594
    • /
    • 2019
  • 본 논문은 사용자의 검색 의도와 개별 관심을 반영한 순위화된 검색 결과 문서를 제공하는 개인화 검색 기법을 제안한다. 개인화 검색에서는 사용자의 개별 관심사와 선호도를 정확하게 판별하기 위한 사용자 프로파일을 생성하는 기술이 개인화 검색의 성능을 좌우한다. 개인 프로파일은 사용자의 최근 입력 질의어들과 검색과정에서 참조했던 문서들에 나타나는 주제어들의 가중치와 빈도가 기록된 데이터 집합이다. 사용자 프로파일은 웹 검색에 앞서 사용자의 입력 질의어를 개인화된 질의어들로 확장하기 위해 사용된다. 중의적 질의어의 정확한 의미를 결정하기 위해서 워드넷을 사용하여 프로파일에 등록된 단어들과 의미 유사도를 계산한다. 검색 시스템의 사용자 측에 질의확장 모듈과 순위 재계산 모듈을 확장모듈로 구축하여 진행한 실험에서 개인화 검색 기술을 적용한 실험 결과가 상위문서들에 대해서 정확률과 재현률이 크게 향상된 성능을 보이고 있다.