• 제목/요약/키워드: Search Query

검색결과 688건 처리시간 0.026초

모바일 인터넷 기반 이미지 검색을 위한 초기질의 자동생성 기법 (An Automatic Generation Method of the Initial Query Set for Image Search on the Mobile Internet)

  • 김덕환;조윤호
    • 지능정보연구
    • /
    • 제13권1호
    • /
    • pp.1-14
    • /
    • 2007
  • 휴대전화의 배경화면을 위한 캐릭터 이미지의 수요가 모바일 컨텐츠 시장에서 빠르게 성장함에도 불구하고 지능형 검색 도구의 부재로 인해 사용자들은 원하는 이미지를 검색하는 데 많은 어려움을 겪고 있다. 이 문제를 해결하기 위한 방법으로 이미지 검색을 위해 가장 널리 사용되는 내용기반 이미지 검색(Content-Based Image Retrieval; CBIR)이 사용될 수 있겠으나 PC-기반 시스템과는 달리 초기 질의 요구를 만족시킬 수 없는 모바일 응용 소프트웨어의 제약 사항의 극복이 필요하다. 본 연구에서는 적합성 피드백과정에서 얻어진 선호도 정보를 이용하는 협업필터링(Collaborative Filtering; CF) 기법을 사용하여 내용기반 이미지 검색의 초기 질의로 사용될 수 있는 후보이미지의 리스트를 자동 생성하는 IQS-AutoGen이라고 하는 새로운 방법을 제안한다. IQS-AutoGen은 CBIR로부터 피드백된 이미지들에 대한 적합성 정보를 이용하여 목표 사용자와 선호도가 유사한 이웃(neighbor)을 확인하고 이웃들이 선호하는 이미지들의 리스트를 제공하는 CF 프로세스를 통해 CBIR을 위한 초기 질의 집합(Initial Query Set : IQS)을 자동으로 생성한다. 따라서 모바일 사용자는 IQS에 있는 이미지들 중의 하나를 선택하여 CBIR 세션을 위한 질의 이미지로 사용할 수 있게 된다. PC-기반 프로토타입 시스템을 사용하여 실험한 결과로부터 제안한 방법이 모바일 인터넷 환경에서 CBIR의 초기질의 요구를 성공적으로 만족시킬 뿐만 아니라 현재의 검색 방법보다 우수한 성능을 보여주고 있음을 알 수 있다.

  • PDF

빅데이터 전처리 기반의 실시간 사용자 선호 데이터 추천을 위한 개선된 스카이라인 질의 기법 (An Improved Skyline Query Scheme for Recommending Real-Time User Preference Data Based on Big Data Preprocessing)

  • 김지현;김종완
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권5호
    • /
    • pp.189-196
    • /
    • 2022
  • 스카이라인 질의(Skyline Query)는 객체의 다중 속성을 기준으로 사용자 선호에 적합한 대상을 탐색하는 기법이다. 기존 스카이라인 질의는 탐색 결과를 일괄처리(batch processing)로 반환하지만, 대화형 앱이나 모바일 환경의 등장으로 실시간 탐색 결과의 필요성이 증가하였다. 스카이라인을 위한 온라인 알고리즘(online algorithm)은 객체의 반환 속도를 향상해 실시간으로 선호 객체를 제공한다. 하지만 객체 탐색 과정에서 기존에 탐색한 영역을 재방문하여 반복 비교하는 불필요한 연산 시간이 소요된다. 본 논문은 온라인 알고리즘에서 불필요한 탐색 시간을 제거하여 스카이라인 질의 결과를 실시간으로 제공하기 위한 스카이라인 온라인 전처리 알고리즘을 제안한다. 제안 기법은 기존의 온라인 알고리즘에서 전처리를 수행함으로써 반복적으로 재탐색 되는 영역을 미리 제거하여 탐색 성능을 향상하였다. 실험 결과, 기존 온라인 알고리즘과 비교 시 이산 데이터 집합의 표준 분포, 편향 분포, 양의 상관 및 음의 상관분포에서 향상된 성능을 보였다. 제안 기법은 비교 대상을 최소화하여 탐색 성능을 향상하므로 모바일 장치의 사용이 증가하는 현실에서 사용자들에게 신속한 서비스를 제공할 수 있는 새로운 기준이 될 것이다.

인용 지표를 이용한 재순위화 및 질의 확장의 성능 평가 - 인용색인 데이터베이스를 기반으로 - (Performance Evaluation of Re-ranking and Query Expansion for Citation Metrics: Based on Citation Index Databases)

  • 이혜경;이용구
    • 한국문헌정보학회지
    • /
    • 제57권3호
    • /
    • pp.249-277
    • /
    • 2023
  • 본 연구의 목적은 인용 지표가 인용 색인 데이터베이스의 검색성능 향상에 기여할 가능성을 파악하는 데에 있다. 이를 위하여 본 연구는 문헌정보학 분야 10개의 질의를 Web of Science에서 검색하여 수집한 3,467건의 문헌과 2000년부터 2021년까지 SSCI 문헌정보학 분야 저널 85종에 수록된 60,734건의 문헌을 기반으로 적합성 판단을 거쳐, 검색 결과의 상위 100순위에 대한 성능 및 검색 방식과 인용 지표를 활용한 재순위화, 그리고 벡터 공간모형 검색시스템 구축 등에 따른 질의 확장 실험을 수행하였다. 그 결과 첫째, 인용 지표를 단독으로 사용한 재순위화의 성능은 Web of Science의 검색성능과 상이하였으며, 인용 지표는 Web of Science 기존 시스템에 적용되지 않는 독립적인 지표로 작용하고 있었다. 둘째, 고유 질의어 수에 질의어의 총 출현 빈도를 조합하고 인용수를 보조적으로 사용했을 때, 성능에 긍정적인 영향을 미칠 것으로 확인하였다. 셋째, 질의 확장에서는 전반적으로 벡터 공간모형 기반 검색시스템의 기본 성능 대비 성능이 향상되었다. 넷째, 이용자 적합성을 통해 질의 확장을 적용한 경우가 시스템 적합성을 적용한 경우보다 성능이 향상 되었다. 다섯째, 피인용 수를 적합 문헌과 더불어 사용하면 최상위권 내 적합 문헌에서의 순위 변동 가능성을 보여주었다.

BRS/Search 시스템을 이용한 XML 문서 검색시스템 설계 및 구현 (Design and Implementation of a XML Document Retrieval System Using the BRS/Search System)

  • 손충범;이병엽;유재수
    • 인터넷정보학회논문지
    • /
    • 제2권2호
    • /
    • pp.51-63
    • /
    • 2001
  • 본 논문에서는 상용 검색 엔진인 BRS/Search 시스템을 이용하여 XML문서에 대한 구조 기반 검색이 가능하도록 XML문서 검색시스템을 설계하고 구현한다. 본 논문에서 구현한 시스템은 XML문서의 논리적인 구조를 Unix 파일시스템의 디렉토리 구조로 표현한다. 이렇게 표현된 XML 문서를 BRS/Search 시스템의 데이터베이스에 정보의 손실 없이 저장하기 위해 데이터베이스 스키마를 정의하고 내용 검색뿐만 아니라, 구조 검색, 혼합 검색, 애트리뷰트 검색이 가능하도록 BRS/search 시스템에 부가적으로 필요한 ETID 추출기, 구조정보 추출기, 저장 관리기, 질의 처리기를 설계하고 구현한다.

  • PDF

관련성 분포정보를 이용한 통합 검색 시스템의 설계 및 구현 (Design and Implementation of Meta Search using Relevance Distribution Information)

  • 김현주
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권11호
    • /
    • pp.1427-1438
    • /
    • 2001
  • 본 논문에서는 관련성 분포 정보를 이용한 새로운 컬렉션 융합 모델을 제시한다. 이는 먼저 주어진 질의에 대하여 검색에 참여한 정보원을 평가하고 질의에 가장 적합한 정보원을 선택한다. 그리고 정보원의 평가 결과에 따라 해당 정보원으로부터 검색 문서를 차별적으로 수집하고, 검색된 문서들은 정보원의 평가 값인 관련성 분포 정보를 기반으로 최종 검색 문서의 순위 매김을 수행한다. 이렇게 순위 매김 된 검색 문서는 단일 우선 순위를 가지는 검색 문서의 집합으로 통합하여 사용자에게 단일 검색 결과를 제공한다. 그리고 질의어에 대하여 가장 좋은 정보원들을 분류할 수 있는 체계를 개발하여 사용자의 질의어에 대하여 최선의 정보원들을 선택할 수 있는 알고리즘의 제시하였다. 마지막으로 선택된 정보원으로부터 질의에 적합한 문서를 검색한 후에 이들을 순위 매김하고 통합하는 통합검색 시스템을 제시한다.

  • PDF

Cost-Effective Replication Schemes for Query Load Balancing in DHT-Based Peer-to-Peer File Searches

  • Cao, Qi;Fujita, Satoshi
    • Journal of Information Processing Systems
    • /
    • 제10권4호
    • /
    • pp.628-645
    • /
    • 2014
  • In past few years, distributed hash table (DHT)-based P2P systems have been proven to be a promising way to manage decentralized index information and provide efficient lookup services. However, the skewness of users' preferences regarding keywords contained in a multi-keyword query causes a query load imbalance that combines both routing and response load. This imbalance means long file retrieval latency that negatively influences the overall system performance. Although index replication has a great potential for alleviating this problem, existing schemes did not explicitly address it or incurred high cost. To overcome this issue, we propose, in this paper, an integrated solution that consists of three replication schemes to alleviate query load imbalance while minimizing the cost. The first scheme is an active index replication that is used in order to decrease routing load in the system and to distribute response load of an index among peers that store replicas of the index. The second scheme is a proactive pointer replication that places location information of each index to a predetermined number of peers for reducing maintenance cost between the index and its replicas. The third scheme is a passive index replication that guarantees the maximum query load of peers. The result of simulations indicates that the proposed schemes can help alleviate the query load imbalance of peers. Moreover, it was found by comparison that our schemes are more cost-effective on placing replicas than PCache and EAD.

NDSL 검색 질의어와 기술용어간의 관계에 대한 분석적 연구 (A Relation Analysis between NDSL User Queries and Technical Terms)

  • 강남규;조민희;권오석
    • 정보관리연구
    • /
    • 제39권3호
    • /
    • pp.163-177
    • /
    • 2008
  • 본 논문에서는 NDSL을 검색하기 위해 이용자가 입력하는 검색 질의어를 대상으로 질의어에 사용되는 키워드와 학술지에서 추출한 기술용어와의 관계를 분석하고자 한다. 관계 분석을 위해 사용된 키워드는 17개월 동안의 NDSL 검색 질의어에서 추출한 약 83만3,000개, 기술용어는 NDSL, INSPEC, FSTA 3개 영문 학술지 데이터베이스 약 4,100만건에서 추출한 약 97만5,000개이다. 그리고 분석에 사용된 키워드와 기술용어는 2어절 이상의 영어 단어이며, 이들 간의 관계 분석은 키워드와 기술용어간의 일치성, 연관성, 기술용어에 대한 빈도 분석 등이다.

무순위 연속 k 최근접 객체 탐색을 위한 효율적인 분할점 추출기법 (A Efficient Method of Extracting Split Points for Continuous k Nearest Neighbor Search Without Order)

  • 김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.927-930
    • /
    • 2010
  • 최근 이동 중인 경로 상에 존재하는 모든 지점에 대해 k개의 최근접 객체를 탐색하는 연속 k 최근접 객체 탐색 질의가 위치기반 서비스와 지능형 교통 시스템의 응용 분야에 폭넓게 사용되고 있다. 이러한 질의는 위와 같은 응용에 빠른 응답을 요구하고, 공간 네트워크 데이터베이스에 적용가능 해야 한다. 이 논문에서는 공간네트워크 상에서 움직이는 질의 객체를 위한 최근접 객체를 효율적으로 탐색하는 새로운 기법을 제안하고자 한다. 제안하는 기법은 다수의 분할점과 그에 상응하는 k개의 최근접 객체 집합들을 결과로 추출하며, POI들 간에는 순서가 없다. 분석을 통해 제안한 기법에 기존기법에 비해 우수함을 보인다.

  • PDF

이동객체궤적에 대한 효율적인 최근접 이웃 검색 (Efficient Nearest Neighbor Search on Moving Object Trajectories)

  • 김규재;박영희;조우현
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 추계학술대회
    • /
    • pp.418-421
    • /
    • 2014
  • 스마트폰과 같은 이동 통신 매체의 발달과 LTE, NFC, RFID 등 무선통신의 발달로 실시간으로 이동 객체의 위치데이터를 수집하여 활용하는 위치 기반의 서비스들이 다방면의 개발에 이용되고 있다. 이에 따라 대용량의 이동객체 위치 데이터들을 효율적으로 저장하는 방법과 여러 질의를 좀 더 빠르게 처리할 수 있는 방법들에 대한 연구들이 진행 중이다. 본 논문에서는 Douglas-Peucker 알고리즘을 응용하여 대용량의 이동객체궤적 데이터를 단순화하여 색인 구조를 생성하고 이 색인 구조를 이용하여 최근접 이웃 검색 질의를 효율적으로 처리할 수 있는 알고리즘을 제안한다. 제안된 방법으로 대용량의 데이터가 더 적은 양의 데이터로 단순화 되고 얼마나 더 효율적으로 질의를 처리하는지 실험을 통하여 확인하였다.

  • PDF

PdR-트리 : 고차원 데이터의 검색 성능 향상을 위한 효율적인 인덱스 기법 (PdR-Tree : An Efficient Indexing Technique for the improvement of search performance in High-Dimensional Data)

  • 조범석;박영배
    • 정보처리학회논문지D
    • /
    • 제8D권2호
    • /
    • pp.145-153
    • /
    • 2001
  • 피라미드 기법은 n-차원 공간 데이터를 1차원 데이터로 변환하여 $B^+$-트리로 표현하고, n-차원 데이터 공간에서 하이퍼큐브 영역질의 처리로 발생하는 "차원의 저주현상"에 영향을 받지 않게 검색 시간 문제를 해결하고 있다. 구형 피라미드 기법은 피라미드 기법의 공간 분할 전략을 응용하여 유사도 검색에 적합하도록 구 영역질의 방법을 사용하고 검색 성능을 개선하고 있다. 그러나 두 방법은 데이터 크기와 차원 변화에 따른 검색 성능이 100만건 이상과 16차원 이상일 때 현저하게 저하하는 현상을 보이고 있다. 이 논문에서는 멀티미디어 데이터와 같은 고차원 데이터의 검색 성능을 향상시키기 위한 새로운 인덱스 구조로 PdR-트리를 제안한다. 모의 데이터와 실제 데이터를 이용하여 실험한 결과, PdR-트리가 피라미드 기법과 구형 피라미드 기법보다 검색 성능이 향상되었음을 보이고 있다.

  • PDF