• 제목/요약/키워드: 우선순위검색

검색결과 117건 처리시간 0.023초

소프트웨어 재사용에서 검색 피드백을 위한 유저 프로필 정의에 관한 연구 (A Study on Definition of User Profile for Retrieval Feedback in Software Reuse)

  • 김귀정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.341-344
    • /
    • 2004
  • 본 연구는 소프트웨어 재사용을 효과적으로 수행하기 위해 사용자 검색 피드백을 지원할 수 있는 유저 프로필을 정의하였다. 컴포넌트 검색을 위해 퍼지 함수를 이용한 신뢰값을 사용하였으며, 사용자 집단의 요구에 능동적으로 반응할 수 있도록 퍼지 함수를 변화시켜 컴포넌트의 검색 우선순위를 변경시키는 방법을 사용하였다. 본 연구에서는 사용자 피드백을 반영하는 퍼지화 함수에 유저 프로필을 적용하여 사용자 등급에 따라 사용자 의견이 시스템에 반영되는 정도를 다르게 해주었다. 본 연구의 사용자 검색 피드백 방법은 퍼지 기법을 적용한 퍼지화 함수와 유저 프로필을 이용하여 시스템을 장기간에 걸쳐 서서히 변화시킬 수 있도록 하였다.

  • PDF

다차원 인덱스를 위한 벡터형 태깅 연구 (A Vector Tagging Method for Representing Multi-dimensional Index)

  • 정재윤;진현철;김종근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권9호
    • /
    • pp.749-757
    • /
    • 2009
  • 인터넷 사용이 대중화되면서 개인이 정보의 또는 검색할 주제에 따라 원하는 정보에 쉽게 접근할 수 있다. 이때 다양한 구조를 갖는 자료들의 속성을 잘 나타내는 메타데이터를 이용하면 검색의도에 보다 정확하게 부합하는 검색 결과를 얻을 수 있어 다양한 연구가 지속되고 있다. 본 연구는 소그룹의 사용자들이 공동으로 관심 있는 웹 콘텐츠의 즐겨 찾기를 공동으로 유지 관리하는 용도로 다차원 벡터형 태그를 제안한다. 제안하는 벡터형 태그는 정보 유용성을 나타내는 색인을 벡터방식으로 기술하고 이것을 활용해 정보의 분류 관리 재활용의 효율을 높이는 표현법이다. 벡터방식 태깅은 대상 키워드에 사용자들이 두 개 이상의 요소에 대한 우선순위를 부여하고 벡터 방식으로 표현한다. 이 때 벡터의 기본이 되는 벡터공간은 정보생성시간, 선호순위 등으로 구성한다. 벡터성분으로 산출할 수 있는 벡터크기가 정보의 유용성을 나타내며 순위측정의 기준이 된다. 제안방식에 의한 순위측정은 단순한 링크구조에 의해 측정된 순위와 비교하였을 때, 사용자의 검색의도에 부합하는 순위 정보를 제공하고 있다.

다차원 공간에서 거리조인 질의처리를 위한 R-트리의 효율적 접근 (Efficient Accesses of R-Trees for Distance Join Query Processing in Multi-Dimensional Space)

  • 신효섭;문봉기;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권1호
    • /
    • pp.72-78
    • /
    • 2002
  • 거리조인은 R-트리를 사용하여 두 공간 데이터 집합 사이의 데이터쌍을 거리 상 가까운 순으로 검색하는 공간조인이다. 거리조인은 R-트리를 하향식으로 순회하면서 생성되는 노드쌍들을 거리값 순으로 우선순위 큐에 저장한다. 본 논문에서는 거리조인 처리시 우선순위 큐 안에서 동점자 노드쌍들의 우선 순위 정책이 알고리즘의 성능을 많이 좌우할 수 있음을 보여주고, 이를 위한 최적화된 2차 우선 순위 기법을 제안한다. 실험을 통하여, 제안한 기법이 다른 기법에 비하여 항상 좋은 성능을 나타냄을 보여준다.

XLinks를 이용한 하이퍼텍스트 검색 시스템 (Hypertext Retrieval System Using XLinks)

  • 김은정;배종민
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.483-494
    • /
    • 2001
  • 일반적인 하이퍼텍스트 검색 모델은 문서와 문서사이의 관계나 링크의 의미를 무시하고, 모든 문서를 독립적인 존재로 간주하여 검색한다. 그러나 하이퍼텍스트 검색 시스템에 있어 링크 정보를 이용하며 검색의 성능을 향상시킬 수 있다. 기존의 링크 기반 하이퍼텍스트 검색 모델은 문서의 색인 과정에서 링크 정보를 무시하고, 검색 결과 집합에 대하여 문서의 우선 순위를 제조정하는데 링크 정보를 활용한다. 이는 링크정보의 활용이 검색 결과 집합의 문서들에만 한정된다는 단점이 있다. 본 논문에서는 링크 정보를 문서의 색인 과정에서 활용한다. 색인 과정에서 링크 정보를 이용하여 문서 내 용어의 가중치와 문서 내 inLinks의 가중치를 정의하고, 이들의 이용하여 문서의 우선 순위를 위한 확장된 RSV 계산식을 제시한다. 실험 결과에서 링크 의미에 따른 검색 조회율과 정확도를 제시하고 기존 링크 기반 검색 모델과의 비교, 분석 결과를 제시한다.

  • PDF

유사 적합성 피드백 기반의 문서 요약 기법을 이용한 효과적인 스니펫 생성 (An Effective Snippet Generation Method using Text Summarization Techniques based on Pseudo Relevance Feedback)

  • 안홍국;고영중;서정연
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.174-181
    • /
    • 2007
  • 정보 검색의 결과로 나타나는 요약문을 스니펫(snippet)이라 한다. 사용자는 자신이 원하는 정보를 얻기 위해 문서를 검색하는데, 이 때 스니펫은 사용자가 원하는 문서를 찾는데 중요한 역할을 한다. 본 논문에서는 정보검색 분야에서 높은 성능을 보이는 유사 적합성 피드백을 자동 문서 요약에 맞게 적용하여 높은 성능의 스니펫 생성 시스템을 구현한다. 우선, 사용자의 질의가 포함된 문장들을 일차적으로 요약 문장 후보로 추출한다. 그리고 추출된 문장 후보로부터 명사들을 질의 후보로 고려한다. 각 문장이 질의의 포함 여부에 따라 문장의 적합성을 판단하게 되고, 유사 적합성 피드백 확률 모델에 적용한 후 질의 후보들의 가중치를 추정하여 가중치 순위를 통해 확장할 질의들을 결정한다. 확장된 질의들과 기존의 질의들의 가중치를 합산하여 각 문장의 순위를 매기게 되고 가장 높은 순위의 문장들이 스니펫으로 제시된다. 논문에서 제안한 기법은 추가적인 핵심 질의들을 자동으로 확장하여 중요한 문장을 추출할 수 있다. 이 연구를 위해서 일반 상용 정보 검색 서비스에서 제공하는 스니펫을 수집하였고 이들의 정확도와 시스템의 정확도를 비교하였다. 실험 결과를 통해 살펴본 제안된 시스템의 성능은 상용 정보 검색기에서 제공되고 잇는 스니펫의 정확도 보다 우수한 성능을 보였다.

  • PDF

영역기반 검색환경을 위한 FRIP 시스템 (FRIP Stystem For Region-based Image Retrieval)

  • 고병철;변혜란
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.499-501
    • /
    • 2000
  • 본 논문에서는 영역기반 검색환경을 제공하는 FRIP(Finding Region in the Pictures) 시스템을 소개한다. FRIP 시스템은 영역 기반 검색환경을 제공하기 위해서, 우선적으로 영상을 분할하고, 각 분할된 영역으로부터 색상, 질감, 크기, 모양, 위치 정보와 같은 최적의 특징 벡터들을 추출하여 색인화시킨다. 그런 뒤에, 사용자가 검색하고자 하는 영역과 검색 영상 수 k를 입력하면, 유사성 측정 식에 의해 가장 유사한 k만큼의 영상을 우선 순위 형태로 사용자에 보여주게 된다. 본 시스템에서는 영상을 분할하기 위해서 기본적인 RGB 색상계를 확장(Scaling 및 이동(Shifting) 알고리즘을 통해 영상의 대비 정도가 향상된 새로운 색상계로 변환시키고, 원형 필터를 설계하여, 영역 안에 포함된 의미 없는 작은 영역을 제거하도록 하였다. 그리고 이렇게 분할된 각 영역들로부터, 본 시스템에서 제안하는 모양 기술자인 MRS(Modified Radius-based Signature)를 포함하여 5가지의 최적의 특징 벡터들을 전처리 단계에서 데이터베이스에 색인으로 저장하고 유사성 측정을 위한 수치로 사용하였다.

  • PDF

검출 복잡도를 감소 시키는 Depth-first branch and bound 알고리즘 기반 디코더 (Depth-first branch-and-bound-based decoder with low complexity)

  • 이은주;;윤기완
    • 한국정보통신학회논문지
    • /
    • 제13권12호
    • /
    • pp.2525-2532
    • /
    • 2009
  • 본 논문에서는 uncoded V-BLAST(Vertical Bell Laboratories Layered Space Time) 시스템에서 PSK 신호들을 joint-detection하기 위한 fast sphere decoder를 제안한다. 이른바 PSD라 불리는 제안된 디코더는 예비처리단계와 검색단계로 구성된다. PSD의 검색단계에서는 depth-first branch and bound 알고리즘을 통해 검출 후보가 되는 신호원들의 최상우선순위(best-first order)를 정하고 이 순위에 따라 신호를 검출하게 된다. 이 때 제안된 디코더는 최상우선순위(best-first order)를 정하는데 있어 계산복잡성을 줄이는 새로운 방법을 제안한다. 시뮬레이션 결과는 PSD에 의해 시스템의 복잡성은 줄이면서 시스템 성능은 ML과 동일하게 유지할 수 있음을 보여준다.

문서 단위 순위화를 통한 XML 문서에 대한 키워드 검색 성능 향상 (Accelerating Keyword Search Processing over XML Documents using Document-level Ranking)

  • 이형동;김형주
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.538-550
    • /
    • 2006
  • XML 문서에 대한 키워드 검색은 사용자로 하여금 XML 문서의 복잡한 구조에 관한 지식 없이 쉽게 정보를 검색할 수 있게 해준다. 또한 사용자의 정보 요구에 대해 해당 정보를 포함하는 문서 전체를 반환하는 기존의 정보 검색 시스템과 달리 문서 내의 해당 정보를 포함하는 문서 조각을 결과로 반환함으로써 보다 빠르게 원하는 정보를 얻을 수 있도록 도와준다. 이러한 특징은 XML 문서 검색 시스템이 XML 문서를 문서 단위가 아닌 세부적인 엘리먼트 단위로 처리함으로써 가능하다. 하지만 이로 인해 대용량 문서들에 대한 질의 처리 부담 역시 가중되었다. 본 논문에서는 엘리먼트 단위 질의 처리의 비용을 줄이기 위해 XML 문서에 대한 문서 단위 순위화 기법을 제안하는데, 이는 결과물의 점수에 영향을 미치는 질의 키워드들의 문서 내에서의 근접도를 경로 노드 집합 정보와 이에 대한 유사도를 통해 구함으로써 엘리먼트 단위 질의 처리 결과를 예측하고 문서 단위 점수를 계산한다. 이러한 문서 중심의 뷰는 대용량 문서에 대한 순위화 혹은 필터링을 가능하게 해주며, 우리는 문서 단위 인덱스를 통해 순위가 높은 문서를 우선적으로 처리함으로써 Top-k 질의에 대해 검색 성능을 높였으며, 실험을 통해 해당 기법의 유효성과 성능 향상을 검증하였다.

검색결과 역배열 제시를 통한 순서 기반 정보탐색 유형 실증연구 (An Empirical Study on Click Patterns in Information Exploration)

  • 조봉관;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권2호
    • /
    • pp.301-307
    • /
    • 2018
  • 일반적으로 검색엔진은 이용자가 검색하고자 하는 내용의 정보를 제공하는 사이트를 우선 탐색할 수 있도록 검색결과의 주요내용을 요약하여 이용자에게 제공하고 있다. 본 연구에서는 이용자의 검색 결과 클릭이 검색 엔진에서 제공하는 요약 내용 기반으로 진행되는 것인지 검색결과 배치 순서에 기인한 것인지를 검색 결과 역배열 제시를 통한 실증 연구 결과를 제시하였다. 검색엔진 업체에서 제공하는 API를 활용하여 검색결과를 정배열과 역배열로 제시해 주는 검색사이트를 제작하여 각 이용자들의 검색결과에 대한 클릭 행동을 실제 클릭 순서와 클릭 위치, 클릭 수, 검색결과 내에서의 페이지 간 이동경로 등과 같은 이용자 검색 유형을 분석하였다. 분석 결과 대부분의 이용자들은 검색결과 정배열 또는 역배열 제시와 상관없이 첫 번째와 두 번째 노출된 검색 결과를 우선 클릭하는 이용자가 60% 이상 차지하였다. 이는 검색 결과 요약 내용과 상관없이 검색 결과 배치 순서에 따라 이용자의 정보탐색 우선순위가 결정되는 것으로 확인되었다.

용어 연관성 분석을 이용한 사용자 위주의 문서순위결정 기법 (User-Centered Document Ranking Technique using Term Association Analysis)

  • 우선미;유춘식;김용성
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권2호
    • /
    • pp.149-156
    • /
    • 2001
  • 정보의 가치와 사용자의 정보획득 요구가 증대됨에 따라 특정 개인 위주의 서비스를 제공하는 정보검색 시스템의 필요성이 증대되고 있다. 그러나 현재의 정보검색 시스템들은 사용자의 선호도를 반영하고 편의성을 제공하는 면에서 매우 미흡한 점들이 많다. 따라서 본 논문에서는 적합성 정도에 따라 최적의 문서를 제공하기 위하여 사용자 위주의 문서순위결정 기법을 제안한다. 특정 개인의 선호도(preference)를 반영하기 위하여 사용자 프로파일(User Profile)을 구성 및 갱신하고, LSA(Latent Semantic Analysis)를 적용하여 적합율에 따라 문서의 순위를 결정한다.

  • PDF