• 제목/요약/키워드: 검색 적합성

검색결과 520건 처리시간 0.028초

이미지 검색 실패에 나타난 비적합성 평가요소 규명에 관한 연구 (An Investigation on Non-Relevance Criteria for Image in Failed Image Search)

  • 정은경
    • 한국문헌정보학회지
    • /
    • 제50권1호
    • /
    • pp.417-435
    • /
    • 2016
  • 적합성 평가는 검색효율을 향상시키는데 있어서 중요한 요소이다. 또한 이미지의 검색과 이용이 인터넷과 디지털 정보기술의 발달로 인해 보편화되었음에도 불구하고 이미지 적합성 평가에 관한 연구는 미미한 상황이다. 본 연구는 이미지 검색 실패 사례에 나타난 비적합성 평가요소를 규명하고 특성을 살펴보고자 하였다. 이를 위해서 총 135명의 대학생이 연구에 참여하였으며, 1,452건의 평가요소가 분석의 대상이 되었다. 기존의 연구에서 밝힌 평가요소를 포함하여 본 연구는 13종의 평가요소를 규명하였으며, 전체적으로 '주제적합성', '구성', '정확성', '시각적특성', '완전성', '심미적요소', '구도', '서지적요소', '인상', '자세', '얼굴특성', '새로움', '시대배경' 순의 비중으로 나타났다. 이중에서 '구성'과 '구도'는 본 연구에서 특징적으로 새롭게 규명한 평가요소이며, 기존의 연구에서 밝힌 '행동' 평가요소는 본 연구 데이터에서는 찾아볼 수 없었다. 또한 이러한 평가요소의 비중은 이용자가 지닌 이미지요구와 이용목적의 특성에 따라서 차이를 보였다.

공간 위치 정보를 적합성 피드백을 위한 가중치로 사용하는 영역 기반 이미지 검색 시스템 (Region-Based Image Retrieval System using Spatial Location Information as Weights for Relevance Feedback)

  • 송재원;김덕환;이주홍
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.1-7
    • /
    • 2006
  • 최근 이미지 검색은 검색의 정확성을 높이고자 사용자의 요구를 반영하는 적합성 피드백에 관한 연구가 활발히 진행되고 있다. 본 논문은 이미지 검색 시 나타나는 고수준 개념과 저수준 특징 사이의 의미적 격차를 줄이기 위하여 적합성 피드백에 기반한 영역 기반 이미지 검색의 가중치 기법에 대해서 논의하고 새로운 가중치 기법을 제안한다. 새롭게 제시된 가중치 기법은 한 이미지에 존재하는 영역들의 공간적 위치에 따라 영역의 중요성을 결정한다. 실험 결과는 본 논문에서 제시된 가중치 기법이 평균 재현율에 있어서 크기 백분율 가중치 기법에 비해 약 18%, 역 이미지 빈도수를 적용한 영역 빈도수 가중치 기법에 비해 약 11% 가량 높게 나타나는 것을 보이고 있으며, 검색 시간에 있어서도 영역 빈도수 가중치에 비해 약 1/10인 것을 보이고 있다.

  • PDF

계층적 클러스터링과 문장 적합성 피드백을 이용한 상담사례 검색 시스템 (Counseling Case Retrieval System Using Hierarchical Clustering and Sentence Relevance Feedback)

  • 김승일;곽희규;김수형
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.172-174
    • /
    • 1999
  • 본 논문에서는 카운셀링을 원하는 사용자가 카운셀러와 전자메일을 통해 상담을 원할 때 사용자의 상담 내용에 근거하여 유사한 사례를 검색해 주는 시스템을 제안한다. 제안방법은 문서의 계층적 클러스터링과 용어 적합성 피드백을 상담 사례 검색 시스템에 적용시켜, 상담사례에 나타나는 단어의 출현 빈도와 유사도를 통해 트리 구조를 형성하고, 이 트리 구조를 통한 하향 탐색을 수행한다. 하향 탐색을 하는 도중 노드의 매칭함수의 값이 서로 유사하여 노드 선택이 어려울 경우, 사용자에게 질의를 통해 용어를 제시하고, 사용자의 피드백을 통해 입력된 사연 내용의 가중치를 개선하여 내용에 가장 부합되는 문서를 탐색한다.

  • PDF

웹 사이트 구조를 이용한 토픽 검색 연구 (An Experimental Study on Topic Distillation Using Web Site Structure)

  • 이지숙;정영미
    • 정보관리학회지
    • /
    • 제24권3호
    • /
    • pp.201-218
    • /
    • 2007
  • 이 연구에서는 TRBC이 제시한 토픽 검색의 정의에 따라 질의에 적합한 웹 사이트를 검색하는 효과적인 토픽 검색 알고리즘을 제안하고 실험을 통해 그 성능을 평가하였다. 이 연구의 토픽 검색 알고리즘은 먼저 질의에 대한 웹 페이지 검색 결과로부터 적합한 웹 사이트를 선정한 다음, 선정된 사이트의 구조를 이용하여 질의에 대한 적합성 점수를 산출한다. TREC의 .GOV 실험 문헌 집단과 TREC-2004 실험의 질의 및 적합문헌 리스트를 이용한 검색 실험 결과 이 토픽 검색 알고리즘은 상위 10위 안에 최소 2개 이상의 적합 사이트를 검색하여 비교적 높은 수준의 성능을 보였다. 또한 TREC-2004의 적합문헌 리스트 분석을 통해 적합문헌 선정에 토픽 검색의 정의가 엄격하게 적용되지 않은 경우가 있음을 확인하고, 수정된 적합문헌 리스트를 이용하여 토픽 검색 성능을 재평가한 결과 이 연구에서 제안한 토픽 검색 알고리즘의 성능이 월등히 향상되었다.

검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델 (A Term Cluster Query Expansion Model Based on Classification Information of Retrieval Documents)

  • 강현수;강현규;박세영;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.7-12
    • /
    • 1999
  • 정보 검색 시스템은 사용자 질의의 키워드들과 문서들의 유사성(similarity)을 기준으로 관련 문서들을 순서화하여 사용자에게 제공한다. 그렇지만 인터넷 검색에 사용되는 질의는 일반적으로 짧기 때문에 보다 유용한 질의를 만들고자 하는 노력이 지금까지 계속되고 있다. 그러나 키워드에 포함된 정보가 제한적이기 때문에 이에 대한 보완책으로 사용자의 적합성 피드백을 이용하는 방법을 널리 사용하고 있다. 본 논문에서는 일반적인 적합성 피드백의 가장 큰 단점인 빈번한 사용자 참여는 지양하고, 시스템에 기반한 적합성 피드백에서 배제한 사용자 참여를 유도하는 검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델(Term Cluster Query Expansion Model)을 제안한다. 이 방법은 검색 시스템에 의해 검색된 상위 n개의 문서에 대하여 분류기를 이용하여 각각의 문서에 분류 정보를 부여하고, 문서에 부여된 분류 정보를 이용하여 분류 정보의 수(m)만큼으로 문서들을 그룹을 짓는다. 적합성 피드백 알고리즘을 이용하여 m개의 그룹으로부터 각각의 용어 클러스터(Term Cluster)를 생성한다. 이 클러스터가 사용자에게 문서 대신에 피드백의 자료로 제공된다. 실험 결과, 적합성 알고리즘 중 Rocchio방법을 이용할 때 초기 질의보다 나은 성능을 보였지만, 다른 연구에서 보여준 성능 향상은 나타내지 못했다. 그 이유는 분류기의 오류와 문서의 특성상 한 영역으로 규정짓기 어려운 문서가 존재하기 때문이다. 그러나 검색하고자 하는 사용자의 관심 분야나 찾고자 하는 성향이 다르더라도 시스템에 종속되지 않고 유연하게 대처하며 검색 성능(retrieval effectiveness)을 향상시킬 수 있다.사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

적합성 피드백을 통해 결정된 가중치를 갖는 시각적 특성에 기반을 둔 이미지 검색 모델 (A Image Retrieval Model Based on Weighted Visual Features Determined by Relevance Feedback)

  • 송지영;김우철;김승우;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권3호
    • /
    • pp.193-205
    • /
    • 2007
  • 디지털 이미지의 양이 증가함에 따라 원하는 이미지를 정확하고 빠르게 찾을 수 있는 방법의 필요성이 증가하고 있다. 이미지 검색 방법으로는 이미지의 색상이나 명암과 같은 시각적 특성을 검색 조건으로 이용하는 내용 기반 검색과 이미지를 설명하는 키워드를 검색 조건으로 이용하는 키워드 기반 검색이 있다. 하지만 이러한 방법만으로는 사용자가 원하는 이미지를 정확하게 찾기 힘들다는 문제점이 제기되어 왔다. 따라서 최근에는 검색 도중 사용자의 응답을 받아 사용자의 요구를 파악함으로써 향상된 검색 결과를 제공하는 적합성 피드백에 대한 연구가 많이 진행되고 있다. 하지만 적합성 피드백을 이용하는 방법들도 원하는 결과를 얻기 위해서는 여러 번의 피드백을 필요로 하고 질의 수행이 완료된 후에는 얻어진 피드백 정보를 재사용하지 못한다는 단점이 있다. 따라서 본 논문에서는 이미지에 키워드를 연결한 후 사용자의 피드백 정보를 반영하여 키워드의 신뢰도를 조절함으로써 키워드 기반 이미지 검색의 정확도를 높일 수 있는 모델을 제안한다. 제안된 모델에서는 사용자로부터 피드백을 받은 이미지뿐만 아니라 긍정적 피드백을 받은 이미지들이 공통적으로 가지는 시각적 특성과 유사한 시각적 특성을 가지는 다른 이미지들까지도 키워드의 신뢰도를 조정함으로써 좀 더 빠른 시간 내에 검색 결과의 정확도를 높이도록 한다. 제안한 방법의 정확성을 검증하기 위한 실험 결과에 따르면, 같은 횟수의 피드백을 받으면서도 재현율과 정확률은 빠른 증가를 보이는 것으로 나타났다.

가중치에 따른 질의확장의 검색효율성 (Retrieval Effectiveness of Query Expansion depending on Term Weights)

  • 최성환
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2002년도 제9회학술대회 논문집
    • /
    • pp.259-264
    • /
    • 2002
  • 기존의 질의확장 혹은 적합성 피드백 연구에서 코사인 정규화를 사용하여 검색성능을 향상시킨 연구들이 많다. 본 논문에서 실험한 결과를 근거로 하였을 때 이는 낮은 검색성능을 보였던 것이 검색공간의 확장으로 성능이 크게 향상되었을 가능성이 있다. 실험결과 가중치 유사도 모델간의 커다란 차이는 보이지 않고 코사인정규화 가중치 알고리즘에서 상당한 성능향상이 있었다. 그러나 기존의 코사인정규화 가중치 알고리즘을 이용한 전역적 질의확장의 경우 성능 향상률은 높으나 원질의어를 이용하여 가장 좋은 성능을 보였던 가중치 알고리즘들의 검색성능과 비교하면 오히려 낮은 성능을 보였다.

  • PDF

클러스터링 및 연속적 I/O를 이용한 이미지 데이터 검색 연구 (A study on the searching of images via clustering and sequential I/O)

  • 김진옥
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.106-108
    • /
    • 2002
  • 본 연구에서는 멀티미디어 데이터 검색에 클러스터링과 인덱싱 기법을 같이 적용하여 유사할 이미지끼리는 인접 디스크에 클러스터하고 이 클러스터에 접근하는 인덱스를 구축하여 검색이 빠르게 이루어지는 유사 검색방법을 제시한다. 이 연구에서는 트리 유사 구조의 인덱스 대신 해싱 방법을 이용하며 검색시 I/O시간을 줄이기 위해 오브젝트를 가진 클러스터 위치를 찾는데 한번의 I/O를 사용하고 이 클러스터를 읽기 위해 연속주인 파일 I/O를 사용하여 클러스터를 찾는 데용을 최소화한다 클러스터인덱싱 접근은 트리 유사 구조와 임의 I/O를 사용한 내용기반의 이미지 검색보다 효율적인 검색 적합성을 보이며 연속적 I/O를 통해 검색 미용을 낮춘다.

  • PDF

한국어 테스트 컬렉션 HANTEC의 확장 및 보완 (Extension and Validation of Hangul Text Collection(HANTEC))

  • 김지영;장동현;맹성현;이석훈;서정현;김현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.210-215
    • /
    • 2000
  • HANTEC1.0은 12만 건의 문서집합과 30개의 질의집합, 그리고 각 질의에 대한 적합문서로 구성된 정보검색용 한글 테스트 컬렉션이다. 본 연구에서는 HANTEC1.0의 확장 및 보완하기 위해 과학기술분야 20개의 질의를 추가하였는데, 질의 추가를 위해서 일본 NACSIS 테스트 컬렉션의 질의를 번역하여 사용함으로써 한일 교차언어 검색환경을 조성하고자 하였다. 추가된 각 질의에 대해서는 여러 검색기에서 총 41가지 검색방법으로 검색한 후, 각 검색조합의 상위 50개 문서로 구성된 중간 결과집합을 만들었으며, 이를 대상으로 적합성판정에 대한 평가기준 및 절차 교육이 이루어진 평가자가 각 질의에 대한 적합성평가를 실시하였다 이렇게 구축된 HANTEC 테스트 컬렉션의 적합문서 집합의 객관적 품질 평가와 시스템 성능평가를 위하여 통계적인 방법을 적용하므로써 공신력있고 일반화된 테스트 컬렉션을 구축하고자 하였다. 현재 HANTEC2.0은 검색분야 연구자 및 개발자에게 자유롭게 배포 중이며 정보검색 시스템의 신뢰도 측정을 목적으로 하는 학술대회의 연구결과 발표 및 제품 비교 등에 활용되어질 것이다.

  • PDF

영상에 대한 Semantics 축적이 가능한 Relevance Feedback (Semantics Accumulation-Enabled Relevance Feedback)

  • 오상욱;설상훈;정민교
    • 한국멀티미디어학회논문지
    • /
    • 제8권10호
    • /
    • pp.1306-1313
    • /
    • 2005
  • Relevance Feedback(RF)은 사용자의 인지적 피드백(perceptual feedback)을 사용하는 영상 검색 기법 중의 하나로서, 사용자 피드백을 통해 얻게 되는 적합성 정보(relevance information)를 이용하여 사용자 질의(query)를 점진적으로 구체화하게 된다. 그러나, 기존 RF 기법에서는 이러한 적합성 정보가 매우 유용한 정보임에도 불구하고, 검객이 끝나는 순간 없애버리고 만다. 그래서, 본 논문에서는 사용자의 인지적 피드백 정보를 버리지 않고, 저장하는 새로운 개념의 RF를 제안한다. 새로 제안된 RF는 시간의 흐름에 따라 축적되어 저장된 상위 레벨의 적합성 정보(high-level relevance information)를 하위 레벨의 특징벡터(low-level feature vectors)와 동적으로(dynamically) 결합하여 사용함으로써, 검색의 효율성을 크게 향상시킨다. 제안 방법의 우수성을 입증하기 위해 다양한 실험 결과도 제시한다.

  • PDF