• 제목/요약/키워드: 검색가중치

검색결과 400건 처리시간 0.03초

TAG 정보를 활용한 기업검색의 적합성 향상 기법에 관한 연구 (A Study on the Relevance Improvement of Enterprise Search using Tag Information)

  • 손태식;박병섭;최효현
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권12호
    • /
    • pp.101-108
    • /
    • 2010
  • 기업에서 업무 시스템들을 활용하여 업무를 진행하다 보면 기하급수적으로 증가하는 정보를 얼마나 신속하고 정확하게 사용자에게 제공할 수 있는가 하는 것이 기업 경쟁력의 중요한 요소이다. 검색 적합성 향상을 통한 양질의 검색 결과 제공은 기업 경쟁력의 중요한 요소가 되었으며, 가치 있고 효율적인 검색 서비스 제공을 위해 검색엔진에서 제공하는 단순한 검색 서비스 이상을 제공하는 것이 필요하다. 본 논문에서는 검색 과정에서 Tag 정보와 그 가중치 값을 활용하여 검색 적합성을 향상 시키는 방안에 대해서 연구함으로써 검색엔진에서 제공하는 검색 적합성의 한계를 극복하는 방안을 제안한다. 또한, 제안된 방법에 대한 검색 성능을 비교하기 위해서 제안 기법을 기존 웹 검색 서비스에서 제공하는 검색결과와의 적합성 평가 및 연관 검색어와 비교함으로써 우수성을 검증하였다.

VQ를 이용한 영상의 객체 특징 추출과 이를 이용한 내용기반 영상 검색 (Representative Feature Extraction of Objects Using VQ and Its Application To Content-Based Image Retrieval)

  • 정세환;유헌우;장동식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.359-361
    • /
    • 1999
  • 내용 기반 영상 검색을 위해 본 연구에서는 Vector Quantization을 이용하여 영상을 구성하는 주요 객체들의 특징 추출 방법을 제안한다. 내용 기반 검색 시스템에서 사용되는 영상의 주요 특징들은 색상, 질감, 형태 및 영상을 구성하고 있는 객체들의 공간적 위치 등이 사용된다. 이러한 특징들 중에서 어떤 특징들을 사용하고 또 어떤 방식으로 결합하느냐에 따라 혹은 영상의 특성을 잘 나타낼 수 있는 주요 특징을 어떻게 추출, 표현하느냐에 따라 검색 성능에 큰 영향을 미친다. 이 중 본 논문에서는 일반적인 색상, 질감 특징 추출방법과 더불어 Vector Quantization 알고리즘을 이용하여 정지 영상을 구성하고 있는 객체들의 대표 색상과 질감 특징을 빠르게 추출하고 이를 내용 기반 검색에 이용함으로써 객체의 위치, 회전 및 크기 변화에 무관한 검색을 가능케 했다. 연구의 실험 결과 VQ를 이용함으로써 대표특징치 추출시간을 줄일 수 있었고 검색시 색상과 질감 특징의 가중치를 각각 0.5, 0.5로 주는 것이 가장 높은 검출율을 보였으며 제안된 방식에 의해 '사람' 영상의 경우 0.9의 검출율을 보였다.

  • PDF

칼라 공간과 형태 정보를 이용한 내용기반 이미지 검색 시스템의 설계 및 구현 (Daign and Implementation of Content-based Image Retrieval system using Color Spatial and Shape Information)

  • 반종오;강문주;최형진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.613-615
    • /
    • 2002
  • 최근 디지털 이미지 사용이 급속도로 증가함에 있어 자동적인 이미지 데이터 색인과 검색에 관한 연구가 증가하고 있는 추세이나 특정한 분야에 속하지 않은 일반 이미지를 대상으로 하는 연구는 아직까지 만족스럽지 못한 실정이다. 내용기반 이미지 검색은 대량의 일반 이미지 집합에서 사용자가 원하는 이미지를 효율적으로 찾아내는 시스템이며 이에 본 논문에서는 이미지의 색상과 형태의 특징 정보들을 추출하여 자동으로 색인하고 검색하는 새로운 시스템을 제안하였다. 특징 추출은 인간의 이미지 인식 과정에 기반하여 전체적인 정보와 세부적인 정보로 구분하여 수행하는 새로운 기법을 사용하였고 추출된 특징 정보들은 전역 칼라, 부분 영역 칼라, 전역 형태, 부분 영역 형태 정보로 구분되어 데이터베이스에 저장하였으며 유사도 검색 시에는 사용자가 검색 목적에 알맞은 가중치를 적용하여 이미지를 검색하도록 하였다.

  • PDF

이미지의 속성 및 랭크 정보를 이용한 이미지 검색 시스템 (Image Retrieval System Using Image Attributes and Links)

  • 한기덕;정성원;윤근수;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.333-336
    • /
    • 2003
  • 컴퓨터와 네트워크의 처리속도 증가와, 인터넷의 발달로 인하여 이미지, 사운드, 동영상 등 각종 멀티미디어 정보가 인터넷상에 다수 등록되고 있으며, 이에 대한 검색 요구도 증가하고 있다. 그에 따라 다양한 멀티미디어 정보 검색을 위한 방법이 연구되고 있지만, 그에 대하 활용도는 미미하며, 데이터 베이스에 등록된 단순 멀티미디어 정보 검색에 머물고 있는 실정이다. 이에 본 연구는 인터넷상의 멀티미디어 정보 중 이미지 정보를 능동적으로 수집, 정보를 추출하여 검색에 이용한다 이를 위하여, 이미지에 대한 text 정보와 이미지의 속성 및 Link 정보를 이용, 의미 있는 이미지와 의미 없는 이미지를 분류하여 검색의 효율을 높이고, 속성 및 Link 정보를 가중치로 사용함으로써 검색 시 이미지의 중요도를 평가할 수 있도록 한다.

  • PDF

허밍 질의을 위한 그룹 허밍 표현법 (A Group Humming Expression for Query By Humming)

  • 남현우;황성호;박능수;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.139-141
    • /
    • 2007
  • 최근 멀티미디어를 검색하기 위해 메타데이터 기반의 검색 방법에서 컨텐츠 자체를 검색 하려는 연구들이 활발히 진행되고 있다. 특히 음악 검색의 경우 허밍 입력으로 검색을 하려는 QBH(Query By Humming)가 많은 관심을 끌고 있다. 하지만 허밍 데이터는 개인마다 음높이나 박자 정보들이 모두 다르고 숨소리 등의 내재된 오류 정보들이 많아 정확한 검색 결과를 얻기가 쉽지 않다. 허밍 검색의 정확도 향상을 위해서는 음 데이터 추출이나 허밍의 오류 보정, 유사도 측정과 관련된 연구들이 선행되어야 한다. 본 논문에서는 효과적인 멜로디 표현방법에 대해 다양한 실험을 통해 최적의 모델을 제시하려 한다. 방법으로 UDR을 다양한 범위로 나누고 가중치를 달리하는 방법으로 실험을 한 결과 허밍을 그룹으로 분류하는 방법이 정확도를 향상 시키는 것을 확인 하였다.

개인화 추천 시스템의 예측 정확도 향상을 위한 사용자 유사도 가중치에 대한 비교 평가 (Comparative Evaluation of User Similarity Weight for Improving Prediction Accuracy in Personalized Recommender System)

  • 정경용;이정현
    • 전자공학회논문지CI
    • /
    • 제42권6호
    • /
    • pp.63-74
    • /
    • 2005
  • 전자상거래에서 최근 대부분의 개인화된 추천 시스템들은 협력적 필터링 기술을 적용하고 있다. 이 방법은 사용자의 성향에 맞는 아이템을 예측하고 추천하기 위하여 비슷한 선호도를 가지는 사용자들간의 유사도 가중치를 계산한다. 이때 일반적으로 피어슨 상관계수를 많이 사용한다. 그러나 이 방법은 두 사용자가 공통으로 선호도를 평가한 아이템들이 있을 때만 상관관계를 계산할 수 있으므로 예측의 정확도는 떨어진다. 사용자 유사도 가중치는 사용자의 성향에 맞는 아이템을 예측하는 경우 뿐만 아니라 개인화된 추천 시스템의 성능에 영향을 미칠 수 있다. 본 논문에서는 정보검색 분야의 벡터 유사도, 엔트로피, 역 사용자 빈도, 기본 선호도 평가를 적용하여 유사도 가중치 공식에 대해서 살펴보고, 추천 시스템의 예측 정확도 향상에 대해서도 실험을 통해 확인해 보았다. 실험 결과는 엔트로피를 이용한 유사도 가중치에 기본 선호도 평가를 결합하는 방법이 가장 성능이 우수함을 알 수 있다.

웨블릿 변환기법을 이용한 내용기반 컬러영상 검색시스템 구현 (Implementation of Content Based Color Image Retrieval System using Wavelet Transformation Method)

  • 송석진;이희봉;김효성;남기곤
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.20-27
    • /
    • 2003
  • 본 논문에서는 사용자가 질의를 원하는 물체 영역을 선택하면 유사 물체를 영상 데이터베이스 내에서 검색할 수 있는 내용기반 영상검색 시스템을 구현하였다. 질의영상은 색상성분과 그레이성분으로 나누어져 웨블릿 변환되고 색상성분에서는 컬러 오토코릴로그램과 분산으로 색상특성을 추출한다. 그리고 그레이성분에서는 오토코릴로그램과 GLCM을 통해 질감특성을 추출한다. 이렇게 구한 2개 성분에서의 특성들을 이용하여 데이터베이스내의 영상들과 각각 유사도를 비교하여 검색하게 된다. 이때 각 유사도에 가중치를 적용하였다. 한 가지 성분보다 두 가지 성분에서 특성을 구하여 각각의 단점을 보완하였고 실험 결과에서도 소환성(recall) 및 정확성(precision)이 향상됨을 볼 수 있었다 또한 가중치를 적용함으로써 검색 효율이 개선되었다. 그리고 데이터베이스내 영상들의 여러 특성을 특성 라이브러리내에 자동 색인화 시킴으로써 고속의 영상 검색이 가능하였다.

응용 계층에서 노드 성능가중치 적용을 통한 최적의 컨텐츠 변환 노드 검색 메커니즘의 설계 (Design of optimal contents translation node discovery mechanism applying node capability weight in application layer)

  • 전해조;임경식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.580-582
    • /
    • 2004
  • 본 논문에서는 사용자의 다양한 단말환경에 맞게 보다 효율적으로 컨텐츠 변환 서비스를 제공하는 최적의 컨텐츠 변환 노드(Contents Translation Node: CTN) 검색 메커니즘을 개발하였다 이 메커니즘은 컨텐츠 변환 노드로 구성된 서비스 오버레이 네트워크에서 노드부하가 적고, 근거리에 위치한 최적의 노드를 선택하여 신속하고 효율적인 서비스 제공을 가능케 하고 노드간의 부하 배분 기능을 지원한다 그리고 털러 노드 성능 요인들 간에 가중치를 적용하여 현재 상황에 맞게 시의적절한 최적의 노드를 선택할 수 있게 한다. 또한 본 논문에서는 이 메커니즘을 이용하여 인터넷 컨텐츠 최적화 서비스를 제공하는 인터넷 컨텐츠 분산 관리 시스템 (Internet Contents Distribution Management System: ICOMS)을 설계하였다.

  • PDF

정보검색 기술을 이용한 비교사 학습 기반 문서 분류 시스템 개발 (Developing a Text Categorization System Based on Unsupervised Learning Using an Information Retrieval Technique)

  • 노대욱;이수용;나동열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.98-106
    • /
    • 2006
  • 문서분류기의 개발에 있어 교사학습기법을 이용할 경우 많은 양의 사람에 의한 범주 부착 말뭉치가 필요하다. 그러나 이의 구축은 많은 시간과 노력을 필요로 한다. 최근 이러한 범주 부착 말뭉치 대신 원시말뭉치와 범주마다 약간의 씨앗 정보를 이용하여 학습을 수행하여 문서분류기를 개발하는 방법론이 제시되었다. 본 논문에서는 이 방법론 하에서 다른 연구에서의 결과보다 좋은 성능을 나타내는 비교사 학습 기법을 소개한다. 본 논문에서 제시하는 기법의 특징은 씨앗 단어에서 출발하여 평균상호정보를 이용하여 다른 대표단어 및 그들의 가중치를 학습한 다음, 정보검색에서 많이 사용하는 기술을 이용하여 그 가중치를 갱신하는 것이다. 그리고 이 과정을 반복 수행하여 최종적으로 높은 성능의 시스템을 개발할 수 있음을 제시하였다.

  • PDF

사용자 질의 의미 결정을 위한 새로운 N-ary 개체 관계 디자인 패턴 (A New N-ary Entities Relation Approach for User Query Mean Desicion)

  • 김수경;안기홍
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.635-638
    • /
    • 2008
  • 본 연구는 웹이나 정보 검색 환경에서 사용자로부터 입력되는 단순한 키워드 형태의 질의가 아닌 문장형태의 질의에 있어 문장이 내포하는 질의의 의미를 결정하여 더 정확한 검색 결과를 제공하기 위해 온톨로지 내 개념들 간의 속성간 연결을 위해 A-Box 기반의 관계 선언과 새로운 N-ary 개체 관계 방법을 제안한다. 특히 개념 개체들 간의 의미를 더 정확히 결정하기 위해 기존의 N-ary 개체 관계 방법이 갖고 있는 속성에 가중치를 포함하는 것이 아니라 가중치에 관련된 새로운 개체를 생성 패턴을 제시하여 특정 개념에 연관된 개념들의 관련성 결정의 성능을 높이도록 하였다. 본 연구의 실험에 있어 사용자가 입력한 병증의 문장을 결정하기 위해, A-Box 기반의 관계 선언과 N-ary 디자인 패턴에 결합하는 지식 도메인 온톨로지 등을 구축하였으며, 이를 통한 실험 결과 문장의 의미에 따른 더 정확한 결과를 보여주었다.