• Title/Summary/Keyword: 검색가중치

Search Result 400, Processing Time 0.042 seconds

A Weight Boosting Method of Sentiment Features for Korean Document Sentiment Classification (한국어 문서 감정분류를 위한 감정 자질 가중치 강화 기법)

  • Hwang, Jaewon;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.201-206
    • /
    • 2008
  • 본 논문은 한국어 문서 감정분류에 기반이 되는 감정 자질의 가중치 강화를 통해 감정분류의 성능 향상을 얻을 수 있는 기법을 제안한다. 먼저, 어휘 자원인 감정 자질을 확보하고, 확장된 감정 자질이 감정 분류에 얼마나 기여하는지를 평가한다. 그리고 학습 데이터를 이용하여 얻을 수 있는 감정 자질의 카이 제곱 통계량(${\chi}^2$ statics)값을 이용하여 각 문장의 감정 강도를 구한다. 이렇게 구한 문장의 감정 강도의 값을 TF-IDF 가중치 기법에 접목하여 감정 자질의 가중치를 강화시킨다. 마지막으로 긍정 문서에서는 긍정 감정 자질만 강화하고 부정 문서에서는 부정 감정 자질만 강화하여 학습하였다. 본 논문에서는 문서 분류에 뛰어난 성능을 보여주는 지지 벡터 기계(Support Vector Machine)를 사용하여 제안한 방법의 성능을 평가한다. 평가 결과, 일반적인 정보 검색에서 사용하는 내용어(Content Word) 기반의 자질을 사용한 경우 보다 약 2.0%의 성능 향상을 보였다.

  • PDF

Improving the Effectiveness of Information Retrieval Using Data Fusion Method in the Vector and Neural Network Model (벡터와 신경망 모델에서 데이터 퓨전 기법을 이용한 정보검색의 효율성 향상)

  • 최성환
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2001.08a
    • /
    • pp.137-142
    • /
    • 2001
  • 본 논문에서는 벡터모델과 신경망 모델을 이용하여 데이터 퓨전의 관점에서 다중증거로서 가중치, 문헌분리가, 엔트로피, 공기유사도를 적절히 결합하여 질의를 확장하는 방법을 제안한다. 실험결과 코사인 정규화 가중치 알고리즘, 문서길이 정규화 가중치 알고리즘과 결합하여 질의를 확장하는 것이 정규화시키지 않고 단순히 문헌빈도와 역문헌빈도의 조합을 이용한 가중치 알고리즘과 결합했을 때 보다 평균 정확률 향상이 더 높게 나타났다. 또한 다양한 공기기반 유사도를 이용하여 질의확장을 한 결과 벡터모델과 신경망 모델에서 코사인 공기유사도에 기반하여 질의확장한 경우가 다른 공기유사도에 비해 더 좋은 성능을 보였다.

  • PDF

Performance Improvement For Content-Based Image Retrieval Using Probabilistic Bollean Model And Relevance Learning (확률적 부울(Boolean) 모델과 연관성 학습을 통한 내용기반 영상 검색 성능 향상)

  • 고병철;변혜란
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.556-558
    • /
    • 2001
  • 전체 영상을 이용하지 않고 영상 안에 포함된 특정 객체 혹은 영역만을 이용하는 "영역에 의한 질의(query-by-region)" 방법은 내용기반 영상 검색 중 상위개념의 방법 이지만, 영상 분할의 한계, 여러개로 분할된 영역을 모두 검색하기 위한 인덱싱 문제, 유사성 측정 시 선형적으로 분리되지 않는 특징 값들에 대한 무리한 선형 조합으로 인한 검색 오류와 같은 많은 문제점을 안고 있다. 따라서 본 논문에서는 영역 기반 영상 검색 시스템인 FRIP에 대하여 영상 분할의 한계를 극복하고, 사용자의 주관성을 영상 검색에 적용하기 위해 확률적 연관성 학습 모델(MPFRL)을 유사성 측정 단계에서 적용 하였고, 아울러 검색 모델로는 기존에 일반적으로 사용되어 오던, 선형 모델을 사용하지 않고 선형 모델보다 유연한 검색 결과를 보여주는 확률적 이접 부울 모델(PDB)을 사용하였다. 또한, 검색 시간을 단축 시키기 위해, 선형 검색 방법에 부울 AND 연산자를 적용 시킴으로써, 검색 시간을 상당부분 단축 할 수 있었다. 실험 결과, 본 논문에서 제안하는 방법(MPFRL+PDB)을 사용할 경우 검색 결과가 선형 조합 보다 향상되는 것을 알 수 있었다. 아울러 사용자 피드백을 통해 사용자가 특징 가중치를 일일이 조절하지 않더라도 단순한 몇 번의 클릭만으로 사용자의 주관성을 반영하고 보다 정확한 검색 결과를 보여 줄 수 있는 시스템을 설계 할 수 있었다.

  • PDF

Implementing Dynamic Web Hierarchical Structuring System (동적인 계층적 웹 검색 시스템)

  • Yoon, Kwang-Ho;Lee, Woo-Key;Kim, Chang-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10c
    • /
    • pp.102-107
    • /
    • 2006
  • 웹은 유향그래프로 표현할 수 있으며, 이때 웹 페이지를 노드로 페이지 사이의 하이퍼링크를 아크로 나타낸다. 본 연구에서는 이러한 웹 그래프로부터 검색트리를 유도하여 이를 브라우징할 수 있는 시스템으로 구현하였다. 본 시스템은 사용자가 임의의 노드를 동적으로 검색의 시작노드 즉, 루트노드로 결정할 수 있고 이를 변경하여 새로운 검색을 할 수 있으며, 그 루트노드로부터 도달 가능한 노드들의 집합을 도메인이라 하고, 노드 및 링크에 대하여 일정한 가중치를 부여함에 따라 검색트리를 구성할 수 있으며 이를 검색트리 시스템으로 구현하였다.

  • PDF

Similar video streaming searching with SURF descriptors (SURF 특징점을 이용한 유사 비디오 스트림 검색)

  • Kim, Tae-Suk;Shim, Kyu-Seok;Lee, Jeong-Hun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.81-84
    • /
    • 2011
  • 최근 디지털 비디오는 다양한 멀티미디어 어플리케이션을 이용하여 인터넷을 통해 스트림 동영상으로 전송 되고 있다. 이러한 영향으로 비디오 영상을 검색하는 동영상 검색엔진의 필요성이 크게 증가하였다. 기존의 비디오 이미지 처리에는 전체적 특징을 이용한 비디오 검색을 사용하여 완전히 동일한 동영상을 찾는 것은 가능하였지만, 유사한 동영상을 찾는 것은 불가능하였다. 본 논문에서는 유사한 동영상들은 서로 비슷한 부문이 많이 존재한다는 점에 착안하여 동영상 클립을 키 프레임 단위로 나누어 각 키 프레임의 지역 특징을 사용해, 각 특징들 간의 가중치 있는 최대 이분 매치를 이용한 유사도 측정을 통해 비슷한 동영상 검색할 수 있게 하였다. 실험 결과 만족할 만한 성능으로 유사한 동영상 영상을 검색해 내는 것을 확인 할 수 있었다.

HyREX: Universal XML Retrieval Engine for XML (다국어를 지원하는 XML 문서 검색 시스템: HyREX)

  • Han, Ye-Ji;Chae, Jong-Dae;Kim, Su-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.11c
    • /
    • pp.1713-1716
    • /
    • 2002
  • HyREX는 연구용 프로토타입 XML 하이퍼미디어 문서 검색시스템으로 다국어를 지원하고 있다. HyREX는 검색을 위한 효율적인 접근 경로들을 처리하는 물리적 계층 HyPath와 질의어를 처리하는 논리적 계층 XIRQL 그리고 사용자 인터페이스인 HyGate 계층으로 이루어져 있다. 이 연구에서는 영어와 독일어 등의 검색을 지원하는 기존의 HyREX 시스템을 한글 XML 문서 검색시스템으로 확장하기 위해 먼저 한글 데이터타입을 위한 클래스를 구현하였다. 앞으로 한글 XML 문서 검색에서 정확율과 재현율을 향상하기 위해 각 문서의 인덱스에 대해 $tf{\cdot}idf$ 공식을 이용하여 가중치를 부여하고 이를 개발하고자 한다.

  • PDF

Query Extension and Component Retrieval Method using similarity (유사도를 이용한 질의 확장과 컴포넌트 검색 방법)

  • Jung, Dae-Sung;Han, Jung-Soo;Kim, Gui-Jung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2003.05c
    • /
    • pp.1829-1832
    • /
    • 2003
  • 본 연구는 유의어 매트릭스를 이용하여 질의의 확장을 통한 컴포넌트 검색 과정을 기술하였다. 컴포넌트 검색은 질의를 입력하면 질의의 확장이 이루어지고 컴포넌트 사이의 신뢰도를 측정하여 검색한다. 신뢰도 계산을 위해서는 질의와 컴포넌트 사이에 유사한가를 나타내는 동치관계, 클래스의 가중치와 동치관계 값을 이용한 포함관계, 그리고 유사도를 계산한다. 끝으로 이들 값을 이용하여 신뢰도를 계산한 후 이 신뢰도 값에 의하여 유사 컴포넌트들을 검색하여 유사도 우선순위로 컴포넌트가 검색된다.

  • PDF

A Study on Providing Relative Keyword using The Social Network Analysis Technique in Academic Database (학술DB에서 SNA(Social Network Analysis) 기법을 이용한 연관검색어 제공방안 연구)

  • Kim, Kyoung-Yong;Seo, Jung-Yun;Seon, Choong-Nyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.79-82
    • /
    • 2011
  • 본 논문은 다양한 주제 분야의 연구 성과물을 제공하는 학술DB에서 주제어(Keyword) 정보를 바탕으로 SNA(Social Network Analysis)기법을 적용해 검색어와 연관도가 높은 연관검색어를 제공하는 것을 그 목적으로 한다. 이를 위해 주제어들 간의 가중치(Weight)를 계산한 뒤 Ego Network 분석을 통해 검색어와 연관된 연관주제어를 추출하고 이를 기존 학술DB에서 제공한 연관검색어와 비교 정리하였다. 그리고 정리된 결과를 연관규칙 마이닝기법, 유사계수를 적용해 연관도측면에서 비교 평가하였다.

  • PDF

Conten-Based Image Retrieval Using Wavelet and Texture (Wavelet 변환과 질감 특성을 이용한 내용기반 영상 검색)

  • Lee, Hyun-Woon;Chun, Jun-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2000.04a
    • /
    • pp.1051-1055
    • /
    • 2000
  • 본 연구에서는 내용기반 영상 데이터 검색을 위하여 변환 영역에서 위치 정보와 주파수 정보를 가지는 웨이블릿 성질을 이용하여 객체들의 특징을 추출하는 방안인 Vector Quantization 을 이용한 영상을 검색하는 방안을 제시한다. 내용기반 영상 검색의 주요 특징들은 색상, 질감, 그리고 영상의 공간적인 특징을 고려한 특징 값 등이 사용된다. 이러한 영상의 특징들을 어떻게 결합하고 특징 추출을 하느냐에 따라 검색의 효율성에 영향을 준다. 따라서 본 연구에서는 영상의 위치 정보와 주파수 정보를 가지는 웨이블릿 변환 후 얻어지는 저대역 부밴드에서의 공간적인 특성을 고려한 특징 값을 이용하여 Vector Quantization 알고리즘에 의해 정지영상의 객체 대표 특징들을 빠르게 검색하고자 한다. 본 연구에서는 Haar Wavelet 과 Vector Quantization 에서 색상과 질감의 가중치를 적용하고자 한다.

  • PDF

Searching and Clustering of Textile Images (텍스타일 이미지 검색 및 클러스터링)

  • Kang, Miyeong;Lee, Eunok;Park, Uchang
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.152-154
    • /
    • 2010
  • 본 연구에서는 내용 기반의 텍스타일 이미지 검색 시스템을 구축하였다. 텍스타일 이미지에 대한 색상, 질감, 모양 특성 추출 조합을 각각 혹은 가중치를 이용한 방법으로 검색한다. 검색은 사용자 인터페이스에서 오라클 데이터베이스 시스템에서 제공되는 이미지의 색상, 질감 특성 값에 대한 검색과 결과 피드백을 보면서 진행된다. 또 검색 대상 이미지들을 유사도에 따라 다차원 비례법에 의하여 2차원 화면에 클러스터링하여 전체 이미지의 군집화 특성을 쉽게 파악할 수 있는 기능을 구현하였다.