• 제목/요약/키워드: Similar information retrieval

검색결과 297건 처리시간 0.027초

의미 정보를 이용한 다차원 데이터 시퀀스의 유사성 척도 연구 (A Study of Similarity Measures on Multidimensional Data Sequences Using Semantic Information)

  • 이석룡;이주홍;전석주
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.283-292
    • /
    • 2003
  • 연속된 일차원 실수로 이루어진 시계열 데이터는 데이터 마이닝이나 데이터 웨어하우징과 같은 다양한 데이터베이스 응용 분야에서 연구되어져 왔다. 그러나 최근의 복잡한 비즈니스 환경에서, 다차원 데이터 시퀀스(multidimensional data sequence : MDS)는 일차원 시계열 데이터와 더불어 그 중요성이 더해가고 있다. 다차원 데이터 시퀀스의 예로써, 비디오 스트림은 색상과 질감 등의 속성들로 이루어진 다차원 공간상에서 MDS로 나타낼 수 있다. 본 논문에서는 패턴 유사성 검색에서 사용되는 효과적인 유사성 척도를 제시한다. 하나의 MDS는 여러 개의 세그먼트(segment)로 나누어지며, 각 세그먼트는 다양한 의미적인 특징들로 표현된다. 유사성 척도는 이러한 세그먼트에 대해서 정의되는데 이 척도를 사용하여 어떤 주어진 질의 시퀀스에 대하여 무관한 세그먼트들은 검색 대상에서 일차적으로 제외된다. 데이터 시퀀스와 질의 시퀀스 모두 세그먼트 단위로 분할되며, 질의 처리는 전체 시퀀스의 모든 데이터를 검색하지 않고 데이터 세그먼트와 질의 세그먼트의 특징을 비교하는 것을 기초로 하여 수행된다.

JCBP : 사례 기반 계획 시스템 (JCBP : A Case-Based Planning System)

  • 김인철;김만수
    • 지능정보연구
    • /
    • 제14권4호
    • /
    • pp.1-18
    • /
    • 2008
  • 사례 기반 계획 시스템은 과거의 유사한 사례 계획들을 이용함으로써 새로운 문제를 위한 계획을 효율적으로 생성 할 수 있다. 하지만 대부분의 기존 사례 기반 계획 시스템들은 사례 검색 및 사례 일반화를 위한 제한적 기능들만을 제공할 뿐만 아니라, 계획 생성과정에 사용자의 참여를 허용하지 않는다. 본 논문에서 제안하는 JCBP 시스템은 효율적인 메모리 사용과 사례 검색을 위해 각 도메인의 동일한 작업 목표를 가진 사례들을 개별 사례 베이스로 그룹화하고, 이들에 대한 색인을 유지한다. 또 이 시스템은 문제모델로부터 자동으로 추출한 휴리스틱 지식을 사례 적응 단계에 이용하며, 목표 회귀를 통한 사례 일반화 기능도 제공한다. 또한 JCBP 시스템은 대화형 모드를 통한 혼합 주도 계획 생성 기능도 제공한다. 이와 같이 JCBP 시스템은 문제 해결을 위해 사용자의 기호와 지식을 이용함으로써 사용자의 요구를 더 잘 만족하는 해 계획을 생성할 수 있을 뿐 아니라 계획 생성의 복잡도도 줄일 수 있다.

  • PDF

역인덱스 기반 상향식 군집화 기법을 이용한 대규모 학술 핵심어 분석 (Analysis of Massive Scholarly Keywords using Inverted-Index based Bottom-up Clustering)

  • 오흥선;정유철
    • 한국산학기술학회논문지
    • /
    • 제19권11호
    • /
    • pp.758-764
    • /
    • 2018
  • 특허(patent), 학술 논문(scholarly paper)과 연구 보고서(research report)와 같은 디지털 문서(digital document)에는 주제(topic)를 요약하는 저자 키워드(author keyword)가 있다. 서로 다른 문서가 동일한 키워드를 공유하고 있다면 두 문서가 동일한 주제의 내용을 기술하고 있을 가능성이 매우 높다. 문서 군집화(document clustering)는 비슷한 주제를 가지는 문서들을 비지도 학습 방법(unsupervised learning)을 이용하여 같은 군집으로 그룹(group)화 하는 것이다. 문서 군집화는 다양한 분석에 이용되지만 대용량의 문서 데이터에 적용하기 위해서는 많은 계산량이 필요함으로 쉽지 않다. 이러한 경우, 문서의 내용을 이용하는 것보다 문서의 키워드를 이용하여 군집화하면 더욱 효율적으로 대용량의 데이터를 연결할 수 있다. 기존의 상향식 군집화 방법(bottom-up hierarchical clustering)은 대용량의 키워드 군집화(keyword clustering)를 수행하는데 있어서 많은 시간이 필요하다는 문제점이 있다. 본 논문에서는 정보검색(information retrieval)에서 널리 사용되는 역인덱스(inverted-index) 구조를 상향식 군집화에 적용한 효율적인 군집화 방법을 제안하고, 제안 방법을 대용량의 키워드 데이터에 적용하였으며, 그 결과를 분석하였다.

COST ESTIMATE AT EARLY STAGE USING CASE-BASED REASONING

  • Kihoon Seong;Moonseo Park;Hyun-Soo Lee;Sae-Hyun Ji
    • 국제학술발표논문집
    • /
    • The 3th International Conference on Construction Engineering and Project Management
    • /
    • pp.883-889
    • /
    • 2009
  • The importance of cost estimate in early stage such has been increasing due to market change and severe competition in construction industry. Because the adjustable budget is only 20% after design stage, most of the crucial decisions to influence cost is made in the early stage. However, in the early stage, the project scope is not defined completely so that estimator has inaccurate information to make critical decision. Therefore, this research suggests the cost estimate method using case-based reasoning. Case-based reasoning is appropriate for the early cost estimating, as it has the strength of rapidity and convenience in cost estimation. This research analyzes 84 actual data of public apartment on the scale of 11~15 stories. In order to extract the most similar case, at the first step this research identifies influence factors and calculates attribute similarity. In case-based reasoning, the most challenging task is determining attribute weight. At the third step, this research calculates case similarity which is aggregated attribute similarity multipled by attribute weight. Finally, extracts the most similar case which has the highest score of case similarity.

  • PDF

다중 해상도 에지 정합을 이용한 임의물체 검색 시스템의 설계 및 구현 (A Design and Implementation of Arbitrary Retrieval System Using Multi-resolution Edge Mathcing)

  • 이강호;안용학
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.95-102
    • /
    • 2004
  • 본 논문에서는 작은 형태정보의 차이를 감지할 수 있고 부분적인 입력 패턴도 효과적으로 검색할 수 있는 윤곽선 정보를 기반으로 하는 GHT와 다중 해상도 검색 방법을 제안한다. 제안된 방법은 부분적인 에지 정보를 효율적으로 사용할 수 있고 작은 형태변화를 구분할 수 있어서 도검과 같은 유사한 물체를 효과적으로 구분할 수 있다. 또한, 에지 리스트를 이용한 다중 해상도 에지 생성과 계층적인 패턴 정합을 통해서 신속하고 정확한 검색을 가능하게 한다. 실험 결과, 제안된 방법은 도검과 같은 임의 물체에 대해 높은 검색율을 보였다.

  • PDF

ETLARS 시스템에서의 데이터베이스 설계 및 생성에 관한 연구 (Database design and production in ETLARS system)

  • 김상도;박계숙;김희섭;홍기채;우동진;기민호
    • 정보관리학회지
    • /
    • 제11권2호
    • /
    • pp.165-184
    • /
    • 1994
  • DB 구축 과정은 데이터 분석, DB 설계, 소스 데이터 입력, 데이터 변환 및 로드, DB 유지 보스 등의 일련의 과정을 포함한다. DB 구축을 위한 데이터 입력 및 DB 생성 S/W의 개발 및 운영에 관한 기술은 컴퓨터 환경이나 정보 검색 시스템의 기능에 따라 다소 차이가 있을 수 있으나 대체로 유사하다고 볼 수 있다. 따라서 본 고에서는 한글 DB의 구축 및 운영 사례로서 국내 6,000 가입자 ('94년 10월초 현재)를 대상으로 전자통신 분야의 전문적인 기술 정보 DB 12종을 서비스 하고 있는 한국전자통신연구소의 ETLARS 한글 정보검색 시스템에서의 데이터 입력 및 DB 생성 S/W를 소개하고자 한다.

  • PDF

웹 뉴스의 기사 추출과 요약 (Text Extraction and Summarization from Web News)

  • 한광록;선복근;유형선
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권5호
    • /
    • pp.1-10
    • /
    • 2007
  • 뉴스 콘텐츠 등 웹을 통해 제공되는 많은 정보들은 불필요한 클러터를 많이 포함하고 있다. 이러한 클러터들은 문서의 요약, 추출, 검색과 같은 자동화된 정보처리 시스템의 구축을 어렵게 한다. 본 논문에서는 웹 뉴스 콘텐츠를 추출하고 이를 요약하는 시스템을 구축하고자 한다. 추출 시스템은 HTML로 된 뉴스 콘텐츠를 입력받아 DOM 트리와 유사한 요소 트리를 구축하며, 이 요소 트리에서 HTML 태그의 하이퍼링크 속성을 갖는 클러터를 제외하면서 본문을 추출한다. 추출 시스템을 통해 추출된 본문은 요약시스템으로 전달되어 핵심 문장이 추출된다. 요약 시스템은 공기관계 그래프를 이용하여 구성한다. 본 논문에서 구현한 시스템을 통해 추출된 요약 문장은 SMS와 같은 메시지 서비스를 통하여 PDA이나 모바일 폰 등에 전송될 수 있을 것으로 기대된다.

  • PDF

Descriptor 조합 및 동일 병명 이미지 수량 역비율 가중치를 적용한 유사도 기반 작물 질병 검색 기술 설계 및 구현 (Design and Implementation of a Similarity based Plant Disease Image Retrieval using Combined Descriptors and Inverse Proportion of Image Volumes)

  • 임혜진;정다운;유성준;구영현;박종한
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권6호
    • /
    • pp.30-43
    • /
    • 2018
  • 영상의 특징인 색상, 모양, 질감 등을 이용해 영상을 검색하는 연구들은 많이 진행되어 왔다. 또한 작물의 질병 영상과 관련된 연구들도 진행되고 있다. 농업 현장에서 재배되는 작물에 발생한 질병을 확인하는데 도움이 되기 위해 본 논문에서는 시설원예 작물의 질병 영상을 이용한 유사도 기반 작물 질병 검색 시스템을 제안한다. 제안하는 시스템은 단일 Descriptor를 사용하지 않고, 조합 Descriptor를 통해 기존 대비 영상의 유사도 검색 성능을 높였고 유사도 검색 결과를 가독성 높게 사용자에게 제공하기 위해 가중치 기반 산출방법을 적용했다. 본 논문에서는 총 13개의 개별 Descriptor를 이용해 조합을 진행했다. 조합 Descriptor를 이용해 6개 작물의 질병에 대해 유사도 검색을 진행했고 작물별로 평균 accuracy가 높은 조합 Descriptor를 선정해 유사도 검색에 사용했다. 검색된 결과는 병명의 비율을 기반으로 한 산출방법과 가중치를 기반으로 한 산출방법을 사용해 백분율로 나타냈다. 병명의 비율을 기반으로 한 산출방법은 질의 영상과 유사도 검색에 사용되는 영상의 수가 많은 병명이 1순위로 출력되는 문제점이 있다. 이를 해결하기 위해 가중치를 기반으로 한 산출방법을 사용했다. 작물의 병명별 테스트 영상을 두 가지 산출방법에 적용해 검색 성능을 측정했다. 작물의 질병별로 두 가지 산출방법에 대해 검색 성능 값의 평균을 비교한 결과 고추, 사과 작물에서는 병명의 비율을 기반으로 한 산출방법의 성능이 가중치를 기반으로 한 산출방법의 성능보다 평균 약 11.89%의 높은 성능 결과를 보였다. 국화, 딸기, 배, 포도 작물에서는 가중치를 기반으로 한 산출방법이 병명의 비율을 기반으로 한 산출방법의 성능보다 평균 약 20.34%의 높은 성능 결과를 보였다. 또한 본 논문에서 제안하는 시스템의 UI/UX는 실제 사용자의 피드백을 통해 편리하게 구성했다. 시스템의 화면마다 상단에 제목과 설명을 출력했고 사용자가 질병의 정보를 보기 편리하게 화면을 구성했다. 검색된 질병의 정보는 위에서 제안한 산출방법을 토대로 유사한 질병의 영상과 병명을 출력한다. 시스템의 환경은 PC 환경 기반의 웹 브라우저와 모바일 디바이스 환경 기반의 웹 브라우저를 통해 사용할 수 있도록 구현했다.

칼라 분할 방식을 이용한 비디오 영상에서의 움직이는 물체의 검출과 추적 (Moving Object Tracking Method in Video Data Using Color Segmentation)

  • 이재호;조수현;김회율
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 하계종합학술대회 논문집(4)
    • /
    • pp.219-222
    • /
    • 2001
  • Moving objects in video data are main elements for video analysis and retrieval. In this paper, we propose a new algorithm for tracking and segmenting moving objects in color image sequences that include complex camera motion such as zoom, pan and rotating. The Proposed algorithm is based on the Mean-shift color segmentation and stochastic region matching method. For segmenting moving objects, each sequence is divided into a set of similar color regions using Mean-shift color segmentation algorithm. Each segmented region is matched to the corresponding region in the subsequent frame. The motion vector of each matched region is then estimated and these motion vectors are summed to estimate global motion. Once motion vectors are estimated for all frame of video sequences, independently moving regions can be segmented by comparing their trajectories with that of global motion. Finally, segmented regions are merged into the independently moving object by comparing the similarities of trajectories, positions and emerging period. The experimental results show that the proposed algorithm is capable of segmenting independently moving objects in the video sequences including complex camera motion.

  • PDF

효과적인 수학 그래프 저작 시스템 (Effective Graph Drawing Tool for Mathematics Education)

  • 오영택;김용준;김명수
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.422-427
    • /
    • 2009
  • 본 논문에서는 수학 교육을 위한 실시간 그래프 저작 시스템을 제안한다. 사용자는 대략적인 스케치를 통해 의도하는 그래프를 쉽게 그릴 수 있으며 실제 수학 교육에서 필요한 부가적인 정보 역시 쉽게 포함시킬 수 있다. 이와 더불어, 본 논문에서는 복잡한 그래프를 쉽게 그리기 위해 이미 그려져 있는 그래프 중 현재 그리고 있는 그래프와 가장 유사한 그래프를 찾아서 후보로 제시하는 방법을 제안한다.

  • PDF