• Title/Summary/Keyword: 유사도 질의

Search Result 1,856, Processing Time 0.032 seconds

Efficient Time-Series Subsequence Matching Using Index Interpolation (인덱스 보간법을 이용한 효율적인 시계열 서브시퀀스 매칭)

  • Lim Seung-Hwan;Ko Hyun-Gil;Loh Woong-Kee;Kim Sang-Wook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2004.11a
    • /
    • pp.31-34
    • /
    • 2004
  • 서브시퀀스 매칭은 시계열 데이터베이스에서 질의 시퀀스와 유사한 서브시퀀스틀 찾아내는 연산이다. 기존의 서브시퀀스 매칭 알고리즘들은 하나의 인덱스만을 사용하여 검색을 수행하기 때문에, 인덱스를 생성하기 위하여 데이터 시퀀스로부터 추출한 윈도우의 크기와 질의 시퀀스의 길이 간의 차이가 커질수록 검색 성능이 급격히 저하되는 문제점을 갖고 있다. 본 논문에서는 이러한 기존 알고리즘의 문제점을 해결하기 위하여 인덱스 보간법에 기반한 새로운 서브시퀀스 매칭 기법을 제안한다. 인덱스 보간법이란 하나 이상의 인덱스를 구축하고 주어진 질의 시퀀스의 길이에 따라 적절한 인덱스를 선택하여 검색을 수행하는 기법이다. 본 논문에서는 서브시퀀스 매칭 비용 공식을 산출하고, 이 비용 공식에 기반하여 제안된 기법의 성능을 최적화 하도록 다수의 인덱스를 구성하는 알고리즘을 제시한다. 마지막으로, 실제 데이터를 이용한 여러 가지 실험을 통하여 제안된 기법의 우수성을 정량적으로 검증한다.

  • PDF

A Multimedia Database System using Method of annotation-based retrieval (주석 기반 검색 기법을 이용한 멀티미디어 데이터베이스 시스템)

  • Cho, Kyung-Mo
    • Proceedings of the KAIS Fall Conference
    • /
    • 2010.05a
    • /
    • pp.319-322
    • /
    • 2010
  • 본 논문에서는 특징기반 검색을 이용하여 대용량의 비디오 데이터에 대한 사용자의 다양한 의미검색을 지원하는 에이전트 기반에서의 자동화되고 통합된 비디오 의미기반 검색 시스템을 제안한다. 사용자의 기본적인 질의를 분석하고 질의에 의해 추출된 키 프레임의 이미지를 사용자가 선택함으로써 인덱싱 에이전트는 추출된 키 프레임의 주석에 대한 의미를 더욱 구체화시킨다. 또한, 사용자에 의해 선택된 키 프레임은 특징기반 검색의 질의 이미지가 되고 인덱싱 에이전트는 제안하는 다중 분할 칼라 히스토그램 기법을 통해 질의 이미지와 데이터베이스의 키 프레임들을 비교한 후 가장 유사한 키 프레임 이미지를 검색하여 사용자에게 디스플레이한다. 제안하여 구현된 시스템은 현저히 향상된 성능을 보였다.

  • PDF

A Query Indexing Method for Filtering Event Data in RFID Middleware Systems (RFID 미들웨어에서 이벤트 필터링을 위한 질의 색인 기법)

  • Seok, Su-Wook;Park, Jae-Kwan;Hong, Bong-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.19-21
    • /
    • 2005
  • EPCglobal은 RFID와 관련된 다양한 분야의 표준화를 주도하고 있으며 응용 표준으로써 Tag 정보의 운용을 위한 미들웨어 표준인 ALE Specification을 제시하였다. ALE의 ECSpec은 애플리케이션이 미들웨어에 등록하는 이벤트 필터링을 위한 스펙으로써 일정 시간동안 반복적으로 수행되는 연속 질의와 유사한 특성을 가진다. ECSpec을 연속질의로 변환할 때 해당질의의 WHERE절이 가지는 Predicate는 매우 긴 길이를 가지는 Long Interval이 된다. 이러한 특성은 기존의 질의 색인들의 삽입과 검색 성능을 저하시키는 문제점을 가진다. 이 논문에서는 ECSpec을 연속 질의의 형태로 변환하고 해당 질의가 기지는 Predicate인 2D Interval의 특성을 반영한 새로운 질의 색인 구조로써 TLC-Index를 제안한다. 색인 구조는 그리드 방식의 큰 크기를 가지는 셀 분할 구조와 선분 모양의 가상 분할 구조를 병행하는 하이브리드 구조이다. 색인에서 Long Interval의 정의는 셀 분할 구조의 길이보다. 크거나 같은 길이를 가지는 interval이다. 제안하는 색인은 Long Interval을 큰 크기를 가지는 셀 분할 구조로 분할 삽입함으로써 저장 공간의 소모를 줄이고 삽입 성능을 향상시킨다. 또한 Short Interval들을 짧은 길이를 가지는 가상 분할 구조들로 분할 삽입함으로써 그리드 방식이 가질 수 있는 부분적 겹침을 제거하여 검색 성능을 향상시킨다.

  • PDF

Improved Query By Sketch Method for Contents-Based Retrieval (내용 기반 검색을 위한 향상된 스케치 질의 방법)

  • Ha Myung-Hwan;Jung Byung-Hee;Kim Hee-Jung;Lim Mi-Young;Kim Hyoung-Joon;Kim Whoi-Yul Yura
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2003.11a
    • /
    • pp.275-278
    • /
    • 2003
  • 디지털 콘텐츠의 증가에 따라 이들의 효율적인 검색과 관리를 위하여 내용 기반 검색에 관한 많은 연구가 이루어지고 있다. 이러만 내용 기반 검색의 질의 방법으로는 유사한 영상을 질의의 사용하는 QBE(Query By Example)와 영상을 사용자가 직접 스케치하여 질의에 사용하는 QBS(Query By Sketch)가 대표적이다. 본 논문서는 질의로 용할 정확한 영상이 필요한 QBE 방법의 제약과 질의할 영상 전체를 처음부터 스케치해야 하는 QBS 방법의 문제점을 보완하는 개선된 질의 방법을 제안한다. 제안하는 방법은 입력 영상을 단순화하여 스케치의 근간이 되는 밑그림을 제공하고 사용자치 수정 과정을 거쳐 질의하는 방법으로 정확한 검색 결과와 검색 시 소요되는 시간과 노력을 절감할 수 있는 장점이 있다.

  • PDF

Numerical Analysis of the Turbulent Flow through an Oil-Grit Separator (3차원 모형을 이용한 유류-유사분리기내에서의 난류흐름해석)

  • Lee, Jin-Woo;Lee, Seung-Oh;NamGung, Don;Cho, Yong-Sik
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2007.05a
    • /
    • pp.1254-1257
    • /
    • 2007
  • 본 연구에서는 유류-유사 분리기내에서 유체의 흐름거동을 상용 3차원 수치모형인 FLOW-3D를 이용하여 해석하였다. 유류-유사 분리기는 도심지의 우수로 인한 유출발생시 동반되는 이물질을 여과시키는 기능을 가진 지하구조물이다. 우수로 인한 유출이 발생하여 유류-유사 분리기내로 흘러들어오는 유입수는 3차원적 거동을 하고 다양한 흐름특성을 갖는다. 따라서, 분리기내에서의 흐름거동을 정확히 해석하는데 많은 어려움이 있다. 본 연구에서는 정류판(baffle)과 유류흡착기(oil skimmer)로 구성된 유류-유사 분리기에서의 유류와 유사를 포함하고 있는 유출수의 복잡한 거동을 해석하기 위해 수치모의를 실시하였다. 유류와 유사에 대한 포착률(oil and grit trap)은 유류-유사 분리기내에서 유체의 흐름거동과 관계된다. 따라서, 본 연구에서는 유류와 유사의 포착률을 향상시키기 위한 수치모의의 기초적인 단계로서 유류-유사 분리기내에서 유류흡착기(oil skimmer)를 설치한 경우와 설치하지 않은 경우에 대한 유체의 흐름거동을 FLOW-3D를 이용하여 3차원 수치모의를 실시하였다. 수치모의를 통해 유류흡착기의 유무에 따른 유류-유사 분리기내에서의 흐름거동을 알 수 있었으며, 유류흡착기를 설치한 경우엔 유류 흡착기에 의해 여과될 수 있는 유류와 유사에 대한 각각의 포획률이 높아짐을 알 수 있었다.

  • PDF

Cost-based Optimization of Extended Boolean Queries (확장 불리언 질의에 대한 비용 기반 최적화)

  • 박병권
    • Journal of the Korean Society for information Management
    • /
    • v.18 no.3
    • /
    • pp.29-40
    • /
    • 2001
  • In this paper, we suggest a query optimization algorithm to select the optimal processing method of an extended boolean query on inverted files. There can be a lot of methods for processing an extended boolean query according to the processing sequence oh the keywords con tamed in the query, In this sense, the problem of optimizing an extended boolean query it essentially that of optimizing the keyword sequence in the query. In this paper, we show that the problem is basically analogous to the problem of finding the optimal join order in database query optimization, and apply the ideas in the area to the problem solving. We establish the cost model for processing an extended boolean query and develop an algorithm to filled the optimal keyword-processing sequence based on the concept of keyword rank using the keyword selectivity and the access costs of inverted file. We prove that the method selected by the optimization algorithm is really optimum, and show, through experiments, that the optimal method is superior to the others in performance We believe that the suggested optimization algorithm will contribute to the significant enhancement of the information retrieval performance.

  • PDF

Prediction of Protein Secondary Structure Using the Weighted Combination of Homology Information of Protein Sequences (단백질 서열의 상동 관계를 가중 조합한 단백질 이차 구조 예측)

  • Chi, Sang-mun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.20 no.9
    • /
    • pp.1816-1821
    • /
    • 2016
  • Protein secondary structure is important for the study of protein evolution, structure and function of proteins which play crucial roles in most of biological processes. This paper try to effectively extract protein secondary structure information from the large protein structure database in order to predict the protein secondary structure of a query protein sequence. To find more remote homologous sequences of a query sequence in the protein database, we used PSI-BLAST which can perform gapped iterative searches and use profiles consisting of homologous protein sequences of a query protein. The secondary structures of the homologous sequences are weighed combined to the secondary structure prediction according to their relative degree of similarity to the query sequence. When homologous sequences with a neural network predictor were used, the accuracies were higher than those of current state-of-art techniques, achieving a Q3 accuracy of 92.28% and a Q8 accuracy of 88.79%.

Efficient Time-Series Subsequence Matching using Duality in Constructing Windows (윈도우를 구성하는 방법의 이원성을 이용한 효율적인 시계열 서부시퀀스 매칭)

  • Mun, Yang-Se;No, Ung-Gi;Hwang, Gyu-Yeong
    • Journal of KIISE:Databases
    • /
    • v.28 no.1
    • /
    • pp.15-30
    • /
    • 2001
  • 서브시퀀스 매칭은 질의 시퀀스와 유사한 서브시퀀스를 가지는 데이터 시퀀스와 해당 서브시퀀스의 위치를 찾는 문제이다. 본 논문에서는 윈도우를 구성하는 방법의 이원성을 이용한 새로운 서부시퀀스 매칭 방법인 Dual-Match는 윈도우를 구성하는 방법에 있어서 Faloutsos 등이 사용한 방법(간단히 FRM 이라한다)의 이원적 접근법이다. 즉, FRM에서는 데이터 시퀀스를 슬라이딩 윈도우로 나누고 질의 시퀀스를 디스조인트 윈도우로 나누는 방법을 사용한 반면, Dual-Match에서는 데이터 시퀀스를 디스조이트 윈도우로 나누고 질의 시퀀스를 슬라이딩 윈도우로 나누는 방법을 사용한다. FRM은 색인에 필요한 저장공간을 줄이기 위하여 개별 점 대신 최소 포함 사각형만을 저장함으로 인하여 많은 착오해답(유사하지 않은 후보 서브시퀀스)을 발생시켰다. Dual-Match는 FRM과 비슷한 크기의 저장공간에 개별 점을 직접 저장함으로써 이 문제를 해결한다. 실험결과, Dual-Match는 많은 경우에 있어서 FRM에 비하여 후보 개수를 크게 줄이고 성능을 향상시켰다. 특히, 선택률이 낮은 경우($10^{-4}$이하)에는 후보 개수를 최대 8800배 까지 줄이고, 페이지 액세스 횟수를 최대 26.9배까지 줄였으며, 성능을 최대 430배까지 향상시켰다. 또한, 동일한 크기의 색인을 생성하는데 있어서 Dual-Match는 FRM보다 4.10~25.6배 빠르게 색인을 구성하였다. 이는 색인 구성시에 CPU 오버헤드의 많은 부분을 차지하는 저차원 변환의 횟수를 FRM에 비해 크게 줄이기 때문이다. 이 같은 결과로 볼 때, Dual-Match는 대용량 데이터베이스에 대한 서부시퀀스 매칭의 성능을 크게 향상시킬 수 있는 획기적인 연구 결과라 믿는다.

  • PDF

Malignant Melanoma of the Vagina: A Report of 2 Cases (질의 원발성 악성 흑색종: 증례보고)

  • Kim, Ok-Bae;Kim, Jin-Hee;Jung, Young-Yeon;Cho, Chi-Heum;Choi, Tae-Jin
    • Radiation Oncology Journal
    • /
    • v.23 no.2
    • /
    • pp.111-115
    • /
    • 2005
  • Primary malignant melanoma of the vagina is an extremely rare genital neoplasm occurring mainly on postmenopausal women. It has a worse prognosis than cutaneous melanomas, because of the high rate of loco-regional recurrences and rapid systemic dissemination. In the past, radical surgical extirpation as the primary management had been recommended to improve loco-regional control, and possibly overall survival. However, the prognosis was poor In spite of such a radical approache. Recently, more conservative treatment such as wide local excision combined with adjuvant high-dose fraction radiotherapy seems to have premising results. Primary radiation therapy could be served as an alternative to surgery for patients with lesion less than 3 cm in diameter. We report 2 cases of primary vaginal malignant melanoma treated with radiotherapy.

A Study on Clustering Query-answer Documents with Structural Features (문서구조를 이용한 질의응답문서 클러스터링에 관한 연구)

  • Choi, Sang-Hee
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.39 no.4
    • /
    • pp.105-118
    • /
    • 2005
  • As the number of users who ask and give answers in the query-answer documents retrieval system is growing exponentially, the query-answer document become a crucial information resource, as a new type of information retrieval service. A query-answer document Consists of three structural parts : a query, explanation on query, and answers Chosen by users who asked the query. To identify the role of each structural part in representing the topics of documents, the three structural parts were clustered automatically and the results of several clustering tests were compared in this study.