• 제목/요약/키워드: Exact match

검색결과 76건 처리시간 0.027초

완전 매치와 부분 매치 검색 기법에 관한 연구 ((A Study of an Exact Match and a Partial Match as an Information Retrieval Technique))

  • 김영귀
    • 정보관리학회지
    • /
    • 제7권1호
    • /
    • pp.79-95
    • /
    • 1990
  • 본 연구는 그동안 연구되고 개발된 여러 검색 기법을 검색된 문헌 집합의 특성과 사용된 표현에 의해서 완전 매치 검색과 부분 매치 검색으로 구분하였다. 완전 매치는 부울 논리가 그 대표적이며 현행 대부분의 정보 검색 시스템에서 사용하고 있는 검색 기법이다. 부분 매치는 부울논리가 가지고 있는 문제점과 한계점을 극복하기 위한 대한으로서 많은 연 구가 있었으나 그 본질은 부울 논리 구조안에서 검색을 향상시킨다는 점에서 한계를 가질수 밖에 없다 하겠다. 대표적인 예로 확률 검색, 벡터 공간 모델, 그리고 퍼지 집합을 대상으로 두 검색 기법을 비교하고 앞으로의 검색 기법이 나아가야 할 방향을 제시하였다.

  • PDF

클러스터 세그먼트 인덱스를 이용한 단백질 이차 구조의 효율적인 유사 검색 (Clustered Segment Index for Efficient Approximate Searching on the Secondary Structure of Protein Sequences)

  • 서민구;박상현;원정임
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권3호
    • /
    • pp.251-260
    • /
    • 2006
  • 단백질 일차 구조(아미노산 배열)에 대한 상동 검색은 유전자나 단백질의 기능과 진화 과정을 유추하기 위한 필수 연산이다. 그러나 진화 단계가 멀리 떨어진 경우 단백질 일차 구조는 보존되지 않기 때문에 단백질의 공간적 구조에 대한 유사 검색을 통해서만 진화 단계를 유추할 수 있다. 따라서 본 논문에서는 단백질의 공간적 구조를 표현하는 단백질 이차 구조를 대상으로 하여 RDBMS상에 쉽게 구현이 가능한 인덱싱 방안을 제안한다. 제안된 인덱싱 방안은 클러스터링 기법과 LookAhead 개념을 활용하여 Exact Match, Range Match, Wildcard Match 질의를 신속하게 처리한다. 제안된 방법의 우수성을 검증하기 위하여 실제의 단백질 데이타를 대상으로 성능 평가를 수행하였다. 실험 결과에 의하면, 제안된 방법은 기존의 방법과 비교하여 Exact Match의 경우 6.3배까지, Range Match의 경우 3.3배까지, Wildcard Match의 경우 1.5배까지의 개선된 검색 성능을 가지는 것으로 나타났다.

Quantum-based exact pattern matching algorithms for biological sequences

  • Soni, Kapil Kumar;Rasool, Akhtar
    • ETRI Journal
    • /
    • 제43권3호
    • /
    • pp.483-510
    • /
    • 2021
  • In computational biology, desired patterns are searched in large text databases, and an exact match is preferable. Classical benchmark algorithms obtain competent solutions for pattern matching in O (N) time, whereas quantum algorithm design is based on Grover's method, which completes the search in $O(\sqrt{N})$ time. This paper briefly explains existing quantum algorithms and defines their processing limitations. Our initial work overcomes existing algorithmic constraints by proposing the quantum-based combined exact (QBCE) algorithm for the pattern-matching problem to process exact patterns. Next, quantum random access memory (QRAM) processing is discussed, and based on it, we propose the QRAM processing-based exact (QPBE) pattern-matching algorithm. We show that to find all t occurrences of a pattern, the best case time complexities of the QBCE and QPBE algorithms are $O(\sqrt{t})$ and $O(\sqrt{N})$, and the exceptional worst case is bounded by O (t) and O (N). Thus, the proposed quantum algorithms achieve computational speedup. Our work is proved mathematically and validated with simulation, and complexity analysis demonstrates that our quantum algorithms are better than existing pattern-matching methods.

More Efficient Method for Determination of Match Quality in Adaptive Least Square Matching Algorithms

  • Lee, Hae-Yeoun;Kim, Tae-Jung;Lee, Heung-Kyu
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 1998년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.274-279
    • /
    • 1998
  • For the accurate generation of DEMs, the determination of match quality in adaptive least square matching algorithm is significantly important. Traditionally, only the degree of convergence of a solution matrix in least squares estimation has been considered for the determination of match quality. It is, however, not enough to determine the true match quality. This paper reports two approaches of match quality determination based on adaptive least square correlation : the conventional if-then logic approaches with scene geometry and correlation as additional quality measures; and, the fuzzy logic approaches. Through these, accurate decision of match quality will minimize the number of blunder and maximize the number of exact match. The proposed methods have been tested on JERS and SPOT images and the results show good performance.

  • PDF

염기문자의 빈도와 위치정보를 이용한 DNA 인덱스구조 (A DNA Index Structure using Frequency and Position Information of Genetic Alphabet)

  • 김우철;박상현;원정임;김상욱;윤지희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.263-275
    • /
    • 2005
  • 대규모 DNA 데이타베이스를 대상으로 원하는 서열을 빠르게 검색하기 위해 인덱싱 기법을 많이 사용하고 있다. 그러나 대부분의 인덱싱 기법은 원래 데이타베이스보다 더 큰 저장공간을 사용하고 DBMS와의 밀 결합이 어렵다는 문제점을 가지고 있다. 본 논문에서는 완전 매치, 와일드카드 매치, k-미스매치와 같은 근사 매치 질의 처리를 위해 작은 공간을 사용하는 디스크 기반의 효율적인 인덱싱 기법과 질의 처리 기법을 제안한다 인덱싱을 위해서 DNA 염기서열에 일정 크기의 슬라이딩 윈도우를 위치시킨 후, 윈도우 내에서 각 문자의 출현 빈도를 이용해 서명을 추출해서 R*-트리와 같은 다차원 공간 인덱스에 저장한다. 특히 윈도우 내의 각 위치에 따라서 가중치를 줌으로써 서명들이 인덱스 공간에 집중되는 현상을 억제한다. 제안된 질의 처리방법은 질의 시퀀스를 다차원 사각형으로 변환하고 그 사각형과 중첩되는 서명들을 인덱스로부터 찾아낸다 제안된 방법을 실제 생물학자들이 사용하는 데이타를 이용해 실험한 결과 서픽스 트리 기반의 방법에 비해서 완전 매치인 경우 3배 이상, 와일드카드 매치인 경우 2배 이상, k-미스매치인 경우 수십 배 이상의 성능향상을 보였다.

프리픽스 그룹화를 이용한 병렬 복수 해슁 IP 주소 검색 구조 (A Parallel Multiple Hashing Architecture Using Prefix Grouping for IP Address Lookup)

  • 김혜란;정여진;임창훈;임혜숙
    • 한국통신학회논문지
    • /
    • 제30권3B호
    • /
    • pp.65-71
    • /
    • 2005
  • 라우터의 주요한 기능은 들어오는 패킷의 목적지 IP 주소를 참조하여 패킷을 최종 목적지를 향하여 내 보내는 것이다. 이것을 수행하기 위해서는 주소 검색 과정이 필요하며 이 작업은 모든 패킷에 대해 실시간으로 수행되어야 하므로 라우터의 성능을 결정하는 중요한 요소가 된다. 또한 CIDR(classless inter-domain routing) IP 주소 체계를 도입하게 되면서 라우터에서는 단순 exact 매치가 아니라 가능한 모든 프리픽스 중에 가장 길게 매치하는 프리픽스를 검색하는 longest prefix match가 필요하게 되었다. 이에 따라 IP 주소 검색을 위한 알고리즘 및 구조에 관한 연구가 널리 수행되고 있으며 본 논문에서는 병렬 복수 해슁 (parallel multiple hashing)과 프리픽스 그룹화 (prefix grouping)를 이용하여 한 번의 메모리 접근으로 IP 주소 검색을 수행할 수 있는 효율적인 하드웨어 구조를 제안한다.

MPLS망에서 브로드캐스팅을 위한 포워딩 동일 클래스 (Forwarding Equivalence Class for Broadcasting on MPLS network)

  • 최현경;박창민;김상하
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (3)
    • /
    • pp.386-388
    • /
    • 1998
  • Multiprotocol Label Switching(MPLS)는 기존 인터넷 라우팅에서 사용하는 longest prefix match 방식 대신에 short label exact match 방식을 사용함으로써 더 단순한 고속 포워딩 기술을 제공한다. 또한, 동일한 Forwarding Equivalence Class(FEC)에속하는 플로우들을 합성하여 하나의 레이블을 사용하는 방법 즉, Multipoint-to-point Tree(MPT)를 형성함으로써 확장설을 향상시켰다. 본 논문에선 현재 이슈가 괴고 있는 "IP address prefix"와 "host LSP"의 FEC타입과는 전송방식이 다른 브로드캐스팅을 위한"broadcast"FEC 타입을 제안하였으며, 브로드캐스트 패킷을 전송하는데 있어서 각각의Label Switched Path(LSP)제어 방식을 사용할 경우의 문제점을 분석하고, 유니캐스팅과 브로드캐스팅의 서로 다른 레이블 할당방식으로 인한 레이블 충돌을 해결하기 위해서 레이블 범위를 분류하여 사용하는 방식을 제안한다.해서 레이블 범위를 분류하여 사용하는 방식을 제안한다.

  • PDF

MPLS망에서 IP Multicast 적용 (IP Multicast deployment in an MPLS Environment)

  • 김갑동;박창민;김상하
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 1998년도 추계종합학술대회
    • /
    • pp.354-357
    • /
    • 1998
  • MPLS (Multiprotocol Label Switching)는 인터넷에서 속도, 확장성 그리고 서비스 제공 능력을 향상시키기 위한 백본 네트웍으로 이용하기 위하여 Internet Engineering Task Force (IETF) standard로 급속하게 성장하고 있다. MPLS는 기존의 인터넷 라우팅에서 사용하는 longest prefix match 방식을 이용하는 라우팅 방법 대신에 short label exact match 방식과 L3 forwarding 방법을 사용함으로써 고속 인터넷 서비스 기술을 제공한다. 한편, 기존 인터넷의 IP format을 보면 Host Id, (Address prefix, Host Id), Broadcasting, Multicasting의 네 가지 종류의 구조를 가지고 있다. 그러나 아직 MPLS에서의 멀티캐스트 서비스에 대한 방식이 아직 표준화되고 있지 않고 있는 상황에서, MPLS 서비스 도메인 내에서 멀티캐스트 패킷은 기존의 멀티캐스트 라우팅 프로토콜과 연계되어 MPLS상에서 멀티캐스트 서비스가 이루어져야 한다. 본 논문에서는 기존의 인터넷상에서 제공되어지는 멀티캐스트 IP 플로우들을 MPLS 상에서 수용하기 위한 방식을 제안한다.

  • PDF

플로우 레이블을 지원하는 IPv6라우팅 데몬의 구현 (The Extension of IPv6 Routing Daemon For Using The Flow Label)

  • 김형준;오승현;안종석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (3)
    • /
    • pp.361-363
    • /
    • 2001
  • 본 논문은 IPv6 헤더의 플로우 레이블 필드를 이용한 레이블 포워딩 방법을 제안하고 이 방법을 기반으로 리눅스 운영체제에서 멀티캐스팅 라우팅 레몬과 유니 캐스팅 데몬과 구현하여 레이블 포워딩에 의한 유니 캐스트 및 멀티캐스트 전송을 구현하였다. 레이블을 이용한 포워딩은 라우팅 엔트리를 결정하기 위해 If주소 중 가장 많은 부분이 일치되는 엔트리를 찾는 방법(longest prefix match) 을 기본으로 하는 IP주소정색 방법에 비해, 짧은 레이블 값 전체가 일치하는 엔트리를 찾는 방법 (short label exact match)을 원칙으로 하고있어 상대적으로 빠른 속도로 라우팅 테이블을 검색할 수 있으며, 쉽게 QoS를 제공할 수 있는 구조를 제공한다. 실험을 통해 구현된 레이블 포워딩을 이용한 유니캐스트 및 멀티캐스트 전송이 잘 동작함을 확인하였고, 성능비교 실험을 통해 레이불 포워딩이 일반 IP 검색 포워딩 방법보다 더 좋은 성능을 발휘함을 확인할 수 있다.

  • PDF

스포츠의 공정성과 권력의 탐구 (A research of fairness and power in sport)

  • 김진훈
    • 한국체육학회지인문사회과학편
    • /
    • 제54권5호
    • /
    • pp.581-592
    • /
    • 2015
  • 이 연구는 스포츠에서의 공정성과 권력이 어떻게 형성되고 변화하였는지에 대한 역사적 고찰을 통해서 스포츠에서 공정성에 위배되는 도핑과 승부조작에 대한 문제점들을 인간 욕망의 산물인 권력과의 관계에 대하여 탐구하였다. 첫째, 도핑과 권력의 탐구이다. 도핑의 역사는 스포츠의 역사처럼 오래전부터 존재하였다. 선수들의 약물복용은 자의든 타의든 간에 권력과의 관계를 형성하였는데, 그 중 승리에 따른 부와 명예 그리고 기득권에 대한 유혹과 갈망은 개인, 사회, 국가에 이르기까지 다양하고 폭넓게 자행되었다. 특히 힘의 표현이 냉전시대에서 스포츠에 투영되어 잘 반영되었으며, 이 당시의 잘못된 사고와 관행들이 아직도 도핑과 반도핑의 관계에 대한 본질을 흐리게 하고 있다. 둘째, 승부조작과 권력의 탐구이다. 승부조작 또한 도핑처럼 스포츠의 역사에서 항상 존재해왔다. 스포츠와 공정성의 관계에서 승부조작은 인위적인 결과를 결정하는 것으로 끝나는 것이 아니라 스포츠 도박이나 다른 범죄로 연결되어 문제가 되며, 이는 다시 스포츠로 영향을 미쳐 악순환의 연속이 되게 한다. 이러한 승부조작의 이유에는 권력의 요소인 자본의 형성과 이익을 위한다는 명확한 원인이 형성되어 있어 공정한 스포츠를 더욱 위협하고 있다. 이처럼 스포츠의 공정성과 권력의 관계에서 도핑과 승부조작은 역사적으로 매우 의미가 있으며, 더 많은 연구와 논의가 필요하다. 스포츠의 물질적 가치에 매몰되어 도핑과 승부조작이 아무렇지 않게 용인하거나 묵인되면서 권력의 요소들에 의해서 스포츠 파이만을 키우기만 한다면 마냥 스포츠의 미래가 밝다고만 장담할 수 없다.