• 제목/요약/키워드: 트리비교

검색결과 987건 처리시간 0.029초

시맨틱 구문 트리 커널을 이용한 생명공학 분야 전문용어간 관계 식별 및 분류 연구 (A Study on the Identification and Classification of Relation Between Biotechnology Terms Using Semantic Parse Tree Kernel)

  • 최성필;정창후;전홍우;조현양
    • 한국문헌정보학회지
    • /
    • 제45권2호
    • /
    • pp.251-275
    • /
    • 2011
  • 본 논문에서는 단백질 간 상호작용 자동 추출을 위해서 기존에 연구되어 높은 성능을 나타낸 구문 트리 커널을 확장한 시맨틱 구문 트리 커널을 제안한다. 기존 구문 트리 커널의 문제점은 구문 트리의 단말 노드를 구성하는 개별 어휘에 대한 단순 외형적 비교로 인해, 실제 의미적으로는 유사한 두 구문 트리의 커널 값이 상대적으로 낮아지는 현상이며 결국 상호작용 자동 추출의 전체 성능에 악영향을 줄 수 있다는 점이다. 본 논문에서는 두 구문 트리의 구문적 유사도(syntactic similarity)와 어휘 의미적 유사도(lexical semantic similarity)를 동시에 효과적으로 계산하여 이를 결합하는 새로운 커널을 고안하였다. 어휘 의미적 유사도 계산을 위해서 문맥 및 워드넷 기반의 어휘 중의성 해소 시스템과 이 시스템의 출력으로 도출되는 어휘 개념(WordNet synset)의 추상화를 통한 기존 커널의 확장을 시도하였다. 실험에서는 단백질 간 상호작용 추출(PPII, PPIC) 성능의 심층적 최적화를 위해서 기존의 SVM에서 지원되던 정규화 매개변수 외에 구문 트리 커널의 소멸인자와 시맨틱 구문 트리 커널의 어휘 추상화 인자를 새롭게 도입하였다. 이를 통해 구문 트리 커널을 적용함에 있어서 소멸인자 역할의 중요성을 확인할 수 있었고, 시맨틱 구문 트리 커널이 기존 시스템의 성능향상에 도움을 줄 수 있음을 실험적으로 보여주었다. 특히 단백질 간 상호작용식별 문제보다도 비교적 난이도가 높은 상호작용 분류에 더욱 효과적임을 알 수 있었다.

RMESH구조에서 unaligned 선형 사진트리의 alignment를 위한 상수시간 알고리즘 (Constant Time Algorithm for Alignment of Unaligned Linear Quadtrees on RMESH)

  • 김경훈;우진운
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권1_2호
    • /
    • pp.10-18
    • /
    • 2004
  • 계층적 자료구조인 사진트리는 이진 영상을 표현하는데 매우 중요한 자료구조이다. 사진트리를 메모리에 저장하는 방법 중 선형사진트리 표현 방법은 다른 표현 방법과 비교할 때 저장 공간을 매우 효율적으로 절약할 수 있는 이점이 있기 때문에 사진트리와 관련된 연산의 수행을 위해 선형 사진트리를 사용하는 효율적인 알고리즘 개발에 맡은 연구가 진행되어 왔다. Unaligned 선형 사진트리의 연산은 기준점이 서로 다른 선형 사진트리들 사이의 연산으로 선형 이동이나 회전시킨 영상을 효율적으로 처리할 수 있으며, 선형 사진트리의 alignment를 필요로 한다. 본 논문에서는 RMESH(Reconfigurable MESH) 구조에서 3-차원 $n{\pm}n{\pm}n$ 프로세서를 사용하여 unaligned 선형 사진트리의 alignment를 효율적으로 수행하는 알고리즘을 제안한다. 이 알고리즘은 $n{\pm}n{\pm}n$ RMESH의 계층구조에서 선형 사진트리의 위치코드들을 효율적으로 전송할 수 있는 기본적인 연산들을 이용함으로써 상수 시간의 시간 복잡도를 갖는다.

IP 멀티캐스팅을 위한 센트로이드 기반의 백본코아트리 생성 알고리즘 ((A Centroid-based Backbone Core Tree Generation Algorithm for IP Multicasting))

  • 서현곤;김기형
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권3호
    • /
    • pp.424-436
    • /
    • 2003
  • 본 논문에서는 공유 트리에 기반에서 IP 멀티캐스팅을 위한 센트로이드 기반 백본코아트리 (Centroid-based Backbone Core Tree: CBCT) 생성 알고리즘을 제안한다 코아기반트리(Core Based Tree: CBT)는 공유 트리를 이용하여 멀티캐스트 자료를 전달하는 것으로 소스 기반 트리에 비하여 각 라우터가 유지해야 하는 상태 정보의 양이 적고, 적용하기 간단한 장점을 가지고 있지만, 코아 라우터(Core router) 선택이 어렵고, 멀티캐스트 트래픽이 코아로 집중되는 문제점을 가지고 있다. 백본코아트리(Backbone Core Tree: BCT)는 CBT의 단점을 보완하기 위해 제안되었다. BCT는 각 멀티캐스트 그룹마다 특정한 코아 라우터를 선정하지 않는 대신 코아라우터 후보들을 백본코아트리(BCT)로 연결하고, 이 트리를 통하여 코아라우터 후보들이 서로 협동하므로써 위의 두 가지 문제점을 해결한다. 이때 BCT를 어떻게 구성하는가에 따라 멀티캐스트 성능이 크게 변하게 된다. 본 논문에서는 백본코아라우터 후보들 및 이들을 연결하는 BCT를 생성하기 위해 네트워크의 최소 신장 트리와 센트로이드를 이용하는 효율적인 알고리즘 CBCT를 제시한다. 제안된 알고리즘의 성능평가를 위해서 CBT와 CBCT 프로토콜의 성능비교 결과를 보인다.

트리패턴매칭기법의 재목적 가능한 중간코드 최적화 시스템 (Retargetable Intermediate Code Optimization System Using Tree Pattern Matching Techniques)

  • 김정숙;오세만
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2253-2261
    • /
    • 1999
  • ACK에서는 패턴 테이블 생성기와 핍홀 최적화기에서 스트링 패턴 매칭 기법을 이용하여 EM 중간 코드에 대한 최적화 코드를 생성한다. 하지만 이 스트링 패턴 매칭 방법은 패턴 결정 시에 반복적으로 많은 비교 동작이 이루어지므로 비효율적이다. 본 논문은 ACK의 중간 코드 최적화기를 개선하기 위해 EM 트리 생성기, 최적화 패턴 테이블 생성기, 트리 패턴 매칭기로 구성된 트리 패턴 매칭 알고리즘을 이용한 EM 중간 코드 최적화 시스템을 설계하고 구현하였다. 이러한 트리 패턴 매칭 알고리즘은 EM 트리를 하향식으로 순회하면서 트리 구조를 가진 패턴 테이블을 참조하여 루트 노드를 중심으로 패턴 매칭을 수행한다. 트리 패턴 매칭 동작은 궁극적으로 ACK의 스트링 패턴 매칭에 비해 최적화 패턴을 찾는데 걸리는 시간을 평균 10.8% 감소시킬 수 있는 효과를 보였다.

  • PDF

점진적 속성문법을 위한 효과적인 최적화 알고리즘에 관한 연구 (A study on the effectively optimized algorithm for an incremental attribute grammar)

  • 장재춘;안희학
    • 정보처리학회논문지A
    • /
    • 제8A권3호
    • /
    • pp.209-216
    • /
    • 2001
  • 복잡한 언어 처리에 점진적 속성 문법을 적용하기 위해서는 최적화 알고리즘을 사용하는 것이 효과적이다. 점진적 속성문법의 최적화 알고리즘에서는 새로운 입력 속성 트리가 기존 입력 속성 트리와 정확히 비교되어서 새로운 속성 트리를 구성할 대 기존 속성 트리의 어떤 서브트리를 사용해야 하는가를 결정한다. 본 논문에서는 Carle과 Pollock에 의해 제안된 알고리즘을 분석하여 효과적인 최적화 알고리즘으로 재구성하고, 새로은 속성 트리 d'copy의 생성 과정과, 속성트리 d'copy의 새로운 최적화 알고리즘을 추가하였다. 이 논문에서 제안한 매칭 알고리즘의 성능평가를 통하여 기존의 알고리즘 보다 제안한 최적화 알고리즘의 실행 시간을 약 19.5% 향상 시킬 수 있었다.

  • PDF

수량적 접근 방법에 의한 이진 검색 트리 불균형도에 따른 검색 성능 비교 분석 (Quantitative approach to analyze searching efficiencies varying degrees of imbalance in a binary search tree)

  • 김숙영
    • 한국컴퓨터산업학회논문지
    • /
    • 제3권2호
    • /
    • pp.235-242
    • /
    • 2002
  • 트리 재균형 과정을 최소화하기 위하여 이진 검색 트리의 불균형도에 따른 검색 성능에 관한 수량적 정보를 얻기 위한 실험이 행하여졌다. 트리를 구성하는 노드들의 좌, 우 서브트리 높이 차 인 균형 인수에 의하여 불균형도를 수량화 한 결과 불균형도가 심해질수록 검색성능이 저하됨이 실험 자료들에 의하여 확률적으로 증명되었고 (p<0.01), 노드 개수와 평균 검색 횟수 관계를 설명하기 위한 모형으로는 로그 모형 보다 선형 모형이 적합한 경향을 보였다. 그러나 균형 인수 크기가 3 미만인 노드들만으로 구성된 이진 검색 트리의 성능은 높이 균형이진 트리에 비하여 저하되지 않는 것으로 평가된다. 본 연구 결과들은 이진 트리를 자료 구조를 사용하는 소프트웨어 관리에 적용될 수 있을 것이다.

  • PDF

계층적 속성문법을 위한 효율적인 점진적 속성평가 (Effective incremental attribute evaluation for a hierarchical attribute grammar)

  • 장재춘;김태훈
    • 인터넷정보학회논문지
    • /
    • 제2권3호
    • /
    • pp.71-79
    • /
    • 2001
  • 점진적 속성 평가 알고리즘에서는 새로운 입력 트리가 기존 입력 트리와 정확히 비교되어서 새로운 트리를 구성할 때 기존 속성 트리의 어떤 서브 트리를 사용해야 하는가를 결정한다. 이 논문에서는 계층적 속성 문법의 점진적 평가를 효율적으로 하기 위해 점진적 속성 평가 알고리즘을 이용하였으며 Carle과 Pollock의 알고리즘을 분석하여 점진적 속성 평가 알고리즘으로 재구성하고, 속성 트리 dcopy의 구성요소를 새로운 속성 트리 d'copy에 적용하여 최적화된 속성 트리 d'copy의 점진적 속성 평가 알고리즘을 구성하였다. 또한 점진적 속성 평가 알고리즘을 이용하여 실제적인 입력 프로그램에서 재사용된 노드의 표현과 정의된 변수 형(type)이 어떻게 점진적인 속성 평가를 수행하는가를 나타내었다.

  • PDF

대용량 DNA서열 처리를 위한 서픽스 트리 생성 알고리즘의 개발 (Suffix Tree Constructing Algorithm for Large DNA Sequences Analysis)

  • 최해원
    • 한국산업정보학회논문지
    • /
    • 제15권1호
    • /
    • pp.37-46
    • /
    • 2010
  • 서픽스 트리는 데이터의 내부구조를 자세히 나타내고 선형시간 탐색이 가능한 효과적인 자료구조로서 DNA 서열분석 등에 유용하다. 그러나 서열을 서픽스 트리로 구축하는 경우 트리의 크기가 원본의 최소 30배 이상으로 커지므로 테라바이트(TB)급의 대용량 DNA 서열의 경우에 메모리상의 응용은 매우 어려운 문제점이 있다. 이에 본 논문에서는 디스크를 이용한 대용량 DNA의 서픽스 트리 응용기법을 제시한다. 이때 DNA 서열구조를 고려한 서픽스 트리 선형 탐색 특성 유지를 보장한다. 이를 검증하기 위하여 9G Byte의 유전자 단편 서열을 이용해 424G Byte의 서픽스 트리를 디스크에 구축한 다음, 임의의 질의 서열에 대해 KMP알고리즘과 비교한 결과 질의 응답시간에서 우수한 성능을 보였다.

대용량 3차원 포인트 클라우드의 탐색을 위한 메모리 효율적인 옥트리의 설계 (Design of Memory-Efficient Octree to Query Large 3D Point Cloud)

  • 한수희
    • 한국측량학회지
    • /
    • 제31권1호
    • /
    • pp.41-48
    • /
    • 2013
  • 본 연구는 대용량 3차원 포인트 클라우드의 탐색을 위한 메모리 효율적인 옥트리를 설계하는 것을 목표로 한다. 이를 위하여 C++ 언어로 구현된 옥트리 노드의 구성요소 중 최소 경계 입방체 좌표 정보 등을 위한 변수를 제거하는 대신, 부모 노드에서 자식 노드 접근시 최소 경계 입방체 좌표를 계산하여 전달하였다. 아울러 자식 노드 등의 생성시마다 new 연산자를 사용하는 대신, 수도 트리와 정식 트리를 생성하는 이중적인 과정을 통해 노드 등을 배열로 미리 선언함으로서 메모리 효율성을 더욱 개선하였다. 1800만개 이상의 포인트로 구성된 실제 포인트 클라우드를 대상으로 트리를 구성하고 인접 포인트를 탐색하는 실험을 수행하였다. 최소 경계 입방체 좌표 정보를 노드에 저장하는 경우와 비교한 결과 메모리 사용량과 탐색 속도의 트레이드오프가 존재하지만 제안한 방식이 비교군보다 메모리 효율적이어서 대용량 포인트 클라우드에 적용할 수 있는 대안임을 확인할 수 있었다.

CS-트리 : 고차원 데이터의 유사성 검색을 위한 셀-기반 시그니쳐 색인 구조 (CS-Tree : Cell-based Signature Index Structure for Similarity Search in High-Dimensional Data)

  • 송광택;장재우
    • 정보처리학회논문지D
    • /
    • 제8D권4호
    • /
    • pp.305-312
    • /
    • 2001
  • 최근 고차원 색인 구조들이 멀티미디어 데이터베이스, 데이터 웨어하우징과 같은 데이터베이스 응용에서 유사성 검색을 위해 요구된다. 본 논문에서는 고차원 특징벡터에 대한 효율적인 저장과 검색을 지원하는 셀-기반 시그니쳐 트리(CS-트리)를 제안한다. 제안하는 CS-트리는 고차원 특징 벡터 공간을 셀로써 분할하여 하나의 특징 벡터를 그에 해당되는 셀의 시그니쳐로 표현한다. 특징 벡터 대신 셀의 시그니쳐를 사용함으로써 트리의 깊이를 줄이고, 그 결과 효율적인 검색 성능을 달성한다. 또한 셀에 기반하여 탐색 공간을 효율적으로 줄이는 유사성 검색 알고리즘을 제시한다. 마지막으로 우수한 고차원 색인 기법으로 알려져 있는 X-트리와 삽입시간, k-최근접 질의에 대한 검색 시간 그리고 부가저장 공간 측면에서 성능 비교를 수행한다. 성능비교 결과 CS-트리가 검색 성능에서 우수함을 보인다.

  • PDF