• 제목/요약/키워드: 부분 트리

검색결과 365건 처리시간 0.024초

과학 데이타베이스에서 부분 문자열의 발생 빈도 예측 (Frequency Estimation of Substring for Scientific Database)

  • 배진욱;이석호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.536-538
    • /
    • 2003
  • 대량의 짧은 문자열들에 대해 부분 문자열의 발생 빈도를 예측하는 문제는 카운트 서픽스 트리를 미리 생성한 후 이를 이용함으로써 처리될 수 있다. 카운트 서픽스 트리는 모든 부분 문자열의 발생 빈도를 저장한 뒤 가지치기를 함으로써, 제한된 트리 크기와 발생 빈도 예측이라는 두 가지 목표를 처리한다. 하지만, 염기서열에서 처럼 저장된 문자열의 길이가 길어질 경우 카운트 서픽스 트리를 생성하기가 대단히 어려워진다는 문제점이 발생한다. 이 논문에서는 선삽입, 후가지치기 방식의 카운트 서픽스 트리 대신 처음부터 길이가 q 이하인 문자열들만을 삽입하는 큐그램 트리를 제안한다. 큐그램 트리는 제한된 트리 크기에 따라 저장할 부분 문자열의 크기를 미리 결정할 수 있으며, 데이타베이스에 저장된 문자열의 전체 길이가 N일 때 O(N) 시간에 생성 가능하다. 실험 결과 제한된 부분 문자열을 가지고 있음에도 불구하고 긴 부분 문자열의 발생 빈도를 매우 정확하게 예측할 수 있음을 보였다.

  • PDF

부분키를 사용한 캐쉬 인식 B+ 트리의 성능 평가 (Performance Evaluation of Cache Sensitive B+-tree)

  • 김원식;한욱신
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2004년도 추계 종합학술대회 논문집
    • /
    • pp.448-452
    • /
    • 2004
  • 부분키를 사용한 캐쉬 인식 $B^+$ 트리는 키 압축과 포인터 압축 방법을 동시에 적용한 캐쉬 인식 트리이다. 기존의 캐쉬 인식 트리들은 키 압축과 포인터 압축을 따로 고려하였다. 이에 반해 부분키를 사용한 캐쉬 인식 $B^+$ 트리는 키와 포인터를 동시에 압축하여 캐쉬 활용도를 높였다. 본 논문은 기 발표된 부분키를 사용한 캐쉬 인식 $B^+$ 트리의 벌크로드와 검색 알고리즘을 구현하여 성능 평가를 수행하였다. 그리고 $B^+$-트리와 Simple Prefix $B^+$-트리의 성능비교를 통하여 부분키 캐쉬 인식 $B^+$ 트리의 성능의 우수함을 확인 하였다.

  • PDF

영상처리를 이용한 부분방전 측정에 관한 연구 (A Study on Measurement of Partial Discharge Using Image Processing)

  • 김형균;김단환;오태석;오무송
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(하)
    • /
    • pp.622-625
    • /
    • 2002
  • 부분방전의 특성을 연구하기 위하여 트리패턴을 추출하는 과정을 이용하는데, 트리열화 과정의 재현성이 떨어지고 트리의 패턴이 복잡함으로 기존의 시각적 관측으로는 트리성장의 정확한 정량화가 어렵기 때문에 영상처리에 의한 실시간 처리가 제안되고 있다. 본 연구에서는 부분방전의 측정을 위해 영상처리에 필요한 전반적인 과정을 제시하고, 특히 제안된 전경 물체 추출기법을 이용하여 측정된 영상에서 배경과 전경을 분할하여 전기트리를 측정하고자 한다. 전경 물체를 추출하기 위하여 전기트리를 측정한 영상에서 현재 프레임과 다음 프레임과의 차이 영상을 이용한 차이 검출 마스크를 사용하고, 추출된 전경 물체에서 에지를 검출하여 부분방전시 발생되는 전기트리를 실시간으로 계측 및 정량화하고자 한다.

  • PDF

부분키를 사용한 캐쉬 인식 $B^+$ 트리 (Cache Sensitive $B^+$ Trees with Partial Keys)

  • 이동민;김원식;한욱신
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.94-96
    • /
    • 2004
  • 캐쉬 인식 트리는 주기억장치의 느린 액세스 속도를 캐쉬를 활용함으로써 개선하려는 주기억장치 데이터베이스 인덱스이다. 본 논문에서는 기존의 캐처 인식 트리에서 사용된 기법들을 살펴보고, 이를 통함, 개선하여 새로운 캐쉬 인식 트리를 제안한다. 기존의 캐쉬 인식 트리는 키 압축과 포인터 알축을 따로 고려하였기 때문에 각각 노드의 크기와 키의 길이 변화에 취약한 문제점이 있었다. 이에 반해 제안하는 부분키 캐쉬 인식 $B^{+}$트리는 키와 포인터를 동시에 압축하여 이러한 문제점을 해결하고. 보다 캐쉬 활용도를 높였다. 또한 제안하는 트리의 벌크로드, 삽입, 삭제 알고리즘을 제시하고 이론적인 분석 통길 각 알고리즘이 올바르게 수행되고, 성능에 개선됨을 확인하였다.

  • PDF

생물학 서열 데이타베이스에서 부분 문자열의 선적도 추정 (Estimation of Substring Selectivity in Biological Sequence Database)

  • 배진욱;이석호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제30권2호
    • /
    • pp.168-175
    • /
    • 2003
  • 지금까지 문자열 데이타에 대한 선택도 추정은 문자열들의 등장 회수에 대한 정보를 저장하고 있는 '카운트 서픽스 트리'를 생성한 뒤, 이 트리를 이용하여 부분 문자열들의 선택도를 추정하는 방법으로 이루어졌다. 그런데, 문자열 데이타가 생물학 서열처럼 매우 길어질 경우 카운트 서픽스 트리를 생성하는 일은 거의 불가능해진다는 문제점이 발생한다. 이 논문에서는 길이가 q인 부분 문자열들만을 삽입한 '카운트 큐그램 트리'를 제안한다. 카운트 큐그램 트리는 서열 내의 길이가 q 이하인 모든 부분 문자열(큐그램) 들의 정확한 등장 회수를 저장하고 있으며, 문자열의 전체 길이 N에 상관없는 크기로, O(N) 시간에 생성 가능하다. 또한, 이 논문에서는 카운트 큐그램 트리를 이용한 'k번째 최대겹침' 추정 방법을 제시한다. 이 추정 방법은 질의 문자열을 길이 q인 부분 문자열로 나눌 때 부분 문자열들의 겹치는 정도 k를 선택할 수 있도록 한 방법으로 이전 연구에서 제시한 '최대겹침' 방법을 확장하였다. q와 k를 변화시키며 진행한 실험 올 통해 대부분의 경우에 매우 정확하게 선택도를 추정할 수 있음을 확인하였다.

대량의 한국어 구문 트리 태깅 코퍼스 구축을 위한 구문 트리 태깅 워크벤치의 설계 및 구현 (Design and Implementation of Tree Tagging Workbench To Build a Large Tree Tagged Corpus of Korean)

  • 장병규;이공주;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.421-429
    • /
    • 1997
  • 한국어 구문 트리 태깅 코퍼스는 한국어 문장의 구문 구조가 구문 트리 형태로 태깅된 코퍼스이다. 코퍼스 구축은 사람(annotator)에 의하여 수작업으로 이루어지므로, 많은 시간과 인력을 소모하는 작업이다. 그렇기 때문에 코퍼스 구축을 도와주는 구문 트리 태깅 워크벤치는 코퍼스 구축에 필수적인 요소이다. 본 논문에서는 대량의 구문 트리 태깅 코퍼스를 일관되고 빠르게 구축하기 위한 워크벤치 설계시의 고려 사항을 제시한다. 이러한 고려 사항을 기반으로, 다소 정확한 부분에 대한 태깅만을 수행하는 부분 구문 분석, 태깅한 결과에 대한 검증 과정인 일관성 검사, 편한 구문 트리 태깅을 고려한 사용자 인터페이스, 플랫폼 독립적인 구현 등과 같은 워크벤치의 실제 구현에 대하여 설명한다. 또한, 구문 트리 태깅 워크벤치의 앞으로의 연구 방향을 제시한다.

  • PDF

옥트리를 이용한 3차원 물체 추출에서의 모델링 향상 기법 (Modeling Improvement Algorithm for 3D Volume Refinement Using Octree)

  • 임석현;한창호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 추계학술발표논문집 (상)
    • /
    • pp.231-234
    • /
    • 2000
  • 옥트리(octree)는 3차원 물체를 복원함에 있어서 간편함으로 팥이 이용되어지는 방법이다. 하지만 물체의 형태가 복잡해지고 물체 내부에 구멍이 뚫어져 있는 경우 옥트리로 표현된 결과만으로는 형태를 파악하기 어려운 경우가 발생한다. 본 논문은 옥트리를 이용하여 3차원 물체의 형태를 복원하는데 있어서 나타나는 문제점을 옥트리의 계층적 구조를 증가시키지 않고 현실감이 떨어지는 부분에 대해서 CSG모델을 이용하여 해결하는 방안을 제시한다. 옥트리로 만들어진 결과물과 3차원 물체와의 차이가 나는 부분에 대하여 좀 더 현실감을 주기 위하여 CSG모델을 이용하여 기본도형을 만들고, 만들어진 도형을 다시 CSG모델을 이용하여 옥트리로 만들어진 물체에 결합시키는 형태로 문제를 해결한다. 본 논문에서는 실험을 위하여 3차원 물체를 만들고, 이를 옥트리를 이용하여 문제점을 확인하고, 이를 본 논문에서 주장한 방법을 이용하여 해결하는 방안을 제시한다.

  • PDF

부분 암호화를 위한 해쉬 트리 체인 기반 키 생성 및 관리 알고리즘 (Key Generation and Management Scheme for Partial Encryption Based on Hash Tree Chain)

  • 김경민;손규식;남승엽
    • 한국시뮬레이션학회논문지
    • /
    • 제25권3호
    • /
    • pp.77-83
    • /
    • 2016
  • 본 논문에서는 부분 암호화를 위한 키 생성 및 관리 알고리즘의 연구한다. 제안하는 알고리즘에서는 해쉬 트리 구조를 이용하여 적은 양의 해쉬키로부터 다양한 암호화 키를 생성하는 기능을 제공하고 있다. 본 논문에서는 새로운 키 생성 알고리즘을 이용하여 부분 암호화 및 부분 복호화하는 방법을 제시하고 시뮬레이션을 통하여 그 성능을 분석한다.

파스 트리를 이용한 불완전 XML 문서의 완성 (Completion of Incomplete XML Document Using Parse Tree)

  • 조용윤;박용관;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.868-870
    • /
    • 2004
  • 프로그래머는 프로그램 작성 중 문법적으로 올바르지 않은 문장을 입력할 수 있다. 문법적으로 불완전한 문장 입력은 사용자의 계속적인 편집 상태를 종료하고, 정상적인 파싱을 보장하지 않는 원인이 된다. 따라서, 사용자는 편집기가 제공하는 적절한 오류 처리 루틴을 통해 문법적으로 잘못된 문장에 대해 수정 작업을 실행해야 한다. 에디터 환경에서의 사용자 입력은 입력 부분의 왼쪽, 오른쪽에서 완전하지 못한 형태로 입력될 수 있다. 따라서, 에디터가 문법적으로 빠져있는 부분의 심볼이 무엇인지 정확히 인식 가능하고, 주어진 문법에 따라 부분적인 파스트리를 완성한다면, 사용자의 프로그래밍 편집 상태를 종료하지 않고 계속적인 편집과 성공적인 파싱을 보장할 수 있을 것이다. 본 논문은 파서가 문법적으로 올바르지 않은 문장의 입력에 대해 해당 문법에 따라 빠진 부분을 올바로 인식하고, 누락된 문법 심벌을 찾아 부족한 부분 파스 트리를 완성함으로써 성공적인 편집을 보장할 수 있는 파싱 방법을 제안하고 실험한다. 제안된 파싱 방법을 통해 사용자는 프로그래밍 편집 중 문법 오류에 대한 부담을 줄일 수 있으며, 불완전 입력에 대해 계속적인 파싱을 보장받아 편집 효율을 높일 수 있다.

  • PDF

Easy-First Deep Biaffine Attention을 이용한 한국어 의존 파싱 (Easy-First Deep Biaffine Attention for Korean Dependency Parsing)

  • 홍승연;나승훈;신종훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.30-33
    • /
    • 2019
  • 기존의 그래프 기반 파서는 문장의 가능한 모든 트리를 찾고 가장 높은 점수를 갖는 트리를 취하는 방식이다. 하지만 점수를 계산하는데 있어서 노드 정보만을 사용하기 때문에 트리 구조의 특성을 반영하지 못하는 단점이 있다. 이를 위해 본 논문에서는 사전 학습된 모델에서 단어 간의 점수를 얻어 높은 점수를 가지는 단어를 미리 결정하고 결정된 의존성을 통해 부분 트리 만든다. 만들어진 부분 트리 정보를 사용하여 트리 구조의 특성을 반영할 수 있도록 하였다.

  • PDF