• 제목/요약/키워드: TRIE구조

검색결과 46건 처리시간 0.021초

최장 길이 우선 검색에 기초한 프리픽스 길이에 따른 이진 IP 검색 구조 (Longest First Binary Search on Prefix Length for IP Address Lookup)

  • 추하늘;임혜숙
    • 한국통신학회논문지
    • /
    • 제31권8B호
    • /
    • pp.691-700
    • /
    • 2006
  • 라우터는 입력된 패킷의 목적지 주소에 따라 IP 주소검색을 통해 패킷의 최종 목적지로 갈 수 있는 다음 흡으로 패킷을 전달하는 역할을 한다. 인터넷에 접속된 단일 호스트 네트워크 수의 증가로 인해 라우팅 테이블의 크기가 급격히 증가하고 있으며, 통신 링크의 속도 또한 기하급수적으로 빠르게 증가하고 있다. 라우터에 입력된 패킷은 선속도(wire-speed)로 처리되어야 하므로, 링크 속도의 증가는 라우터에서의 패킷 처리시간이 감소됨을 의미한다. 그러므로 차세대 라우터는 더 효율적이고 빠른 IP 주소검색 기술을 필요로 한다. 기존에 연구되어온 대부분의 검색 구조들에서는 짧은 길이의 프리픽스로부터 긴 길이의 프리픽스로 검색 영역을 확장하였다. 이 때문에 일치하는 가장 긴 프리픽스를 찾을 때까지 현재까지 일치된 가장 긴 프리픽스를 기억하면서 검색을 진행하였다. 본 논문에서는 긴 프리픽스를 먼저 검색하는 프리픽스 길이에 따른 이진 IP 주소 검색 구조를 제안한다. 제안하는 구조는 트라이의 리프에 존재하는 프리픽스들만으로 이루어진 독립적인 여러 개의 트라이를 구성하고, 길이에 따르는 이진 검색을 통해 긴 길이의 프리픽스와의 일치 여부를 먼저 확인함으로써 보다 빠른 검색속도를 제공한다. 또한, 이 구조는 기존의 프리픽스 길이에 따른 이진검색 구조가 선처리(pre-processing)가 많아 프리픽스의 부가적 추가가 힘들었던 것과는 다르게 선처리가 없이 프리픽스의 부가적 추가가 가능한 장점을 갖는다. 본 논문에서는 제안하는 구조의 성능을 실험한 후, 기존에 연구되어온 다른 IP 주소 검색 구조와 성능을 비교하였다.$와 혼합된 rubrene에 의한 낮은 전하주 입장벽, 높은 전류밀도에서 나타나는 발광감쇄현상의 감소, 그리고 발광층의 DLD구조에 의한 전하의 trap & confinement 에 따른 발광 exciton의 형성확률이 증가한데서 나타났다고 생각된다. 차이가 없었으나 고급알코올함량을 비교하였을 때 Sacch. cerevisiae Wine 3이 와인제조에 가장 적합한 것으로 평가되었다.장 낮은 값을 나타내었으며, 홍국의 함유량이 증가할수록 유의적으로 증가하였다. b값은 CSB가 가장 낮은 값을 나타내었으며, 홍국의 함유량이 증가할수록 유의적으로 증가하였다. 물성측정 결과 경도와 응집성은 각 시료들 간의 유의적인 차이가 나타나지 않았다. 탄력성과 부서짐성은 CSB가 가장 낮았으며, 홍국의 함유량이 증가할수록 증가하였다. 점착성은 SDB1이 가장 낮았으며, 홍국의 함유량이 증가할수록 증가하였다. 관능검사 결과 기공의 균일성은 SDB1이 가장 균일한 것으로 나타났으며, 색은 홍국의 함유량이 증가할수록 높게 나타났다. 경도, 탄력성, 단맛 및 신맛 등은 홍국 함유량이 증가할수록 증가하는 것으로 나타났다. 이취는 SDB1이 가장 적게 나는 것으로 나타났으며, 전반적인 기호도는 SDB1이 가장 높았다. 따라서 홍국을 10% 첨가한 sourdough starter를 3일 동안 발효한 후 반죽에 첨가하여 sourdough bread를 제조할 때 품질이 가장 우수한 제품을 얻을 수 있었다.생수와 여러 물질의 혼합용액의 온도가 장에 끼치는 자극에 차이가 있지 않나 추측되며 이에 관한 추후 연구가 요망된다. 총대장통과시간의

경로 서명 : XML문서 검색을 위한 경로-지향 질의처리 시스템 (Path Signatures : Path-oriented Query Processing System for XML document Retrieval)

  • 박희숙;박주현;조우현
    • 한국정보통신학회논문지
    • /
    • 제11권7호
    • /
    • pp.1311-1317
    • /
    • 2007
  • 최근 인터넷의 폭발적인 성장과 인기로 인하여, 인터넷상에서 정보의 교환이 매우 빠르게 증가하고 있다. 또한 XML은 인터넷상에서 정보교환의 수단인 동시에 표준으로서 자리를 잡아 가고 있다. 따라서 본 논문에서는 경로-지향 질의어를 평가하기 위한 새로운 인덱싱 기법과 사용자들에게 편리한 XML문서 검색 결과를 제공하기 위한 경로-지향 질의 처리 시스템의 설계 및 구현을 제공한다. 제안된 인덱싱 기법은 XML문서의 검색 성능을 향상시키기 위하여 이진 트라이 구조와 경로서명 파일을 결합하였다.

임베디드 시스템에 적합한 한국어 복합명사 분해 (Korean Compound Nouns Decomposition Suitable for Embedded Systems)

  • 최민석;김창현;천민아;박호민;남궁영;윤호;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.316-320
    • /
    • 2018
  • 복합명사는 둘 이상의 말이 결합된 명사를 말하며 문장에서 하나의 단어로 간주된다, 그러나 맞춤법 및 띄어쓰기 검사나 정보검색의 색인어 추출, 기계번역의 미등록어 추정 등의 분야에서는 복합명사를 구성하는 개별 단어를 확인할 필요가 있다. 이 과정을 복합명사 분해라고 한다. 복합명사를 분해하는 방법으로 크게 규칙 기반 방법, 통계 기반 방법 등이 있으며 본 논문에서는 규칙을 기반으로 최소한의 통계 정보를 이용하는 방법을 제안한다. 본 논문은 4개의 분해 규칙을 적용하여 분해 후보를 생성하고 분해 후보들 중에 우선순위를 정하여 최적 후보를 선택하는 방법을 제안한다. 기본 단어(명사)로 트라이(trie)를 구축하고 구축된 트라이를 이용하여 양방향 최장일치를 적용하고 음절 쌍의 통계정보를 이용해서 모호성을 제거한다. 성능을 평가하기 위해 70,000여 개의 명사 사전과 음절 쌍 통계정보를 구축하였고, 이를 바탕으로 복합명사를 분해하였으며, 분해 정확도는 단어 구성비를 반영하면 96.63%이다. 제안된 복합명사 분해 방법은 최소한의 데이터를 이용하여 복합명사 분해를 수행하였으며 트라이 자료구조를 사용해서 사전의 크기를 줄이고 사전의 검색 속도를 개선하였다. 그 결과로 임베디드 시스템과 같은 소형 기기의 환경에 적합한 복합명사 분해 시스템을 구현할 수 있었다.

  • PDF

개체명 사전 기반의 반자동 말뭉치 구축 도구 (A Semi-automatic Annotation Tool based on Named Entity Dictionary)

  • 노경목;김창현;천민아;박호민;윤호;김재균;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.309-313
    • /
    • 2017
  • 개체명은 인명, 지명, 조직명 등 문서 내에서 중요한 의미를 가지므로 질의응답, 요약, 기계번역 분야에서 유용하게 사용되고 있다. 개체명 인식은 문서에서 개체명에 해당하는 단어를 찾아 개체명 범주를 부착하는 작업을 말한다. 개체명 인식 연구에는 개체명 범주가 부착된 개체명 말뭉치를 사용한다. 개체명의 범주는 연구 분야에 따라 다양하게 정의되므로 연구 분야에 적합한 개체명 말뭉치가 필요하다. 하지만 이런 말뭉치를 구축하는 일은 시간과 인력이 많이 필요하다. 따라서 본 논문에서는 개체명 사전 기반의 반자동 말뭉치 구축 도구를 제안한다. 제안하는 도구는 크게 전처리, 사용자 태깅, 후처리 단계로 나뉜다. 전처리 단계는 자동으로 개체명을 찾는 단계이다. 약 11만 개의 개체명을 기반으로 하여 트라이(trie) 구조의 개체명 사전을 구축한 후 사전을 이용하여 개체명을 자동으로 찾는다. 사용자 태깅 단계는 사용자가 수동으로 개체명을 태깅하는 단계이다. 전처리 단계에서 찾은 개체명 중 오류가 있는 개체명들은 수정하거나 삭제하고, 찾지 못한 개체명들은 사용자가 추가로 태깅하는 단계이다. 후처리 단계는 태깅한 결과로부터 사전 정보를 갱신하는 단계이다. 제안한 말뭉치 구축 도구를 이용하여 752개의 뉴스 기사에 대해 개체명을 태깅한 결과 7,620개의 개체명이 사전에 추가되었다. 제안한 도구를 사용한 결과 사용하지 않았을 때 비해 약 57.6% 정도 태깅 횟수가 감소했다.

  • PDF

택시 데이터에 대한 효율적인 Top-K 빈도 검색 (Finding Frequent Route of Taxi Trip Events Based on MapReduce and MongoDB)

  • ;안성아;;정한유;권준호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권9호
    • /
    • pp.347-356
    • /
    • 2015
  • IoT(사물인터넷) 기술의 빠른 개발로 인하여 기존의 택시들은 디스패처와 위치 시스템을 통해 서로 연결되고 있다. 일반적으로 현대의 택시들은 경로 정보를 획득하기 위한 목적으로 GPS(Global Positioning System)를 탑재하고 있다. 택시 운행 데이터들의 경로 빈도를 분석하여, 주어진 질의 시간에 해당하는 빈번한 경로를 찾을 수 있다. 그러나 위치 데이터의 용량이 매우 크고 복잡하기 때문에 택시의 운행 이벤트의 위치 데이터를 분석된 빈도 정보로 변환할 때에 확장성 문제가 발생한다. 이 문제를 해결하기 위하여, NoSQL 데이터베이스에 기반한 택시 운행 데이터에 대한 Top-K 질의 시스템을 제안한다. 첫째, 원시 택시 운행 이벤트를 분석하고 모든 경로들의 빈도 정보를 추출한다. 추출한 경로 정보는 NoSQL 문서-지향 데이터베이스인 MongoDB에 해시 기반의 인덱스 구조로 저장한다. 주로 발생하는 경로에 대한 효율적인 Top-K 질의 처리는 몽고DB의 상에서 이루어진다. 미국 뉴욕시의 실제 택시 운행 데이터를 이용한 실험을 통하여 알고리즘의 효율성을 검증하였다.

개체명 사전 기반의 반자동 말뭉치 구축 도구 (A Semi-automatic Annotation Tool based on Named Entity Dictionary)

  • 노경목;김창현;천민아;박호민;윤호;김재균;김재훈
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.309-313
    • /
    • 2017
  • 개체명은 인명, 지명, 조직명 등 문서 내에서 중요한 의미를 가지므로 질의응답, 요약, 기계번역 분야에서 유용하게 사용되고 있다. 개체명 인식은 문서에서 개체명에 해당하는 단어를 찾아 개체명 범주를 부착하는 작업을 말한다. 개체명 인식 연구에는 개체명 범주가 부착된 개체명 말뭉치를 사용한다. 개체명의 범주는 연구 분야에 따라 다양하게 정의되므로 연구 분야에 적합한 개체명 말뭉치가 필요하다. 하지만 이런 말뭉치를 구축하는 일은 시간과 인력이 많이 필요하다. 따라서 본 논문에서는 개체명 사전 기반의 반자동 말뭉치 구축 도구를 제안한다. 제안하는 도구는 크게 전처리, 사용자 태깅, 후처리 단계로 나뉜다. 전처리 단계는 자동으로 개체명을 찾는 단계이다. 약 11만 개의 개체명을 기반으로 하여 트라이(trie) 구조의 개체명 사전을 구축한 후 사전을 이용하여 개체명을 자동으로 찾는다. 사용자 태깅 단계는 사용자가 수동으로 개체명을 태깅하는 단계이다. 전처리 단계에서 찾은 개체명 중 오류가 있는 개체명들은 수정하거나 삭제하고, 찾지 못한 개체명들은 사용자가 추가로 태깅하는 단계이다. 후처리 단계는 태깅한 결과로부터 사전 정보를 갱신하는 단계이다. 제안한 말뭉치 구축 도구를 이용하여 752개의 뉴스 기사에 대해 개체명을 태깅한 결과 7,620개의 개체명이 사전에 추가되었다. 제안한 도구를 사용한 결과 사용하지 않았을 때 비해 약 57.6% 정도 태깅 횟수가 감소했다.

  • PDF