• 제목/요약/키워드: 장문분할

검색결과 8건 처리시간 0.021초

쉼표의 자동분류에 따른 중국에 장문분할 (Segmentation of Long Chinese Sentences using Comma Classification)

  • 김미훈;김미영;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권5호
    • /
    • pp.470-480
    • /
    • 2006
  • 입력문장이 길어질수록 구문분석의 정확률은 크게 낮아진다. 따라서 긴 문장의 구문분석 정확률을 높이기 위해 장문분할 방법들이 많이 연구되었다. 중국어는 고립어로서 자연언어처리에 도움을 줄 수 있는 굴절이나 어미정보가 없는 대신 쉼표를 비교적 많이, 또 정확히 사용하고 있어서 이러한 쉼표사용이 장문분할에 도움을 줄 수 있다. 본 논문에서는 중국어 문장에서 쉼표 주변의 문맥을 파악하여 해당 쉼표위치에 문장분할이 가능한지 Support Vector Machine을 이용해 판단하고자 한다. 쉼표의 분류의 정확률이 87.1%에 이르고, 이 분할모델을 적용한 후 구문분석한 결과, 의존트리의 정확률이 5.6% 증가했다.

S-절 분할을 통한 구문 분석 (Syntactic Analysis based on Subject-Clause Segmentation)

  • 김미영;이종혁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권9호
    • /
    • pp.936-947
    • /
    • 2005
  • 한국어 장문에서는 하나의 주어를 여러 용언이 공유하는 경우가 흔하고 주어의 생략 또한 빈번하다. 따라서 주어를 공유하는 용언들의 구간을 파악하는 것이 어렵고 의존문법을 이용한 구문분석시 주어의 의존관계를 찾는데 많은 오류가 생긴다. 이러한 주어의 의존관계의 애매성을 해소하기 위하여 우리는 S(ubject)-절이라는 개념을 제안한다. S-절은 한 개의 주어와 이 주어를 공유하는 단어그룹의 집합으로 정의되고, 본 논문에서는 결정트리를 이용하여 S-절을 자동적으로 분할하는 방법을 제안한다. S-절을 사용한 결과 의존문법에 기반한 구문분석 시스템의 성능이 $5\%$ 향상되었고 주어의 지배소를 찾는 정확률이 $32\%$ 증가했다.

SVM 모델을 이용한 중국어 장문 분할 (Segmentation of Chinese Long Sentence Using Support Vector Machine)

  • 김미훈;김미영;김동일;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.261-266
    • /
    • 2003
  • 문장이 길면 구문분석의 정확률이 크게 낮아진다. 따라서 장문을 분할하여 분석하면 구문분석의 복잡도를 크게 줄일 수 있어 정확률 향상에 크게 기여할 수 있다. 특히, 중국어는 고립어로서, 교착어나 융합어와 비교할 때 자연어처리에 도움을 줄 수 있는 굴절이나 어미정보가 없어 구문분석에 어려움이 더욱 많다. 반면, 중국어 문자에서는 쉼표를 비교적 많이 사용하고 있고 또한 쉼표의 쓰임이 정확하므로 구문 분석에 도움을 줄 수 있다. 본 논문에서는 쉼표가 많이 쓰이고 있는 중국어 문장에서 해당 쉼표위치 문장 분할가능여부를 Support Vector Machine을 이용 판단하여 정확률 88.61%의 높은 분할 성능을 보였다.

  • PDF

사각형 분할에 의한 육각형 노드의 중성자확산 노달기법

  • 이창호;송재승;조병오;지성균;장문희
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1998년도 춘계학술발표회논문집(1)
    • /
    • pp.99-105
    • /
    • 1998
  • 육각형구조에서 중성자 확산방정식의 해를 구하기 위해 육각형을 3개의 사각형으로 분할하여 노달해를 구하는 방법을 개발하였다. 이 방법은 기존의 사각형 노달기법의 기본적인 틀을 그대로 이용할 수 있기 때문에 육각형을 직접 푸는 방법에 비해 간단하며, 향후 노드의 세분화 및 다군 확산방정식에 적용하기 쉬운 장점을 가지고 있다. 이러한 사각형분할에 의한 육각형 노달해를 구하는 방법을 2차원 IAEA 벤치마크 계산을 통해 검증해 본 결과, 정확성이 잘 유지되고 있음을 알 수 있었다.

  • PDF

파장분할다중화방식 전광통신망에서 물리적 제약을 고려한 가상망 설계 알고리즘 (An Algorithm for Virtual Topology Design in WDM optical Networks under Physical constraints.)

  • 유지연;김상완;서승우;장문종;우희곤
    • 한국통신학회논문지
    • /
    • 제25권3A호
    • /
    • pp.443-450
    • /
    • 2000
  • Although designing a virtual topology for all-optical WDM wide-area networks has been extensively studied and several algorithms have been proposed, these algorithms assumed error-free communication between two nodes. However, noises from optical amplifiers and optical cross-connects can degraded the signal, resulting in a nonzero bit-error rate. In this paper, we investigate the effect of physical limitations on the virtual topology design. We show that for side-area all-optical networks where transmission distance is fairly long, virtual topology design algorithm that can determine the locations of opto-electronic(OE) and electro-optic(EO) conversions to set up a connection request with a high BER in a multihop manner.

  • PDF

파장분할다중화방식을 수용한 전광전송망 모델 설계에 관한 연구 (The Study on the Design for the All Optical Network modeling with WDM)

  • 장문종;안성준;현덕화;박병석
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2000년도 하계학술대회 논문집 A
    • /
    • pp.561-563
    • /
    • 2000
  • 최근 인터넷에 대한 수요의 증가로 인해 데이터 트래픽이 음성 트래픽을 초과하는 단계로 이르고 있으며 또한 이동통신 가입자의 급증으로 인한 트래픽도 상당한 것으로 알려져 있다. 이렇게 폭증하는 망에 대한 요구를 수용하기 위해서는 단순히 광섬유를 추가로 설치하기 보다는 기존의 광섬유를 최대한 활용할 수 있어야 한다. 이를 위해 WDM 방식 광통신 시스템이 각광받고 있다. 본 연구에서는 우리나라의 실정에 적합한 트래픽을 모델링하기 위한 Pl(Population- Information factor) 트래픽 모델링 기법을 제시하며 이에 기초하여 도출된 트래픽 값으로 WBM을 수용하는 전력통신망 모델을 설계한다. 전력통신망 설계와 특성 분석을 위하여 Visual C로 시뮬레이션 툴을 개발하였으며, 본 결과는 향후 WDM을 수용한 전광전송망을 구축할 때 활용될 수 있다.

  • PDF

비정형 홍채 패턴 분리에 관한 연구 (A Study on Extraction of Irregular Iris Patterns)

  • 원정우;조성원;김재민;백강철
    • 한국지능시스템학회논문지
    • /
    • 제18권2호
    • /
    • pp.169-174
    • /
    • 2008
  • 최근 정보화 시대에 발맞추어 보안에 관한 중요성이 증가하고 있다. 따라서 지문, 장문, 서명, 홍채 인식과 같은 생체 인식시스템에 대한 관심이 급증하고 있고, 그 중에서 가장 신뢰성과 보안성에서 뛰어난 홍채 인식에 대한 연구가 활발히 진행중이다. 홍채 인식의 환한 연구는 많이 진행되어 왔지만 홍채 인식의 가장 큰 이슈는 홍채 영역 분할과 특징 추출로 할 수 있다. 본 논문에서는 곡선에 유연한 곡선 검출기를 이용하여 기존 원형 검출기가 갖는 문제점을 극복하고, 보다 정확한 홍채 영역 분할을 이루었다. 따라서 주변 환경의 변화에 신속히 대처할 수 있고, 기하학적인 경계 검출에 유용하다.

행렬기반의 정합 알고리듬에 의한 음악 기호의 인식 (A Matrix-Based Graph Matching Algorithm with Application to a Musical Symbol Recognition)

  • 허경용;장경식;장문익;김재희
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.2061-2074
    • /
    • 1998
  • 패턴 인식의 분야에서 그래프는 복잡한 대상체의 표현 및 인식의 도구로서 많이 사용되지만, 그래프간의 유사성 비교에는 많은 시간이 소요될 뿐아니라 실제 입력되는 영상은 왜곡으로 인해 저장되어 있는 이상적인 영상과 동일함을 기대할 수 없으므로 유사한 정도를 판별하는 기준이 마련되어야만 한다. 이 논문에서는 행렬을 그래프의 표현 수단으로 사용하였다. 행렬은 표현이 간단하며, 정의되어 있는 연산을 통해 순서 배열 및 매칭 과정을 간단히 수행하루 수 있다. 이 때 그래프를 구성하는 노드(node)들을 기하학적 위치에 따라 순서 배열함으로써 그래프를 구성하는 노드들 사이의 대응 관계를 효율적으로 찾을 수 있도록 하였으며, 또한 왜곡으로 인하여 기호를 표현하는 그래프의 노드가 제대로 추출되지 못한 경우는 기호의 구조를 고려하여 보정해 줄 수 있는 분할 과정을 도입하여 해결하였다. 제안한 방법은 악보의 비음표 기호 인식을 통해 실험하였으며, 실험 결과 95% 정도의 인식률을 얻을 수 있었다.

  • PDF