• 제목/요약/키워드: Korean parsing

검색결과 325건 처리시간 0.024초

전자계산기에 의한 필기체 한글 인식에 관한 연구 (A study on the Automatic Recognition of Hand Printed Hangeul patterns by the Computer)

  • 남궁재찬;김영건
    • 한국통신학회논문지
    • /
    • 제5권1호
    • /
    • pp.44-48
    • /
    • 1980
  • 본 논문에서는 필기체 한글인식을 위한 한 방법을 제안했다. 기본 자모를 대상으로 하였으며, 임의의 Pattern에 대하여 접합보상및 정형 Algorithm을 제안하므로써 본래의 표준 한글 pattern으로 정형화하였다. 인식에는 Tree grammar를 사용하였으며, 새로운 Parsing 방법을 제안하므로써 종래의 방법보다 처리를 간단화시켰으며 error를 감소시켰다. 제한된 필기체에 대하여는 매우 효과적이었으며 on line 필기체 인식에도 유용성이 있음을 보였다.

  • PDF

표준형상 매개변수 추출을 이용한 자동공정계획 (Automatic Process Planning by Parsing the Parameters of Standard Features)

  • 신동목
    • 한국정밀공학회지
    • /
    • 제20권3호
    • /
    • pp.105-111
    • /
    • 2003
  • This paper presents an approach to automate process planning of press dies for manufacturing of car bodies. Considering that the press-dies used at the same press operations regardless of the panels they produce or the car models of which they produce panels have similar shapes except for the forming part of the dies, general approaches to recognize manufacturing features from CAD models are not necessary. Therefore, a hybrid approach is proposed combining feature-based design and feature-extraction approaches. The proposed method recognizes features by parsing the parameters extracted from CAD models and finds proper operations by querying the database by the recognized features. An internet-based process planning system is developed to demonstrate the proposed approach and to suggest a new paradigm of process planning system that utilizes an internet access to the CAD system.

표층 구문 타입을 사용한 조건부 연산 모델의 일반화 LR 파서 (Generalized LR Parser with Conditional Action Model(CAM) using Surface Phrasal Types)

  • 곽용재;박소영;황영숙;정후중;이상주;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권1_2호
    • /
    • pp.81-92
    • /
    • 2003
  • 일반화 LR(Generalized LR, 이하 GLR) 파싱은 선형 스택을 사용하는 전통적인 LR 파싱 방식의 한계를 극복하도록 만들어진 LR 파싱 기법의 하나로서, LR 기법에 여러 가지 매커니즘을 통합하여 자연어 파싱에 응용하는 작업의 토대가 되어 왔다. 본 논문에서는 기존의 확률적 LR 파싱 기법이 가지고 있는 문제를 개선한 조건부 연산 모델(Conditional Action Model)을 제안한다. 기존의 확률적 LR 파싱 기법은 그래프 구조 스택의 복잡성으로 인해 상대적으로 제한된 문맥 정보만을 사용하여 왔다. 제안된 모델은 부분 생성 파스의 표현을 위하여 표층 구문 타입(Surface Phrasal Type)을 사용하여 그래프 구조 스택에 들어 있는 구문 구조를 기술함으로써 좀 더 세분된 구조적 선호도를 파서에 반영시킬 수 있다. 실험 결과, 어휘를 고려하지 않고 학습한 조건부 연산 모델로 구현된 본 GLR 파서는 기존의 방식보다 약 6-7%의 정확도 향상을 보였으며, 본 모델을 통해 풍부한 스택 정보를 확률적 LR 파서의 구조적 중의성 해결에 효과적으로 사용할 수 있음을 보였다.

트리 합성 문법을 이용한 한국어 파싱 (Parsing Korean Using Tree Combining Grammar)

  • 양성일;나동렬
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.426-433
    • /
    • 1994
  • 본 논문에서는 트리의 점증적인 합성에 의하여 파싱을 진행시켜 나가는 파싱 방법을 소개하며 이의 한국어 파싱에의 응용을 살펴 본다. 이와 같은 트리 합성 파싱(tree combining parsing)을 지원하기 위한 문법인 트리 합성 문법(Tree Combining Grammar)을 소개한다. 우리는 먼저 문맥 자유 문법을 작성한 후 이로부터 자동적인 변환에 의하여 트리 합성 문법을 얻는 과정을 취한다. 따라서 트리 합성 파싱은 일종의 문맥 자유 파싱(context-free parsing)으로 볼 수 있으나 점증성(incremental), 하향성(top-down), 상향성(bottom-up), 유연성(flexible) 등과 같은 장점을 갖고 있다. 트리 합성 파싱의 유연성을 기반으로 하여 부분 자유 어순, 중심어 후행성과 같은 특성을 가진 한국어를 효과적으로 파싱할 수 있도록 트리 합성 파싱을 확장하는 방법을 살펴본다.

  • PDF

한국어 확률 의존문법 학습 (Probabilistic Dependency Grammar Induction)

  • 최선화;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.513-515
    • /
    • 2003
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 의존문법 생성을 위해 구성성분의 기능어들 간의 의존관계를 학습했던 기존 연구와는 달리. 한국어 구성성분은 내용어와 기능어의 결함 형태로 구성되고 임의 구성성룬 기능어와 임의 구성성분 내용어간의 의존관계가 의미가 있다는 사실을 반영한 의존문법 학습방법을 제안한다. KAIST의 트리 부착 코퍼스 31,086문장에서 추출한 30,600문장의 Tagged Corpus을 가지고 학습한 결과 초기문법을 64%까지 줄인 1.101 개의 의존문법을 획득했고. 실험문장 486문장을 Parsing한 결과 73.81%의 Parsing 정확도를 보였다.

  • PDF

잘못 형성된 입력문장에 대한 CHART PARSER (CHART PARSER FOR ILL-FORMED INPUT SENTENCES)

  • 민경호
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.177-212
    • /
    • 1993
  • 본 연구는 잘못 형성된 입력에 대한 멜리쉬의 연구(1989)에 기반하고 있다. 이 글은 chart-based parser를 이용하여 구문론적 차원에서 잘못 형성된 입력 문자의 복구에 촛점을 둔다. 멜리쉬의 체계는 두가지 분석기, 즉 잘형성된 입력 분석기와 잘못 형성된 입력 분석기로 구성되는데, 필자의 연구는 그에 생각을 따르고 있다. 이글에서는 주로 chartparsing의 개념, 잘못형성된 입력에 대한 분석전략이 논의된다. 또한 필자가 제시하는 체계의 디자인과 구현, 필자의 체계를 멜리쉬의 체계와의 비교와 같은 사항들이 다루어질 것이다.

한국어 관계절 문장의 이해 과정과 구조 (Comprehension Processes and Stuctures of Korean Relative Clause Sentence)

  • 김영진
    • 인지과학
    • /
    • 제6권2호
    • /
    • pp.5-27
    • /
    • 1995
  • 본 논문에서는 관계절 문장의 마디별 읽기 시간을 측정한 세 실험 결과를 종합하여 한국어 문장 해독의 처리 전략 및 수행 구조를 제안하였다. 첫째로,읽기 시간의 증가가 주로 명사 마디에서 일어났다는 결과에 근거해,한국어 해독이 명사 중심으로 이루어질 가능성에 대하여 논의하였다. 둘째로 문장 구조의 특성과 작업 기억의 부담을 읽기 시간의 증감과 관련지어 세가지 처리를 구분하였으며,병행기능 효과를 설명하기 위한 처리 전략을 제안하였다.셋째로 인접한 마디간의 읽기 시간의 차이에 기초해 관계절 문장 이해의 수행 구조를 제안하였다.이들 전략과 수행 구조는 관계절문장에서 보이는 마디별 읽기 시간의 변화를 잘 설명할 뿐만 아니라,현재 실험 자료가 없는 관계절 문장 유형에서 마디별 읽기 시간이 어떻게 나타날 것인지를 예측할 수 있게 한다.마지막으로 앞으로의 실험을 위한 여러 생각들을 논의 하였다.

  • PDF

한국어 의존 관계 분석과 자질 집합 분할을 이용한 기계학습의 성능 개선 (Analysis of Korean Language Parsing System and Speed Improvement of Machine Learning using Feature Module)

  • 김성진;옥철영
    • 전자공학회논문지
    • /
    • 제51권8호
    • /
    • pp.66-74
    • /
    • 2014
  • 최근에 한국어 의존 관계에 대한 파싱 시스템과 관련된 연구가 소프트웨어 공학자들이나 언어학자들에 의해 다양하게 연구되고 있으며, 시스템 구현은 주로 기계 학습이나 기호 주의를 사용하고 있다. 기계 학습을 사용한 방법은 한국어 문장 데이터가 매우 크기 때문에 시스템 특성상 매우 긴 학습시간을 가지며, 데이터 자체가 가지는 오류로 인하여 한정된 인식율을 가진다. 본 연구에서는 기계학습을 이용한 시스템에 대하여 학습 시간을 줄일 수 있도록 특징들을 자질 집합 모듈로 분할하여 처리하는 방법을 제안하고, 문장수와 반복횟수에 따른 인식율을 분석하였다. 설계된 시스템은 분리된 모듈과 이진 검색을 위한 정렬 기법이 사용되었다. 데이터는 세종 말뭉치로부터 추출한 후 정제된 36,090문장을 사용하였다. 학습 시간은 약 3시간으로 줄었으며, 인식율은 10,000 문장을 50회 학습하였을 때 84.54%로 가장 높았다. 모든 학습 문장(32,481)을 10회 학습하였을 때 인식율은 82.99%이다. 결과적으로 정제된 데이터를 이용하여 시스템이 안정화될 때까지 반복하는 것이 더 효율적이었다.

하위범주화에 의한 한국어 파싱 설계 (A Design of Korean Language Parsing based on Subcategorization)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.242-247
    • /
    • 2008
  • 본 논문은 하위범주화에 의한 한국어 파싱의 설계를 논의한다. 우선, 기계 번역에 중요한 영향을 끼치는 한국어 문법구성 요소인 통사 범주, 조사, 어미, 통사적 접사, 의존 명사 등을 논의하고 하위 범주화와 표현 패턴을 논의한다. 다음에 간단한 한국어 파서의 기본 골격을 제시한다. 첫 번째 과정은 입력 단계로서 문장을 스캐닝(scanning) 하고 관사, 명사, 수사, 통사적 접사, 조사, 의존 명사, 어미활용, 형용사, 부사, 조동사 들을 처리한다. 두 번째 과정에서는 하위범주화 패턴과 표현 패턴을 처리한다. 세 번째 단계에서는 절을 처리하고, 네 번째 단계에서는 SEA(Sentence Ending+Auxiliary)를 처리한다.

  • PDF

한국어의 Machine translation을 위한 구문 구조 분석 (Syntactic Analysis of Korean Sentence for Machine Translation)

  • 이주근;한성국;전병대
    • 대한전자공학회논문지
    • /
    • 제18권5호
    • /
    • pp.15-21
    • /
    • 1981
  • 이 논문은 기계 번역을 위한 한국어의 구문분석 algorithm과 system구성에 관한 것이다. 종래의 언어학적 문장구조를 재검토하여 품사와 성분을 통일된 관점에서 형태론적으로 분석 다음, 효과적인 품사분류 algorithm을 제안하고, 역이동변형 algorithm을 적용한 성분구조를 attribute개념을 도입하여 phrase structure rule로 처리하였다. 또한 한국어 조합문자의 조직개념을 lexicon구성에 도입하고 breadth-first searching에 의하여 문장의 심층구조가 포함된 parsing tate을 생성하는 구문분석 system을 구성하였으며, system program에 의해 입력문장을 심층구조로 분석한 결과를 보였다.

  • PDF