• 제목/요약/키워드: Parsing

검색결과 506건 처리시간 0.029초

Table parsing을 이용한 정보검색시스템의 효율향상 (Implementation of Information Retrieval System by Table-parsing)

  • 김영순;권혁철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.413-416
    • /
    • 2001
  • 인터넷 문서에서 구조정보의 대표적인 예라 할 수 있는 표(table)는 의미있는 정보를 가지고 있는 경우가 많다. 하지만 인터넷상의 표는 여러 가지 형태이며, 이것에 맞게 표를 효과적으로 parsing하는 방법이 필요하다. 이렇게 parsing한 표의 정보를 이용하여, 인터넷 문서, 특히 전자상거래 문서에 있는 표를 표준화한 틀에 따라 개념화하여, 의미있는 정보를 추출해 낼 수 있다.

  • PDF

소규모 문맥 자유 문법에 대한 Left-Corner / Look-Ahead 차트 파싱 알고리즘의 성능 평가 (Performance Evaluation of Left-Comer and Look-Ahead Chart Parsing for Small-Sized Context Free Grammar)

  • 심광섭
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권7호
    • /
    • pp.571-579
    • /
    • 2009
  • 차트 파싱 알고리즘에서 left-corner와 look-ahead 정보를 이용하여 불필요한 중간 구조가 생성되지 않도록 함으로써 파싱 속도를 향상시키는 방법이 제안된 바 있다. left-corner와 look-ahead 정보를 이용할 경우 불필요한 중간 구조가 생성되지 않으므로 파싱 속도가 빨라지겠지만 이러한 정보를 유지 관리하고 참조하는 데 따른 추가 비용이 발생한다. 이러한 추가 비용이 발생함에도 불구하고 대규모 문법을 사용하여 파싱을 할 때에는 파싱 속도가 상당한 많이 향상되었다는 연구 결과가 있었다. 본 논문에서 는 소규모 문법을 사용했을 때 파싱 속도가 어느 정도 향상되는가를 관찰하는 실험을 하였다. 실험 결과 소규모의 문법에서는 파싱 속도 향상 정도가 상대적으로 낮았으며 left-corner 정보는 파싱 속도를 향상 시키는 것이 아니라 오히려 저해한다는 사실을 알 수 있었다.

Extended LR Methods for Efficient Parsing with Feature-based Grammars

  • Le, Kang-Hyuk
    • 인지과학
    • /
    • 제15권1호
    • /
    • pp.25-33
    • /
    • 2004
  • 본 논문은 자질기반 문법의 LR 파싱 테이블 생성과 관련된 두 가지 문제점을 논의한다. 먼저 자질기반 문법에 LR 파싱 방법을 적용할 경우 발생하는 비종결성 및 비결정성의 문제를 살펴본 후, 이 문제를 해결할 수 있는 LR 방법을 제시한다. 또한 파싱 테이블을 생성하기에는 충분한 정보를 가지지 못하는 하위명시 규칙의 문제점을 지적하고, 이러한 규칙들을 LR 파싱 방법으로 처리할 수 있도록 하는 규칙추론 알고리듬을 제안한다.

  • PDF

변화된 스레드 트리를 이용한 점진적 LR 파싱 알고리즘 구현 및 설계 (On Design and Implementation of Incremental LR Parsing Algorithm Using Changed Threed Tree)

  • 이대식
    • 융합보안논문지
    • /
    • 제5권4호
    • /
    • pp.19-25
    • /
    • 2005
  • 스레드 트리란 LR 파싱표를 사용하여 파스 트리인 동시에 파스 스택을 표현 할 수 있는 자료구조이다. $Larchev\^{e}que$는 스택을 사용하여 스레드 트리들 구성하고 점진적 파싱을 한다. 본 논문에서는 재 파싱 노드와 파싱속도를 줄이기 위해 스택을 사용하지 않는 변화된 스레드 트리를 구성하는 알고리즘을 제안한다. 또한 노드의 재 파싱 과정을 없애기 위해 변화된 스레드 트리와 LR 파싱표를 사용하는 점진적 파싱 알고리즘을 제안한다.

  • PDF

이벤트 파싱 엔진의 구조 설계와 성능 분석 (Architecture Modeling and Performance Analysis of Event Rule Engine)

  • 윤태웅;민덕기
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2003년도 추계학술대회 및 정기총회
    • /
    • pp.51-57
    • /
    • 2003
  • In operating distributed systems, proactive management is one of the major concerns for better quality of service and future capacity planning. In order to handle this management problem effectively, it is necessary to analyze performances of the distributed system and events generated by components in the system. This paper provides a rule-based event parsing engine for proactive management. Our event parsing engine uses object hooking-based and event-token approaches. The object hooking-based approach prepares new conditions and actions in Java classes and allows dynamically exchange them as hook objects in run time. The event-token approach allows the event parsing engine consider a proper sequence and relationship among events as an event token to trigger an action. We analyze the performance of our event parsing engine with two different implementations of rule structure; one is table-based and the other is tree-based.

  • PDF

Proper Noun Embedding Model for the Korean Dependency Parsing

  • Nam, Gyu-Hyeon;Lee, Hyun-Young;Kang, Seung-Shik
    • Journal of Multimedia Information System
    • /
    • 제9권2호
    • /
    • pp.93-102
    • /
    • 2022
  • Dependency parsing is a decision problem of the syntactic relation between words in a sentence. Recently, deep learning models are used for dependency parsing based on the word representations in a continuous vector space. However, it causes a mislabeled tagging problem for the proper nouns that rarely appear in the training corpus because it is difficult to express out-of-vocabulary (OOV) words in a continuous vector space. To solve the OOV problem in dependency parsing, we explored the proper noun embedding method according to the embedding unit. Before representing words in a continuous vector space, we replace the proper nouns with a special token and train them for the contextual features by using the multi-layer bidirectional LSTM. Two models of the syllable-based and morpheme-based unit are proposed for proper noun embedding and the performance of the dependency parsing is more improved in the ensemble model than each syllable and morpheme embedding model. The experimental results showed that our ensemble model improved 1.69%p in UAS and 2.17%p in LAS than the same arc-eager approach-based Malt parser.

Deep Facade Parsing with Occlusions

  • Ma, Wenguang;Ma, Wei;Xu, Shibiao
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.524-543
    • /
    • 2022
  • Correct facade image parsing is essential to the semantic understanding of outdoor scenes. Unfortunately, there are often various occlusions in front of buildings, which fails many existing methods. In this paper, we propose an end-to-end deep network for facade parsing with occlusions. The network learns to decompose an input image into visible and invisible parts by occlusion reasoning. Then, a context aggregation module is proposed to collect nonlocal cues for semantic segmentation of the visible part. In addition, considering the regularity of man-made buildings, a repetitive pattern completion branch is designed to infer the contents in the invisible regions by referring to the visible part. Finally, the parsing map of the input facade image is generated by fusing the results of the visible and invisible results. Experiments on both synthetic and real datasets demonstrate that the proposed method outperforms state-of-the-art methods in parsing facades with occlusions. Moreover, we applied our method in applications of image inpainting and 3D semantic modeling.

포인터 네트워크를 이용한 한국어 의존 구문 분석 (Korean Dependency Parsing using Pointer Networks)

  • 박천음;이창기
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.822-831
    • /
    • 2017
  • 본 논문에서는 멀티 태스크 학습 기반 포인터 네트워크를 이용한 한국어 의존 구문 분석 모델을 제안한다. 멀티 태스크 학습은 두 개 이상의 문제를 동시에 학습시켜 성능을 향상시키는 방법으로, 본 논문에서는 이 방법에 기반한 포인터 네트워크를 이용하여 어절 간의 의존 관계와 의존 레이블 정보를 동시에 구하여 의존 구문 분석을 수행한다. 어절 기반의 의존 구문 분석에서 형태소 기반의 멀티 태스크 학습 기반 포인터 네트워크를 수행하기 위하여 입력 기준 5가지를 정의하고, 성능 향상을 위하여 fine-tuning 방법을 적용한다. 실험 결과, 본 논문에서 제안한 모델이 기존 한국어 의존 구문 분석 연구들 보다 좋은 UAS 91.79%, LAS 89.48%의 성능을 보였다.

점진적 LL(1) 구문분석에서의 재사용 시점의 계산 (Computation of Reusable Points in Incremental LL(1) Parsing)

  • 이경옥
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권11호
    • /
    • pp.845-850
    • /
    • 2010
  • 점진적 구문분석은 기존 입력 문자열에 대한 구문분석 정보를 새로운 문자열의 구문분석 시에 재사용하고자 하는 취지로 연구 개발되었다. 기존 점진적 LL(1) 구문분석에서는 미리 재사용 시점을 계산하여 이를 구문분석 시에 이용하였다 본 논문에서는 기존의 재사용 시점 계산을 인수분해하여 불필요한 중복 계산 없이 효율적으로 수행하는 방법을 제안한다. 또한 기존의 재사용 시점 파악을 위해서 사용되었던 공통심볼 저장방법과 거리저장방법을 결합하여 공통심볼까지의 거리저장방법을 제안한다. 이에 기반한 효율적인 점진적 LL(1) 구문분석기를 생성한다.

Semantic parsing 기반 지식 베이스 질의응답 시스템의 어휘-의미 패턴 질의 템플릿을 통한 보완 (Assisting semantic parsing-based QA system with lexico-semantic pattern query template)

  • 심효섭;박선영;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.255-258
    • /
    • 2014
  • 본 논문에서는 semantic parsing과 사전 정의된 어휘-의미 패턴 질의 템플릿 방법론을 결합하여 자연어 질의로부터 RDF 지식베이스에 질의하기 위한 SPARQL 쿼리를 생성하는 방법을 제안한다. semantic parsing 접근법은 문장의 표현과 분리된 형식적 의미표현만을 포착해내므로, paraphrase 혹은 의미 변화와 무관한 어순의 변화에 강인하지만, 일부 자연어 질의문장에는 단순한 의미 및 구조를 갖는 문장도 적합한 형식적 의미표현을 생성하지 못하는 단점이 있다. 따라서 이 연구에서는 이러한 단순한 문장에 있어서는 사전 정의된 질의 템플릿을 사용하여 적합한 쿼리를 생성하되, 적합한 템플릿을 선택하는데 있어 해당 질의문장의 어휘-의미적 유형을 포착하고 해당 정보를 이용하는 방법을 이용하였으며 이를 통해 주 방법론의 약점을 보완하는 제한적인 효과를 얻을 수 있었다.

  • PDF