• 제목/요약/키워드: Syntactic Analysis

검색결과 261건 처리시간 0.024초

주관식 문제 채점에서의 구문의미트리 비교 시스템에 대한 연구 (Research on Comparing System with Syntactic-Semantic Tree in Subjective-type Grading)

  • 강원석
    • 컴퓨터교육학회논문지
    • /
    • 제20권5호
    • /
    • pp.79-88
    • /
    • 2017
  • 질높은 주관식 문제 채점을 위해서는 답변 속에 들어있는 단어간의 구문의미적 관계를 분석하는 구문 의미 분석이 필요하다. 그러나 구문의미 분석의 결과인 구문의미트리는 단어간의 구조적 의미 관계를 내포하고 있어 단어의 나열인 일차원적인 벡터의 유사도 계산을 적용할 수가 없다. 본 연구는 단어의 지식과 함께 단어와 단어간의 구조적 의미 관계를 내포하는 구문의미트리를 비교하는 비교 시스템에 대한 연구를 한다. 본 연구에서는 구문의미트리 비교를 위해 유사성 계산 원칙을 제안하고 실험을 통해 검증하였다. 본 구문의미트리 비교 시스템은 구문의미분석의 결과를 비교할 수 있게 하여 주관식 문제 채점에 도움을 줄 것이고 문서 유사도 영역에도 활용할 수 있을 것이다.

L2 한국어 통사 발달과 학습자 변인에 대한 종적 고찰: 자연 학습 환경의 예 (A Longitudinal Investigation on L2 Korean Syntactic Development and Learner Variables: Evidence from Natural Learning Environment)

  • 김정운;김영주;이선진
    • 한국어교육
    • /
    • 제28권4호
    • /
    • pp.1-38
    • /
    • 2017
  • This longitudinal study analyzed syntactic development (Complexity, Accuracy, and Fluency; CAF) of six L2 Korean learners in a natural learning context. The learners recalled the stories of a short animated video through speaking and writing every 3 months, from month 0 to 15. The learners' responses were analyzed for a series of CAF measures and their cognitive, psychological, and social variables were investigated. The results showed that (i) L2 Korean learners' speaking and writing in various time periods showed significant differences in spoken and written accuracy, and complexity; (ii) the correlation between spoken and written complexity, spoken and written accuracy, as well as spoken and written fluency were significant, and (iii) the regression analysis showed that learners' cognitive, social, and psychological variables have significant effect on the L2 Korean syntactic development. The current study reports that L2 Korean learners engaged in self-learning in a natural learning environment without formal instruction made significant syntactic development.

구문의미트리 비교기를 이용한 유사문서 판별기 (Discriminator of Similar Documents Using the Syntactic-Semantic Tree Comparator)

  • 강원석
    • 한국콘텐츠학회논문지
    • /
    • 제15권10호
    • /
    • pp.636-646
    • /
    • 2015
  • 정보사회에 문서 복제나 표절의 검출에 대한 필요성이 증대되고 있다. 그 필요성에 따라 많은 연구가 이루어지고 있으나 자연어 처리의 문제가 유사 문서 판별의 질 향상에 제약이 되었다. 최근 구문의미분석의 기술을 접목하여 유사문서 판별의 성능을 향상을 시도하였으나 구문의미분석의 결과인 구문의미트리를 비교하는 어려움이 있었다. 본 논문은 구문의미트리의 유사도를 계산하는 구문의미트리 비교기를 개발하고 이를 이용하여 유사문서를 판별하는 시스템을 설계, 구현한다. 본 시스템의 성능을 실험하기 위하여 휴먼 판별과 제안한 시스템의 판별과의 상관계수를 분석하였다. 실험결과, 구문의미트리 비교기를 이용한 유사문서 판별기의 성능을 검증할 수 있었다. 앞으로 문서 유형을 정의하고 각 유형에 맞는 판별 기법을 개발할 필요가 있다.

한국어 교재의 행 바꾸기 -띄어쓰기와 읽기 능력의 계발 - (Examining Line-breaks in Korean Language Textbooks: the Promotion of Word Spacing and Reading Skills)

  • 조인정;김단비
    • 한국어교육
    • /
    • 제23권1호
    • /
    • pp.77-100
    • /
    • 2012
  • This study investigates issues in relation to text segmenting, in particular, line breaks in Korean language textbooks. Research on L1 and L2 reading has shown that readers process texts by chunking (grouping words into phrases or meaningful syntactic units) and, therefore, phrase-cued texts are helpful for readers whose syntactic knowledge has not yet been fully developed. In other words, it would be important for language textbooks to avoid awkward syntactic divisions at the end of a line, in particular, those textbooks for beginners and intermediate level learners. According to our analysis of a number of major Korean language textbooks for beginner-level learners, however, many textbooks were found to display line-breaks of awkward syntactic division. Moreover, some textbooks displayed frequent instances where a single word (or eojeol in the case of Korean) is split between different lines. This can hamper not only learners' learning of the rules of spaces between eojeols in Korean, but also learners' development in automatic word recognition, which is an essential part of reading processes. Based on the findings of our textbook analysis and of existing research on reading, this study suggests ways to overcome awkward line-breaks in Korean language textbooks.

정보 검색 시스템의 성능 향상을 위한 구문 분석과 검색어 확장 (Syntactic Analysis and Keyword Expansion for Performance Enhancement of Information Retrieval System)

  • 윤성희
    • 한국산학기술학회논문지
    • /
    • 제5권4호
    • /
    • pp.303-308
    • /
    • 2004
  • 자연어 질의문장을 입력하는 방법은 정보 검색 시스템 사용자에게 가장 이상적인 인터페이스이다. 본 논문은 자연어 질의문장을 입력하는 검색 시스템을 위해 자연어 처리 기술에 기반 하여 사용자의 입력 질의 문장을 분석하고 검색어를 확장하는 다중검색 기법을 제안한다. 질의 문에 대한 형태소 분석 및 구문 분석을 수행하고, 구문 트리를 순회하여 구조적으로 연관된 복합명사를 조합하거나 분할하고, 이형표기 용어와 축약표기 용어들을 확장하여 다중 검색함으로써 재현율을 11.3%, 정확도를 4.7% 높였다.

  • PDF

내포문의 단문 분할을 이용한 한국어 구문 분석 (Korean Syntactic Analysis by Using Clausal Segmentation of Embedded Clause)

  • 이현영;이용석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권1호
    • /
    • pp.50-58
    • /
    • 2008
  • 한국어 문장은 대부분 주절과 내포문을 가지는 복문으로 구성되어 있다. 따라서 복문에 나타나는 하나 이상의 용언으로 인해 구문 분석 과정에서 다양한 구문 애매성이 발생한다. 이들 중 대부분은 내포문의 수식 범위로부터 발생되는 구 부착의 문제 때문이다. 이런 구문 애매성은 내포문의 범위를 정해서 하나의 구문 범주의 기능을 가지도록 하면 해결할 수가 있다. 본 논문에서는 내포문의 범위를 정하기 위해서 문형과 한국어의 구문 특성을 이용한다. 먼저, 내포문에 있는 용언의 문형 정보가 가질 수 있는 필수격을 최대로 부착하여 내포문의 범위를 정하고 이를 이용해서 복문을 내포문과 주절로 분할한다. 그리고 한국어의 구문 특성을 이용해서 분할된 내포문의 기능을 하나의 구문 범주인 체언구나 부사구로 변환한다. 이렇게 함으로써 복합문의 구성 형태가 단문 구조로 변환되기 때문에 내포문의 범위에 의한 구 부착의 문제가 쉽게 해결된다. 이것을 본 논문에서는 내포문의 단문 분할이라고 한다. 본 논문에서 제안한 방법으로 1000 문장을 실험한 결과 문형과 단문 분할을 이용하지 않은 방법보다 구문 애매성이 88.32% 감소되었다.

의존문법 기반의 구간 분할법을 활용한 한국어 구문 분석기 (Korean Parser Using Segmentation Based on Dependency Grammar)

  • 박용욱
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1705-1712
    • /
    • 2009
  • 최근 대부분의 한국어 구문분석기는 의존문법(Dependency Grammar)을 사용하고 있는데, 그 이유는 한국어의 특성인 어순이 비교적 자유롭고 생략이 잦은 문장에 대한 처리가 용이하기 때문이다. 하지만 의존문법을 이용한 한국어 구문분석은 많은 중의성을 도출하는 문제점이 대두되고 있다. 본 논문에서는 이러한 중의성을 보다 효과적으로 해결하기 위하여 200개가 넘는 의존문법 규칙과 문장의 구성성분을 이용한 구간분할방법, 관형형어미가 붙은 용언에 대한 처리 및 같은 용언에 중복된 구성성분 결합제한 방법을 사용한 구문분석기를 제안한다. 실험 결과 중의성 제거에 많은 효과가 있음을 보여준다.

보강문맥자유문법을 이용한 필기체한글 온라인 인식 (On-Line Recognition of Handwritten Hangeul by Augmented Context Free Grammar)

  • 이희동;김태균
    • 대한전자공학회논문지
    • /
    • 제24권5호
    • /
    • pp.769-776
    • /
    • 1987
  • A method of on-line recognition of Korean characters (Hangeul) by augmented conterxt free grammar is described in this paper. Syntactic analysis with context free grammar oftern has ambiguity. Insufficient description of relations among Hangrul sub-patterns causes this ambiguity can be determined through repetition of experiments. Flexible syntactic analysis is executed by adapting the condition to the (advice)part of augmented context free grammar. The ratio of correct recognition of this method is more than 99%.

  • PDF

형태소 분석기의 어휘적 중의성 해결에 관한 연구 (A Study on Lexical Ambiguity Resolution of Korean Morphological Analyzer)

  • 박용욱
    • 한국전자통신학회논문지
    • /
    • 제7권4호
    • /
    • pp.783-787
    • /
    • 2012
  • 한 어절을 중심으로 검사가 이루어지는 맞춤법 검사는 문맥상 어울리지 않는 단어로 인하여 생기는 오류는 찾기 어렵다. 맞춤법 검사기는 현재 어절 단위로 오류 여부를 판단하는 것이기 때문에 어휘적 중의성을 고려하지 않아도 된다. 그러나 문법 검사기는 문장 분석을 해야 하므로 어휘적 중의성을 제거하지 않고는 정확한 검사가 어렵다. 본 논문에서는 어휘적 중의성을 해결하기 위하여 몇 가지 규칙을 만들고 이를 활용하여 문장에 존재하는 어휘적 중의성을 해결할 수 있는 방법을 보인다. 또한 실험을 통하여 그 결과를 분석하였다.

우리나라 기록관리학 분야의 연구영역 분석 - 논문제목의 구문 및 의미 구조를 중심으로 - (A Study on Intellectual Structure of Records Management and Archives in Korea: Based on Syntactic and Semantic Structure of Article Titles)

  • 김규환;장보성;이현정
    • 한국문헌정보학회지
    • /
    • 제43권3호
    • /
    • pp.417-439
    • /
    • 2009
  • 본 연구는 논문제목의 구문 및 의미구조를 기반으로 국내 기록관리학 분야의 연구영역의 특성을 분석하였다. 이를 위해 1999년부터 2008년까지 국내 기록관리학 분야 전문 학술지 3종으로부터 핵심 연구논문 344개를 선정하였다. 해당 연구논문의 제목을 대상으로 구문 및 의미 구조를 분석하여 논문제목에 포함된 키워드들의 역할개념으로 '연구도메인', '연구대상', '연구초점'을 추출하였다. 추출된 3개의 역할개념별로 키워드들을 배정하여 군집화 하였다. 군집화 결과를 통해 최종적으로 국내 기록관리학 분야에서 어떤 연구대상이 핵심 연구대상이며 핵심 연구대상은 어느 연구도메인에서 어떤 연구초점에 관심을 두고 있는지를 분석하였다.