• Title/Summary/Keyword: 언어 분석

Search Result 4,670, Processing Time 0.037 seconds

Static Useless-Code-Detection for Two-Stage Language (정적으로 2단계 언어의 불필요한 식 찾기)

  • Cho, Sung-Keun;Yi, Kwang-Keun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06c
    • /
    • pp.478-481
    • /
    • 2011
  • 이 논문에서는 정적으로 2단계 언어의 불필요한 식을 찾는 분석 방법을 제안한다. 불필요한 식이란 식의 실행의미가 프로그램의 결과에 영향을 미치지 않는 식을 말한다. 다단계 프로그램이 불필요한 식을 만들어내는 지 프로그램 실행전에 알 수 있다면 프로그램 실행에 드는 비용을 줄일 수 있다. 이 분석은 다형타입을 가지는 다단계 언어의 타입시스템과 타입시스템에 올라탄 분석에 기반하고 있다. 이 분석으로 프로그램 실행 시 불필요한 식이 프로그램 코드 형태로 전파되는 것을 알 수 있으며 다형타입을 이용한 정교한 분석이 가능하다.

Performance Improvement of Parser through Error Analysts (오류 분석을 통한 파서의 성능향상)

  • Oh, Jin-Young;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.213-218
    • /
    • 2009
  • 본 논문에서는 무제한 텍스트 입력이 가능한 파서에서 오류분석을 통한 성능 향상을 이루고자 한다. 우선 코퍼스로부터 자동학습에 의해서 구문 분석 모델을 만들고 이를 평가하여 발생하는 오류를 분석한다. 오류를 감소시킬 수 있는 언어 특성이 반영된 자질을 추가하여 성능을 향상시키고자 한다. 세종 코퍼스를 10-fold cross validation으로 평가할 때, 한국어의 특성을 반영한 자질 추가로 1%이상의 성능 향상을 이루었다.

  • PDF

A Study on Implementation of treatment of Korean in multi-Language Corpus Analyzer (다국어 말뭉치 분석기의 한국어 처리 구현에 관한 연구)

  • Huh, Hyun-Gue;Chung, Hye-Myoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.04a
    • /
    • pp.118-121
    • /
    • 2009
  • 말뭉치 분석기는 언어 연구에 필요한 도구로써 망뭉치 분석을 통한 언어 정보의 추출, 적용 및 확인용으로 사용할 수 있다. 본 논문에서는 언어 기술을 국부 문법에 의한 그래픽적인 기술방법으로 처리하는 말뭉치 분석기를 이용하여 한국어 텍스트를 연구하기 위하여 기존의 굴절어 중심으로 구현되어진 다국어 말뭉치 분석기에 한국어와 같은 교착어들의 텍스트 처리를 위한 기능을 구현한다.

The Expansion of BIRS for Information Flow Analysis (정보흐름분석을 위한 BIRS의 확장)

  • Jung, Ji-Woong;Kim, Je-Min;Kim, Seon-Tae;Park, Joon-Seok;Yoo, Weon-Hee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.269-271
    • /
    • 2012
  • 프로그램에 대한 검증을 수행하기 위해서는 프로그램 안에서 여러 가지 분석이 이루어진다. 그 중에서 객체지향언어의 경우 분석을 위하여 객체지향적인 특성에 맞는 정보흐름분석을 사용해야 한다. 본 논문에서는 왜 객체지향언어의 특성에 맞는 정보흐름분석이 필요한지를 보이고, 객체지향적인 특성을 고려하지 않은 정보흐름분석 시에 어떤 문제가 생기는지 예시를 들어 설명한다. 그리고 자바의 검증도구인 BIRS(Bytecode Intermediate Representation with Specification)언어를 대상으로 하여 객체지향언어의 특성을 고려한 정보흐름분석이 가능하도록 새로운 명세를 추가하여 확장한다.

Non-autoregressive Multi Decoders for Korean Morphological Analysis (비자동회귀 다중 디코더 기반 한국어 형태소 분석)

  • Seongmin Cho;Hyun-Je Song
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.418-423
    • /
    • 2022
  • 한국어 형태소 분석은 자연어 처리의 기초가 되는 태스크이므로 빠르게 결과를 출력해야 한다. 기존연구는 자동회귀 모델을 한국어 형태소 분석에 적용하여 좋은 성능을 기록하였다. 하지만 자동회귀 모델은 느리다는 단점이 있고, 이 문제를 극복하기 위해 비자동회귀 모델을 사용할 수 있다. 비자동회귀 모델을 한국어 형태소 분석에 적용하면 조화롭지 않은 시퀀스 문제와 토큰 반복 문제가 발생한다. 본 논문에서는 두 문제를 해결하기 위하여 다중 디코더 기반의 한국어 형태소 분석을 제안한다. 조화롭지 않은 시퀀스는 다중 디코더를 적용함으로써, 토큰 반복 문제는 두 개의 디코더에 서로 어텐션을 적용하여 문제를 완화할 수 있다. 본 논문에서 제안한 모델은 세종 형태소 분석 말뭉치를 대상으로 좋은 성능을 확보하면서 빠르게 결과를 생성할 수 있음을 실험적으로 보였다.

  • PDF

Comparative Study of Sentiment Analysis Model based on Korean Linguistic Characteristics (한국어 언어학적 특성 기반 감성분석 모델 비교 분석)

  • Kim, Gyeong-Min;Park, Chanjun;Jo, Jaechoon;Lim, Heui-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.149-152
    • /
    • 2019
  • 감성분석이란 입력된 텍스트의 감성을 분류하는 자연어처리의 한 분야로, 최근 CNN, RNN, Transformer등의 딥러닝 기법을 적용한 다양한 연구가 있다. 한국어 감성분석을 진행하기 위해서는 형태소, 음절 등의 추가 자질을 활용하는 것이 효과적이며 성능 향상을 기대할 수 있는 방법이다. 모델 생성에 있어서 아키텍쳐 구성도 중요하지만 문맥에 따른 언어를 컴퓨터가 표현할 수 있는 지식 표현 체계 구성도 상당히 중요하다. 이러한 맥락에서 BERT모델은 문맥을 완전한 양방향으로 이해할 수있는 Language Representation 기반 모델이다. 본 논문에서는 최근 CNN, RNN이 융합된 모델과 Transformer 기반의 한국어 KoBERT 모델에 대해 감성분석 task에서 다양한 성능비교를 진행했다. 성능분석 결과 어절단위 한국어 KoBERT모델에서 90.50%의 성능을 보여주었다.

  • PDF

Movie Revies Sentiment Analysis Considering the Order in which Sentiment Words Appear (감성 단어 등장 순서를 고려한 영화 리뷰 감성 분석)

  • Kim, Hong-Jin;Kim, Dam-Rin;Kim, Bo-Eun;Oh, Shin-Hyeok;Kim, Hark-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.313-316
    • /
    • 2020
  • 감성 분석은 문장의 감성을 분석해 긍정 또는 부정으로 분류하는 작업을 의미한다. 문장에 담긴 감성을 파악해야 하기 때문에 문장 전체를 이해하는 것이 중요하다. 그러나 한 문장에 긍정과 부정의 이중 극성이 동존하는 문장은 감성 분석에 혼동이 생길 수 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 단어의 감성 점수 예측을 통해 감성 단어 등장 순서를 고려한 감성 분석 모델을 제안한다. 또한 최근 다양한 자연어 처리 분야에서 좋은 성능을 보이는 사전 학습 언어 모델을 활용한다. 실험 결과 감성 분석 정확도 90.81%로 기존 모델들에 비해 가장 좋은 성능을 보였다.

  • PDF

Design Method for Language Translation (언어 변환을 위한 설계 방법)

  • Park, Ju-Yeol;Kawk, Dong-Guy;Ko, Bang-Won;Yoo, Chae-Woo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.553-557
    • /
    • 2008
  • 현재 컴퓨터 응용프로그램을 개발하기 위해 많은 프로그래밍 언어가 존재한다. 사용자는 사용 목적에 따라 그에 맞는 새로운 프로그래밍 언어를 학습하고 사용한다. 그러나 프로그래밍 언어를 학습하고 사용하기 위해서는 많은 시간과 노력이 필요하기 때문에 사용자의 언어 학습의 비용과 시간을 줄이기 위해 두 언어간에 변환을 가능하게 해주는 방법이 필요하다. 본 논문에서는 기존의 어휘 분석, 구문 분석 등의 여러 단계를 거치는 방법과는 다른 토큰 매핑 테이블과 XML로 기술한 변환 규칙을 통한 새로운 언어 변환을 위한 설계 방법을 제시함으로써 재사용성과 생산성을 높일 수 있는 것으로 기대된다.

  • PDF

Expansion and Improvement of Korean FrameNet utilizing linguistic features (언어적 특징을 반영한 한국어 프레임넷 확장 및 개선)

  • Kim, Jeong-uk;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.85-89
    • /
    • 2016
  • 프레임넷 (FrameNet) 프로젝트는 버클리에서 1997년에 처음 제안했으며, 최근에는 다양한 언어적 특징을 반영하여 여러 국가에서 사용되고 있다. 하지만 문장의 프레임을 분석하는 것은 자연언어처리 전문가들이 많은 시간을 들여야 한다. 이 때문에, 한국어 프레임넷을 처음 만들 때는 충분한 훈련을 받은 번역가들이 영어 프레임넷의 문장들과 그 주석 정보들을 직접 번역하는 방법을 사용했다. 결과적으로 상대적으로 적은 비용이 들지만, 여전히 한 문장에 여러 번 등장하는 프레임 정보를 모두 번역하고 에러를 분석해야 했기에 많은 노력이 들어갔다. 본 연구에서는 일본어와 한국어의 언어적 유사성을 사용하여 비교적 적은 비용으로 한국어 프레임넷을 확장하는 방법을 제시한다. 또한 프레임넷에 친숙하지 않은 사용자가 더욱 쉽게 프레임 정보를 활용할 수 있도록 PubAnnotation 기술을 도입하고 "조사"라는 특성을 고려한 Valence pattern 분류를 통해 한국어 공개 프레임넷 사이트를 개선하였다.

  • PDF

Design and Implementation of Real-Time Language Satisfying Timing Constraints using the Results of Static Analysis (정적 분석을 이용하여 시간 제약 조건을 해결한 실시간 언어의 설계 및 구현)

  • Lee, Jun-Dong;Baek, Jeong-Hyeon;Won, Yu-Heon
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.6 no.6
    • /
    • pp.620-627
    • /
    • 2000
  • 실시간 프로그램은 다양한 응용분야에 중요하게 이용되고 있는데, 기존의 일반 언어는 시간적인 개념을 고려하여 설계하지 않았으므로 실시간 응용에 부적합하며, 이를 해결하기 위한 실시간 언어는 시간 개념을 표현하기 위하여 많은 문법이 추가되어 기존 프로그래머에 익숙치 못한 결점이 있다. 본 연구에서는 기존의 C언어에 익숙한 프로그래머들이 저항감 없이 실시간 프로그래밍을 할 수 있는 언어를 설계하고 구현한다. 이 구현에서는 시간 트리를 이용함으로써 원시 언어와 목적 언어의 연결이 가능하며, 정적 분석을 이용한 결과를 코드 생성에 이용함으로써 외부적인 타이머 없이 시간적인 사건의 처리가 가능하다.

  • PDF