• Title/Summary/Keyword: 언어적 오류

Search Result 380, Processing Time 0.03 seconds

Multi-class Classification System Based on Multi-loss Linear Combination for Word Spacing and Sentence Boundary Detection (띄어쓰기 및 문장 경계 인식을 위한 다중 손실 선형 결합 기반의 다중 클래스 분류 시스템)

  • Kim, GiHwan;Seo, Jisu;Lee, Kyungyeol;Ko, Youngjoong
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.185-188
    • /
    • 2018
  • 띄어쓰기와 문장 경계 인식은 그 성능에 따라 자연어 분석 단계에서 오류를 크게 전파하기 때문에 굉장히 중요한 문제로 인식되고 있지만 각각 서로 다른 자질을 사용하는 문제 때문에 각각 다른 모델을 사용해 순차적으로 해결하였다. 그러나 띄어쓰기와 문장 경계 인식은 완전히 다른 문제라고는 볼 수 없으며 두 모델의 순차적 수행은 앞선 모델의 오류가 다음 모델에 전파될 뿐만 아니라 시간 복잡도가 높아진다는 문제점이 있다. 본 논문에서는 띄어쓰기와 문장 경계 인식을 하나의 문제로 보고 한 번에 처리하는 다중 클래스 분류 시스템을 통해 시간 복잡도 문제를 해결하고 다중 손실 선형 결합을 사용하여 띄어쓰기와 문장 경계 인식이 서로 다른 자질을 사용하는 문제를 해결했다. 최종 모델은 띄어쓰기와 문장 경계 인식 기본 모델보다 각각 3.98%p, 0.34%p 증가한 성능을 보였다. 시간 복잡도 면에서도 단일 모델의 순차적 수행 시간보다 38.7% 감소한 수행 시간을 보였다.

  • PDF

A Design on Error Tracking System for Enhanced-Reliable IoT Service (사물인터넷 서비스의 신뢰성 강화를 위한 오류 추적 시스템 설계)

  • Lim, Ho-Seung;Choi, Chang-Won
    • Journal of Internet of Things and Convergence
    • /
    • v.6 no.3
    • /
    • pp.15-20
    • /
    • 2020
  • In this paper, an error tracking platform is designed for enhanced-reliable IOT system. The platform is designed to enhance reliability of IOT system by analysing additional informations(OS, Browser, Device) and by notifying error detection to developers. Especially, in the case of an error in the service which it is difficult for developers to recognize it, The platform also supports notification services through various communication media(Email, Slack, SMS). The common interface is designed to accommodate many languages(typescript, Swift, and Android) in the development process, and the interface allows users to analyze errors that occur on various platforms, including mobile/web/desktop applications. By presenting each error in groups through issues, developers can easily identify issues in the service. The visualizing function is included to recognize various error type by dashboard.

A Preliminary Study on Serious Game for C Language Study of Beginners : freCman (초보자를 위한 C 언어 학습 기능성 게임 개발 사례 : 프레C맨)

  • Hwang, Kitae;Jung, Inhwan
    • Journal of Korea Game Society
    • /
    • v.15 no.4
    • /
    • pp.199-206
    • /
    • 2015
  • This paper introduces a serious game called freCman developed for C programming language beginners. Since key words, syntax, and programming structure of C programming language are unfamiliar for them, they feel uneasy and have many difficulties to study. We developed three games such as shooting star C, finding hidden errors, unscrambling C codes through which C beginners can study C language easily. Also we developed CTS(Code to Speech) which speeches C source codes like English statements so that C beginners can be familiar with C key words and statements. To prove effectiveness of the freCman, some experiments have been conducted with C language beginners. Experiment results show that the freCman helps beginners studying C programming language much.

Applying Universal Dependency Relation Tagsets to Korean (Universal Dependency 관계 태그셋의 한국어 적용)

  • Lee, Chanyoung;Kim, Jinung;Kim, Han Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.334-339
    • /
    • 2018
  • 본 논문에서는 기존에 구축되어 있는 구 구조 기반 구문 분석 태그셋을 Universal Dependency 관계 태그 셋으로 변환하는 방안에 대해 논의하였다. 범언어적으로 활용하기 위해 개발된 Universal Dependency의 관계 태그셋을 한국어에 적용할 때에는 범용 POS 태그셋인 UPOS뿐만 아니라 개별 언어의 특성을 반영하고 있는 XPOS를 반드시 참고해야만 한다. 본 연구에서는 Universal Dependency 관계 태그셋을 한국어 구문 분석 태그셋에 대응시키는 과정에서 생기는 문제점들을 '원시 말뭉치 처리 문제'와 '기구축 구문 태그 말뭉치 오류의 문제'로 나누어 지적하고, 이에 대한 해결책을 제시하였다.

  • PDF

Korean-English statistical speech translation Using n-best re-ranking (n-best 리랭킹을 이용한 한-영 통계적 음성 번역)

  • Lee, Dong-Hyeon;Lee, Jong-Hoon;Lee, Gary Geun-Bae
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.171-176
    • /
    • 2006
  • 본 논문에서는 n-best 리랭킹을 이용한 한-영 통계적 음성 번역 시스템에 대해 논하고 있다. 보통의 음성 번역 시스템은 음성 인식 시스템, 자동 번역 시스템, 음성 합성 시스템이 순차적으로 결합되어 있다. 하지만 본 시스템은 음성 인식 오류에 보다 강인한 시스템을 만들기 위해 음성 인식 시스템으로부터 n-best 인식 문장을 추출하여 번역 결과와 함께 리랭킹의 과정을 거친다. 자동 번역 시스템으로 구절기반 통계적 자동 번역 모델을 사용하여, 음성 인식기의 발음 모델에서 기본 단어 단위와 맞추어 번역 모델과 언어 모델을 훈련시킴으로써 음성 번역 시스템에서 형태소 분석기를 제거할 수 있다. 또한 음성 인식 시스템에서 상황 별로 언어 모델을 분리하여 처리함으로써 자동 번역 시스템에 비해 부족한 음성 인식 시스템의 처리 범위를 보완할 수 있었다.

  • PDF

Advanced detection of sentence boundaries based on hybrid method (하이브리드 방법을 이용한 개선된 문장경계인식)

  • Lee, Chung-Hee;Jang, Myung-Gil;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.61-66
    • /
    • 2009
  • 본 논문은 다양한 형태의 웹 문서에 적용하기 위해서, 언어의 통계정보 및 후처리 규칙에 기반 하여 개선된 문장경계 인식 기술을 제안한다. 제안한 방법은 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 문서에 적용하기 위해서 문장경계로 사용될 수 있는 모든 음절을 대상으로 학습하여 문장경계 인식을 수행하였고, 문장경계인식 성능을 최대화 하기 위해서 다양한 실험을 통해 최적의 자질 및 학습데이터를 선정하였고, 다양한 기계학습 기반 분류 모델을 비교하여 최적의 분류모델을 선택하였으며, 학습데이터에 의존적인 통계모델의 오류를 규칙에 기반 해서 보정하였다. 성능 실험은 다양한 형태의 문서별 성능 측정을 위해서 문어체와 구어체가 복합적으로 사용된 신문기사와 블로그 문서(평가셋1), 문어체 위주로 구성된 세종말뭉치와 백과사전 본문(평가셋2), 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 사이트의 게시판 글(평가셋3)을 대상으로 성능 측정을 하였다. 성능척도로는 F-measure를 사용하였으며, 구두점만을 대상으로 문장경계 인식 성능을 평가한 결과, 평가셋1에서는 96.5%, 평가셋2에서는 99.4%를 보였는데, 구어체의 문장경계인식이 더 어려움을 알 수 있었다. 평가셋1의 경우에도 규칙으로 후처리한 경우 정확률이 92.1%에서 99.4%로 올라갔으며, 이를 통해 후처리 규칙의 필요성을 알 수 있었다. 최종 성능평가로는 구두점만을 대상으로 학습된 기본 엔진과 모든 문장경계후보를 인식하도록 개선된 엔진을 평가셋3을 사용하여 비교 평가하였고, 기본 엔진(61.1%)에 비해서 개선된 엔진이 32.0% 성능 향상이 있음을 확인함으로써 제안한 방법이 웹 문서에 효과적임을 입증하였다.

  • PDF

Implementing LGDB, CHILL Cross Debugger Using IPC of Switch System (교환기 IPC를 이용한 CHILL 교차 디버거, LGDB의 구현)

  • 윤기창;문정석;김병철;권경인;조시철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10c
    • /
    • pp.596-598
    • /
    • 1999
  • 교환기 소프트웨어 개발에 많은 언어가 사용되고 있으나, 현재 우리나라의 교환기 제조업체 대부분은 ITU-T에서 통신 소프트웨어 개발 언어로 권고하는 CHILL 언어를 사용하고 있다. CHILL은 엄격한 타입 검사, 구조적 프로그래밍, 모듈화, 병렬 처리 기능을 특징으로 하고 있다. LG정보통신에서는 이러한 CHILL 프로그램의 시험 및 디버깅을 위하여 GNU Debugger(GDB)를 기반으로 CHILL 교차 디버거인 LGDB(LG Debugger)를 개발하였다. LGDB는 현재 사용 중인 대부분의 마이크로 프로세서를 지원하며, 호스트에서 개발한 프로그램들이 교환기 시스템과 같은 목적 시스템 상에서 정상적으로 실행되는지 검사하고, 만약 오류가 발생하였을 경우 이를 추적하여 수정하는 기능을 제공한다. 점차 대용량화, 고성능화가 요구되고 있는 교환기 개발 프로젝트의 추세를 감안할 때, LGDB는 교환기 소프트웨어의 품질 및 생산성 향상에 매우 높은 기여를 할 것이다.

  • PDF

A Study on the Teaching Method of Korean Pronunciation for the Chinese Learners (중국인 초급 학습자의 한국어 발음 교육 연구 - 자음과 모음을 중심으로 -)

  • Jiang, Fei
    • Korean Educational Research Journal
    • /
    • v.40 no.2
    • /
    • pp.35-56
    • /
    • 2019
  • This study is concentrated to search for the effective teaching method of Korean pronunciation as one of Korean language teaching for the chinese. Pronunciation is the most basic factor in the use of language. pronunciation is the basic factor for learners to judge the fluency and accuracy of the target language in the process of communication. but people usually learn the second- language when they are adults, who are surely influenced by mother language. Therefore, it is the main purpose of this thesis to seek vocal sound system and phonological phenomena in Korean and Chinese and figure out the common and difference of these two languages through contrastive analysis.

  • PDF

Verification of the Domain Specialized Automatic Post Editing Model (도메인 특화 기계번역 사후교정 모델 검증 연구)

  • Moon, Hyeonseok;Park, Chanjun;Seo, Jaehyeong;Eo, Sugyeong;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.3-8
    • /
    • 2021
  • 인공지능 기술이 발달함에 따라 기계번역 기술도 많은 진보를 이루었지만 여전히 기계번역을 통한 번역문 내에는 사람이 교정해야 하는 오류가 다수 포함되어있다. 이렇게 번역 모델에서 생성되는 오류를 교정하는 전문인력의 요구를 경감시키기 위하여 기계번역 사후교정 연구가 등장하였고, 해당 연구는 현재 WMT를 주축으로 활발하게 연구되고 있다. 이러한 사후교정 연구는 최근 도메인 특화 관점에서 주로 연구가 이루어지고 있으며 현재 많은 도메인에서 유의미한 성과를 내고 있다. 하지만 이런 연구들은 기존 번역문의 품질을 얼만큼 향상시켰는가에 초점을 맞출 뿐, 다른 도메인 특화 번역모델의 성능과 비교했을 때 얼마나 뛰어난지는 밝히지 않기 때문에 사후교정 연구가 도메인 특화에서 효과적으로 작용하는지 명확하게 알 수 없다. 이에 본 연구에서는 도메인 특화 번역 모델과 도메인 특화 사후교정 모델간의 성능을 비교함으로써, 도메인 특화에서 사후교정을 통해 얻을 수 있는 실제적인 성능을 검증한다. 이를 통해 사후교정이 도메인 특화 번역모델과 비교했을 때 미미한 수준의 성능을 보임을 실험적으로 확인하였고, 해당 실험 결과를 분석함으로써 향후 도메인특화 사후교정 연구의 방향을 제안하였다.

  • PDF

A programming enhancements for embedded software development -Be based on MISRA-C (임베디드 S/W 개발 시 프로그래밍 개선점 -MISRA-C를 중심으로)

  • Jung, Da-Hye;Ahn, So-Jin;Choi, Jin-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.238-240
    • /
    • 2012
  • 소프트웨어 개발 시 코딩 규칙을 준수하면 소프트웨어에 잠재적으로 존재하는 프로그래밍 오류를 예방하는데 많은 도움이 된다. MISRA-C: 2004 는 고 신뢰성과 고품질이 요구되는 자동차, 우주항공, 통신, 등 제조분야에 대한 C언어 코딩 가이드 라인이다. 본 논문에서는 자동차와 우주항공같이 높은 안전성이 요구되는 원격 수소시스템을 타깃으로 하여 정적 분석한다. 그리고 분석 결과 발견된 오류 중 가장 빈번히 일어나는 오류에 대한 문제점을 분석하고 소프트웨어 품질 개선을 위하여 프로그래머들의 코딩 규칙 준수를 권장한다.