• 제목/요약/키워드: 언어적 오류

검색결과 380건 처리시간 0.027초

띄어쓰기 및 문장 경계 인식을 위한 다중 손실 선형 결합 기반의 다중 클래스 분류 시스템 (Multi-class Classification System Based on Multi-loss Linear Combination for Word Spacing and Sentence Boundary Detection)

  • 김기환;서지수;이경열;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.185-188
    • /
    • 2018
  • 띄어쓰기와 문장 경계 인식은 그 성능에 따라 자연어 분석 단계에서 오류를 크게 전파하기 때문에 굉장히 중요한 문제로 인식되고 있지만 각각 서로 다른 자질을 사용하는 문제 때문에 각각 다른 모델을 사용해 순차적으로 해결하였다. 그러나 띄어쓰기와 문장 경계 인식은 완전히 다른 문제라고는 볼 수 없으며 두 모델의 순차적 수행은 앞선 모델의 오류가 다음 모델에 전파될 뿐만 아니라 시간 복잡도가 높아진다는 문제점이 있다. 본 논문에서는 띄어쓰기와 문장 경계 인식을 하나의 문제로 보고 한 번에 처리하는 다중 클래스 분류 시스템을 통해 시간 복잡도 문제를 해결하고 다중 손실 선형 결합을 사용하여 띄어쓰기와 문장 경계 인식이 서로 다른 자질을 사용하는 문제를 해결했다. 최종 모델은 띄어쓰기와 문장 경계 인식 기본 모델보다 각각 3.98%p, 0.34%p 증가한 성능을 보였다. 시간 복잡도 면에서도 단일 모델의 순차적 수행 시간보다 38.7% 감소한 수행 시간을 보였다.

  • PDF

사물인터넷 서비스의 신뢰성 강화를 위한 오류 추적 시스템 설계 (A Design on Error Tracking System for Enhanced-Reliable IoT Service)

  • 임호성;최창원
    • 사물인터넷융복합논문지
    • /
    • 제6권3호
    • /
    • pp.15-20
    • /
    • 2020
  • 본 논문에서는 사물인터넷 서비스 개발 과정에서 발생할 수 있는 오류에 대한 분석 및 추적, 알림 시스템을 설계하였다. 오류에 대한 세부적인 부가정보(OS, Browser, Device)들을 체계적으로 분석하고 오류가 발생한 상황을 개발자가 인지하도록 하여 시스템의 신뢰성을 강화하였다. 특히 서비스 내에서 오류가 발생한 경우 개발자가 이를 인지하기 어려운 상황을 고려하여 다양한 알림 매체(Email, Slack, SMS)를 통해서 인지할 수 있도록 하였다. 설계 및 개발과정에서 사물인터넷 환경의 특성 상 여러 언어(Typescript, Swift, Android)에 대해 수용할 수 있도록 공용 인터페이스를 고안했으며, 이 인터페이스를 활용하여 모바일, 웹, 데스크톱 어플리케이션 등 여러 사물인터넷 시스템에서 발생한 오류를 수용해서 분석할 수 있다. 또한 각각의 오류 이슈를 통해 집합으로 표현함으로써 개발자가 서비스 개발 시 어떤 이슈가 있는지 쉽게 파악할 수 있으며 대시보드를 통해서 발생한 오류들을 인지할 수 있는 시각화 기능을 제공하였다.

초보자를 위한 C 언어 학습 기능성 게임 개발 사례 : 프레C맨 (A Preliminary Study on Serious Game for C Language Study of Beginners : freCman)

  • 황기태;정인환
    • 한국게임학회 논문지
    • /
    • 제15권4호
    • /
    • pp.199-206
    • /
    • 2015
  • 본 논문은 C 언어를 배우는 초보자를 위한 기능성 게임 프레C맨(freCman)의 개발 사례를 소개한다. C 언어를 처음 배우는 사람들은 C 언어의 키워드나 문법, 문장 구조에 생소하여 학습에 어려움을 느낀다. 본 논문은 슈팅스타C, 숨은 오류 찾기, 코드 순서 맞추기 등의 3 가지의 게임을 개발하고, 이를 통해 C 언어에 보다 쉽게 접근할 수 있도록 하였고, CTS(Code to Speech) 기능을 추가하여 C 소스 코드를 읽어 줌으로써 청각적으로 C 언어의 키워드나 문장에 친숙하도록 하였다. C 언어를 처음 배우는 학생들을 대상으로 실험한 결과 프레C맨이 C 프로그래밍 학습에 도움이 되었다는 결과를 얻었다.

Universal Dependency 관계 태그셋의 한국어 적용 (Applying Universal Dependency Relation Tagsets to Korean)

  • 이찬영;김진웅;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.334-339
    • /
    • 2018
  • 본 논문에서는 기존에 구축되어 있는 구 구조 기반 구문 분석 태그셋을 Universal Dependency 관계 태그 셋으로 변환하는 방안에 대해 논의하였다. 범언어적으로 활용하기 위해 개발된 Universal Dependency의 관계 태그셋을 한국어에 적용할 때에는 범용 POS 태그셋인 UPOS뿐만 아니라 개별 언어의 특성을 반영하고 있는 XPOS를 반드시 참고해야만 한다. 본 연구에서는 Universal Dependency 관계 태그셋을 한국어 구문 분석 태그셋에 대응시키는 과정에서 생기는 문제점들을 '원시 말뭉치 처리 문제'와 '기구축 구문 태그 말뭉치 오류의 문제'로 나누어 지적하고, 이에 대한 해결책을 제시하였다.

  • PDF

n-best 리랭킹을 이용한 한-영 통계적 음성 번역 (Korean-English statistical speech translation Using n-best re-ranking)

  • 이동현;이종훈;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.171-176
    • /
    • 2006
  • 본 논문에서는 n-best 리랭킹을 이용한 한-영 통계적 음성 번역 시스템에 대해 논하고 있다. 보통의 음성 번역 시스템은 음성 인식 시스템, 자동 번역 시스템, 음성 합성 시스템이 순차적으로 결합되어 있다. 하지만 본 시스템은 음성 인식 오류에 보다 강인한 시스템을 만들기 위해 음성 인식 시스템으로부터 n-best 인식 문장을 추출하여 번역 결과와 함께 리랭킹의 과정을 거친다. 자동 번역 시스템으로 구절기반 통계적 자동 번역 모델을 사용하여, 음성 인식기의 발음 모델에서 기본 단어 단위와 맞추어 번역 모델과 언어 모델을 훈련시킴으로써 음성 번역 시스템에서 형태소 분석기를 제거할 수 있다. 또한 음성 인식 시스템에서 상황 별로 언어 모델을 분리하여 처리함으로써 자동 번역 시스템에 비해 부족한 음성 인식 시스템의 처리 범위를 보완할 수 있었다.

  • PDF

하이브리드 방법을 이용한 개선된 문장경계인식 (Advanced detection of sentence boundaries based on hybrid method)

  • 이충희;장명길;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.61-66
    • /
    • 2009
  • 본 논문은 다양한 형태의 웹 문서에 적용하기 위해서, 언어의 통계정보 및 후처리 규칙에 기반 하여 개선된 문장경계 인식 기술을 제안한다. 제안한 방법은 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 문서에 적용하기 위해서 문장경계로 사용될 수 있는 모든 음절을 대상으로 학습하여 문장경계 인식을 수행하였고, 문장경계인식 성능을 최대화 하기 위해서 다양한 실험을 통해 최적의 자질 및 학습데이터를 선정하였고, 다양한 기계학습 기반 분류 모델을 비교하여 최적의 분류모델을 선택하였으며, 학습데이터에 의존적인 통계모델의 오류를 규칙에 기반 해서 보정하였다. 성능 실험은 다양한 형태의 문서별 성능 측정을 위해서 문어체와 구어체가 복합적으로 사용된 신문기사와 블로그 문서(평가셋1), 문어체 위주로 구성된 세종말뭉치와 백과사전 본문(평가셋2), 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 사이트의 게시판 글(평가셋3)을 대상으로 성능 측정을 하였다. 성능척도로는 F-measure를 사용하였으며, 구두점만을 대상으로 문장경계 인식 성능을 평가한 결과, 평가셋1에서는 96.5%, 평가셋2에서는 99.4%를 보였는데, 구어체의 문장경계인식이 더 어려움을 알 수 있었다. 평가셋1의 경우에도 규칙으로 후처리한 경우 정확률이 92.1%에서 99.4%로 올라갔으며, 이를 통해 후처리 규칙의 필요성을 알 수 있었다. 최종 성능평가로는 구두점만을 대상으로 학습된 기본 엔진과 모든 문장경계후보를 인식하도록 개선된 엔진을 평가셋3을 사용하여 비교 평가하였고, 기본 엔진(61.1%)에 비해서 개선된 엔진이 32.0% 성능 향상이 있음을 확인함으로써 제안한 방법이 웹 문서에 효과적임을 입증하였다.

  • PDF

교환기 IPC를 이용한 CHILL 교차 디버거, LGDB의 구현 (Implementing LGDB, CHILL Cross Debugger Using IPC of Switch System)

  • 윤기창;문정석;김병철;권경인;조시철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.596-598
    • /
    • 1999
  • 교환기 소프트웨어 개발에 많은 언어가 사용되고 있으나, 현재 우리나라의 교환기 제조업체 대부분은 ITU-T에서 통신 소프트웨어 개발 언어로 권고하는 CHILL 언어를 사용하고 있다. CHILL은 엄격한 타입 검사, 구조적 프로그래밍, 모듈화, 병렬 처리 기능을 특징으로 하고 있다. LG정보통신에서는 이러한 CHILL 프로그램의 시험 및 디버깅을 위하여 GNU Debugger(GDB)를 기반으로 CHILL 교차 디버거인 LGDB(LG Debugger)를 개발하였다. LGDB는 현재 사용 중인 대부분의 마이크로 프로세서를 지원하며, 호스트에서 개발한 프로그램들이 교환기 시스템과 같은 목적 시스템 상에서 정상적으로 실행되는지 검사하고, 만약 오류가 발생하였을 경우 이를 추적하여 수정하는 기능을 제공한다. 점차 대용량화, 고성능화가 요구되고 있는 교환기 개발 프로젝트의 추세를 감안할 때, LGDB는 교환기 소프트웨어의 품질 및 생산성 향상에 매우 높은 기여를 할 것이다.

  • PDF

중국인 초급 학습자의 한국어 발음 교육 연구 - 자음과 모음을 중심으로 - (A Study on the Teaching Method of Korean Pronunciation for the Chinese Learners)

  • 강비
    • 한국교육논총
    • /
    • 제40권2호
    • /
    • pp.35-56
    • /
    • 2019
  • 본 연구의 목적은 중국인 한국어 초급 학습자들이 한국어를 정확하게 발음하도록 교육하는 방법을 탐구하여 제시하는 데 있다. 발음은 언어를 구사하는 데 있어 가장 기본적인 요소로, 의사소통 과정에서 학습자가 목표 언어에 대한 유창성과 정확성을 판단하는 기본 적인 요소이다. 그러나 제2외국어를 학습하는 과정에서 오류를 범하는 원인 중 하나가 모국어의 간섭으로 인한 오류 요인이 많이 작용되는 것이다. 따라서 본 연구에서는 한국어와 중국어의 음운 체계를 분류하여, 한국어와 중국어 음운 체계의 그 차이점과 유사점을 알아보고 이를 바탕으로 중국에서 태어나고 중국에서 거주하는 중국인 초급 한국어 학습자들을 위해 한국어를 정확히 발음할 수 있도록 한국어 발음 교육 방법을 모색하는 것이 본 논문의 목적이다.

  • PDF

도메인 특화 기계번역 사후교정 모델 검증 연구 (Verification of the Domain Specialized Automatic Post Editing Model)

  • 문현석;박찬준;서재형;어수경;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2021
  • 인공지능 기술이 발달함에 따라 기계번역 기술도 많은 진보를 이루었지만 여전히 기계번역을 통한 번역문 내에는 사람이 교정해야 하는 오류가 다수 포함되어있다. 이렇게 번역 모델에서 생성되는 오류를 교정하는 전문인력의 요구를 경감시키기 위하여 기계번역 사후교정 연구가 등장하였고, 해당 연구는 현재 WMT를 주축으로 활발하게 연구되고 있다. 이러한 사후교정 연구는 최근 도메인 특화 관점에서 주로 연구가 이루어지고 있으며 현재 많은 도메인에서 유의미한 성과를 내고 있다. 하지만 이런 연구들은 기존 번역문의 품질을 얼만큼 향상시켰는가에 초점을 맞출 뿐, 다른 도메인 특화 번역모델의 성능과 비교했을 때 얼마나 뛰어난지는 밝히지 않기 때문에 사후교정 연구가 도메인 특화에서 효과적으로 작용하는지 명확하게 알 수 없다. 이에 본 연구에서는 도메인 특화 번역 모델과 도메인 특화 사후교정 모델간의 성능을 비교함으로써, 도메인 특화에서 사후교정을 통해 얻을 수 있는 실제적인 성능을 검증한다. 이를 통해 사후교정이 도메인 특화 번역모델과 비교했을 때 미미한 수준의 성능을 보임을 실험적으로 확인하였고, 해당 실험 결과를 분석함으로써 향후 도메인특화 사후교정 연구의 방향을 제안하였다.

  • PDF

임베디드 S/W 개발 시 프로그래밍 개선점 -MISRA-C를 중심으로 (A programming enhancements for embedded software development -Be based on MISRA-C)

  • 정다혜;안소진;최진영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.238-240
    • /
    • 2012
  • 소프트웨어 개발 시 코딩 규칙을 준수하면 소프트웨어에 잠재적으로 존재하는 프로그래밍 오류를 예방하는데 많은 도움이 된다. MISRA-C: 2004 는 고 신뢰성과 고품질이 요구되는 자동차, 우주항공, 통신, 등 제조분야에 대한 C언어 코딩 가이드 라인이다. 본 논문에서는 자동차와 우주항공같이 높은 안전성이 요구되는 원격 수소시스템을 타깃으로 하여 정적 분석한다. 그리고 분석 결과 발견된 오류 중 가장 빈번히 일어나는 오류에 대한 문제점을 분석하고 소프트웨어 품질 개선을 위하여 프로그래머들의 코딩 규칙 준수를 권장한다.