• Title/Summary/Keyword: 오류 수정

Search Result 626, Processing Time 0.031 seconds

A Study on Effectively Detecting and Correcting POS-Tagged Errors (효율적인 품사부착 오류 검출 및 수정에 관한 연구)

  • Choi, Myung-Gil;Seo, Hyeong-Won;Nam, Yoo-Rim;Kwon, Hong-Seok;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.132-137
    • /
    • 2012
  • 본 논문에서는 세종형태분석 말뭉치에 포함되어 있는 오류를 효율적으로 수정하기 위하여 오류 수정도구를 개발하였다. 세종형태분석 말뭉치에서 오류를 검출하기 위하여 형태소 생성과 자동 띄어쓰기 방법을 이용하였다. 검출된 오류를 수정하기 위하여 철자 오류 수정, 형태소 삭제 수정, 형태소 삽입 수정, 어절 재분석 방법을 사용하였다. 또한 최대한 반복적인 작업은 수행하지 않도록 설계하였다. 구현된 오류 수정 도구를 통하여 세종형태분석 말뭉치를 수정하였을 경우 텍스트 파일 형태의 말뭉치에서 오류를 수정하는 것보다 최소 9배 이상 빠른 작업이 가능하였으며, 사용자가 오류 수정 작업을 진행할수록 수정 속도가 빨라짐을 실험을 통해서 알 수 있었다.

  • PDF

Developing an Error Correction Tool for Sejong POS Tagged Corpus (세종 형태분석 말뭉치의 오류 수정 도구 개발)

  • Choi, Myung-Gil;Nam, Yoo-Rim;Seo, Hyung-Won;Jeon, Kil-Ho;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.114-116
    • /
    • 2011
  • 한국어 정보처리에서 널리 사용되는 세종 형태분석 말뭉치는 품사정보와 문장정보 등 다양한 한국어 정보를 포함하고 있다. 이 말뭉치는 방대한 양의 정보들로 구축되었지만 많은 오류 또한 포함되어 있다. 예를 들면 철자 오류, 띄어쓰기 오류, 그리고 품사부착 오류 등이 있다. 하지만 세종말뭉치와 같이 대용량 말뭉치의 오류를 수정하는 것은 많은 인력과 시간이 필요하며 일관성 있게 오류를 수정하는 것은 쉽지 않다. 따라서 본 논문에서는 세종 형태분석 말뭉치에 포함된 오류를 빠르고 일관성 있게 수정하기 위한 오류 수정 도구를 구현하였다. 본 논문에서 수정 대상이 되는 오류는 어절과 형태소 분석 결과의 불일치에 관한 오류만 대상으로 한다. 이를 위해 세종 형태분석 말뭉치를 데이터베이스로 재구축하였으며, 본래의 어절과 품사가 부착된 형태소의 자모를 각각 분리하여 두 자모의 차이점을 분석하여 오류 후보를 선정한다. 오류 후보에서 동일한 오류 패턴을 갖는 모든 오류 후보에 대하여 동일한 방법으로 일관성 있고 빠르게 수정할 수 있다.

  • PDF

Open Sourced and Collaborative Method to Fix Errors of Sejong Morphologically Annotated Corpora (공개와 협업을 통한 세종 형태 분석 말뭉치 오류 개선 방법)

  • Han, Gyeong-Eun;Baek, Seul-Ye;Lim, Jae-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.228-232
    • /
    • 2017
  • 본 논문에서는 21세기 세종계획 "현대문어 형태 분석 말뭉치"에서 나타나는 오류를 개선하는 방법으로 패치 시스템을 제안한다. 이 패치 시스템은 패치 파일과 패치 적용-생성 스크립트로 구성되며, 사용자들은 패치 파일을 사용하여 원래의 말뭉치에서 어떤 파일과 어절을 수정하였는지 확인할 수 있어 개발 목적에 맞는 학습 말뭉치를 생성할 수 있다. 또한 이 시스템을 이용해 서로의 수정 사항을 공유하고, 지속적으로 세종 말뭉치의 오류를 개선할 수 있다. 본 논문에서는 총 1,015만 어절을 대상으로 31만여 개의 오류를 수정하였다. 오류의 유형으로는 문장, 어절 분리 오류, 철자 오류, 불일치 오류, 분석 오류, 형식 오류가 있으며, 오류 수정 사항을 패치 파일에 반영하였다.

  • PDF

Open Sourced and Collaborative Method to Fix Errors of Sejong Morphologically Annotated Corpora (공개와 협업을 통한 세종 형태 분석 말뭉치 오류 개선 방법)

  • Han, Gyeong-Eun;Baek, Seul-Ye;Lim, Jae-Soo
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.228-232
    • /
    • 2017
  • 본 논문에서는 21세기 세종계획 "현대문어 형태 분석 말뭉치"에서 나타나는 오류를 개선하는 방법으로 패치 시스템을 제안한다. 이 패치 시스템은 패치 파일과 패치 적용-생성 스크립트로 구성되며, 사용자들은 패치 파일을 사용하여 원래의 말뭉치에서 어떤 파일과 어절을 수정하였는지 확인할 수 있어 개발 목적에 맞는 학습 말뭉치를 생성할 수 있다. 또한 이 시스템을 이용해 서로의 수정 사항을 공유하고, 지속적으로 세종 말뭉치의 오류를 개선할 수 있다. 본 논문에서는 총 1,015만 어절을 대상으로 31만여 개의 오류를 수정하였다. 오류의 유형으로는 문장, 어절 분리 오류, 철자 오류, 불일치 오류, 분석 오류, 형식 오류가 있으며, 오류 수정 사항을 패치 파일에 반영하였다.

  • PDF

A Study on Determining the Optimal Time to Launch of Software Considering Error Correction Time (오류 수정 시간을 고려한 소프트웨어 최적 출시 시점 결정 연구)

  • Ahn, Cheol-Hoon
    • Journal of Software Assessment and Valuation
    • /
    • v.16 no.2
    • /
    • pp.69-76
    • /
    • 2020
  • In this paper, the problem of determining the optimal time to market of software was studied using error correction time, an indicator of error correction difficulty. In particular, it was intended to modify the assumption that error detection time and correction time are independent in the software reliability growth model considering the existing error correction time, and to establish a general framework model that expresses the correlation between error detection time and correction time to determine when the software will be released. The results showed that it was important from an economic perspective to detect errors that took time to correct early in the test. It was concluded that it was very important to analyze the correlation between error detection time and error correction time in determining when to release the optimal software.

소프트웨어 취약점 자동 수정 기술 소개

  • Oh, Hakjoo
    • Review of KIISC
    • /
    • v.28 no.2
    • /
    • pp.27-32
    • /
    • 2018
  • 최근들어 소프트웨어의 오류 및 취약점을 자동으로 수정하는 기술이 주목받고 있다. 소프트웨어의 오류를 수정하는 작업은 소프트웨어 개발 단계에서 매우 큰 비용이 소요된다. 본 글에서는 이를 자동화하는 기술인 소프트웨어 오류 자동 수정 기술에 대해서 소개하고 연구 동향을 살펴본다.

Detecting and correcting errors in Korean POS-tagged corpora (한국어 품사 부착 말뭉치의 오류 검출 및 수정)

  • Choi, Myung-Gil;Seo, Hyung-Won;Kwon, Hong-Seok;Kim, Jae-Hoon
    • Journal of Advanced Marine Engineering and Technology
    • /
    • v.37 no.2
    • /
    • pp.227-235
    • /
    • 2013
  • The quality of the part-of-speech (POS) annotation in a corpus plays an important role in developing POS taggers. There, however, are several kinds of errors in Korean POS-tagged corpora like Sejong Corpus. Such errors are likely to be various like annotation errors, spelling errors, insertion and/or deletion of unexpected characters. In this paper, we propose a method for detecting annotation errors using error patterns, and also develop a tool for effectively correcting them. Overall, based on the proposed method, we have hand-corrected annotation errors in Sejong POS Tagged Corpus using the developed tool. As the result, it is faster at least 9 times when compared without using any tools. Therefore we have observed that the proposed method is effective for correcting annotation errors in POS-tagged corpus.

Hybrid ASR Error Correction Using Word Sequence Pattern and Recurrent Neural Network (단어열 패턴 매칭과 Recurrent Neural Network를 이용한 하이브리드 음성 인식 오류 수정 방법)

  • Choi, Junhwi;Ryu, Seonghan;Lee, Kyusong;Park, Seonyeong;Yu, Hwanjo;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.129-132
    • /
    • 2015
  • 본 논문에서는 단어열 패턴과 리커런트 신경망을 이용한 하이브리드 음성 인식 오류 수정 방법을 제안한다. 음성 인식 결과 문장에서 음성 인식 오류 단어가 발견되었을 경우에 첫째로 단어열 패턴과 그 패턴의 발음열 점수를 통해 1차적 수정을 하고 적절한 패턴을 찾지 못하였을 경우 음절단위로 구성된 Recurrent Neural Network를 통해 단어를 음절단위로 생성하여 2차적으로 오류를 수정한다. 해당 방법론을 한국어로 된 음성 인식 오류와 그 정답 문장으로 구성된 TV 가이드 영역 말뭉치를 바탕으로 성능을 평가하였고, 기존의 단순 단어열 패턴 기반의 음성 인식 오류 수정보다 성능이 향상되었음을 볼 수 있었다. 이 방법론은 음성 인식 오류와 정답의 말뭉치가 필요 없이 옳은 문장으로만 구성된 일반 말뭉치만으로 훈련이 가능하여, 음성 인식 엔진에 의존적이지 않는 강점이 있다.

  • PDF

A Study about Error Classification Method for Web-based Virtual Experiments (웹기반 가상 실험을 위한 오류 분류 방법에 관한 연구)

  • 이건민;백광운;김갑수;이숙희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.598-600
    • /
    • 2001
  • 기존의 웹기반 가상실험 시스템은 단방향적 학습내용 제시 및 학습자의 반응이라는 구조를 가지고 있으며 실제 과학실험에서 범하기 쉬운 오류들을 학습자가 스스로 진단하고 수정할 수 있는 과정을 간과하고 있다. 또한 현재의 가상실험 사이트는 학습자의 입장에서 다양하게 사고하고 변인을 조작하며 피드백을 통한 오류를 분석, 분류 및 수정 할 수 있는 기회를 제공하지 않는 경우가 대부분이다. 이에 본 논문은 가상 실험에서 학습자들이 겪게 되는 오류발생 문제를 진단하고 분석하여 피드백과정을 거쳐 오류를 수정하고 보완하여 가상공간에서 교사와 학습자, 학습자와 학습자간의 상호작용을 통한 가상실험이 원활하게 이루어지게 하는데 목적이 있다. 본 논문에서는 웹 기반 가상실험 학습의 장점 및 그와 연관된 오류분석 및 피드백의 의미를 7차 교육과정과 관련되어 기술하였으며, 시스템을 인터페이스 프로세스, 오류체크 프로세스, 오류분석 프로세스, 오류기록 프로세스, 오류제어 프로세스, 피드백 프로세스로 구성하였다. 또한 현 교육과정 중 초등학교 4학년 과학과의 한 단원을 선택하여 시스템을 적용하였다. 먼저 국내 및 국외에서 웹기반 학습과 관련된 가상실험 사이트들이 다수 개발되고 있으나 단순한 학습내용 제시와 실험결과 위주의 평가를 중시한다는 단점이 있다. 본 시스템의 학습자는 이와는 달리 실험결과 뿐만 아니라 실험과정의 오류를 확인하고 피드백을 받아 스스로 오류를 분석, 수정하게 된다.

  • PDF

A Software Release Policy with Testing Time and the Number of Corrected Errors (시험시간과 오류수정개수를 고려한 소프트웨어 출시 시점결정)

  • Yoo, Young Kwan
    • Asia-Pacific Journal of Business Venturing and Entrepreneurship
    • /
    • v.7 no.4
    • /
    • pp.49-54
    • /
    • 2012
  • In this paper, a software policy considering testing time and the number of errors corrected is presented. The software is tested until a specified testing time or the time to a specified number of errors are corrected, whichever comes first. The model includes the cost of error correction and software testing during the testing time, and the cost of error correction during operation. It is assumed that the length of software life cycle has no bounds, and the error correction follows an non-homogeneous Poisson process. An expression for the total cost under the policy is derived. It is shown that the model includes the previous models as special cases.

  • PDF