• 제목/요약/키워드: 자동 테스트 데이터 생성

검색결과 84건 처리시간 0.018초

딥러닝 기반 한국어 맞춤법 교정을 위한 오류 유형 분류 및 분석 (Classification and analysis of error types for deep learning-based Korean spelling correction)

  • 구선민;박찬준;소아람;임희석
    • 한국융합학회논문지
    • /
    • 제12권12호
    • /
    • pp.65-74
    • /
    • 2021
  • 최근 기계 번역 기술과 자동 노이즈 생성 방법론을 기반으로 한국어 맞춤법 교정 연구가 활발히 이루어지고 있다. 해당 방법론들은 노이즈를 생성하여 학습 셋과 데이터 셋으로 사용한다. 이는 학습에 사용된 노이즈 외의 노이즈가 테스트 셋에 포함될 가능성이 낮아 정확한 성능 측정이 어렵다는 한계점이 존재한다. 또한 실제적인 오류 유형 분류 기준이 없어 연구마다 사용하는 오류 유형이 다르므로 질적 분석에 어려움을 겪고 있다. 이를 해결하기 위해 본 논문은 딥러닝 기반 한국어 맞춤법 교정 연구를 위한 새로운 '오류 유형 분류 체계'를 제안하며 이를 바탕으로 기존 상용화 한국어 맞춤법 교정기(시스템 A, 시스템 B, 시스템 C)에 대한 오류 분석을 수행하였다. 분석결과, 세 가지 교정 시스템들이 띄어쓰기 오류 외에 본 논문에서 제시한 다른 오류 유형은 교정을 잘 수행하지 못했으며 어순 오류나 시제 오류의 경우 오류 인식을 거의 하지 못함을 알 수 있었다.

SQL 기반 퍼시스턴스 프레임워크 (A Persistence Framework Based SQL)

  • 조동일;류성열
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.549-556
    • /
    • 2008
  • 기업의 웹 기반 인트라넷 시스템은 객체지향 언어로 개발되고, 데이터의 관리는 RDBMS를 이용하여 구축된다. 두 시스템은 이질적 패러다임에 기인하여 모델의 불일치성을 발생시킨다. 이 문제를 해결하고자 사용되는 ORM 프레임워크는 RDB의 테이블과 객체지향 언어의 객체를 매핑하는 구조로 응용프로그램의 개발이 복잡하고, 변경에 유연하지 못하여 기업형 인트라넷 시스템의 개발 및 유지보수에 어려움을 준다. 본 연구에서는 기존 ORM 프레임워크의 복잡성을 해소하고, 변경에 유연하여 기업의 인트라넷 시스템에 적합한 퍼시스턴스 프레임워크를 제안한다. 제안한 퍼시스턴스 프레임워크는 테이블의 엔티티와 객체를 매핑하는 매핑 메타정보가 불필요하고, 소스코드를 자동 생성하여 개발 및 유지보수의 편의성을 제공하고, 변경에 유연하다. 제안 프레임워크는 Hibernate, iBATIS와의 테스트 결과 iBATIS와는 처리속도가 비슷했으나 iBATIS는 대용량 데이터 처리시 문제를 나타냈으며, Hibernate보다 약 3배 빠른 속도를 보였다.

UI4GSD: 글로버스 툴킷 4 기반 그리드 서비스 개발을 위한 사용자 인터페이스의 설계 및 구현 (UI4GSD: Design and Implementation of User Interface for Grid Service Development Based on Globus Toolkit 4)

  • 김혁호;이필우;김양우
    • 인터넷정보학회논문지
    • /
    • 제8권5호
    • /
    • pp.45-58
    • /
    • 2007
  • 본 논문에서는 그리드 미들웨어인 글로버스 툴킷 4 상에서 그리드 서비스 개발자들이 효율적으로 서비스를 개발할 수 있는 사용자 인터페이스(UI4GSD, User Interface for Grid Service Development)를 제시하고자 한다. 일반적으로 그리드 서비스를 개발하기 위해서는 개발에 필요한 전문 지식이 요구되며, 서비스 개발 및 개발된 서비스를 글로버스 컨테이너에 배치하고 테스트하기 위해서는 많은 시간이 필요하기 때문에 서비스 개발의 효율성이 매우 떨어진다. 그러나 UI4GSD는 GUI를 통해 개발자로부터 서비스 개발에 필요한 정보를 입력 받아 처리함으로써 그리드 서비스 개발에 필요한 서비스 인터페이스 파일, 빌드 파일, 서비스 클래스들과 클라이언트 클래스를 자동으로 생성한다. UI4GSD에서는 정형화된 5단계의 개발 프로세스에 따라 그리드 서비스 개발이 이루어지고, 단계별로 입력된 데이터를 기반으로 쉽게 서비스를 개발할 수 있다. 결과적으로 UI4GSD는 그리드 서비스 개발을 위한 쉽고 편리한 작업 환경을 제공함으로써 서비스 개발의 편리성과 효율성을 증가시킬 수 있다.

  • PDF

하이브리드 동정 알고리즘에 의한 최적 퍼지 시스템에 관한 연구 (A Study on Optimal fuzzy Systems by Means of Hybrid Identification Algorithm)

  • 오성권
    • 한국지능시스템학회논문지
    • /
    • 제9권5호
    • /
    • pp.555-565
    • /
    • 1999
  • 복잡하고 비선형적인 시스템의 규칙베이스 퍼지모델링을 위하여 퍼지시스템의 최적 동정알고리즘을 연구한다. 비선형 시스템은 퍼지모델의 입력변수와 퍼지 입력공간 분할에 의한 구조동정과 파라미터 동정을 통해 표현된다. 본 논문에서 규칙베이스 퍼지모델링은 비선형 시스템을 위해 퍼지추론방법과 두 종류의 최적화 이론의 결합에 의한 하이브리드 구졸를 이용하여 시스템 구조와 파라미터동정을 수행한다. 퍼지모델의 추론방법은 간략추론 및 선형추론에 의한다. 제안된 하이브리드 최적 동정 알고리즘은 유전자 알고리즘과 개선된 콤플렉스 방법을 이용한다. 여기서 유전자 알고리즘은 전반부 퍼지규칙의 멤버쉽함수의 초기 파라미터들을 결정하기 위해 사용되고 강력한 자동동조 알고리즘인 개선된 콤플렉스 방법은 정교한 파라미터들을 얻기 위해 수행된다. 따라서 최적 퍼지모델을 위해 전반부 파라미터 동정에는 하이브리드형의 최적 알고리즘을 이용하고 후반부 동정에는 최소자승법을 이용한다. 또한 학습과 테스트 데이터에 의해 생성된 퍼지모델의 성능결과 사이의 상호균형을 얻기 위해 하중계수를 가지는 합성 성능지수를 제안한다. 제안된 모델의 성능평가를 위해 두가지 수치적 예를이용한다.

  • PDF