• Title/Summary/Keyword: 언어적 오류

Search Result 380, Processing Time 0.022 seconds

Representation of Local Grammar for Temporal Expression and Analysis of Temporal Phrase with FST (시간 표현에 대한 부분 문법 기술 및 FST를 이용한 시간 구문 분석)

  • Kim, Youn-Gwan;Yoon, Jun-Tae;Song, Man-Suk
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.231-236
    • /
    • 1999
  • 시간표현은 문장에서 다른 명사와 결합하여 복합어를 이루는 경우가 있고, 용언과 결합하여 시간 부사의 역할을 하는 경우가 있는데, 이는 구문 분석에 있어서 중의적 해석이 두드러지며, 그 결과 구문 분석의 오류를 빈번히 야기하기도 한다. 본 논문에서는 이러한 시간 관계의 표현을 대량의 말뭉치로부터 획득하고 이들을 부분문법(local grammar)으로 표현한 후, 이것을 FST(Finite State Transducer)를 이용하여 부분 구문분석을 하고자 한다. 이를 위해 5천만 어절의 말뭉치에서 259개의 시간 단어를 추출하였고, 시간 단어들의 의미적 또는 기능적 사용에 의해서 26개의 어휘 범주로 분류하고 각 범주들의 결합관계를 일반화하였다. 실험을 통하여 인식을 위한 시간표현의 결합관계는 최고 97.2%의 정확률을 보였고, 품사태깅에 있어서는 평균 96.8%의 정확률을 보였다. 이는 시간 표현의 결합관계가 부분 구문분석에 있어서 유용한 정보임을 보여준다.

  • PDF

Automatically Generating C++ Source Code from LOTOS Specifications (LOTOS 명세로부터 C++ 소스코드의 자동 생성)

  • Kim, Cheol-Hong;Cheon, Yun-Sik;Kim, Gang-Ho
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.12
    • /
    • pp.3138-3150
    • /
    • 1998
  • 정보통신용 소프트웨어 개발은 대용량, 고신뢰도, 고복잡도, 이질성 및 분산 환경이라는 특징을 가지고 있다. 이러한 시스템을 개발함에 있어서 개발 품질 및 적정 비용을 유지하기 위해서는 향상된 정형명세 기법과 이러한 기법을 지원하는 도구가 필수적이다. ISO 표준 정형 명세 언어인 LOTOS는 사용자의 요구사항이나 시스템 모형을 추상적이고 정형적으로 작성할수 있도록 한다. 반면, 명세로부터 구현을 직접 도출하기는 쉽지 않다. 본 연구는 LOTOS 명세 언어로 작성된 명세로부터 C++ 코드를 자동 생성하여, 이를 PC 플랫폼상에서 실행하는 동작 모형을 통하여 시스템의 기능적 요구사항의 오류를 초기에 검출할 수 있는 프로토타이핑을 지원하는 LOTOS/C++ 코드 생성기(code generator)를 개발하는 것이다.

  • PDF

Index Extraction Using Syntactic Morpheme (구문형태소를 이용한 색인어 추출)

  • Hwang, Y.G.;Lee, K.Y.;Kim, N.S.;Lee, Y.S.
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.26-30
    • /
    • 2000
  • 문서를 대표하는 단어를 추출하는 색인어 추출은 정보검색 시스템의 질을 좌우한다. 대부분의 색인어 추출 시스템은 명사를 추출하고 있으며, 가능한 모든 명사를 추출하고 있다. 이러한 방법은 불필요한 단어가 그 문장을 대표하는 색인어로 추출될 가능성이 높으며, 이는 정보 검색 시스템의 효율을 저하시킨다. 이를 해결하기 위해 품사 태깅이나 구문 해석 단계 등을 통해 불필요한 후보를 제거할 수 있지만, 태거를 구축하거나 구문 해석을 위해서는 많은 비용과 시간이 필요하다. 본 논문에서는 구문 형태소 단위의 형태소 해석에 기반한 색인어 추출 방법을 제안한다. 구문 형태소는 통사적/의미적으로 강한 공기 관계를 가지면서 문장에서 하나의 통사적 단위나 자질의 단위로 표현되기 때문에 구문 형태소내에 포함된 단어열들은 대부분 색인어가 될 수 없다. 이러한 방법을 이용하여, 형태소 해석 결과를 이용한 색인어 추출에서 발생하는 색인 오류를 제거함으로써 색인기의 성능을 높이는 방법을 제안한다.

  • PDF

Specification of Requirements of Railroad Control System using Statechart (상태차트를 이용한 철도제어시스템 요구사항 명세)

  • Lee, Hyuk;Hwang, Dae-Yon;Yoon, Yong-Ki;Hwang, Jong-Gyu;Jo, Hyun-Jeong;Choi, Jin-Young
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06b
    • /
    • pp.114-118
    • /
    • 2008
  • 시스템 운영 중에 오류가 발생하면 치명적인 인적, 물적 피해를 초래하는 안전필수 시스템은 안전성과 신뢰성을 확보하기 위한 요구명세의 정형적인 명세와 검증이 요구된다. 철도 차량의 진로와 속도를 제어하는 철도제어 시스템은 안전필수 시스템임에도 불구하고 요구사항이 자연어로 표현되어 있다. 자연어로 명세 된 요구사항은 자연어의 모호한 특성으로 인하여 오류의 위험으로부터 안전하지 못하다. 본 논문에서는 자연어로 명세 되어있는 철도제어 시스템의 요구사항을 도식적인 설계언어인 상태차트(Statechart)를 이용하여 정형적으로 명세함으로써 철도제어 시스템의 안전성과 신뢰성을 향상하고자 한다.

  • PDF

Z model-based Specification (Z 모델 기반 명세 기법)

  • Shin, Jeehoon;Yun, Yong-Gi;Choi, Jin-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.1034-1037
    • /
    • 2010
  • 오늘날 많은 컴퓨터 시스템들이 우리의 삶에 사용이 되고 있다. 컴퓨터 시스템의 사용이 증가함에 따라 오류로 인한 문제들도 커지고 있다. 특히 열차 제어 시스템, 원자력 제어 시스템과 같은 안전필수 시스템에 오류가 발생하면 재산적, 인명적인 피해를 초래할 수 있다. 정형명세 언어 중 하나인 Z notation 은 안전필수 시스템 명세등에 많이 사용이 되고 있으며 Z 를 사용하여 명세하는 방법들이 제시되고 있다. 본 논문에서는 Correctness by Construction 에 기반하여 Z 를 사용하여 시스템을 명세하는 방법을 제안하며 안전필수 시스템인 DCM 을 적용하여 명세한다.

Improving Recall for Context-Sensitive Spelling Correction Rules Through Integrated Constraint Loosening Method (통합적 제약완화 방식을 통한 한국어 문맥의존 철자오류 교정규칙의 재현율 향상)

  • Choi, Hyunsoo;Yoon, Aesun;Kwon, Hyukchul
    • KIISE Transactions on Computing Practices
    • /
    • v.21 no.6
    • /
    • pp.412-417
    • /
    • 2015
  • Context-sensitive spelling errors (CSSE) are hard to correct, since they are perfect words when analyzed alone. Determined only by considering the semantic and syntactic relations of their context, CSSEs affect largely the performance of spelling and grammar checkers. The existing Korean Spelling and Grammar Checker (KSGC 4.5) adopts a rule-based method, which uses hand-made correction rules for CSSEs. Using rule-based method, the KSGC 4.5 is designed to obtain the very high precision, which results in the extremely low recall. In this paper, we integrate our previous works that control the CSSE correction rules, in order to improve the recall without sacrificing the precision. In addition to the integration, facultative insertion of adverbs and conjugation suffix of predicates are also considered, as for constraint-loosening linguistic features.

A Study on the Reliable Video Transmission Through Source/Channel Combined Optimal Quantizer for EREC Based Bitstream (EREC 기반 비트열을 위한 Source-Channel 결합 최적 양자화기 설계 및 이를 통한 안정적 영상 전송에 관한 연구)

  • 김용구;송진규;최윤식
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.25 no.12B
    • /
    • pp.2094-2108
    • /
    • 2000
  • 오류를 수반하는 통신망을 통한 멀티미디어 데이터의 응용은 최근 그 수요가 급증하고 있다. 하지만 그 구현은 많은 문제점들을 야기하는데, 전송된 비디오 데이터에 발생한 오류를 처리하는 문제가 그 중 하나이다. 이는 압축된 비트열에 발생한 오류가 영상의 시-공간 방향으로 심각한 전파 현상을 수반하기 때문이다. 이러한 심각한 오류 전파를 완화하기 위해 본 논문에서는 EREC라 알려진 오류 제한 기법을 적용하고, 적용된 EREC의 오류 전파 특성을 분석하였다. 이를 통해, 압축 부호화된 하나의 기본 블록 (매크로 블록)이 복호시 오류가 생길 확률을 추정하였으며, 추정된 확률의 근사를 통해 양 끝단(전송단과 수신단)에서의 비디오 화질 열화를 예측하였다. 추정 확률의 근사는 매 기본 블록에서 발생된 비트수에 대한 그 기본 블록이 복호시 오류가 생길 확률을 간단한 1차식을 통한 선형 회귀법으로 모델링 되었으며, 따라서 간단한 방법을 통해 양 끝단의 화질 열화를 효과적으로 예측할 수 있었다. 부호화된 비트열이 전송 오류에 보다 강인하게 되도록 하기 위해, 본 논문에서 개발된 화질 열화 모델을 양자화기 선택에 적용함으로써, 새로운 최적 양자화 기법을 제시하였다. 본 논문에서 제안된 최적 양자화 기법은, 기존의 양자기 최적화 기법들과는 달리, 복호단에서의 복원 영상 화질이 주어진 비트율에서 최적이 되도록 양자화를 수행한다. H.263 비디오 압축 규격에 적용한 제안 양자화 기법의 실험 결과를 통해, 제안 기법이 매우 적은 계산상의 부하를 비용으로 객관적 화질은 물론 주관적 화질까지 크게 개선할 수 있음을 확인할 수 있었다.내었다.Lc. lacti ssp. lactis의 젖산과 초산의 생성량은 각각 0.089, 0.003과 0.189, 0.003M이었다. 따라서 corn steep liquor는 L. fermentum와 Lc. lactis ssp, lactis 의 생장을 위해 질소 또는 탄소 공급원으로서 배지에 첨가 될 수 있는 우수한 농업 부산물로 판단되었다.징하며 WLWQ에 적용되는 몇 가지 제약을 관찰하고 이를 일반적인 언어원리로 설명한다. 첫째, XP는 주어로만 해석되는데 그 이유는 XP가 목적어 혹은 부가어 등 다른 기능을 할 경우 생략 부위가 생략의 복원 가능선 원리 (the deletion-up-to recoverability principle)를 위배하기 때문이다. 둘째, WLWQ가 내용 의문문으로만 해석되는데 그 이유는 양의 공리(the maxim of quantity: Grice 1975) 때문이다. 평서문으로 해석될 경우 WP에 들어갈 부분이 XP의 자질의 부분집합에 불과하므로 명제가 아무런 정보제공을 하지 못한다. 반면 의문문 자체는 정보제공을 추구하지 않으므로 앞에서 언급한 양의 공리로부터 자유롭다. 셋째, WLWQ의 XP는 주제어 표지 ‘는/-은’을 취하나 주어표지 ‘가/-이’는 취하지 못한다(XP-는/-은 vs. XP-가/-이). 이는 IP내부 에 비공범주의 존재 여부에 따라 C의 음운형태(PF)가 시성이 정해진다는 가설로 설명하고자 했다. WLWQ에 대한 우리의 논의가 옳다면, 본 논문은 다음과 같은 이론적 함의를 기닌다. 첫째, WLWQ의 존재는 생략에 대한 두 이론 즉 LF 복사 이론과 PF 삭제 이론

  • PDF

The Construction of Predicate Subcategorization Using Tree Tagged Corpus (구문구조부착 말뭉치를 이용한 술어의 하위범주화 정보 구축)

  • Ryu, Pum-Mo;Jang, Myung-Gil;Park, Soo-Jun;Park, Jae-Deuk;Park, Doing-In
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.116-121
    • /
    • 1997
  • 한국어 문장에서 술어의 역할이 매우 중요하기 때문에 술어의 하위범주화 정보는 한국어 분석 및 생성에서 필수적이다. 그러나 기존의 한국어 술어의 하위범주화 사전은 전문가의 사전지식이나 직관에 의존하여 만들어졌기 때문에 주관적이고 오류의 가능성이 높으며 많은 수작업이 필요했다. 또 영역에 독립적인 하위범주화 정보를 구축하는 작업은 매우 어렵기 때문에 응용영역에 맞는 하위범주화 정보를 쉽게 구축하는 방법이 요구되었다. 본 논문에서는 구문구조부착 말뭉치를 이용하여 전문가의 제한된 개입만으로 통계정보와 명사의 의미정보를 포함하는 술어의 하위범주화 정보 구축 방법을 제안한다.

  • PDF

Design of Interval Type-2 Fuzzy Inference System and Its optimization Realized by PSO (Interval Type-2 퍼지 추론 시스템의 설계와 PSO를 이용한 최적화)

  • Ji, Kwang-Hee;Oh, Sung-Kwun
    • Proceedings of the KIEE Conference
    • /
    • 2008.10b
    • /
    • pp.251-252
    • /
    • 2008
  • Type-2 퍼지 집합은 Type-1 퍼지 집합에서는 다루기 어려운 언어적인 불확실성을 더욱 효과적으로 다룰 수 있다. TSK 퍼지 로직 시스템(TSK Fuzzy Logic Systems; TSK FLS)은 후반부를 1차 및 2차 함수식으로 나타내며 Mamdani 모델과 함께 가장 널리 사용되는 모델이다. 본 연구의 Interval Type-2 TSK FLS은 전반부에서 Type-2 퍼지 집합을 이용하고 후반부는 계수가 Type-1 퍼지집합인 1차식을 사용한다. 또한 전반부는 가우시안 형태의 Type-2 멤버쉽 함수를 사용하며, 오류역전파 학습알고리즘을 사용하여 파라미터들을 최적화 한다. 또한 학습에 앞서 PSO(Particle Swarm Optimization) 알고리즘을 사용하여 최적 학습률을 찾아 모델의 학습능력을 보다 효율적으로 한다. 본 논문에서는 Type-1과 Type-2 FLS의 성능을 가스로 공정 데이터를 적용하여 두 모델의 성능을 비교하고 노이즈를 추가한 데이터를 이용하여 노이즈에 대한 성능도 비교 분석한다.

  • PDF

Multi-path LR parsing for nonsegmental words using one-pass strategy (원-패스 전략을 사용하는 미분절어를 위한 다중-경로 LR 파싱)

  • Lee, Gi-O;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.146-154
    • /
    • 1994
  • 한국어는 단어들 사이에 공백이 없는 미분절어이기 때문에, 한국어를 분석하기 위해서는 단어의 경계를 식별하는 분절이 선행되어야 한다. 분절은 쉽지 않은 과정이고 잘못된 분절은 구문분석, 의미 분석 단계에서 심각한 오류를 유발하기 때문에 형태소 분석의 중요한 작업중의 하나가 되어왔다. 기존의 한국어 분석 시스템들은 분절의 어려움으로 인하여 입력 문자열의 끝까지 읽은 후, 우에서 좌로 분석하는 two-pass 전략이나 단어들 사이에 공백을 삽입하여 처리하는 방법을 사용하였다. 또한 이 시스템들은 형태소 분석이 완결된 후, 파서에게 결과를 전달하는 순차적인 전략을 사용하였다. 본 논문은 영어의 분석과 같이 형태소 분석 동안에 파싱을 할 수 있는 one-pass 전략을 사용하여 한국어를 효율적으로 처리하는 모델을 제안한다. 이를 위해 형태소 분석 방법으로써 확장된 최장일치법을 제시하며, 위 방법에서 생성되는 문제점인 다중-범주 구를 처리하기 위하여 다중-경로 LR 파싱을 제시한다.

  • PDF