• 제목/요약/키워드: Linguistic Rules

검색결과 157건 처리시간 0.028초

러프 소속 함수를 이용한 수치 속성의 이산화와 근사 추론 (Discretization of Numerical Attributes and Approximate Reasoning by using Rough Membership Function))

  • 권은아;김홍기
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.545-557
    • /
    • 2001
  • 본 논문에서는 저장 데이타베이스의 정보 시스템을 정제하여 이해 가능한 정보로 전환하고 새로운 객체를 근사 추론할 수 있도록 하기 위해 러프 소속 함수 값의 개념을 도입한 계층적 근사 분류 알 고리즘을 제안한다. 제안하는 알고리즘은 근사 추론의 한 방법인 퍼지 추론 방법의 언어적 불확실성을 속 성의 퍼지 소속 함수 값으로 나타내고 조건 속성의 소속 함수 값의 합성에 의해 근사 추론하는 방법을 이용하였으며 퍼지 소속 함수 값 대신에 러프 소속 함수 값을 이용하도록 제안하였다. 이는 퍼지 소속 함 수 값을 이용하여 괴지 규칙을 생성하는 과정을 생략할 수 있는 장점이 있다. 또한 정보 시스템 내의 속 성 중에서 수치 속성에 대한 이산화 방법을 연구하고 이것 또한 러프 소속 함수 값과 정보이론의 무질서 도의 개념을 이용한 수치 속성의 이산화를 제안하였다. 제안된 알고리즘을 이용하여 패턴 분류 문제에 교 준적으로 사용되는 IRIS 데이타에 대한 실험결과96%~98% 분류율을 나타냈으며 다른 실험 데이타에서 도 기존 알고리즘과 비교하여 수치 이산화나 근사 추론 모두 우수함을 보였다.

  • PDF

Error Correction for Korean Speech Recognition using a LSTM-based Sequence-to-Sequence Model

  • Jin, Hye-won;Lee, A-Hyeon;Chae, Ye-Jin;Park, Su-Hyun;Kang, Yu-Jin;Lee, Soowon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.1-7
    • /
    • 2021
  • 현재 대부분의 음성인식 오류 교정에 관한 연구는 영어를 기준으로 연구되어 한국어 음성인식에 대한 연구는 미비한 실정이다. 하지만 영어 음성인식에 비해 한국어 음성인식은 한국어의 언어적인 특성으로 인해 된소리, 연음 등의 발음이 있어, 비교적 많은 오류를 보이므로 한국어 음성인식에 대한 연구가 필요하다. 또한, 기존의 한국어 음성인식 연구는 주로 편집 거리 알고리즘과 음절 복원 규칙을 사용하기 때문에, 된소리와 연음의 오류 유형을 교정하기 어렵다. 본 연구에서는 된소리, 연음 등 발음으로 인한 한국어 음성인식 오류를 교정하기 위하여 LSTM을 기반으로 한 인공 신경망 모델 Sequence-to-Sequence와 Bahdanau Attention을 결합하는 문맥 기반 음성인식 후처리 모델을 제안한다. 실험 결과, 해당 모델을 사용함으로써 음성인식 성능은 된소리의 경우 64%에서 77%, 연음의 경우 74%에서 90%, 평균 69%에서 84%로 인식률이 향상되었다. 이를 바탕으로 음성인식을 기반으로 한 실제 응용 프로그램에도 본 연구에서 제안한 모델을 적용할 수 있다고 사료된다.

자도르노프 작품 속에 나라난 러시아 유머의 의미군조 (The semantic structure of the Russian humor in the works of Michael Zadornov)

  • 안병팔
    • 인문언어
    • /
    • 제6권
    • /
    • pp.321-357
    • /
    • 2004
  • In this article the structure of modern Russian humor is analyzed on the basis of some theories: bi-sociation theory (Koestler 1964), semantic script theory of verbal humor, using the concept of semantic presupposition, pragmatic felicity condition (Searle 1969; Levinson 1983) and grammatical rules (Chomsky 1965). Up to now the listed former theories were not examined and less analyzed by the semantic structure in the study of the structure of Russian humor(HcaeBa 1969; 3 $a_{OPHOB}$ 1991; 1992). Kreps (1981), who analyzed the works of Zoschenko, presented 21 types of humor, using the term 'humoreme'(Kpenc 1981, 36-37). These types are the list of the available means of humor that work not in the base of semantic criteria, but in the base of means of literary rhetoric. Kreps presented types of humor means, such as contradiction, antonymic substitution, macaronic speech and correlation of humoremes in the various types of humor. Apart from Kreps, Manakov (MaHaKOB 1986, 61-79) also studied these problems. He also set the system of the basic types of humor. Manakov introduced the linguistic means of humor of some Russian writers: Gogol, Tchechov. The means that Manakov showed with detailed examples, are trope, epithet, comic comparison, comic metaphor, comic periphrasis, euphemism, pun, zeugma, comic toponym, comic onomatopoeia, mania of foreign vocabulary, folk etymology, dialect etc. But these studies don't explain why these means make the works humorous. An, B.p tried to answer this question (안병팔 1997 a; b). An B.p. explains contexts of humor through the Release theory, the Superiority theory and the Incongruity theory. An, B.p. explained the process of deviation from the grammatical norms through morpho-syntactic and lexical means. But in these studies the humor was not analyzed by the semantic criteria. In order to linguistically evaluate various means of humor formation, it is necessary to elicit its deep structure, which makes it possible to research the formation and interpretation of humor. For this purpose this article, being based on the Incongruity theory, defined the structure of humor as negation of presupposition. Of course the former traditional studies also well shared the concept of 'contradiction' and 'contrast' of humor structure, but they didn't explain the structure by semantic differential features. This study, analyzing the works of' Zadornov, M., tried to note that through the negation of semantic presupposition the structure of contradiction is formed with semantic differential features on the semantic, syntactic or lexical dimensions.

  • PDF

구문분석에 기반한 한글 자연어 질의로부터의 불리언 질의 생성 (Boolean Query Formulation From Korean Natural Language Queries using Syntactic Analysis)

  • 박미화;원형석;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1219-1229
    • /
    • 1999
  • 일반적으로 AND, OR, NOT과 같은 연산자를 사용하는 불리언 질의는 사용자의 검색의도를 정확하게 표현할 수 있기 때문에 검색 전문가들은 불리언 질의를 사용하여 높은 검색성능을 얻는다고 알려져 있지만, 일반 사용자는 자신이 원하는 정보를 불리언 형태로 표현하는데 익숙하지 않다. 본 논문에서는 검색성능의 향상과 사용자 편의성을 동시에 만족하기 위하여 사용자의 자연어 질의를 확장 불리언 질의로 자동 변환하는 방법론을 제안한다. 먼저 자연어 질의를 범주문법에 기반한 구문분석을 수행하여 구문트리를 생성하고 연산자 및 키워드 정보를 추출하여 구문트리를 간략화한다. 다음으로 간략화된 구문트리로부터 명사구를 합성하고 키워드들에 대한 가중치를 부여한 후 불리언 질의를 생성하여 검색을 수행한다. 또한 구문분석의 오류로 인한 검색성능 저하를 최소화하기 위하여 상위 N개 구문트리에 대해 각각 불리언 질의를 생성하여 검색하는 N-BEST average 방법을 제안하였다. 정보검색 실험용 데이타 모음인 KTSET2.0으로 실험한 결과 제안된 방법은 수동으로 추출한 불리언 질의보다 8% 더 우수한 성능을 보였고, 기존의 벡터공간 모델에 기반한 자연어질의 시스템에 비해 23% 성능향상을 보였다. Abstract There have been a considerable evidence that trained users can achieve a good search effectiveness through a boolean query because a structural boolean query containing operators such as AND, OR, and NOT can make a more accurate representation of user's information need. However, it is not easy for ordinary users to construct a boolean query using appropriate boolean operators. In this paper, we propose a boolean query formulation method that automatically transforms a user's natural language query into a extended boolean query for both effectiveness and user convenience. First, a user's natural language query is syntactically analyzed using KCCG(Korean Combinatory Categorial Grammar) parser and resulting syntactic trees are structurally simplified using a tree-simplifying mechanism in order to catch the logical relationships between keywords. Next, in a simplified tree, plausible noun phrases are identified and added into the same tree as new additional keywords. Finally, a simplified syntactic tree is automatically converted into a boolean query using some mapping rules and linguistic heuristics. We also propose an N-BEST average method that uses top N syntactic trees to compensate for bad effects of single incorrect top syntactic tree. In experiments using KTSET2.0, we showed that a proposed method outperformed a traditional vector space model by 23%, and surprisingly manually constructed boolean queries by 8%.

퍼지 추론 메커니즘에 기반 한 다항식 네트워크 패턴 분류기의 설계와 이의 최적화 (The Design of Polynomial Network Pattern Classifier based on Fuzzy Inference Mechanism and Its Optimization)

  • 김길성;박병준;오성권
    • 한국지능시스템학회논문지
    • /
    • 제17권7호
    • /
    • pp.970-976
    • /
    • 2007
  • 본 연구에서는 퍼지 추론 메커니즘에 기반 한 다항식 네트워크 패턴 분류기(Polynomial Network Pattern Classifier; PNC)를 설계하고 Particle Swarm Optimization 알고리즘을 이용하여 PNC 파라미터, 즉, 학습률, 모멘텀 계수, FCM 클러스터링의 퍼지화 계수(fuzzification Coefficient)를 최적화한다. 제안된 PNC 구조는 FCM 클러스터링에 기반한 분할 함수를 활성 함수로 사용하며, 다항식 함수로 구성된 연결가중치를 사용함으로서 기존 신경회로망 분류기의 선형적인 특성을 개선한다. PNC 구조는 언어적 해석관점에서 "If-then"의 퍼지 규칙으로 표현되며 퍼지 추론 메커니즘에 의해 구동된다. 즉 조건부, 결론부, 추론부 세 가지의 기능적 모듈로 나뉘어 네트워크 구조가 형성된다. 조건부는 FCM 클러스터링을 사용하여 입력 공간을 분할하고, 결론부는 분할된 로컬 영역을 다항식 함수로 표현한다. 마지막으로, 네트워크의 최종출력은 추론부의 퍼지추론에 의한다. 제안된 PNC는 다항식 기반 구조의 퍼지 추론 특성으로 인해 출력 공간상에 비선형 판별 함수(nonlinear discernment function)가 생성되어 분류기로서의 성능을 높인다.

퍼지 기반 다양한 모델을 이용한 회전익 항공기 착륙장치의 위험 우선순위 평가 (Risk Analysis for the Rotorcraft Landing System Using Comparative Models Based on Fuzzy)

  • 나성현;이광은;구정모
    • 한국안전학회지
    • /
    • 제36권2호
    • /
    • pp.49-57
    • /
    • 2021
  • In the case of military supplies, any potential failure and causes of failures must be considered. This study is aimed at examining the failure modes of a rotorcraft landing system to identify the priority items. Failure mode and effects analysis (FMEA) is applied to the rotorcraft landing system. In general, the FMEA is used to evaluate the reliability in engineering fields. Three elements, specifically, the severity, occurrence, and detectability are used to evaluate the failure modes. The risk priority number (RPN) can be obtained by multiplying the scores or the risk levels pertaining to severity, occurrence, and detectability. In this study, different weights of the three elements are considered for the RPN assessment to implement the FMEA. Furthermore, the FMEA is implemented using a fuzzy rule base, similarity aggregation model (SAM), and grey theory model (GTM) to perform a comparative analysis. The same input data are used for all models to enable a fair comparison. The FMEA is applied to military supplies by considering methodological issues. In general, the fuzzy theory is based on a hypothesis regarding the likelihood of the conversion of the crisp value to the fuzzy input. Fuzzy FMEA is the basic method to obtain the fuzzy RPN. The three elements of the FMEA are used as five linguistic terms. The membership functions as triangular fuzzy sets are the simplest models defined by the three elements. In addition, a fuzzy set is described using a membership function mapping the elements to the intervals 0 and 1. The fuzzy rule base is designed to identify the failure modes according to the expert knowledge. The IF-THEN criterion of the fuzzy rule base is formulated to convert a fuzzy input into a fuzzy output. The total number of rules is 125 in the fuzzy rule base. The SAM expresses the judgment corresponding to the individual experiences of the experts performing FMEA as weights. Implementing the SAM is of significance when operating fuzzy sets regarding the expert opinion and can confirm the concurrence of expert opinion. The GTM can perform defuzzification to obtain a crisp value from a fuzzy membership function and determine the priorities by considering the degree of relation and the form of a matrix and weights for the severity, occurrence, and detectability. The proposed models prioritize the failure modes of the rotorcraft landing system. The conventional FMEA and fuzzy rule base can set the same priorities. SAM and GTM can set different priorities with objectivity through weight setting.

헌법적 관점의 기록학 (Archival Science and Constitutional Point of View)

  • 이영남
    • 기록학연구
    • /
    • 제79호
    • /
    • pp.121-168
    • /
    • 2024
  • 기록학의 핵심에는 기록관리가 있다. 기록관리에 충실해야 한다. 그러나 기록관리에 충실할수록 발생하는 역설이 하나 있지 않을까. '책임있는 관리자가 되어, 관리적 차원에서 기록을 효율적으로 관리하는 일'이 그런 기록을 만들고 이용하는 인간이라는 사회적 존재에 대한 관심은 오히려 축소시킨다는 역설. 인간은 왜 기록을 생산하고 이용하는가. 그것은 인간이란 존재가 특이하게도 기록이라는 개념을 가지고 살아가는 존재이기 때문일 것이다. 개념은 '생각의 설계도 같은 것'이다. 기록관리가 발전할수록 가치 있는 기록이 더 많이, 보다 체계적으로 보존되며, 폭넓음과 유효적절함으로 서비스가 되는 것이어서 이 방향성을 의심할 필요는 없다. 그러나 기록관리가 아닌 인간의 시선에서 이런 상황을 관찰하게 되면, 기록관리에 등장하는 인간은 기록을 이용하는 대상으로 제한된다는 것을 알게 된다. 원점에서 재검토한다는 가설에 입각해 인간을 다르게 인식할 경우, 인간과 기록의 관계, 또는 기록과 인간의 관계에 대해 특이한 맥락을 접할 수 있다. 인간은 누구에게도 양도할 수 없는 존엄성을 지닌 존재, 행복을 추구할 권리를 가진 존재, 자유와 평등, 사회적 기본권을 향유하며 살아야 하는 존재라는 규범에까지 이르게 된다면, 요컨대, 헌법적 관점에서 인간을 인식한다면, 기록의 사회적 역할과 방향성에 대해 새롭게 인식할 수 있다. 국내외 헌법과 국내외 인권규범은 인간의 기본권을 최종 규범으로 문서화 하고 있으며, 이를 보장하고 실천하는 것이 국가의 의무임을 명확히 하고 있다. 헌법적 관점에서 기록의 역할은 인간의 기본권을 증식하는 기록실천이다. 또는 인간의 기본권을 옹호하고 지지하며 지원하는 일이다. 인간의 기본권을 증식하는 기록실천은 전문가에게 요구되는 시민의식이기도 하겠지만, 다른 한편으로는 기록학의 직업적 통로가 될 수 있다. 기록관리가 2차선 왕복도로라고 한다면, 기록관리와 인간의 기본권을 증식하는 기록실천이 상호작용하는 것은 4차선 왕복도로를 개척하는 일이라고 할 수 있겠다. 이 글은 헌법적 관점을 기록학의 관점으로 명확히 잡아, 그간 기록관리 안팎으로 전개된 인간의 기본권을 증식하는 기록실천을 점검하고, 이런 기조에서 기록학의 사회적 역할을 재검토한 글이다. 기록학의 사회적 역할에는 기록에 관한 새로운 언어적 규칙을 제공하는 것이 있다.