• Title/Summary/Keyword: 언어적 오류

Search Result 380, Processing Time 0.029 seconds

말 실수와 의미 및 음운 정보 처리: 실험식 유도 말실수의 분석

  • Go, Hye-Seon;Lee, Jeong-Mo
    • Annual Conference on Human and Language Technology
    • /
    • 1996.10a
    • /
    • pp.114-122
    • /
    • 1996
  • 그림자극의 명명에 있어서 이름의 의미유사성, 음운유사성, 그리고 처리부담(말속도, 기억 부담)이 말 실수 오류수와 명명 시간에 주는 영향을 알기 위해 2개의 실험이 실시되었다. 의미(유사/상이), 음운(유사/상이) 변인에 추가하여 실험 1에서는 말속도(330ms, 385ms, 770ms)의 변인이, 실험 2에서는 인지적 부담(높음/낮음)의 변인이 조작되었다. 두 실험의 결과, 의미유사성과 음운유사성, 그리고 인지적 처리 부담이 말 실수의 양과 그림자극 명명 시간이 증가시킴이 드러났다. '의미유사' 조건 및 '음운유사 조건'과 '의미-음운 모두 유사' 조건간의 말실수의 양의 차이는 말 산출 과정에서의 어휘 인출 과정에 대한 '독립적 2단계 모형'과 '활성화 상호작용 모형' 중 전자에 의해 더 잘 설명될 수 있음이 논의되었다.

  • PDF

Design of Interval Type-2 TSK Fuzzy Inference System (Interval Type-2 TSK 퍼지 추론 시스템의 설계)

  • Ji, Kwang-Hee;Oh, Sung-Kwun
    • Proceedings of the KIEE Conference
    • /
    • 2008.07a
    • /
    • pp.1849-1850
    • /
    • 2008
  • Type-2 퍼지 집합은 Type-1 퍼지 집합의 확장으로 Type-1 퍼지 집합으로는 다루기 힘든 언어적인 불확실성을 다루기 위해 고안되었다. 대표적인 퍼지 논리 시스템(Fuzzy Logic System; FLS)으론 Mamdani FLS 모델과 TSK FLS모델이 있다. 본 논문에서는 Interval Type-2 TSK FLS를 구성한다. FLS 구성을 위한 전반부는 가우시안 형태의 Type-2 멤버쉽 함수를 사용하며, 전.후반부 파라미터들은 오류역전파 알고리즘을 통한 학습으로 결정한다. 본 논문에서는 Type-1 TSK FLS와 Interval Type-2 TSK FLS를 설계하고 가스로 공정 데이터에 적용하여 성능을 비교 분석한다. 또한 노이즈를 추가한 데이터들을 통하여 노이즈에 대한 성능도 비교 분석한다.

  • PDF

An Efficient Postprocessing Algorithm for Error Correction in Hangul Address Recognition (한글 주소의 오인식 수정을 위한 효율적인 후처리 알고리즘)

  • Lee, Seong-Whan;Kim, Eun-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.555-566
    • /
    • 1992
  • 본 논문은 한글 주소의 오인식 수정에 관한 연구로서, 필기자의 다양한 필기 형태와 입력 장치의 특성으로 인하여 문자 인식 단계에서 발생할 수 있는 혼동을 줄이고 오류를 효율적으로 수정하는 후처리 알고리즘을 소개한다. 특히, 주소의 행정 구역부에 대해서는 정합해야 할 문자 모델의 범위를 줄여줌으로써 높은 인식률과 처리 속도를 기록하였으며, 문자 인식의 결과에 임계값과 백트랙킹 방법을 도입한 후처리 알고리즘을 적용하여 더욱더 높은 인식률을 나타낼 수 있었다. 번지부와 건물부에 대한 오인식도 제안된 각각의 알고리즘을 적용함으로써 효과적으로 수정할 수 있었다. 우리나라의 25,000여 행정 구역을 바탕으로 작성 가능한 주소들 중에서 임의의 150개 주소 데이타에 대하여 제안된 후처리 방법을 포함한 다양한 후처리 방법으로 실험한 결과, 행정 구역부에 대하여 98%이상의 높은 인식률을 보임으로써, 제안된 후처리 알고리즘이 효과적임을 알 수 있었다.

  • PDF

Development of a System of Writing Tools for Korean Documents (한국어 문서 작성 지원 툴의 설계 및 구현)

  • Lee, Hong-Su;Hong, Soon-Jae;Yoon, Jee-Hee
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.339-345
    • /
    • 1992
  • 한국어 문서 작성 지원 툴 ${\ulcorner}$한림${\lrcorner}$은 기계 가독형의 한국어 문서 화일을 해석하여, 문서의 오류 검출을 포함한 문서 작성상의 수정 지침이 될 수 있는 자료를 사용자에게 제공하는 것을 목적으로 하는 시스템이다. 본 시스템에서는 기본적으로 문법 해석이나 사전을 이용하지 않고 알고리즘을 이용한 문자 분석만에 의하여 한국어 문서를 해석한다. 여기에서는 현재 개발중인 ${\ulcorner}$한림${\lrcorner}$의 개발 목적, 방침, 구현 방법 등에 대하여 논하고, 부분적으로 완성된 몇 개의 툴을 소개한다.

  • PDF

Development of Core Protection Calculator System Software Requirements Specification For Korean Next Generation Reactor (KNGR) (차세대 원전 노심보호계통 소프트웨어 요구 명세서 개발)

  • Kim, Dong-Wook
    • Proceedings of the KIEE Conference
    • /
    • 2000.07d
    • /
    • pp.2498-2500
    • /
    • 2000
  • 차세대 신형원전에서는 디지털 기술의 적용을 기본 설계 요건으로 제시하고 있다. 차세대 원전의 노심보호계통 (Core Protection Calculator Systems; CPCS)은 원전의 안전성을 보장하기 위한 부분으로 이 부분이 올바르게 작성되고, 검증되어야 함은 분명하다. 현재 이부분은 소프트웨어로 개발 중에 있으며 개발 단계에 있어서 시작단계인 요구명세 단계에 있다. 요구 명세 단계의 오류는 소프트웨어 개발 단계 중 소프트웨어의 품질에 가장 영향을 많이 미치는 단계로 알려져 있으므로 이 단계를 정확하게 수행하여야 한다. 안전성이 중요한 소프트웨어를 명세하는 데 있어서 우선 정의되어야 하는 것은 어떤 절차를 통해서 어떤 방법으로 할지를 결정하여 그 절차를 정하여야 한다. 기존에 소프트웨어 요구 명세에 대한 표준안이 존재하기는 하지만, 이러한 표준안들은 개념적인 언어들로 쓰여져 있기 때문에 실제 소프트웨어의 개발 과정에 사용하기 위해서는 구체적인 언어들로 다시 작성하여야 한다. 따라서, 소프트웨어 명세를 작성하기 위해서 절차와 방법에 대해서 정의하여야 한다. 본 논문에서는 개략적인 명세 절차와 명세 방법등을 기술하였다.

  • PDF

Fine-grained Named Entity Recognition using Hierarchical Label Embedding (계층적 레이블 임베딩을 이용한 세부 분류 개체명 인식)

  • Kim, Hong-Jin;Kim, Hark-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.251-256
    • /
    • 2021
  • 개체명 인식은 정보 추출의 하위 작업으로, 문서에서 개체명에 해당하는 단어를 찾아 알맞은 개체명을 분류하는 자연어처리 기술이다. 질의 응답, 관계 추출 등과 같은 자연어처리 작업에 대한 관심이 높아짐에 따라 세부 분류 개체명 인식에 대한 수요가 증가했다. 그러나 기존 개체명 인식 성능에 비해 세부 분류 개체명 인식의 성능이 낮다. 이러한 성능 차이의 원인은 세부 분류 개체명 데이터가 불균형하기 때문이다. 본 논문에서는 이러한 데이터 불균형 문제를 해결하기 위해 대분류 개체명 정보를 활용하여 세부 분류 개체명 인식을 수행하는 방법과 대분류 개체명 인식의 오류 전파를 완화하기 위한 2단계 학습 방법을 제안한다. 또한 레이블 주의집중 네트워크 기반의 구조에서 레이블의 공통 요소를 공유하여 세부 분류 개체명 인식에 효과적인 레이블 임베딩 구성 방법을 제안한다.

  • PDF

The Characteristics of semantic association task performance in elderly with subjective memory impairment and mild cognitive impairment (주관적 기억장애 및 경도인지장애 노인의 의미연상과제 수행 특성)

  • Kang, Seo-Jeong;Park, Seong-Hyeon;Kim, Jung-Wan
    • Journal of Digital Convergence
    • /
    • v.17 no.2
    • /
    • pp.283-292
    • /
    • 2019
  • The loss of semantic knowledge and impairments in semantic associations by semantic category is gaining increasing attention, as indicators of early-stage cognitive decline. As such, we assigned semantic association task (SAT) to normal elderly (NE) and those with subjective memory impairment (SMI) or mild cognitive impairment (MCI) to examine their performance by semantic subcategories and the differences in error patterns. We found a significant difference in the number of correct response and reaction time under the SAT categories among the three groups, with the highest performance observed in 'function' and the lowest performance in 'superordinate' and 'part/whole'. Moreover, the error frequency was the lowest in NE, followed by those with SMI and MCI, with the latter two groups showing a significant increase in no-response. Our findings demonstrate the varying extent and process of impairments in the semantic network by category over different stages of cognitive decline. Thus, we proposed SAT performance as an indicator to detect and follow-up on cognitive decline in elderly with cognitive disorder.

A Robust Pattern-based Feature Extraction Method for Sentiment Categorization of Korean Customer Reviews (강건한 한국어 상품평의 감정 분류를 위한 패턴 기반 자질 추출 방법)

  • Shin, Jun-Soo;Kim, Hark-Soo
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.12
    • /
    • pp.946-950
    • /
    • 2010
  • Many sentiment categorization systems based on machine learning methods use morphological analyzers in order to extract linguistic features from sentences. However, the morphological analyzers do not generally perform well in a customer review domain because online customer reviews include many spacing errors and spelling errors. These low performances of the underlying systems lead to performance decreases of the sentiment categorization systems. To resolve this problem, we propose a feature extraction method based on simple longest matching of Eojeol (a Korean spacing unit) and phoneme patterns. The two kinds of patterns are automatically constructed from a large amount of POS (part-of-speech) tagged corpus. Eojeol patterns consist of Eojeols including content words such as nouns and verbs. Phoneme patterns consist of leading consonant and vowel pairs of predicate words such as verbs and adjectives because spelling errors seldom occur in leading consonants and vowels. To evaluate the proposed method, we implemented a sentiment categorization system using a SVM (Support Vector Machine) as a machine learner. In the experiment with Korean customer reviews, the sentiment categorization system using the proposed method outperformed that using a morphological analyzer as a feature extractor.

Ontology-based Machine Translation Mashup System for Public Information (온톨로지 기반 공공정보 번역 매쉬업 시스템)

  • Oh, Kyeong-Jin;Kwon, Kee-Young;Hong, Myung-Duk;Jo, Geun-Sik
    • Journal of the Korea Society of Computer and Information
    • /
    • v.17 no.8
    • /
    • pp.21-29
    • /
    • 2012
  • We have proposed an ontology-based translation mashup system for foreigner to enjoy Korean cultural information without any language barrier(linguistic problem). In order to utilize public information, we use a mobile public information open API of Seoul metropolitan city. Google AJAX language API is used for translations of public information. We apply an ontology to minimize errors caused by the translations. For ontology modeling, we analyze the public information domain and define classes, relations and properties of cultural vocabulary ontology. We generate ontology instances for titles, places and sponsors which are the most frequently occurring translation errors. We compare the accuracy of translations through our experiment. Through the experimental results using the proposed ontology-based translation mashup system, we verify the validity of the system.

A System Implementation for Mobile Contents Creation and Testing (모바일 콘텐츠의 생성 및 테스트를 위한 시스템의 구현)

  • Kim, Nam-Jin;Bae, Jong-Hwan;Chio, Lee-Kwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2011.01a
    • /
    • pp.225-228
    • /
    • 2011
  • 핸드폰에 의한 모바일 콘텐츠의 사용량이 날로 증가하고 있으며 이러한 추세에 맞추어 다양한 콘텐츠들이 다양한 플렛폼에서 생산되고 있다. 모바일 플랫폼에서 사용 가능한 콘텐츠 생산성은 플랫폼의 특수성으로 인해 생산 속도가 느리고 인력 투입이 많은 것이 문제점으로 지적되고 있다. 또한 무선 플랫폼에서 사용 가능한 콘텐츠 제작시 다양한 하드웨어 플랫폼으로 인한 액정 크기의 다양성과 사용 가능한 콘텐츠 개발 언어의 다양성으로 인한 문제점도 많은 것으로 알려져 있다. 본 연구에서는 이러한 생산성 저하의 원인으로 대표되는 문제점들과 다양한 하드웨어 플랫폼으로 인해 발생하는 문제점들을 해결하기 위한 모바일 콘텐츠를 통합 제작하고 테스트하는 PC용 소프트웨어를 개발하였다. xHTML 언어로 제작된 모바일 콘텐츠를 다양한 언어로 변환하기 위하여 패턴매칭 알고리즘을 사용한 변환 모듈을 개발하였다. 또한, 변환된 콘텐츠들을 각 플랫폼별로 테스팅 하기 위하여 개발자의 직접적 개입이 없이 모든 콘텐츠를 자동으로 검사하고 결과를 리포트 생성하는 자동 테스트 부분과 개발자의 육안으로 확인하고 테스트하여 결과 리포트를 생성하는 수동 테스트 부분으로 나누어진 소프트웨어 엔진을 개발하였다. 이상의 변환엔진을 사용하여 xHTML로 제작한 원본 콘텐츠는 다양한 플랫폼에서 이용 가능한 콘텐츠로 생산이 용이해 졌으며, 두 테스트 엔진을 사용하여 기본적인 콘텐츠 오류들을 쉽게 찾아내고 수정할 수 있는 개발 환경을 구축하였다.

  • PDF