Search | Korea Science

COGNITIVE SPELLING THERAPIST: A combined method for correcting four types of spelling errors: insertion, deletion, transposition, substitution (인지적 철자 교정 후보 제시기: 삽입, 생략, 전위, 대치 오류 수정을 위한 복합 방안)

Lee, Jong-Ho;Lee, Jong-Hyeok;Lee, Gun-Bae
- Annual Conference on Human and Language Technology
- /
- 1994.11a
- /
- pp.132-139
- /
- 1994
Cognitive Spelling Therapist generates the candidates for correction of one-letter misspelling words, which correspond to over 80 % of the misspelling words. One-letter misspelling can be divided into four categories, and for each categories Cognitive Spelling Therapist copes them with seperate cognitive therapies. Each therapy is based on cognitive causes of misspelling: figural confusion, pronunciation confusion, and keyboard confusion. Cognitive Spelling Therapist generates three candidates for correction in average. After we tested the correctness of candidates with 185 misspelled words randomly sampled from two typist for two months, Cognitive Spell Therapist showed 97.5 % correction for substitution errors, while insertion, deletion, and transposition errors were perfectly corrected.
PDF

Implementation of Phrase-based Indexing (구 기반 색인 시스템의 구현)

Lee, Chung-Hee;Kim, Hyun-Jin;Jang, Myung-Gil
- Annual Conference on Human and Language Technology
- /
- 2001.10d
- /
- pp.63-69
- /
- 2001
정보 검색 결과의 정확성을 높이기 위해서는 상위수준의 색인 정보를 이용한 검색 기법이 요구된다. 상위수준의 색인을 하기 위해서는 구문 분석을 이용할 필요가 있지만 웹 페이지를 이용하는 웹 검색에서는 웹 폐이지 자체의 오류 때문에 구문 분석을 할 때 실패할 확률이 높으므로 견고한 구문 분석이 요구된다. 본 논문은 구, 문장에 기반한 색인 기법 및 기존 색인 방법을 병행해서 사용하는 시스템에 대하여 소개한다. 본 논문에서 소개하는 시스템은 5가지 방법의 색인 기법을 사용한다. 각 색인 기법은 적용될 분야 또는 범위에 따라 선택적으로 사용될 수 있다. 색인 기법은 1)명사 색인 2)명사+용언 색인 3)명사+용언+문장정보 색인 4)명사구 색인 5)중심어-종속어(Head-Modifier) 색인으로 나누어진다. 색인 기법 중 4와 5의 경우, 구문 분석된 결과를 사용하여 특정 명사구 및 중심어-종속어 관계를 고려함으로써 문서의 특성을 잘 나타내는 색인어를 추출할 수 있고 그러므로 정보검색의 성능을 향상시키는 기반 기술로 사용될 수 있다.
PDF

Comparative Study on Type-2 and Type-1 TSK FLS. (Type-2와 Type-1 TSK FLS의 비교 연구)

Ji, Gwang-Hui;O, Seong-Gwon
- Proceedings of the Korean Institute of Intelligent Systems Conference
- /
- 2008.04a
- /
- pp.321-324
- /
- 2008
Type-2 퍼지 집합은 Type-1 퍼지 집합에서는 다루기 어려운 언어적인 불확실성을 더욱 효과적으로 다룰 수 있다. TSK 퍼지 로직 시스템(TSK Fuzzy Logic Systems; TSK FLS)은 Mamdani 모델과 함께 가장 널리 사용되는 FLS이다. 본 연구의 Interval Type-2 TSK FLS 모델은 전반부에서 Type-2 퍼지 집합을 이용하고 후반부는 계수가 상수인 1차식을 사용한다. 전반부의 파라미터는 오류역전파 방법(Back-propagation)을 통한 학습으로 결정되고, 후반부 파라미터(계수)들은 Least squre method(LSM)를 사용하여 결정된 값을 사용하여 모델을 구축한다. 본 논문에서는 Type-1 TSK FLS과 Type-2 TSK FLS의 성능을 가스로 공정 데이터를 적용하여 비교 분석한다. 또한 랜덤 화이트 가우시안 노이즈를 추가한 테스트 데이터를 사용하여 노이즈에 대한 성능을 분석한다.
PDF

예외 단어 선별 작업을 이용한 자동 발음열 생성 시스템의 성능향상에 관한 연구

안주은;김선희;김순협
- Proceedings of the KSLP Conference
- /
- 2003.11a
- /
- pp.142-142
- /
- 2003
본 연구는 텍스트 분석 기반 자동 발음열 생성 시스템의 성능을 향상시킬 수 있는 방법으로 예외 단어 선별 작업을 제안한다. 제안하는 자동 발음열 생성 시스템은 형태음운 규칙 적용, 예외 규칙 적용, 일반음운 규칙 적용의 순서로 이루어진다. 이 때 예외 규칙은 예외사전을 검색하여 해당 어휘가 있을 때에만 적용하게 되는데, 예외 단어는 일정한 예외 환경에서만 나타난다. 본 시스템의 예외 사전에 있는 예외 단어는 5만여 어휘 연세사전에서 예외 환경에 해당하는 28,486개의 어휘 중, 총 2,931개의 예외 단어를 선별하였다. 본 시스템의 성능 평가는 ETRI 2,385, PBS 1,637 어절을 사용하였는데 실험 결과 각각 99.8%, 99.9%의 정확도를 보였고, 0.1% 의 오류는 예외 규칙 중에 하나인 어휘적 경음화 현상에서 나타났다. 따라서 예외 사전을 보다 정확하게 만드는 방법인, 예외 단어 선별 작업을 통해 본 시스템의 성능을 향상시킬 수 있다. (중략)
PDF

말뭉치에 근거한 한국어 사전 표제어 구성

Park, Yeong-Hwan;Yun, Jun-Tae;Song, Man-Seok
- Annual Conference on Human and Language Technology
- /
- 1991.10a
- /
- pp.58-65
- /
- 1991
사전은 자연어를 처리하는 핵심 부분을 이루고 있다. 그러나 기존의 한국어 사전은 기계적인 처리에 직접 이용하기에는 크게 미흡하다. 특히, 사전의 기본을 이루는 표제어 수록에 관한 연구는 더욱 취약한 형편이다. 본 연구는 새로운 한국어 사전의 표제어률 구성하기 위하여 대형 말뭉치를 수집하였다. 이 말뭉치를 이용하여 기존 사전에서 빠져있는 미등록어들을 찾아내어 수록하고, 말뭉치에 나타난 각 단어의 출현 빈도를 조사하였다. 이 연구를 수행하기 위하여 형태소 분석기, 용례 분석기 등의 필수적인 텍스트 처리 도구들을 개발하였다. 또한, 말뭉치에 나타난 어절 단위의 오류 분포를 조사하여 밝히었다.
PDF

Concurrent Object Model Verification with SPIN++ (SPIN++를 이용한 병렬 객체 모델의 검증)

조웅희;배두환;차성덕;권용래;원성기;변성원
- Proceedings of the Korean Information Science Society Conference
- /
- 1998.10b
- /
- pp.472-474
- /
- 1998
병렬 객체를 이용한 소프트웨어의 개발시, 병렬성에서 기인한 경쟁 조건의 만족 여부나 교착 상태, 기아 상태 등의 오류를 모델의 검증을 통하여 개발의 초기 단계에 발겨하고 수정하는 것은 개발의 효율성을 높일 수 있다. 이러한 병력 객체모델의 검증을 위해서는 객체간의 상호 메시지 교환과 동적 행위를 기술할 수 있는 모델링 언어가 필요하며, 검증하고자 하는 속성을 기술하기 위한 방법이 요구된다. 본 연구에서는 시스템의 모델링을 위해 SPIN에서 사용되는 PROMELA를 쓰레드 기반의 객체 모델링 언어인 SPIN++로 확장하고, 속성의 기술을 위해 확장된 선형 시제 논리를 제안하였으며, 유한 상태에서는 모델 검사(model checking) 도구인 SPIN을 이용하여 검증하는 방법을 제시하고자 한다. 이러한 연구를 통하여 병렬 객체 모델의 정형적인 검증을 수행할 수 있으며, 시스템 개발의 효율성을 높이는 데 도움을 줄 수 있다.

Using Statistical Correction Rule to Improve Word Alignment (통계적 수정규칙을 이용한 한국어-중국어 단어정렬 개선방법)

Jin, Chang-Hu;Li, Jin-Ji;Na, Hwidong;Kim, Dong-Il;Lee, Jong-Hyeok
- Annual Conference on Human and Language Technology
- /
- 2009.10a
- /
- pp.231-236
- /
- 2009
본 논문에서는 통계적으로 추출한 수정규칙을 이용하여 구 기반 한-중 통계기계번역 시스템(PBSMT)의 단어정렬 결과를 개선하는 방법을 제안한다. 논문에서 제안하는 수정규칙은 단어정렬의 결과를 사람이 만든 정답과 비교하여 통계적으로 추출하였다. 본 논문에서는 위에서 추출한 수정규칙을 이용하여 한-중 통계기계번역 시스템의 단어정렬의 결과에서 한국어 기능어(functional word)에 나타나는 오류를 수정함으로써 단어정렬의 결과를 개선하였고 최종적으로 기계번역의 성능을 제고하였다.
PDF

Design and implementation of an efficient part-of-speech annotation tool that has the study facility (학습기능을 가진 효율적인 품사 부착 도구 설계 및 구현)

Ahn, Yu-Mi;Oh, Jin-Young;Cha, Jung-Won
- Annual Conference on Human and Language Technology
- /
- 2009.10a
- /
- pp.191-196
- /
- 2009
본 논문에서는 자바 기반의 품사부착 코퍼스 작성 도구를 제안 및 구현한다. 본 시스템에서는 각 사용자가 독립적으로 실행하지만 주요 데이터베이스는 서버에서 관리함으로서 지식을 공유할 수 있고, 품사부착 작업에 있어 사전에 만들어진 어절 후보로부터의 선택 및 사용자 입력이 가능하도록 한다. 고빈도 오류어절의 자동 표시 기능, 용례 검색을 통한 도움말 기능, 코멘트를 기반으로 구성된 집단 지식을 이용한 도움말 확장 기능 및 사전 검색 기능을 구현한다. 또한, 일관성 검사를 통해 품사부착 결과에 대한 신뢰도 증가 및 작업의 편의성을 증대시킬 수 있도록 설계한다.
PDF

An Implementation of Neuro-Fuzzy Korean Spelling Corrector Using Keyboard Arrangement Characteristics (자판 배열 특성을 이용한 Neuro-Fuzzy 한국어 철자 교정기의 구현)

Jung, Han-Min;Lee, Geun-Bae;Lee, Jong-Hyeok
- Annual Conference on Human and Language Technology
- /
- 1993.10a
- /
- pp.317-328
- /
- 1993
본 논문은 신경망과 퍼지 이론을 결합한 한국어 철자 교정기 KSCNN(Korean Spelling Corrector using Neural Network)에 대하여 기술한다. KSCNN은 퍼셉트론(perceptron) 학습을 이용한 연상 메모리(associative memory)로 구성되며 자판 배열 특성을 고려한 퍼지 멤버쉽 함수에 의해 신경망의 입력값을 정한다. 본 철자 교정기의 장점은 인지적인 방법으로 철자를 교정하기 때문에 기존의 VA나 BNA와는 달리 오류의 종류에 영향을 받지 않으며 교정된 철자나 후보자들에 대한 견인값(attraction value)을 측정하여 시스템의 신뢰도를 높일 수 있다는 데 있다. 또한, 본 논문은 실험을 통해서 퍼지 멤버쉽 함수에 의한 입력 노드의 활성화가 자판 배열특성을 고려할 수 있기 때문에 시스템의 성능을 향상시킨다는 사실을 보여준다.
PDF

Word Segmentation for Korean with Syllable-Level Combinatory Categorial Grammar (음절단위 결합범주문법을 이용한 한국어 문장의 자동 띄어쓰기)

Lee, Ho-Joon;Park, Jong-C.
- Annual Conference on Human and Language Technology
- /
- 2002.10e
- /
- pp.47-54
- /
- 2002
한국어의 띄어쓰기 현상은 단어별로 정형화된 띄어쓰기를 하는 영어나 띄어쓰기가 발달하지 않은 중국어, 일본어와는 다르게 독특한 형태로 발전되어 왔다. 기존에는 부분적인 띄어쓰기 오류를 바로잡아주는 형태의 연구가 많이 진행되었지만 이제는 문자인식이나 음성인식 등의 연구와 결합하여 띄어쓰기가 완전히 무시된 문장의 띄어쓰기를 자동으로 처리하는 방법에 대한 연구가 활발히 진행 중이다. 본 논문에서는 한국어의 띄어쓰기 현상과 띄어쓰기 복원 방법에 대한 기존의 연구에 대해서 살펴보고 기존의 방법으로는 저리하기 힘들었던 형태를 음절단위 결합범주문법으로 설명한다.
PDF

Search Result 385, Processing Time 0.023 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)