Search | Korea Science

Chinese-Korean Machine Translation System for News Title Translation (뉴스 타이틀 번역을 위한 중한 기계번역 시스템)

Huang, Jin-Xia;Song, Hee-Jeong;Kim, Ji-Hyoun;Song, Yong-Mi;Kang, Won-Sek;Seo, Chong-Won;Chae, Young-Souk;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2000.10d
- /
- pp.350-357
- /
- 2000
본 논문은 근 몇 년간 꾸준히 진행되어진 중한 기계번역시스템에 대한 연구의 기초 위에서, 뉴스 타이틀 번역이라는 특정 도메인에 초점을 맞추어 이의 언어적 특성을 살펴보고, 중한 언어적 유사성에 기반 한 뉴스 타이틀 번역을 위한 중한 기계번역시스템에 대하여 설명한다.
PDF

Parsing Rules for MATES/CK (MATES/CK 중한기계번역시스템의 구문분석규칙)

Song, Young-Mi;Kang, Won-Seok;Kim, Ji-Hyoun;Song, Hee-Jeong;Huang, Jin-Xia;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2000.10d
- /
- pp.337-343
- /
- 2000
중한기계번역시스템(MATES/CK)의 구문분석은 1120개의 구문분석규칙과 통계적 정보에 의한 확률기반에 따라 그 문장에 가장 적합한 구문트리를 찾아져 적용되는 방식으로 이루어지고 있다. 기존 구문분석 규칙은 자체에 오류가 많고, 새로운 규칙의 생성도 필요하다. 규칙에 대한 제약조건에도 좀 더 구체적이고 정확성을 높일 수 있는 상태로의 전환이 필요하다. 본 논문에서는 중한기계번역시스템(MATES/CK)의 구문분석의 정확도를 높이기 위하여 구문분석규칙을 수정하는 방법에 관하여 알아보고 그 연구과정을 살펴본다.
PDF

A Study on the Standardization of IT Terms (정보기술용어의 표준화를 위한 연구)

Kim, Jae-Ho;Ryu, Pum-Mo;Shin, Hyo-Shik;Lee, Sang-Seok;Choi, Key-Sun
- Proceedings of the Korean Society for Cognitive Science Conference
- /
- 2005.05a
- /
- pp.158-162
- /
- 2005
지식의 확산과 대중화로 인하여 동일한 개념에 대한 검증되지 않은 용어들이 난립하고 있다. 종전에는 해당 학 회의용어심의위원회, 혹은 전문가 그룹의 합의를 통해서 출판된 전문용어집이 권위를 가지고 전문용어의 사용을 통제하였었다. 그러나 이제는 기존 전문용어집에 수록되지 않은 새로운 개념을 위한신조어의 생성에 있어서 사용자의 자의적인 해석이 빈번해져서 사회적 합의에 도달하지 못한 새로운 전문용어들이 경쟁적으로 사용되는 추세이다. 이러한 현실에 직면하여 국내외적으로 전문용어의 정비 및 표준화 사업은 언어 및 학문 분야의 경계를 넘어 총체적으로 전략적 접근을 시도하고 있다. 이에 본 연구에서는 7가지의 전문용어 표준화 지침을 수립하고, 그에 따라 ISO 2382의 4030개 정보기술용어를 표준화하고자 한다.
PDF

Conceptual Interlingua Construction for Korean-English Query Translation (한영 질의어 변환을 위한 공통 중간개념 구축)

Choi, Yong-Seok;Seo, Chung-Won;Shin, Sa-Im;Kim, Jae-Ho;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2001.10d
- /
- pp.422-427
- /
- 2001
질의어 변환 방법은 다국어 정보검색을 위한 방법중에 효율적인 방법이다. 양질의 질의어 변환을 위해서, 사전, 온톨로지, 병렬 코퍼스 통과 같은 자연언어 자원이 필요하다. 이러한 자연언어 자원은 양질로 대량으로 구축하려면 많은 비용이 튼다는 단점이 있다. 본 논문에서는 한영 질의어 변환에 적용할 수 있는 공통 중간개념 구축방법을 제안한다. 공통 중간개념은 동사들의 축으로 이루어지며, 통사들은 기본동사들의 조합으로 표현한수 있다고 가정한다. 공통 중간개념은 적은 자연언어 자원을 효율적으로 이용할 수 있도록 한다. 본 논문에서는 기본 동사 축을 특이값 분해(singular value decomposition) 방법으로 구하고, 그 기본 동사 축을 이용해서 질의어 변환하는 방법을 보여준다.
PDF

KorQATeC2.0: Construction of Test Collection for Evaluation of Question Answering System (KorQATeC2.0: 질의/응답 시스템의 성능 평가를 위한 평가집합 구축)

Kim, Jae-Ho;Lee, Kyung-Soon;Oh, Jong-Hoon;Chang, Du-Seong;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2001.10d
- /
- pp.397-404
- /
- 2001
본 논문에서는 질의/응답 시스템의 평가를 위해 구축된 평가집합 (Korean Question Answering Test Collection 2.0: KorQATeC2.0)에 대하여 기술한다. KorQATeC2.0은 총 120개의 질의와 207,067개의 문서로 구성되어 있으며, 120개의 질의는 질의에 대한 정답을 제시하는 방식에 따라 기본 과제 질의, 나열 과제 질의, 문맥 과제 질의, 요약 과제 질의로 나누어진다. 또한 KorQATeCl.0과는 달리 여러 문서를 참조하여 정답을 구성하는 질의와 문서집합에 정답이 존재하지 않는 질의를 포함시킴으로써 질의/응답 시스템의 평가를 다양하게 할 수 있도록 하였다. 본 논문에서 기술하는 평가집합은 질의/응답 시스템의 객관적 평가를 가능하게 한다는 점에서 그 의의가 있다.
PDF

A Morph Analyzer For MATES/CK (중한 기계 번역 시스템을 위한 형태소 분석기)

Kang, Won-Seok;Kim, Ji-Hyoun;Song, Young-Mi;Song, Hee-Jung;Huang, Jin-Xia;Chae, Young-Soog;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2000.10d
- /
- pp.331-336
- /
- 2000
MATES/CK는 기계번역 시스템에서 전통적으로 사용하고 있는 세 단계(분석/변환/생성)에 의해서 중한 번역을 수행하는 시스템이다. MATES/CK는 시스템 성능을 높이기 위해 패턴 기반과 통계적 정보를 이용한다. 태거(Tagger)는 중국어 단어 분리를 최장일치법으로 수행하기 때문에 일부 단어에 대해 오류를 범하게 되고 품사(POS : Part Of Speech) 태깅 시 확률적 정보만 이용하여 특정 단어가 다 품사인 경우 그 단어에 대해 특정 품사만 태깅되는 문제점이 발생한다. 또한 중국어 및 외국어 인명 및 지명에 대한 미등록들에 대해서도 올바른 결과를 도출하지 못한다. 사전에 있어서 텍스트 기반으로 존재하여 이를 관리하기에 힘이 든다. 본 논문에서는 단어 분리 오류 및 품사 태깅 오류를 해결하기 위해 중국어 태깅 제약 규칙을 적용하는 방법을 제시하고 중국어 및 외국어 인명/지명에 대한 미등록어 처리방법을 제시한다. 또한 중국어 사전 관리에 대해 알아본다.
PDF

A Korean Noun Semantic Hierarchy (Wordnet) Construction

Lee, Juho;Koaunghi Un;Bae, Hee-Sook;Park, Key-Sun
- Proceedings of the Korean Society for Language and Information Conference
- /
- 2002.02a
- /
- pp.290-295
- /
- 2002
Since thesaurus is used as a knowledge resource in many natural language processing systems, it is very useful and necessary for the high quality systems, especially for dealing with semantics. In this paper, we introduce a semi-automatic method for the construction of Korean noun semantic hierarchy by utilizing a monolingual MRD and an existing thesaurus.
PDF

Word Sense Disambiguation Using of Cooccurrence Information Vectors (공기정보 벡터를 이용한 한국어 명사의 의미구분)

Shin, Sa-Im;Lee, Ju-Ho;Choi, Yong-Seok;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2001.10d
- /
- pp.472-478
- /
- 2001
본 논문은 문맥의 공기정보를 사용한 한국어 명사의 의미구분에 관한 연구이다. 대상 명사에 대한 문맥의 지엽적인 단어분포는 명사의 의미구분을 위한 의미적 특성을 표현하는데 충분하지 못하다. 본 논문은 의미별로 수집한 문맥 정보를 기저 벡터화 하는 방법을 제안한다. 정보의 중요도 측정을 통하여 의미구분에 불필요한 문맥정보는 제거하고, 남아있는 문맥의 단어들은 변별력 강화를 위하여 상의어 정보로 바꾸어 기저벡터에 사용한다. 상의어 정보는 단어의 형태와 사전 정의문의 패턴을 통해 추출한다. 의미 벡터를 통한 의미구분에 실패하였을 경우엔 훈련데이터에서 가장 많이 나타난 의미로 정답을 제시한다. 실험을 위해 본 논문에서는 SENSEVAL 실험집합을 사용하였으며, 제시한 방법으로 공기정보의 가공 없이 그대로 실험한 방법과 비교하여 최고 42% 정도의 정확률 향상을 나타내었다.
PDF

A Method for Automatic Extract ion of Term Definition from Text (텍스트로부터 용어 정의문의 자동 추출 방법)

Shin, Hyo-Shik;Kim, Jae-Ho;Lee, Hae-Yun;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 2002.10e
- /
- pp.292-299
- /
- 2002
본 연구는 텍스트 코퍼스로부터 용어의 정의를 자동으로 추출하여 용어의 자동 추출기술과 통합하여 다목적의 용어뱅크를 구축하기 위한 목적으로부터 출발하였다. 지식정보의 확산에 따라 기존 전문분야 용어집에 수록되지 알은 용어의 수는 폭발적으로 증가하고 있다. 기존의 용어집 혹은 용어사전의 디지털화만으로는 새로운 전문용어의 포괄성에서 한계가 있는 것이다. 정보의 획득이라는 면에서 보면 이러한 한계를 극복하고 모든 용어에 대해서 즉시적으로 용어의 정의를 제공받는 것이 바람직하다. 자동으로 구축된 용어집의 응용은 여러 가지로 기대된다. 새로운 용어에 대한 의미 파악을 위해서는 물론, 확장된 전문용어집의 작성이나 전문분야 온톨로지의 구축 등에도 이용될 수 있다.
PDF

Implementation of Modularized Morphological Analyzer (모듈화된 형태소 분석기의 구현)

Lee, Woon-Jae;Kim, Sun-Bae;Kim, Gil-Yeon;Choi, Key-Sun
- Annual Conference on Human and Language Technology
- /
- 1999.10d
- /
- pp.123-136
- /
- 1999
자연언어처리 분야에서 형태소 분석은 가장 기본적인 단계로서 응용 시스템의 목적에 따라 사용되는 형태소 분석기의 수준과 사용 정보가 달라진다. 기존의 형태소분석기의 기능을 다른 목적을 지닌 응용 시스템에서 사용하려 할 때, 분석수준과 사용정보의 이질성으로 인해 변경 또는 확장하는데 많은 어려움이 있다. 이러한 형태소 분석기의 변경과 확장에 대한 다양한 요구를 수용하기 위한 방법으로서 재사용가능한 모듈화된 형태소 분석기의 구현을 제안한다. 모듈화된 형태소 분석기는 구성 요소인 모듈들의 독립성과 재사용성을 보장하기 때문에 확장과 보수가 쉽고, 특정한 요구사항에 대하여 새로운 형태소 분석기를 구현하는데 기존의 모듈들을 사용함으로써 시스템의 개발 시간을 단축시킨다. 본 논문에서는 이러한 모듈들의 사용성을 보여주기 위해 전처리기, 형태소 분석기, 명사 추출기, 태거 등을 하나의 시스템 안에 모듈화된 개념으로 구현하였고, 형태소 분석기는 사전, 음운 변화 처리, 결합 검사, 분석 알고리즘 등을 모듈화하여 재사용할 수 있다는 것을 보여준다.
PDF

Search Result 39, Processing Time 0.02 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)