• Title/Summary/Keyword: 전문용어

Search Result 342, Processing Time 0.054 seconds

A terminology extraction system (전문용어 추출시스템)

  • 박정오;황도삼
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.04b
    • /
    • pp.381-383
    • /
    • 2000
  • 현재, 과학기술, 정치, 사회, 문화의 급격한 변화와 발전에 따라, 전문분야마다 새로운 전문용어가 빈번히 생성되거나 소멸되고 있다. 이러한 전문용어를 포함한 문서를 정확히 해석하기 위해서는 전문용어 전자사전이 필요하다. 전문용어 전자사전을 개발하는데는 수시로 생성되는 전문용어 표제어를 정확히 추출하는 것이 무엇보다 중요하다. 본 논문에서는 이러한 전문용어 표제어를 컴퓨터를 이용하여 추출하는 시스템을 개발하였다. 기본적으로 기존의 전문용어가 사용된 특정어구를 이용하여 전문용어를 추출한다. 또한, 전문용어의 어절 패턴을 이용하여 후보 전문 용어를 추출한 후, 전문용어를 구성할 수 있는 단어의 위치정보를 이용하여 전문용어를 추출하는 방법을 제안한다. 기존 전문용어 사전에 없는 단어에 대해서는 시소러스를 이용하여 유사 단어의 위치정보를 이용하는 방법을 이용하였다.

  • PDF

Machine-Learning Based Biomedical Term Recognition (기계학습에 기반한 생의학분야 전문용어의 자동인식)

  • Oh Jong-Hoon;Choi Key-Sun
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.8
    • /
    • pp.718-729
    • /
    • 2006
  • There has been increasing interest in automatic term recognition (ATR), which recognizes technical terms for given domain specific texts. ATR is composed of 'term extraction', which extracts candidates of technical terms and 'term selection' which decides whether terms in a term list derived from 'term extraction' are technical terms or not. 'term selection' is a process to rank a term list depending on features of technical term and to find the boundary between technical term and general term. The previous works just use statistical features of terms for 'term selection'. However, there are limitations on effectively selecting technical terms among a term list using the statistical feature. The objective of this paper is to find effective features for 'term selection' by considering various aspects of technical terms. In order to solve the ranking problem, we derive various features of technical terms and combine the features using machine-learning algorithms. For solving the boundary finding problem, we define it as a binary classification problem which classifies a term in a term list into technical term and general term. Experiments show that our method records 78-86% precision and 87%-90% recall in boundary finding, and 89%-92% 11-point precision in ranking. Moreover, our method shows higher performance than the previous work's about 26% in maximum.

Terminology Standardization in China (중국에서의 전문용어 표준화)

  • Huang, Yinxia
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.202-209
    • /
    • 2007
  • 하나의 개념을 가리키는 여러 개의 전문용어의 난립과 혼란스러운 사용은 학자간, 학계간의 원활한 의사소통을 가로막고, 나아가 학문의 발전을 저해하게 된다. 따라서 전문용어 표준을 확립하고 보급하는 전문용어 정비 및 표준화 사업이 관심사로 부각되고 있다. 한국은 2003년부터 한국학술단체총연합회의 주관으로 학과간 전문용어의 정비와 표준화 사업을 본격적으로 추진해 오고 있다. 한국의 실정에 맞는 전문용어 정리 방법론을 구축하고 적용하기 위해서는, 다른 나라들의 전문용어 표준화 사업에 대한 사례 조사가 선행되어야 할 것이다. 인근 국가인 중국은 일찍이 20세기 초반부터 전문용어 정비 사업을 진행해 왔는데, 특유의 사회 체제와 중국어의 고유한 언어 특성상 전문용어의 정비의 시스템과 그 실제에 있어서 한국의 상황과 아주 다른 양상을 보인다. 본 연구는 중국에서의 전문용어 정비 사업의 연혁과 정비 기구, 나아가 전문용어 정비의 실제에 대해 두루 살펴보고 장단점을 논의하는 것을 목적으로 한다.

  • PDF

Terminology Harmonization (전문용어의 정비)

  • Choi, Key-Sun;Park, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.303-310
    • /
    • 2007
  • 전문용어의 정비, 기초 데이터 구축 및 관리, 전문용어의 구축 과정의 표준화 방안, 전문용어 정비의 심의에 대해서 알아 보고자 한다. 전문용어의 정의에 대해서 간단하게 알아보고, 전문용어 정비를 위한 공정도를 소개하며, 전문용어 정비 순서와 절차에 대해서 설명하고자 한다. 기초 데이터 구축 및 관리 과정에서 어떤 방법으로 기초 데이터를 구축하게 되었으며, 어떠한 절차에 따라 DB화 및 심의를 위한 준비를 하게 되는지를 보고하고자 한다. 또한 전문용어의 정비를 하는 과정에서 발생하는 몇 가지 문제점에 대해서 알아 보고, 표준화 방안을 제시하며, 마지막으로 전문용어 정비를 위한 심의 지침을 제시하고자 한다. 심의 지침은 기존의 연구에서 제시된 권장안을 바탕으로 전문용어의 정비를 위한 기준에 맞게 만들어졌다. 이 논문에서는 전문용어의 정비를 위한 전반적인 절차와 내용 그리고 심의에 대해 기준을 제시하는데 목적을 두고자 한다.

  • PDF

Science and Technology Terminology Dictionary Building Process and Workbench Development in Defense Area (국방과학기술 전문용어 사전 구축을 위한 프로세스 및 워크벤치 개발)

  • Choi, Jung-Whoan;Park, Jeong-Ho;Kim, Kyung-Sun;Kim, Pyung
    • The Journal of the Korea Contents Association
    • /
    • v.12 no.8
    • /
    • pp.420-428
    • /
    • 2012
  • To improve the efficiency of business, it is important to standardize the meaning of terminology. And then, terminology dictionaries have been actively being built and used in various fields. In defense area, the publication of defense terminology dictionary is useful for information exchange of each army and distribution of standardized terminology. Defense agency for technology and quality(DTaQ) publishes terminology dictionary of defense science and technology on a three-year cycle. DTaQ tries to standardize the construction process of terminology dictionary and improve service efficiency by using terminology dictionary in defense area. This proposed method is based on the result of previous study about standardization of terminology dictionary. We suggest the practical steps including terminology dictionary constructing process, composition and role of organization, definition of headword, selection of target documents to be extracted terminology candidate, terminology extraction, generation of terminology candidate group, workbench registration, construction and validation of terminology dictionary. Thesaurus and workbench are developed to use and support terminology dictionary effectively.

Term Extraction and Ranking for Building Term Dictionary (전문용어사전 구축을 위한 전문용어 추출 및 순위화)

  • Koo, Hee-Kwan;Jung, Han-Min;Lee, Byeong-Hee;Sung, Won-Kyung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.05a
    • /
    • pp.745-748
    • /
    • 2005
  • 전문용어는 특정 분야의 전문가 사이에서 통용되는 표현 매체이며, 일반용어에 비해 생성과 소멸의 주기가 짧은 특징을 가지고 있다. 이런 특징 때문에 일반용어 사전구축과 달리 전문용어 사전을 구축하기 위해서는 신속한 대응전략이 필요하다. 이를 위해 본 논문에서는 전문용어 사전 구축을 위한 다음과 같은 두 단계의 과정을 제안한다. 우선 형태소 후처리와 결합규칙을 이용하여 1,200만 어절의 신문 말뭉치로부터 단일어 10만과 복합어 30만의 용어후보를 추출하고, 고빈도 용어 후보 6만개를 선별해 용어지배지수(Term Dominance Value)라는 개념을 도입하여 전문용어를 선정한다. 실험을 통해 용어지배지수 순위와 누적빈도순위 및 최근연도 순위를 비교한 결과 본 논문에서 제안한 용어지배지수가 전문용어 활용도를 나타내는 훌륭한 지표역할을 할 수 있음을 확인할 수 있었다.

  • PDF

Automatic Term Recognition Through EM Algorithm (EM 알고리즘을 이용한 전문용어의 자동 추출)

  • 오종훈;김재호;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.487-489
    • /
    • 2003
  • 전문용어란 전문분야의 개념이 언어적으로 표현된 형태이다. 전문분야마다 분야 특성 적인 개념이 사용되므로, 전문용어는 전문분야를 특성화하는 단위로 사용된다. 따라서 전문분야문서에 대한 자연언어처리에서 전문용어를 효과적으로 처리하는 것은 매우 중요하다. 전문용어 추출은 분야 특성적인 전문용어를 해당 분야 문서에서 파악하는 작업을 말한다. 본 논문에서는 기계학습방법을 이용한 전문용어 자동 추출 기법을 제안한다. 본 논문의 기법은 전문분야 사전과 전문분야 문서를 이용하여 문서에서 나타나는 전문용어의 특성을 파악하고 이를 이용하여 전문용어를 추출한다. 본 논문의 기법은 70,000단어 수준의 영어 의학분야 300개 문서에 대하여 약 77%의 정확률로 전문용어를 추출하였다.

  • PDF

Recognizing Biomedical Terminologies through Integration of Heterogeneous Information (정보통합을 통한 생물/의학 분야 전문용어의 자동 추출)

  • 오종훈;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10a
    • /
    • pp.775-777
    • /
    • 2004
  • 전문용어란 전문분야의 개념이 언어적으로 표현된 형태이다. 전문분야마다 분야 특성적인 개념이 사용되므로, 전문용어는 전문분야를 특성화하는 단위로 사용된다. 따라서 전문분야문서에 대한 자연언어처리에서 전문용어를 효과적으로 처리하는 것은 매우 중요하다. 전문용어 추출은 분야 특성적인 전문용어를 해당 분야 문서에서 파악하는 작업을 말한다. 본 논문에서는 기계학습방법을 이용한 전문용어 자동 추출 기법을 제안한다. 본 논문의 기법은 전문분야 사전과 전문분야 문서를 이용하여 문서에서 나타나는 전문용어의 특성을 파악하고 이를 이용하여 전문용어를 추출한다. 본 논문의 기법은 GENIA 2.01 문서에 대하여 86%의 정확률과 90%의 재현율을 나타내었다. 또한 기존연구보다 최고 21%의 성능향상을 나타내었다.

  • PDF

Automatic Term Recognition using Domain Similarity and Statistical Methods (분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출)

  • Oh, Jong-Hoon;Lee, Kyung-Soon;Choi, Key-Sun
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.4
    • /
    • pp.258-269
    • /
    • 2002
  • There have been many studies of automatic term recognition (ATR) and they have achieved good results. However, there are scopes to improve the performance of extracting terms still further by using the additional technical dictionaries. This paper focuses on the method for extracting terms using the hierarchy among technical dictionaries. Moreover, a statistical method based on frequencies, foreign words, and nested relations assists extracting terms which do not appear in dictionaries. Our method produces relatively good results for this task.

A Study on the Microstructure of Terminological Dictionaries (전문용어사전의 미시구조에 관한 연구)

  • 김성진;정동열
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.35 no.1
    • /
    • pp.143-162
    • /
    • 2001
  • As technical intellectual work now has become prolific and various, rapid evolution of technical terms needs to collect and manage them systematically and efficiently. The purpose of this study is to suggest the microstructure for systematic definitions of definiendum in terminological dictionaries. This study reveals specific properties or differences of terminography on the basis of terminology and lexicography, analyzes problems of microstructure in a current terminological dictionary, and, based upon the theoretical and practical analysis, attempts to derive structural and methodical suggestions for microstructure of terminological dictionaries.

  • PDF