• 제목/요약/키워드: 전문 용어

검색결과 345건 처리시간 0.03초

전문용어 추출시스템 (A terminology extraction system)

  • 박정오;황도삼
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.381-383
    • /
    • 2000
  • 현재, 과학기술, 정치, 사회, 문화의 급격한 변화와 발전에 따라, 전문분야마다 새로운 전문용어가 빈번히 생성되거나 소멸되고 있다. 이러한 전문용어를 포함한 문서를 정확히 해석하기 위해서는 전문용어 전자사전이 필요하다. 전문용어 전자사전을 개발하는데는 수시로 생성되는 전문용어 표제어를 정확히 추출하는 것이 무엇보다 중요하다. 본 논문에서는 이러한 전문용어 표제어를 컴퓨터를 이용하여 추출하는 시스템을 개발하였다. 기본적으로 기존의 전문용어가 사용된 특정어구를 이용하여 전문용어를 추출한다. 또한, 전문용어의 어절 패턴을 이용하여 후보 전문 용어를 추출한 후, 전문용어를 구성할 수 있는 단어의 위치정보를 이용하여 전문용어를 추출하는 방법을 제안한다. 기존 전문용어 사전에 없는 단어에 대해서는 시소러스를 이용하여 유사 단어의 위치정보를 이용하는 방법을 이용하였다.

  • PDF

기계학습에 기반한 생의학분야 전문용어의 자동인식 (Machine-Learning Based Biomedical Term Recognition)

  • 오종훈;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권8호
    • /
    • pp.718-729
    • /
    • 2006
  • 일정 분야의 문서들에서 그 분야 특정을 반영하는 전문용어를 자동으로 인식하는 연구에 대한 관심이 증가하고 있다. '전문용어 인식'은 문서에서 전문용어가 될 수 있는 언어적 단위를 파악하는 '용어 추출' 과정과 '용어추출' 과정에서 얻어진 용어목록 중 해당분야의 전문용어를 고르는 '전문용어 선택' 과정으로 구성된다. '전문용어 선택' 과정은 용어목록을 전문용어의 특정에 따라 순위화한 후 타당한 전문용어를 파악하는 작업으로 정의된다. 따라서 전문용어 선택 문제는 용어목록의 순위화 작업과 순위화된 목록에서 전문용어와 비전문용어 간의 경계를 인식하는 작업으로 정의된다. 기존의 전문용어 선택 기법은 주로 용어의 빈도수 등과 같은 통계적 특정만을 이용하였다. 하지만 통계적 특정만으로는 효과적으로 전문용어를 선택하기 어렵다. 본 논문의 논제는 전문용어 선택에서 다양한 전문용어의 특정을 고려하고 이들 중 전문용어 선택에서 효과적인 특정을 찾으려는 것이다. 순위화 문제는 다양한 전문용어 특정을 도출하고 이들을 기계학습방법으로 통합하여 해결한다. 경계인식 문제는 전문용어와 비전문용어의 이진 분류 문제로 정의하고 기계학습방법으로 해결한다. 본 논문의 기법은 경계인식측면에서 78-86%의 정확률과 87% -90%의 재현율을 나타내었으며, 순위화 측면에서 89%-92%의 11포인트 평균정확률을 나타내었다. 또한 기존 연구보다 최고 26% 의 성능향상을 보였다.

EM 알고리즘을 이용한 전문용어의 자동 추출 (Automatic Term Recognition Through EM Algorithm)

  • 오종훈;김재호;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.487-489
    • /
    • 2003
  • 전문용어란 전문분야의 개념이 언어적으로 표현된 형태이다. 전문분야마다 분야 특성 적인 개념이 사용되므로, 전문용어는 전문분야를 특성화하는 단위로 사용된다. 따라서 전문분야문서에 대한 자연언어처리에서 전문용어를 효과적으로 처리하는 것은 매우 중요하다. 전문용어 추출은 분야 특성적인 전문용어를 해당 분야 문서에서 파악하는 작업을 말한다. 본 논문에서는 기계학습방법을 이용한 전문용어 자동 추출 기법을 제안한다. 본 논문의 기법은 전문분야 사전과 전문분야 문서를 이용하여 문서에서 나타나는 전문용어의 특성을 파악하고 이를 이용하여 전문용어를 추출한다. 본 논문의 기법은 70,000단어 수준의 영어 의학분야 300개 문서에 대하여 약 77%의 정확률로 전문용어를 추출하였다.

  • PDF

중국에서의 전문용어 표준화 (Terminology Standardization in China)

  • 황은하
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.202-209
    • /
    • 2007
  • 하나의 개념을 가리키는 여러 개의 전문용어의 난립과 혼란스러운 사용은 학자간, 학계간의 원활한 의사소통을 가로막고, 나아가 학문의 발전을 저해하게 된다. 따라서 전문용어 표준을 확립하고 보급하는 전문용어 정비 및 표준화 사업이 관심사로 부각되고 있다. 한국은 2003년부터 한국학술단체총연합회의 주관으로 학과간 전문용어의 정비와 표준화 사업을 본격적으로 추진해 오고 있다. 한국의 실정에 맞는 전문용어 정리 방법론을 구축하고 적용하기 위해서는, 다른 나라들의 전문용어 표준화 사업에 대한 사례 조사가 선행되어야 할 것이다. 인근 국가인 중국은 일찍이 20세기 초반부터 전문용어 정비 사업을 진행해 왔는데, 특유의 사회 체제와 중국어의 고유한 언어 특성상 전문용어의 정비의 시스템과 그 실제에 있어서 한국의 상황과 아주 다른 양상을 보인다. 본 연구는 중국에서의 전문용어 정비 사업의 연혁과 정비 기구, 나아가 전문용어 정비의 실제에 대해 두루 살펴보고 장단점을 논의하는 것을 목적으로 한다.

  • PDF

전문용어의 정비 (Terminology Harmonization)

  • 최기선;박정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.303-310
    • /
    • 2007
  • 전문용어의 정비, 기초 데이터 구축 및 관리, 전문용어의 구축 과정의 표준화 방안, 전문용어 정비의 심의에 대해서 알아 보고자 한다. 전문용어의 정의에 대해서 간단하게 알아보고, 전문용어 정비를 위한 공정도를 소개하며, 전문용어 정비 순서와 절차에 대해서 설명하고자 한다. 기초 데이터 구축 및 관리 과정에서 어떤 방법으로 기초 데이터를 구축하게 되었으며, 어떠한 절차에 따라 DB화 및 심의를 위한 준비를 하게 되는지를 보고하고자 한다. 또한 전문용어의 정비를 하는 과정에서 발생하는 몇 가지 문제점에 대해서 알아 보고, 표준화 방안을 제시하며, 마지막으로 전문용어 정비를 위한 심의 지침을 제시하고자 한다. 심의 지침은 기존의 연구에서 제시된 권장안을 바탕으로 전문용어의 정비를 위한 기준에 맞게 만들어졌다. 이 논문에서는 전문용어의 정비를 위한 전반적인 절차와 내용 그리고 심의에 대해 기준을 제시하는데 목적을 두고자 한다.

  • PDF

국방과학기술 전문용어 사전 구축을 위한 프로세스 및 워크벤치 개발 (Science and Technology Terminology Dictionary Building Process and Workbench Development in Defense Area)

  • 최중환;박정호;김경선;김평
    • 한국콘텐츠학회논문지
    • /
    • 제12권8호
    • /
    • pp.420-428
    • /
    • 2012
  • 용어 의미 표준화를 통한 업무의 효율성을 높이기 위해서 다양한 분야에서 전문용어가 구축 활용되고 있으며, 국방분야에서도 국방용어 사전 발간을 통해 각 군의 효율적인 업무 연계 및 표준화된 국방 용어 유통체계를 정립하는데 노력하고 있다. 국방기술품질원에서도 3년을 주기로 국방과학기술분야의 전문용어 사전을 발간함으로써 전문용어 구축 표준화 연구는 물론, 전문용어의 활용성 제고에 힘쓰고 있다. 본 연구에서는 국방기술품질원에서 전문용어 사전을 실제로 구축하는데 필요한 구축 프로세스와 조직, 이를 지원하기 위한 워크벤치에 대해서 기술하고 있다. 즉, 국방과학기술 전문용어 사전을 구축하기 위한 전문용어 사전구축 프로세스 및 조직의 구성, 표제어 정의, 전문용어 후보 추출을 위한 대상 문서의 선정, 전문용어 후보추출, 전문용어 후보군 생성, 워크벤치 등록, 사전 구축, 사전 검증 과정에 대해서 설명하고 있다, 또한 전문 용어 사전의 활용성 제고를 위해서 시소러스를 구축 활용하는 내용은 물론, 전문용어 사전 구축을 위해서 개발된 워크벤치의 기능을 중심으로 효율적인 전문용어 사전 구축 지원 방법에 대해서도 기술한다.

정보통합을 통한 생물/의학 분야 전문용어의 자동 추출 (Recognizing Biomedical Terminologies through Integration of Heterogeneous Information)

  • 오종훈;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.775-777
    • /
    • 2004
  • 전문용어란 전문분야의 개념이 언어적으로 표현된 형태이다. 전문분야마다 분야 특성적인 개념이 사용되므로, 전문용어는 전문분야를 특성화하는 단위로 사용된다. 따라서 전문분야문서에 대한 자연언어처리에서 전문용어를 효과적으로 처리하는 것은 매우 중요하다. 전문용어 추출은 분야 특성적인 전문용어를 해당 분야 문서에서 파악하는 작업을 말한다. 본 논문에서는 기계학습방법을 이용한 전문용어 자동 추출 기법을 제안한다. 본 논문의 기법은 전문분야 사전과 전문분야 문서를 이용하여 문서에서 나타나는 전문용어의 특성을 파악하고 이를 이용하여 전문용어를 추출한다. 본 논문의 기법은 GENIA 2.01 문서에 대하여 86%의 정확률과 90%의 재현율을 나타내었다. 또한 기존연구보다 최고 21%의 성능향상을 나타내었다.

  • PDF

전문용어사전의 미시구조에 관한 연구 (A Study on the Microstructure of Terminological Dictionaries)

  • 김성진;정동열
    • 한국문헌정보학회지
    • /
    • 제35권1호
    • /
    • pp.143-162
    • /
    • 2001
  • 학문의 발전으로 새로운 개념의 생성과 함께 전문용어가 급증함에 따라 이를 체계적으로 집성하여 관리하고자 하는 필요성이 대두되고 있다. 본 연구는 전문용어사전에서 전문용어의 체계적이고 효율적인 뜻풀이를 위한 미시구조를 제안하고자 한다. 이를 위해 전문용어사전과 밀접한 관계를 맺고 있는 전문용어와 사전편찬학의 이론을 바탕으로 전문용어기술학의 특성 혹은 차이점을 살펴보고, 현행 전문용어사전의 미시구조를 분석하여 문제점을 파악한 후, 형태론적 측면과 방법론적 측면에서 미시구조에 대한 개선방안을 제안하였다.

  • PDF

전문용어사전 구축을 위한 전문용어 추출 및 순위화 (Term Extraction and Ranking for Building Term Dictionary)

  • 구희관;정한민;이병희;성원경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.745-748
    • /
    • 2005
  • 전문용어는 특정 분야의 전문가 사이에서 통용되는 표현 매체이며, 일반용어에 비해 생성과 소멸의 주기가 짧은 특징을 가지고 있다. 이런 특징 때문에 일반용어 사전구축과 달리 전문용어 사전을 구축하기 위해서는 신속한 대응전략이 필요하다. 이를 위해 본 논문에서는 전문용어 사전 구축을 위한 다음과 같은 두 단계의 과정을 제안한다. 우선 형태소 후처리와 결합규칙을 이용하여 1,200만 어절의 신문 말뭉치로부터 단일어 10만과 복합어 30만의 용어후보를 추출하고, 고빈도 용어 후보 6만개를 선별해 용어지배지수(Term Dominance Value)라는 개념을 도입하여 전문용어를 선정한다. 실험을 통해 용어지배지수 순위와 누적빈도순위 및 최근연도 순위를 비교한 결과 본 논문에서 제안한 용어지배지수가 전문용어 활용도를 나타내는 훌륭한 지표역할을 할 수 있음을 확인할 수 있었다.

  • PDF

분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출 (Automatic Term Recognition using Domain Similarity and Statistical Methods)

  • 오종훈;이경순;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.258-269
    • /
    • 2002
  • 지금까지 전문용어를 자동으로 추출 (Automatic Term Recognition: ATR)하기 위한 많은 연구들이 있어 왔다. 이들 연구들은 주로 문서 내의 용어의 빈도수와 같은 단순한 통계정보를 이용하여 전문용어를 추출하였다. 하지만 전문분야의 기계가독형 사전의 구축으로 인하여 전문용어를 추출하는 데 있어 전문분야 사전의 사용이 가능하게 되었다. 본 논문에서는 이러한 기계가독형 전문분야 사전들을 이용하여 사전 간의 계층관계를 구축하고 이를 이용하여 전문용어를 추출하는 방법을 제시한다. 또한 전문용어 사전에서 나타나지 않는 전문용어를 추출하기 위하여 용어의 빈도수, 외래어 및 외국어, 내포관계 등을 포함한 통계기법을 이용한다. 본 논문에서 제안하는 기법은 기존의 방법에 비해 좋은 성능을 나타내었다.