• 제목/요약/키워드: 전문분야

검색결과 2,468건 처리시간 0.033초

EM 알고리즘을 이용한 전문용어의 자동 추출 (Automatic Term Recognition Through EM Algorithm)

  • 오종훈;김재호;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.487-489
    • /
    • 2003
  • 전문용어란 전문분야의 개념이 언어적으로 표현된 형태이다. 전문분야마다 분야 특성 적인 개념이 사용되므로, 전문용어는 전문분야를 특성화하는 단위로 사용된다. 따라서 전문분야문서에 대한 자연언어처리에서 전문용어를 효과적으로 처리하는 것은 매우 중요하다. 전문용어 추출은 분야 특성적인 전문용어를 해당 분야 문서에서 파악하는 작업을 말한다. 본 논문에서는 기계학습방법을 이용한 전문용어 자동 추출 기법을 제안한다. 본 논문의 기법은 전문분야 사전과 전문분야 문서를 이용하여 문서에서 나타나는 전문용어의 특성을 파악하고 이를 이용하여 전문용어를 추출한다. 본 논문의 기법은 70,000단어 수준의 영어 의학분야 300개 문서에 대하여 약 77%의 정확률로 전문용어를 추출하였다.

  • PDF

정보통합을 통한 생물/의학 분야 전문용어의 자동 추출 (Recognizing Biomedical Terminologies through Integration of Heterogeneous Information)

  • 오종훈;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.775-777
    • /
    • 2004
  • 전문용어란 전문분야의 개념이 언어적으로 표현된 형태이다. 전문분야마다 분야 특성적인 개념이 사용되므로, 전문용어는 전문분야를 특성화하는 단위로 사용된다. 따라서 전문분야문서에 대한 자연언어처리에서 전문용어를 효과적으로 처리하는 것은 매우 중요하다. 전문용어 추출은 분야 특성적인 전문용어를 해당 분야 문서에서 파악하는 작업을 말한다. 본 논문에서는 기계학습방법을 이용한 전문용어 자동 추출 기법을 제안한다. 본 논문의 기법은 전문분야 사전과 전문분야 문서를 이용하여 문서에서 나타나는 전문용어의 특성을 파악하고 이를 이용하여 전문용어를 추출한다. 본 논문의 기법은 GENIA 2.01 문서에 대하여 86%의 정확률과 90%의 재현율을 나타내었다. 또한 기존연구보다 최고 21%의 성능향상을 나타내었다.

  • PDF

전문용어 및 정보추출에 기반한 문서분류시스템 (Text Categorization Based on Terminology and Information Extraction)

  • 이경순;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 1999
  • 본 연구에서는 문서분류시스템에서 자질의 표현으로 전문분야사전을 이용한 분야정보와 개체정보추출을 통한 개체정보를 이용한다. 또한 지식정보를 보완하기 위해 통계적인 방법으로 범주 전문용어를 인식하여 자질로 표현하는 방법을 제안한다. 문서에 나타난 용어들이 어떤 특정 전문분야에 속하는 용어들이 많이 나타나는 경우 그 문서는 용어들이 속한 분야의 문서일 가능성이 높다. 또한, 정보추출을 통해 용어가 어떠한 개체를 나타내는지를 인식하여 문서를 표현함으로써 문서가 내포하는 의미를 보다 잘 반영할 수 있게 된다. 분야정보나 개체정보를 알 수 없는 용어에 대해서는 학습문서로부터 전문분야를 자동 인식함으로써 문서표현의 지식정보를 보완한다. 전문분야, 개체정보 및 범주전문용어에 기반해서 표현된 문서의 자질에 대해서 지지벡터기계 학습에 기반한 문서분류기틀 이용하여 각 범주에 대해 이진분류를 하였다. 제안된 문서자질표현은 용어기반의 자질표현에 비해 좋은 성능을 보이고 있다.

  • PDF

정렬기법을 이용한 전문분야 조어단위 대역쌍 추출 (An Alignment method for Extracting English-Korean translations of term constituents)

  • 오종훈;황금하;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.529-531
    • /
    • 2003
  • 전문용어는 전문분야의 개념을 표현하는 언어적 표현이다. 전문용어의 조어단위는 전문용어를 구성하는 최소의 형태적 단위이다. 이러한 조어단위는 전문용어의 의미를 파악하는데 중요할 뿐만 아니라 전문분야 문서에 대한 기계번역과 같은 작업에 중요한 언어자원으로 사용될 수 있다. 하지만‘조어단위와 개념단위의 불일치 문제’, 조어 단위의‘동형이의어’,‘동의이형어’문제 등으로 인하여, 하나의 전문분야 개념을 나타내는 조어단위들의 덩어리를 파악할 필요가 있다. 본 논문에서는 이러한 문제점을 조어분석 된 한영 대역 전문용어사전에 대한 한국어-영어 조어단위 정렬문제로 해결하고자 한다. 본 논문의 기법은 97%의 정확률로 조어단위 간의 정렬을 수행하였다.

  • PDF

분야간 유사도와 통계기법을 이용한 전문용어의 자동 추출 (Automatic Term Recognition using Domain Similarity and Statistical Methods)

  • 오종훈;이경순;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권4호
    • /
    • pp.258-269
    • /
    • 2002
  • 지금까지 전문용어를 자동으로 추출 (Automatic Term Recognition: ATR)하기 위한 많은 연구들이 있어 왔다. 이들 연구들은 주로 문서 내의 용어의 빈도수와 같은 단순한 통계정보를 이용하여 전문용어를 추출하였다. 하지만 전문분야의 기계가독형 사전의 구축으로 인하여 전문용어를 추출하는 데 있어 전문분야 사전의 사용이 가능하게 되었다. 본 논문에서는 이러한 기계가독형 전문분야 사전들을 이용하여 사전 간의 계층관계를 구축하고 이를 이용하여 전문용어를 추출하는 방법을 제시한다. 또한 전문용어 사전에서 나타나지 않는 전문용어를 추출하기 위하여 용어의 빈도수, 외래어 및 외국어, 내포관계 등을 포함한 통계기법을 이용한다. 본 논문에서 제안하는 기법은 기존의 방법에 비해 좋은 성능을 나타내었다.

지식경영시스템의 지식 및 전문가 분류시스템 구현 (Knowledge of Information Management System & Realization for a Specialist Distributed System)

  • 승창균;김정웅;양해술
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.427-430
    • /
    • 2006
  • 지식과 정보의 양이 급격히 증가함에 따라 일정한 기준으로 지식을 분류하기 어려울 뿐만 아니라 분류정보에 대한 지속적인 관리노력이 요구되었다. 본 논문에서는 다양한 지식 원천에서 여러 경로를 통해 지식들이 수집되는 경우에 수집된 지식들을 지식경영시스템의 지식 맵에 맞추어 분류한다. 또한 지식경영사용자 중 특정분야에 관심이 있다고 표시한 사용자나 그 분야의 전문가에게 새로 수집된 지식을 추천하게 하여 신속하게 관련지식을 제공하여 줄 수 있게 한다. 이는 사용자의 사용이력을 가지고 사용자의 전문분야를 선정하는 시스템을 구현하는 것이다. 이는 국방 분야를 비롯한 여러 분야에 활용이 가능하여 지식 분류를 위한 노력을 감소시키고 사용자의 전문분야 파악을 통해 전문분야 정보관리 가 용이해 진다.

  • PDF

전문건설업 실태조사 분석

  • 대한설비건설협회
    • 월간 기계설비
    • /
    • 통권57호
    • /
    • pp.48-67
    • /
    • 1995
  • 전문건설협회가 전문건설업이 안고 있는 보다 구체적인 현상들을 진단하고 이를 통해 전문건설업계가 건전하게 발전할 수 있는 방안 마련을 위해 지난 79년 이래 매년 전문건설업계 실태조사를 실시하고 있다. 이번 94년의 조사는 94년 2월말 현재 전문건설면허를 보유하고 있는 모든 업체(설비업종 면허 제외)를 대상으로 94년 2월 21일부터 3월 10일까지 총 20일간 조사하였는데 총 10,010개 조사대상 업체중 33.4$\%$에 해당하는 3,347개 업체가 설문에 응답하였으며, 설문내용으로는 전문건설업체의 경영일반에 관한 사항을 비롯 금융세제분야, 산업재해분야, 수주.계약분야, 하도급계열화문제, 시공 및 인력분야, 불공정 하도급거래에 관한 사항, 건설관련제도 개선에 관한 사항 등 총 7개 분야로 나누어 조사가 실시되었다. 본지는 전문건설업계가 설비공사업계와 비슷한 실정임을 감안하여 이 조사결과를 게재하므로써 타산지석으로 삼고자 한다.

  • PDF

한국의 감성과학 연구참여분야 동향 분석 (An Analysis of the Research Trend of the Participants in Emotional Science in Korea)

  • 박성배
    • 감성과학
    • /
    • 제15권1호
    • /
    • pp.29-36
    • /
    • 2012
  • 본 연구는 한국에서 이루어지는 감성과학의 연구동향을 조사하여 이를 분석하고, 연구에 참여한 전문분야의 인적 구조를 단서로 한국에서 이루어지는 감성 연구의 방향성을 제안하기 위해 이루어졌다. 2011년까지 최근 12년간 한국감성과학회지에 게재된 감성과학 분야 논문 1,262편을 전문분야별, 연구주제어별로 분석한 이번 연구에서 다음과 같은 사실을 확인하였다. 참여 연구자의 전문분야를 분석한 결과, 한국의 감성과학 연구는 여전히 활발하게 참여하는 의류학, 심리학, 의학, 영상미디어, 뇌과학 분야가 주도하는 것을 알 수 있었다. 산업공학, 인간공학 등은 정부의 G7 프로젝트 지원 여부에 따라 연구참여의 변화가 확연하게 차이를 보인다. 산업디자인 분야는 단독 연구가 많고 감성과학과 주제어가 다른 연구가 많다는 문제점을 안고 있음이 드러났다. 또한, 31개의 전문분야가 감성과학 연구에 신규로 참여한 것으로 확인되었는데, 이는 감성에 관한 연구가 전형적인 학제간 연구분야라는 점을 고려할 때 바람직한 현상이라 여겨진다. 한국의 감성과학 연구동향을 분석한 이번 연구결과는 전문분야 간의 공동 연구를 통하여 시너지 효과를 얻을 뿐 아니라 감성과학이 종합적인 학문분야로 발전할 수 있도록 다양한 전문분야의 전문가들이 연구에 참여하는데 기초 자료를 제시하는 의미가 있을 것이다.

  • PDF

메인 메모리 DBMS를 이용한 정보기술 전문용어 검색 시스템 (An Information Retrieval System for IT Terminologies Using a Main Memory DBMS)

  • 강옥선;경원현;조완섭
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2001년도 춘계 Conference: CRM과 DB응용 기술을 통한 e-Business혁신
    • /
    • pp.311-322
    • /
    • 2001
  • 대부분의 일반 정보 검색 시스템은 색인어를 통해 이루어지는데 이런 경우 사용자는 원하는 정보를 얻기 위해 데이터베이스에 저장된 색인어를 정확하게 입력해야 한다. 그러나 일반 사용자가 필요한 색인어를 정확하게 입력하기는 어렵고 특히 원하는 정보가 전문분야의 것일 때는 더욱 그러하다. 따라서 특정 분야의 용어들을 중심으로 전문용어를 관리할 수 있는 시스템의 개발이 요구되고 있다. 정보기술 분야도 빠르게 성장하고 있는 전문분야의 하나로 사용되는 대부분의 단어가 영어이고 한글 표기 또한 다양하여 많은 사용자들이 원하는 정보를 정확하게 찾지 못하고 있다. 이렇듯 단어간의 형태적인 불일치로 인해 생기는 정보 검색의 문제를 해결하고 검색어의 범위를 확장하기 위해 만든 것이 전문용어 검색 시스템이다. 정보 검색시 사용자가 입력한 검색어뿐만 아니라 동의어나 상위어, 하위어까지 검색하여 질의를 확장함으로써 검색 효율을 높일 수 있다. 또한 객체-관계형 데이터베이스로 설계하여 검색이 용이하고, 새로운 단어의 확장이 용이하도록 그 구조를 설계하였다. 제안한 시스템은 메인 메모리 DBMS 를 이용하여 전자상거래와 같이 많은 사용자들이 동시에 접근하는 환경에서도 빠른 검색 성능을 유지할 수 있도록 하였다.

  • PDF

CRF를 이용한 생물/의학 전문용어 인식 (Biomedical Terminology Recognition using CRF)

  • 배영준;김재훈;옥철영;최윤수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.87-91
    • /
    • 2009
  • 전문용어의 수가 급증하면서 전문용어를 자동으로 인식하는 연구가 활발히 진행되고 있다. 전문용어를 인식하기 위해서 전문용어의 범위를 정한 뒤 그 전문용어의 분야를 선택해야 한다. 본 논문에서는 생물/의학 사전정보와 CRF(Conditional Random Fields) 기계학습 기법을 사용하여 연구를 진행한다. 기계학습을 위한 자질로 품사, 접사, 대소문자, 숫자, 특수문자, 단서어휘 등을 사용한다. 특히 단서어휘와 사전정보를 중요한 요소로 생각하여, 3가지 방법으로 나누어 실험한다. 총 분야의 개수는 7개이며, 각 분야별로 정확률, 재현율, F-measure를 측정한다. 경계인식은 83.92%의 정확률, 96.42%의 재현율, 89.73의 F-measure가 결과로 나타났고, 분야분류는 79.29%의 정확률, 91.06%의 재현율, 84.77%의 F-measure가 결과로 나타났다.

  • PDF