• 제목/요약/키워드: 용어(用語)

검색결과 3,798건 처리시간 0.024초

인과관계 문맥정보를 사용한 용어 군집화 연구 (Term Clustering based on Causal Context Information)

  • 장두성;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.25-31
    • /
    • 2004
  • 단서구문 및 어휘 쌍 확률 등을 이용하면 일정한 영역의 문서에서 사용된 용어의 원인이 되거나 결과를 나타나는 관련어들을 찾을 수 있다. 본 논문에서는 이러한 각 용어의 선행 원인과 후행 결과를 인과관계 정보라고 정의한다. 인과관계 정보가 유사한 용어들은 서로 유사한 개념에 속한다고 가정한다면, 용어의 직/간접적 인과관계로서 용어 온톨로지에서 그 용어가 속할 집합을 결정하는데 도움을 줄 수 있다. 본 논문에서는 각 용어의 인과관계가 용어 군집화를 위한 유용한 문맥 정보의 하나라는 것을 실험을 통해 증명하였다. 속성으로 사용된 인과관계는 대용량의 코퍼스로부터 비지도식 학습방법을 통해 자동 습득하였으며, 그 정확도는 74.84%를 보였다. 1659개 용어에 대한 군집화 실험 결과 70.02%의 정확도를 보였으며, 어휘 유사도만을 사용한 경우에 비해 32.9%의 적용도 향상을 보였다.

  • PDF

자연언어 질의 문장의 용어 가중치 부여 기법 (Term Weighting Method for Natural Language Query Sentence)

  • 강승식;이하규;손소현;문병주;홍기채
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.223-227
    • /
    • 2002
  • 자연언어 질의 문장으로부터 검색어로 사용될 질의어의 추출 및 질의어 가중치를 계산하기 위하여 질의 문장들의 유형을 분석하였으며, 질의어 구문의 특성에 따라 용어들의 가중치를 계산하는 방법을 제안하였다. 용어의 가중치를 부여할 때 띄어쓴 복합명사와 접속 관계 등에 의해 연결된 명사구는 질의어 가중치를 동등하게 적용할 필요가 있다. 질의 문장에서 가중치가 동등하게 적용되는 명사구를 인식하기 위한 목적으로 구현된 명사구 chunking을 수행한 후에 각 용어들에 대한 질의어 가중치를 계산한다. 질의어 가중치를 계산하기 위하여 용어의 유형, 질의 구문의 특성, 문서 유형을 지칭하는 용어, 조사 유형, 용어의 길이 등에 따라 가중치를 조절하는 방법을 사용한다. 용어유형에 의한 가중치 계산은 추출된 용어의 품사 정보와 전문 용어 사전, 부사성 명사 사전을 이용하였다.

  • PDF

구조적 학술용어사전 데이터베이스 구축에 있어서 용어의 의미관계 형성에 영향을 미치는 요인에 관한 연구 (A Study on the Factors Influencing Semantic Relation in Building a Structured Glossary)

  • 권선영
    • 한국문헌정보학회지
    • /
    • 제48권2호
    • /
    • pp.353-378
    • /
    • 2014
  • 본 연구는 구조적 정의에 의한 학술 용어 사전 데이터베이스 구축을 위해 학술용어의 의미관계 형성에 미치는 요인이 무엇인지를 찾아내고 이러한 요인이 어떠한 영향을 미치고 있는지를 밝히고자 하였다. 이를 위해 2007년부터 2011년 사이에 한국연구재단 등재학술지에 등재된 학술논문에서 학술논문 주제어를 추출하여 이를 대상으로 주제복합성, 언어 네트워크 특성, 출현빈도, 출현패턴을 분석하고 구축된 STNet의 의미관계 형성정도인 용어의 의미적 연결관계 노드의 수와 유형의 수와의 영향 관계를 살펴보았다. 가설 검증을 통해 구조적 학술용어사전의 구축에 있어 의미관계 형성정도에 주요한 영향을 미치는 요인으로 매개 중심성, 출현빈도, 구조적 공백성의 효과크기라는 것을 알 수 있었다. 그리고 용어의 중요성은 일반적으로 알려진 출현빈도를 통한 방법 외에도 연결정도 중심성, 근접 중심성, 매개 중심성, 위세 중심성과 같은 측정방법에 따라서도 판단할 수 있음을 확인하였다. 또한 주제복합성은 직접적으로 의미관계 형성정도에 영향을 미치지는 않지만 용어의 근접 중심성에 영향을 미치기 때문에 크게 4가지의 요인을 고려하여 용어를 선정할 경우 의미관계 형성정도는 높아질 수 있는 것으로 파악 되었다. 본 연구의 결과는 지금까지 용어를 선정하는 프로세스의 주된 방법론인 용어의 출현빈도를 활용하는 방법 이외에도 용어 네트워크상에서의 용어의 위치나 주제복합성 같은 방법론을 적용하여 용어를 선정할 수 있다는 것을 보여준다. 따라서 전문용어 사전을 구축할 때 용어의 네트워크에서의 매개 중심성, 출현빈도, 구조적 공백성의 효과크기, 용어의 주제복합성을 면밀히 판단하여 다각도로 용어를 선정할 경우 전문용어 사전의 질적인 향상과 완성도가 높아질 것을 기대할 수 있다.

용어관계의 분류 모형 개발에 관한 연구 (A Study on the Development of a Classification Model for Terminological Relationships)

  • 백지원;정연경
    • 정보관리학회지
    • /
    • 제23권1호
    • /
    • pp.63-81
    • /
    • 2006
  • 본 연구는 모든 지식조직체계의 근간인 용어관계가 동일성, 계층성, 연관성이라는 세 가지 포괄적인 기준에 의해 정의되어 사용됨으로써 정보의 정확성이 중시되는 오늘날의 정보 환경에서 제 기능을 다하지 못하고 있으므로, 그 해결 방안의 하나로 용어관계의 분류 모형을 제시하고자 하는데 목적이 있다. 이를 위해 기존의 여러 지식조직체계에 나타나는 각종 용어관계의 사례와 용어관계에 대한 이론적 연구들을 광범위하게 수집하여 다양한 용어관계의 유형을 파악하였다. 그리고 이를 바탕으로 용어관계를 명확하게 정의하고 범주화할 수 있는 용어관계 분류의 근거를 세우고 용어관계의 분류 모형을 개발하였다. 더 나아가 이 분류 모형을 정보검색을 비롯한 다양한 방면에 활용할 수 있는 방안을 모색하고 향후 용어관계 분류 연구에 대한 제언을 했다.

신학 용어 분류를 위한 패싯 설계에 관한 연구 (Establishing Facet for Classifying Theological Terms)

  • 유영준
    • 한국문헌정보학회지
    • /
    • 제42권3호
    • /
    • pp.259-279
    • /
    • 2008
  • 신학 분야의 시소러스를 구축하는 전 단계로서, 패싯을 이용하여 신학 용어를 분류하였다. 영어로 된 신학 사전에서 1.031개의 용어를 선정하였고, 이 중에서 실제로 분류한 용어의 수는 984개이다. 용어를 분류하기 위해서 전개한 패싯은 기본 패싯 7개와 하위 패싯 14개이었다. 분류한 용어들을 분석해 본 결과, 신학 분야의 특성에 맞게 물리적 형태를 갖는 구체적인 용어의 수보다 추상적인 용어의 수가 많았으며. 전체 용어 수의 70% 정도를 차지하였다. 문헌 분류를 위한 십진 분류 체계에 대한 연구가 한계에 이른 상황에서. 이러한 특정 주제 분야의 용어를 분류하고 시소러스를 구축하는 연구가 더 활발해져야 한다고 생각한다.

전문용어 탐지와 해석 모델: 한국어 의학용어 중심으로 (Detecting and Interpreting Terms: Focusing Korean Medical Terms)

  • 염하람;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.407-411
    • /
    • 2022
  • 최근 COVID-19로 인해 대중의 의학 분야 관심이 증가하고 있다. 대부분의 의학문서는 전문용어인 의학용어로 구성되어 있어 대중이 이를 보고 이해하기에 어려움이 있다. 의학용어를 쉬운 뜻으로 풀이하는 모델을 이용한다면 대중이 의학 문서를 쉽게 이해할 수 있을 것이다. 이런 문제를 완화하기 위해서 본 논문에서는 Transformer 기반 번역 모델을 이용한 의학용어 탐지 및 해석 모델을 제안한다. 번역 모델에 적용하기 위해 병렬말뭉치가 필요하다. 본 논문에서는 다음과 같은 방법으로 병렬말뭉치를 구축한다: 1) 의학용어 사전을 구축한다. 2) 의학 드라마의 자막으로부터 의학용어를 찾아서 그 뜻풀이로 대체한다. 3) 원자막과 뜻풀이가 포함된 자막을 나란히 배열한다. 구축된 병렬말뭉치를 이용해서 Transformer 번역모델에 적용하여 전문용어를 찾아서 해석하는 모델을 구축한다. 각 문장은 음절 단위로 나뉘어 사전학습 된 KoCharELECTRA를 이용해서 임베딩한다. 제안된 모델은 약 69.3%의 어절단위 BLEU 점수를 보였다. 제안된 의학용어 해석기를 통해 대중이 의학문서를 좀 더 쉽게 접근할 수 있을 것이다.

  • PDF

전문 용어 표준화 지원 시스템 개발 (Management System for Term Standardization)

  • 김평;성원경;류범종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.94-98
    • /
    • 2009
  • 정보 수준의 격차 해소 및 이분야간 정보 교류를 위한 목적으로 각 분야별 전문 용어를 표준화하는 움직임이 활발하게 진행되고 있다. 각 분야에서 생성되는 전문 용어를 등록/관리하고, 이를 표준 전문 용어로 재정하고 공유하는 과정은 매우 복잡할 뿐만 아니라, 전문 용어와 관련된 많은 사람들이 표준화 과정을 공유하면서 진행되어야 한다. 또한 시간의 흐름에 따라 전문 용어도 변화할 수 있기 때문에 전문 용어 표준화 과정에서의 이력 관리는 물론 세계화에 따른 다국어와의 대역 정보 관리도 필요하다. 많은 기관 및 다양한 분야에서 전문 용어 표준화 작업을 수행하고 있고, 이에 따라 용어 표준화, 용어 이력 관리 및 표준 용어의 공개 서비스를 효율적으로 지원할 수 있는 시스템에 대한 수요도 증가하고 있다. 본 연구에서는 전문 용어의 등록, 표준화 과정 지원, 표준 용어로 제정된 용어를 일반 사용자에게 서비스하는 것을 지원하는 전문 용어 표준화 관리 시스템을 개발하였다.

  • PDF

건설용어- 올바른 우리말 건설용어

  • 대한설비건설협회
    • 월간 기계설비
    • /
    • 통권167호
    • /
    • pp.48-49
    • /
    • 2004
  • 21세기는 문화의 세기라 하여 세계 각국이 자국문화의 확산과 세계시장 선점에 치열한 각축을 벌이고 있는 상황에서 건설문화의 주체성 확보는 그 어느 때보다 중요하다. 따라서 외국어(외래어)에 오염된 건설현장에서 우리말 사용이 확대된다면 선진 건설문화의 정착에 커다란 도움이 될수 있을 것이다. 본지는 건설단체총연합회가 건설현장에서의 우리말 사용을 정착시키기 위해 발간한「올바른 우리말 건설용어집」을 발췌, 연재할 계획이다. 이 용어집에 수록된 순화대상 용어는 건설현장에서 가장 많이 쓰이고 있는 용어 가운데 우리말로 바꾸고 다듬어야 할 용어들을 대상으로 한글학회의 감수를 거쳐 확정된 것으로, 전 건설현장에 확대, 보급되기를 기대한다.

  • PDF

시소러스 용어관계에 관한 연구 (A Study on Term Relationship of Thesaurus)

  • 한상길;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.231-234
    • /
    • 1998
  • 시소러스는 정보검색과정에서 용어를 통제하여 색인과 검색에서 중요한 기능을 수행하는 도구로 사용되고 있는 통제용어집이다. 그러나 정보검색시스템 환경의 변화에도 불구하고 기존의 시소러스와 시소러스의 작성지침으로 사용되고 있는 국제 표준인 ISO 2788이나 Z39.19에서 제시하고 있는 기준은 용어간의 관계를 단순히 표현하고 있어 색인이나 검색시 용어통제의 어려움을 겪고 있다. 본 연구는 시소러스의 용어관계를 국제 표준과 현재 사용되고 있는 각종 시소러스를 비교 분석하여, 시소러스 용어관계의 확장방안을 제시한다.

  • PDF

남북한 과학기술용어

  • 김도한
    • 과학과기술
    • /
    • 제26권6호통권289호
    • /
    • pp.85-86
    • /
    • 1993
  • 국제정세의 변화와 오랜 통일에의 염원에 따라 남북한 상호간에 많은 교류가 예상되고 있다. 그러나 해방 후 분단 반세기 동안 남한과 북한은 전혀 교류가 없는 상태에서 서로 다른 길을 걸어왔기 때문에 모든 분야에서 상당한 이질감을 느낄 수 밖에 없다. 수학의 경우에도 분야에 따른 연구상황은 물론, 용어면에서도 많은 차이를 보인다. 우리가 별 노력없이 일본식 한자용어와 영어용어를 그대로 수용하고 있는 경향인데 반하여 북한에서는 한글화 작업에 많은 노력을 쏟아와 대부분의 수학용어들이 우리 고유의 한글로 정착되어 있다. 현재 우리의 감각에는 생소하고 어색한 단어들도 많지만 북한의 좋은 한글용어를 보완, 수정하는 등 중요 자료로 받아들여 우리의 수학용어를 체계화시킴으로써 통일된 앞날의 우리 수학발전에 기초로 삼아야 할 것이다.

  • PDF