• 제목/요약/키워드: 용어 분석

검색결과 1,402건 처리시간 0.029초

구조적 용어사전 구축에서 법률용어 성분분석을 통한 관계속성 지정의 효과에 관한 연구 (A Study on the Effects of Application of Relational Attribute on Construction of Structured Glossary - A Semantic Analysis of Legal Terminology)

  • 조라현
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.135-141
    • /
    • 2014
  • 본 연구는 법률명 용어의 의미적 성분분석을 통해 '보충적 관계속성'을 도출하고, 이를 구조적 용어사전의 관계속성 설정에 적용하였을 때 용어관계에 나타나는 효과를 확인하는 것을 목적으로 한다. '보충적 관계속성'이란 클래스(범주)별 용어들이 가지는 특징에 기반하여 만든 관계속성을 말하며, 용어사전 구축 시 도출한 관계속성을 반영함으로서 용어 간 관계가 유기적이고 명확하게 표현될 수 있도록 하는 보조적 구축지침의 역할을 하도록 한다. 이를 위해 법원도서관 '법률용어 관련어집의 316개 용어쌍을 분석하여 '보충적 관계속성'을 도출하였으며, 구조적 용어사전 용어에 적용하여 밀도 값과 밀도의 정도를 시각화하여 효과를 확인하였다. 그 결과, '보충적 관계속성' 전, 후의 변화는 적었으나 이는 법률명 용어의 특징으로 인한 결과라는 것을 알 수 있었고, '보충적 관계속성' 반영의 명확한 효과 확인을 위해서는 분석대상용어를 법률명에서 법률관련용어로 확장시켜 연구할 필요성을 확인하였다.

  • PDF

환경 빅데이터 이슈 분석을 위한 용어 가중치 기법 비교 (Comparison of Term-Weighting Schemes for Environmental Big Data Analysis)

  • 김정진;정한석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.236-236
    • /
    • 2021
  • 최근 텍스트와 같은 비정형 데이터의 생성 속도가 급격하게 증가함에 따라, 이를 분석하기 위한 기술들의 필요성이 커지고 있다. 텍스트 마이닝은 자연어 처리기술을 사용하여 비정형 텍스트를 정형화하고, 문서에서 가치있는 정보를 획득할 수 있는 기법 중 하나이다. 텍스트 마이닝 기법은 일반적으로 각각의 분서별로 특정 용어의 사용 빈도를 나타내는 문서-용어 빈도행렬을 사용하여 용어의 중요도를 나타내고, 다양한 연구 분야에서 이를 활용하고 있다. 하지만, 문서-용어 빈도 행렬에서 나타내는 용어들의 빈도들은 문서들의 차별성과 그에 따른 용어들의 중요도를 나타내기 어렵기때문에, 용어 가중치를 적용하여 문서가 가지고 있는 특징을 분류하는 방법이 필수적이다. 다양한 용어 가중치를 적용하는 방법들이 개발되어 적용되고 있지만, 환경 분야에서는 용어 가중치 기법 적용에 따른 효율성 평가 연구가 미비한 상황이다. 또한, 환경 이슈 분석의 경우 단순히 문서들에 특징을 파악하고 주어진 문서들을 분류하기보다, 시간적 분포도에 따른 각 문서의 특징을 반영하는 것도 상대적으로 중요하다. 따라서, 본 연구에서는 텍스트 마이닝을 이용하여 2015-2020년의 서울지역 환경뉴스 데이터를 사용하여 환경 이슈 분석에 적합한 용어 가중치 기법들을 비교분석하였다. 용어 가중치 기법으로는 TF-IDF (Term frequency-inverse document frquency), BM25, TF-IGM (TF-inverse gravity moment), TF-IDF-ICSDF (TF-IDF-inverse classs space density frequency)를 적용하였다. 본 연구를 통해 환경문서 및 개체 분류에 대한 최적화된 용어 가중치 기법을 제시하고, 서울지역의 환경 이슈와 관련된 핵심어 추출정보를 제공하고자 한다.

  • PDF

Analysis of Modern Astronomical Terminology in the Early 1900s

  • BAHK, UHN MEE;MIHN, BYEONG-HEE
    • 천문학회보
    • /
    • 제41권1호
    • /
    • pp.63.2-63.2
    • /
    • 2016
  • 1900년대 초에 발행된 천문학 서적 2권을 중심으로 사용된 천문학 용어를 현재와 비교분석하는 연구를 진행하였다. 우리는 두 서적에 사용된 용어에서 천문학용어, 화학원소 용어, 인물 및 지명 용어로 나누어서 현재의 과학용어사전과 비교하였다. 지금까지 사용되는 용어와 지금은 사용하지 않는 용어, 그리고 의미는 동일하지만 변화를 보인 용어로 나누어 분석하였다. 한 권의 천문학 서적에는 영어 색인이 포함되어 있어, 그 기준으로 현재와 비교하고, 나머지 천문학 서적은 본문에 나온 용어를 추려서 비교하였다. 용어를 통해서 두 권의 서적이 다른 경로로 수입 번역되었음을 알 수 있었고, 현재와 같이 용어의 통일이 없었다는 점에서 당시 천문학 교육의 한계점이 드러났다. 이 연구는 당시의 천문학 서적이나 관련 서적을 연구할 때, 한자 표기 없이 영어 어휘를 음차하여 표기된 용어를 동정하는데 도움을 줄 것으로 보인다.

  • PDF

의학용어의 효율적인 검색을 위한 검색 브라우저의 요건 분석 (Requirement Analysis of Search Browser for Efficient Searching of Clinical Terminology)

  • 류우석
    • 한국정보통신학회논문지
    • /
    • 제18권11호
    • /
    • pp.2691-2696
    • /
    • 2014
  • SNOMED CT는 전자의무기록(EMR) 및 전자건강기록(EHR) 시스템에서 표준화된 용어를 사용하여 진로기록을 작성하고 관리하기 위한 표준 의학용어 체계이다. 이 용어체계는 용어의 방대함 및 설계 구조로 인해 용어 체계가 매우 복잡한 특징이 있다. SNOMED CT에서 제공하는 의학 용어를 검색하기 위해 진료 과정에서 사용하는 기존의 브라우저들은 용어체계의 복잡성을 반영하지 못하여 진료기록의 작성 단계에서 그 효용성이 떨어지는 문제가 있다. 본 연구에서는 SNOMED CT 브라우저에 내재된 문제점을 제시하고 용어체계의 분석을 통해 의학 용어를 빠르고 효율적으로 검색하기 위한 검색 브라우저의 요건을 분석하고 개선안을 제시한다.

한국 의학학술논문의 저자선정 주제어와 MeSH 용어의 비교 분석 연구 (A Comparison Study of Subject Words of Korean Medical Papers: Author Keywords vs MeSH Terms Assigned by MEDLINE)

  • 이춘실;문혜원
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.67-70
    • /
    • 2000
  • 본 연구에서는 국내 의학학술논문의 저자가 선정한 주제용어(저자용어)와 MEDLINE 레코드의 MeSH 용어를 비교하여 국내 의학 학술논문 저자들이 얼마나 정확히 MeSH 용어를 사용하는지 일치도를 측정하였고, 사용방법상 어떠한 특징을 보이는지, 일치하지 않는 이유가 무엇인지 분석하였다. 1989년부터 1998년까지 Korean Journal of Parasitology에 발표된 415편의 논문에 사용된 1,826개의 저자용어 가운데 MEDLINE 레코드의 MeSH 용어와 일치한다고 볼 수 있는 용어는 35.5% (649개)로 한 논문에 평균 1.6개의 용어가 일치하였다. 이 가운데 완전히 일치하는 용어는 10.1%밖에 되지 않았다. 이와 같이 국내 의학학술논문 저자들은 MeSH 용어를 정확히 사용하기 위해 필수적인 체크태그 (Check tag), 계층구조 (Tree Structure), 부표목 사용 등 MeSH 용어 사용방법에 대한 지식이 부족한 것으로 나타났다.

  • PDF

용어 활용주기 모델링을 이용한 기술용어 트렌드 분석 (Trend Analysis of Technical Terms Using Term Life Cycle Modeling)

  • 황미녕;조민희;황명권;정도헌
    • 정보처리학회논문지D
    • /
    • 제18D권6호
    • /
    • pp.493-500
    • /
    • 2011
  • 기술용어 트렌드는 특정 연구 분야의 세부적인 주제가 시간의 흐름에 따라 변화하는 양상을 표현한다. 그런데 학술 문헌이나 특허의 경우에는 그 데이터가 방대하여 인적 자원을 활용하여 트렌드를 분석하는 것이 용이하지 않다. 본 논문은 용어의 활용주기를 모델링하고, 이를 통해 학술 논문에 나타나는 기술용어 트렌드를 탐지하고 분석할 수 있는 방법을 제안한다. 제안된 기법은 다음과 같은 과정으로 구성된다. 먼저 논문 데이터에서 추출된 기술용어를 대상으로 일정 주기별 용어지배값을 측정한다. 용어지배값 획득되면 이를 기반으로 용어 활용주기를 모델링한다. 이 모델링 과정에서 활용주기의 시계열 패턴이 유사한 기술용어들은 동일 트렌드 범주로 분류한다. 본 논문의 기술용어 트렌드 분석 실험을 위해 한국과학기술정보연구원이 운영 중인 국가과학기술정보센터(NDSL) 학술 논문 데이터를 활용하였다.

북한의 학교수학 용어의 현상적 특징에 관한 연구 (A Study on Characteristics of Actual State of School Mathematics Terms in North Korea)

  • 박교식
    • 대한수학교육학회지:학교수학
    • /
    • 제7권1호
    • /
    • pp.1-15
    • /
    • 2005
  • 이 연구에서는 최근의 북한 수학 교과서에 제시된 학교수학 용어에서 찾을 수 있는 외형적 특징에 대해 논의하고 있다. 북한에서는 북한의 맞춤법에 따라 용어를 표기하고 있고, 많은 수의 한자 용어를 한글 용어로 바꾸어 사용하고 있지만, 한자용어도 여전히 많이 사용하고 있다. 우리나라 용어와 북한 용어 사이에 상당한 괴리가 있는 것으로 알려지고 있으나, 실제적으로는 그렇지 않다. 이것은 장차 우리나라 용어와 북한 용어를 통합하는 일이 비교적 수월하게 이루어질 수 있음을 의미한다. 한자 용어를 한글화하는 것이 수학 교수$\cdot$학습에 상당한 도움을 줄 것으로 믿어지고 있으나, 북한의 사례를 볼 때, 한자 용어의 한글화에 신중할 필요가 있다. 우리나라 용어와 완전히 다른 북한 용어의 장단점을 파악하기 위해서는 충분한 논의가 필요하다. 우리나라 용어와 북한 용어의 의미론적인 분석과 함께 선호도 조사가 필요하다 의미론적인 분석은 선호도에 맹종하는 것을 피하게 해 줄 수 있다.

  • PDF

표준 의학용어 체계에서의 효과적인 용어 비교 검색 기법 (Effective Scheme for Comparative Search of Clinical Terms from Standard Clinical Terminology)

  • 류우석
    • 한국정보통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.537-542
    • /
    • 2015
  • 종합적 표준 임상 의학용어 체계인 SNOMED CT는 용어의 방대함 및 구조의 복잡성 때문에 환자 상태를 표현하는 가장 적합한 용어를 짧은 진료 시간 내에 선택하기가 어려운 용어 선택의 모호성 문제를 내포하고 있다. 본 논문에서는 용어 검색 과정에서 발생하는 동일하거나 유사한 용어를 분석하고 이를 효과적으로 구분하기 위한 용어 비교 검색 기법을 제시한다. 제안하는 기법은 용어의 계층 구조 분석을 통해 용어 간 "is-not-a" 관계를 새로 정의함으로써 두 비교 대상 용어의 차이점을 명확하게 하는 특징이 있다. 이를 통해 진료 과정에서 유사한 이름을 가진 용어들 중 환자의 상태를 가장 적합하게 표현하는 용어를 빠르게 선택함으로써 SNOMED CT의 활용성을 개선한다.

텍스트 마이닝과 연관 관계 분석을 이용한 건축역사 용어 분석 (Analyzing Architectural History Terminologies by Text Mining and Association Analysis)

  • 김민정;김철주
    • 디지털융복합연구
    • /
    • 제15권1호
    • /
    • pp.443-452
    • /
    • 2017
  • 건축의 한 분야인 동시에 역사학의 한 분야이기도 한 건축역사는 건축양식의 변천을 다루기는 하나 사회적, 경제적, 문화적, 기술적 상황 등의 시대 배경을 종합적으로 고찰할 필요가 있다. 그러므로 건축역사에서 주로 사용되는 용어는 다양한 분야를 아우를 수밖에 없다. 따라서 본 연구에서는 건축역사 관련 문헌을 대상으로 텍스트 마이닝과 연관 관계 분석을 수행하여 어떤 용어가 건축역사에서 핵심적인 용어인지를 파악해보았다. 우선 국내 건축역사 분야 유일한 학술지인 "건축역사연구"를 선정하여 지금까지 게재된 논문의 제목과 주제어, 초록에 사용된 용어 중 고빈도로 출현하는 핵심 용어들을 도출하였다. 다음으로 연구 분야별 문헌들을 구분하여 핵심 용어의 특징을 분석하였다. 마지막으로, 연관 관계 분석을 통해 핵심 용어들 간에 유기적인 관계를 분석하고 시각화하였다. 이러한 건축역사 핵심 용어의 파악은 건축역사 분야의 지금까지의 논의 내용과 향후 방향성을 이해하는데 유용할 것이다.

웹기반 정보검색시스템의 검색관련 용어 표준에 관한 연구 (A Study on the Standardization of Interface Terms for Information Retrieval)

  • 남영준
    • 정보관리학회지
    • /
    • 제20권2호
    • /
    • pp.199-217
    • /
    • 2003
  • 본 연구에서는 웹기반 정보검색시스템을 사용함에 있어 이용자 편의성을 최적화할 수 있는 검색 인터페이스 표준 용어를 제안하였다. 이를 위해 국립중앙도서관을 비롯하여 주요 전문 정보를 제공하고 있는 기관의 웹페이지를 조사. 분석하였다. 분석한 결과에 근거하여 웹기반 정보검색시스템에서 사용자 오류와 혼란을 최소화하고 검색 편의성을 극대화할 수 있는 표준 용어를 제안하였다. 제안의 기준은 해당 용어의 사용빈도와 의미를 활용하였다. 분석은 검색관련 기본 모듈을 비롯하여 검색범위설정 모듈, 이용자 지원 모듈에서 사용된 용어 가운대 최소 50%이상의 기관에서 제공하는 기능에 존재하는 용어만을 대상으로 하였다. 본 연구의 결과는 웹 기반 검색화면 설계 및 구축 전문가에게 검색 관련 용어선정을 위한 표준 자료로 활용될 것이다.