• 제목/요약/키워드: 용어 분류

검색결과 481건 처리시간 0.026초

개체명 인식을 이용한 소셜 미디어에서의 약물 부작용 표현 추출 및 분류 (Detecting and classification ADRs using Named Entity Recognition on social media)

  • 정현정;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.443-446
    • /
    • 2021
  • 의약품에 대한 안전성 정보 수집과 관리는 온라인, 오프라인을 통해 약물 이상 사례를 보고받는 형태로 진행되고 있다. 하지만 소비자들의 자발적인 참여로 이루어지므로 실제 발생하는 약물 부작용보다 데이터가 현저히 적다는 단점이 존재한다. 본 논문에서는 약물 이상 데이터 희소성 문제를 해결 할 수 있도록 소셜 미디어에서 약물 부작용 표현을 찾을 수 있도록 하였다. 소셜 미디어의 경우에는 표준 약물 부작용 용어를 사용하기보다는 일반인들이 자연어로 표현한 경우가 많으므로 개체명 인식 기법을 이용해 부작용을 추출할 수 있는 모델을 개발하였다. 또한 추출된 부작용 표현을 표준용어로 분류할 수 있는 모델을 제시하였다. 실험 결과 제안한 두 가지 모델은 0.9 이상의 정확도를 얻을 수 있었으며, 일반 사용자들이 자연어로 표현한 약물 부작용 표현을 효과적으로 찾아내고 표준 부작용 용어로 매핑할 수 있음을 보여준다.

유헬스 표준용어 및 용어 표준화 가이드라인 개발 (Development of u-Health standard terminology and guidelines for terminology standardization)

  • 이수경
    • 한국산학기술학회논문지
    • /
    • 제16권6호
    • /
    • pp.4056-4066
    • /
    • 2015
  • 유헬스 산업 활성화를 위해서 유헬스와 관련된 용어의 이해를 돕고, 의사소통을 증진시키기 위한 유헬스 표준용어를 개발할 필요가 있다. 본 연구의 목적은 유헬스 표준용어를 개발하고, 이를 위한 용어 표준화 절차에 대한 지침을 제시하는 것이다. 본 연구에서는 유헬스 관한 보고서, 용어집 및 정보통신기술협회 표준을 대상으로 자료수집, 용어추출, 용어정제, 용어선정 및 용어관리 절차를 통해 최종 187개의 유헬스 표준용어를 개발하였다. 연구결과, 국내 실정에 부합하는 유헬스 용어 표준화를 위한 지침을 제시하였으며, 이는 유헬스 표준용어의 정의, 분류, 구성요소, 절차에 따른 방법 및 원칙에 대한 상세한 내용을 포함하였다. 본 연구에서 제시된 유헬스 표준용어 및 용어 표준화 가이드라인은 개별 용어 도입 및 관리를 위한 비용을 절감하고, 정보교환을 용이하도록 도움으로써 유헬스 산업 전반의 효율성을 향상시킬 것이다.

인트라넷 기반의 최적의 웹문서 자동 분류기법 선정 (The selection of Best suited Automatic Web Document Classification Based on Intranet)

  • 김국희;윤희병
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2004년도 추계학술대회 학술발표 논문집 제14권 제2호
    • /
    • pp.423-426
    • /
    • 2004
  • 인트라넷에서는 증가하는 웹문서의 검색을 목적으로 웹 검색엔진의 도입이 활발히 진행 중이며 대부분 찾아야할 키워드를 알고 접근하는 검색엔진 형태이다. 그러나 사용자가 무엇을 찾아야 하는지 모르는 경우 웹문서 분류체계는 효율적인 방법을 제시할 수 있다. 일부 구축되어 있는 분류체계는 수작업에 의한 분류로 인해 증가하는 웹문서의 양에 효율적으로 대처하기 곤란하므로 자동분류기법을 활용한 분류가 더 효율적일 것이다. 본 논문에서는 국방인트라넷의 수작업으로 구축된 분류체계를 대상으로 용어 가중치를 계산하는 방법을 달리하여 다양한 분류기법을 적용하여 성능을 비교평가하고 웹문서 자동분류시스템에 적용하여 분류성능의 향상을 도모하고자 한다.

  • PDF

전북 서해안권 국가지질공원 지질명소 안내 표지판에 사용된 용어 분석 (An Analyses of the Terms used in the Information Boards of Geosites at Jeonbuk West Coast National Geopark)

  • 신영준;조규성
    • 한국지구과학회지
    • /
    • 제41권1호
    • /
    • pp.40-47
    • /
    • 2020
  • 본 연구는 전북 서해안권 국가지질공원 지질명소의 안내 표지판에 기술된 용어를 분석하였다. 안내 표지판에 기술된 용어들 중 명사만을 추출하여 표준국어대사전, 지구과학 학술용어집, 2015개정 교육과정에 따른 교과용 도서 개발을 위한 편수 자료를 기준으로 등재 여부를 확인하여 8가지 유형으로 분류하였다. 추출된 용어 중 71개(10.8%)의 용어는 어느 용어집에도 등재되지 않은 [유형 8]에 해당하는 용어들이었다. 이 유형의 용어들은 대부분이 [명사]+[명사] 또는 [명사]+[접사]가 결합하여 파생된 합성어로 그 의미를 명확하게 해석하여 이해하기란 쉽지 않은 것으로 판단되었다. 또한 256개(46%)의 용어가 전문 분야에서 사용되는 전문 용어로 확인되었다. 따라서 국가지질공원 안내 표지판의 제작에 있어 일반인들과 학생들이 더 쉽게 읽고 이해할 수 있도록 전문 용어를 가급적 쉽게 풀어서 기술하고 전문 용어를 사용할 경우에는 용어에 대한 주석을 달아 부연 설명을 통해 충분한 교육적 효과를 얻을 수 있도록 해야 할 것이다.

자동분류 알고리즘을 이용한 지능형 정보검색시스템 구축에 관한 연구 (A Study of Designing the Intelligent Information Retrieval System by Automatic Classification Algorithm)

  • 서휘
    • 한국도서관정보학회지
    • /
    • 제39권4호
    • /
    • pp.283-304
    • /
    • 2008
  • 본 연구의 목적은 이용자의 탐색 행태, 시스템의 정보 구축 행태를 기반으로 초기 질의어의 범주에 해당하는 연관 용어들(해당 용어의 지식구조와 관련된 연관 용어들)을 학습기능을 통해 자동으로 제시해 줄 수 있는 지능형 검색 시스템을 구현하는 것이다. 이를 위해 학습을 통해 전문가 수준의 색인어를 추출할 수 있는 지능형자동색인 알고리즘, 자동분류에 관련한 클러스터링 알고리즘과 문서 범주화 알고리즘 그리고 범주 표현 알고리즘에 대한 이론적 연구를 수행하였으며, 이들 이론적 연구를 근거로 비용과 시간적인 측면에서 그리고 재현율과 정도율이란 측면에서 우수한 성능을 발휘할 수 있는 지능형검색시스템을 구현하였다.

  • PDF

혼합된 토층의 합리적 분류를 위한 모델 연구 (A model study for the rational classification of mixed soil layer)

  • 김병국;장승진;손인환;김준석
    • 한국재난정보학회 논문집
    • /
    • 제14권2호
    • /
    • pp.194-202
    • /
    • 2018
  • 연구방법: 지반을 구성하고 있는 각각의 재료들의 공학적 구분을 위하여 토사, 자갈, 호박돌 등의 용어가 사용되고 있으나, 기관별로 제시된 기준의 차이와 관용적 사용으로 인하여 지반에 대한 정확한 표현상의 어려움이 발생하고 있으므로 각 기관별로 상이한 용어 및 크기에 대한 분석을 수행하였다. 연구목적: 시추 기술자의 경험적 판단에 의한 지층 판별이 관행적으로 이루어지는 문제점이 있다. 이러한 것들이 지반분야의 혼란을 야기할 수 있다. 따라서, 통일된 기준을 제시하고자 하였다. 연구결과: 본 논문에서는 이러한 문제점을 해결하기 위하여 각 기관별로 상이한 용어 및 크기에 대한 정리를 통하여 합리적인 기준을 제시하였다. 결론: 시추에 의한 지반조사에서 모래, 자갈, 호박돌 등 채취된 시료의 중량비, 출현빈도 및 시료길이 등을 활용하여 비교적 객관적으로 토층을 분류할 수 있는 합리적인 모델을 제시하였다.

나자식물이 꽃피는 식물로 인식되고 있는 잘못된 관행의 분석 (Analysis of the misguided practice of recognizing Gymnosperms as flowering plants)

  • 이규배
    • 식물분류학회지
    • /
    • 제44권4호
    • /
    • pp.288-297
    • /
    • 2014
  • 이 연구의 목적은 우리나라에서 식물학이 시작된 이후 57년이 넘도록 나자식물 분류군에 대하여 다음과 같이 잘못 인식되어 온 관행의 원인을 분석하는 데 있다. 즉, 수많은 식물(분류)학 관련 매체들에서, 나자식물(꽃이 피지 않는 종자식물)의 생식구조(cone 및 pollen)에 관한 용어 및 기재에 피자식물(꽃이 피는 종자식물)에서 사용되는 생식기관(꽃)의 용어들을 그대로 적용하여 쓰고 있다. 이로 인하여, 마치 나자식물이 꽃이 피는 식물(피자식물)인 것처럼 오도되고 있다. 특히, 이러한 오류의 관행은 각급 학교에서 교사와 학생들이 꽃에 대한 개념 및 정의를 이해하는 데 있어서 커다란 혼란을 불러 일으키고 있으며, 이는 식물(분류)학 교육에 심각한 문제가 아닐 수 없다. 따라서 많은 식물학 관련 매체들로부터 나자식물에 대하여 잘못 표현된 용어 및 기재를 조사하여, 이를 분계도, 생식구조의 해부학, 분류체계의 역사적 배경 등의 관점에서 분석하고 논의하였다.

패싯분류체계를 이용한 시소러스작성에 관한 연구 (A Study on Thesaurus Construction Using Facet Classification)

  • 손대형;김태수
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.235-238
    • /
    • 1998
  • 본 연구에서는 기존의 분석합성형 분류체계(BC2)로부터 개념과 관계를 추출하여 작성한 자모순 시소러스에 패싯도구를 삽입하여 용어의 개념과 관계를 정확하게 이해할 수 있도록 제시하는데 그 목적이 있다. 그리고, 이러한 과정을 통해 기존의 분류체계나 시소러스가 지니고 있는 한계를 개선하고자 한다.

  • PDF

KT 용어 온토로지 구축 (Ontology construction for Korea Telecom(KT) Terms)

  • 노덕근;변동률;박순철
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (D)
    • /
    • pp.550-555
    • /
    • 2007
  • 본 논문에서는 한국통신(KT)에서 사용되는 주요 용어들을 추출하여 추출된 용어들 간의 고유성과 관계성을 기초로 한 용어 온토로지를 구축하였다. 또한 생성된 용어 온토로지를 이용한 검색질의 예를 통해서 기업의 다양한 분야를 관리하는데 도움을 줄 수 있는 방안을 모색했다. 온토로지 구축 툴로는 은토로지 에디터, Protege를 사용하였으며. 온토로지는 최상위 클래스 Organization(기관), Employee(직원), Product(상품), Technique(기술) 등 4가지로 분류하여 구축하였다. 본 연구를 기초로 한국통신(KT)의 다양한 지식정보를 체계화하고 KT 데이터베이스를 효과적으로 관리할 수 있을 것이다. 또한 구축된 온토로지를 이용한 미래의 KT 시멘틱 검색시스템 구축에 기초가 되기를 기대한다.

  • PDF

습지(wetlands)에 대한 용어 이해 (The Conprehesion of the Terminology of Wetlands)

  • 문현숙
    • 동굴
    • /
    • 제75호
    • /
    • pp.35-39
    • /
    • 2006
  • 습지는 물로 덮여 있는 지역에 대한 총칭이다. 습지 연구에 있어 필요한 요건은 수문, 토양, 식생이다. 람사(Ramsar)에서는 수문을 가장 중요한 요건으로 습지를 정의한다. 외국에서 학술적 용어로는 swamps, marshes, bogs, fens 등이 있다. 무엇보다 위치를 중심으로 분류한 용어이다. 수문, 수질, 식생이 기준이 된 경우도 있다. 우리나라에서는 못, 소택지, 늪, 습원, 습지 등으로 불리운다. 그러나, 외국 용어를 해석하기에 혹은 우리나라 안에서의 학술적 통일성이 미흡하여 앞으로의 용어 정의가 절실히 요구된다.