• 제목/요약/키워드: semantic relation

검색결과 233건 처리시간 0.021초

의미관계 정보를 이용한 약품 온톨로지의 구축과 활용 (Medicine Ontology Building based on Semantic Relation and Its Application)

  • 임수연;박성배;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.428-437
    • /
    • 2005
  • 온톨로지는 주어진 응용 도메인의 특성을 나타내는 관련 개념들의 집합과 정의, 그리고 그들간의 관계로 이루어진다. 본 논문에서는 온톨로지를 구축하고 갱신할 때의 시간과 비용을 줄이기 위하여 텍스트의 분석결과를 이용한 도메인 온톨로지의 반자동 구축방안을 제안한다. 이를 위하여 관련 문서들 내에 출현한 전문용어들의 처리방안을 제시하고, 추출한 개념들과 그들간의 관계를 온톨로지의 구축에 활용한다. 실험 도메인은 약품분야로 정하였으며, 구축한 온톨로지는 문서의 검색에 활용하였다. 온톨로지 내의 계층관계들이 문서검색에 효용이 있음을 보이기 위하여 일반적인 키워드기반 문서검색과 온톨로지 내의 관련 정보들을 연관피드백에 이용한 온톨로지기반 문서검색을 비교한 결과, 후자의 경우 정확률이 $4.97\%$, 재현율이 $0.78\%$ 향상됨을 알 수 있었다.

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.

전문용어의 처리에 의한 도메인 온톨로지의 구축 (Domain-specific Ontology Construction by Terminology Processing)

  • 임수연;송무희;이상조
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권3호
    • /
    • pp.353-360
    • /
    • 2004
  • 온톨로지는 특정 도메인에 사용되는 용어들과 그 용어들 간의 관계를 정의하고, 이를 계층구조로 표현한 것을 말한다. 본 논문에서는 전문용어의 처리에 기반 한 도메인 특정적인 온톨로지의 반자동 구축방안을 제안하고자 한다. 이를 위하여 도메인 텍스트 내에서 전문용어를 구성하고 있는 명사나 접미사의 패턴을 분류하고, 이에 따라 전문용어를 추출하고 계층구조를 구하는 알고리즘을 제안한다. 실험은 약학 관련 문서를 대상으로 하였으며, 단일어절 전문용어를 인식한 결과 평균 92.57%, 다중어절 전문용어의 경우 평균 66.64%의 정확도를 보였다. 구축된 온톨로지는 의미정보와 함께 전문용어를 구성하는 특정 명사나 접미사를 중심으로 자연스런 의미 군을 형성함으로써 정보검색 등의 전문적인 지식의 접근에 유용하게 쓰일 수 있으며, 검색의 성능을 향상시키기 위한 추론의 기반으로도 이용할 수 있다.

초등학생들이 사용하는 채팅 언어의 분석 (Analysis on the Chatting Language of Elementary School Students)

  • 정희택;정영순
    • 정보교육학회논문지
    • /
    • 제9권1호
    • /
    • pp.99-112
    • /
    • 2005
  • 본 연구에서는 초등학생들이 사용하는 채팅 언어를 분석하고 이를 통해 발견된 특성을 제시하며, 나아가 이를 해결할 수 있는 방안을 제안한다. 채팅언어의 분석은 문장들 간의 유기적 관계를 고려하여 형식상, 내용상, 통계상의 특성으로 구분하여 분석한다. 분석 결과로 유아발음으로 변형되어 쓰기, 음절의 앞 뒤 바꾸어 쓰기, 상대방이 불분명한 대화와 같은 새로운 특성이 발견되었다. 분석 결과를 통하여 언어의 오용을 최소화하고, 아동의 정서발달에 긍정적인 채팅 문화를 정착시키기 위해 채팅 관련 컴퓨터 시스템적 방안을 제안한다.

  • PDF

An effective approach to generate Wikipedia infobox of movie domain using semi-structured data

  • Bhuiyan, Hanif;Oh, Kyeong-Jin;Hong, Myung-Duk;Jo, Geun-Sik
    • 인터넷정보학회논문지
    • /
    • 제18권3호
    • /
    • pp.49-61
    • /
    • 2017
  • Wikipedia infoboxes have emerged as an important structured information source on the web. To compose infobox for an article, considerable amount of manual effort is required from an author. Due to this manual involvement, infobox suffers from inconsistency, data heterogeneity, incompleteness, schema drift etc. Prior works attempted to solve those problems by generating infobox automatically based on the corresponding article text. However, there are many articles in Wikipedia that do not have enough text content to generate infobox. In this paper, we present an automated approach to generate infobox for movie domain of Wikipedia by extracting information from several sources of the web instead of relying on article text only. The proposed methodology has been developed using semantic relations of article content and available semi-structured information of the web. It processes the article text through some classification processes to identify the template from the large pool of template list. Finally, it extracts the information for the corresponding template attributes from web and thus generates infobox. Through a comprehensive experimental evaluation the proposed scheme was demonstrated as an effective and efficient approach to generate Wikipedia infobox.

수식 속성 문법 단순화에 대한 연구 (A Research on the Simplification of the Expression Attribute Grammar)

  • 정용주
    • 한국멀티미디어학회논문지
    • /
    • 제14권2호
    • /
    • pp.282-287
    • /
    • 2011
  • 속성문법은 각 구문규칙에 의미론을 추가한 문법체계이다. 그러나 이 속성문법은 그 추가적인 규칙들 때문에 구성과 이해의 어려움이 있다. 대부분 속성 문법에서 그 규모가 크고 복잡하기 때문에 규모의 수가 작고 단순하면 좋을 것이다. 그래서 본 논문에서는 LR 파싱을 할 때 수식을 위한 속성문법의 규모를 줄일 수 있는 방법을 연구하였다. 이것은 수식의 종류를 고려한 방식이다. 즉 수식의 종류들 사이의 의미적 포함관계를 성립시키면 보다 단순하고 작은 규모의 속성 문법으로 구성될 수 있음을 보여준다.

태그쌍의 의미유사도 기반 태그 랭킹 시스템 (Tag Ranking System based on Semantic Similarity of Tag-pair)

  • 이시화;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제16권11호
    • /
    • pp.1305-1314
    • /
    • 2013
  • 기존의 태그 기반 시스템들은 콘텐츠에 태깅된 태그들을 활용한 단일 태그 매칭을 통해 검색결과를 제공함에 따라 정확도가 낮은 검색결과를 제공하고 있으며, 또한 사용자들이 콘텐츠에 태깅 시 태그간의 연관관계 및 우선순위는 고려하지 않아 태그가 가지고 있는 콘텐츠와 관련된 정보들을 효율적으로 제공하지 못하고 있다. 이에 본 논문에서는 위의 문제점을 해결하기 위해 태그 기반 시스템에 적합한 태그간 의미 유사도를 추출하여 콘텐츠에 태깅된 태그들을 재 랭킹하기 위한 태그 랭킹 시스템을 제안하였다. 제안 시스템의 성능 평가는 이미지에 태깅된 태그(baseline)와 태그 동시출현 빈도수 기법을 적용한 랭킹(frequency) 결과를 본 논문에서 제안한 태그 랭킹 시스템에 의해 추출된 랭킹 결과와 비교 실험하였다.

MARC의 개념 모델링 연구 (A Study of the Conceptual Modeling of MARC)

  • 이현실;전양승;한성국
    • 한국도서관정보학회지
    • /
    • 제36권3호
    • /
    • pp.275-289
    • /
    • 2005
  • 본 연구에서는 데이터의 포괄성과 상세성이 있는 MARC를 기반으로 서지정보 개념 모델을 구축하였다. MARC21, MARCXML, MODS를 분석하여 MARC의 개념 모델링에 고려하여야 할 요구 사항을 도출하였으며, 이를 충족할 수 있도록 구축한 개념모델은 MARC 기반에 XML의 태그를 사용할 수 있고 관계형 데이터베이스 구축에 활용할 수 있는 집합관계의 모델이다. 집합체 구조는 다양한 배열의 형태로 구현할 수 있기 때문에 서지정보 시스템 개발에 유용하게 사용할 수 있을 것이다. MARC가 서지 정보 레코드 구조만을 정의하고 있기 때문에 풍부한 의미의 표현에는 한계가 있으므로 더블린 코어 등 MARC 수준의 서지 정보 요소를 확장한 메타데이터 시스템을 도입할 필요가 있다.

  • PDF

Therapeutic Functor that calls semantic Argument -Focusing on the compound nouns in Sijo

  • Park, In-Kwa
    • International Journal of Advanced Culture Technology
    • /
    • 제5권3호
    • /
    • pp.35-39
    • /
    • 2017
  • The human body is structured as sentence of healing. This study examines how the mechanism of healing works in the human body by the narrative relation of functor and argument. So, we predict the way of extreme healing by literary or human narrative. For this purpose, we analyze the principle that the emotional and semantic arguments are called by the functor set by the sentences containing the fingerprints of mind in Gosijo and the mechanism of healing works extensively. We analyze the process of the transition from the narrative of the literary to the narrative of the human body. Thus, the barcode of the healing, which is made up of the relationship between the functor of the literature and the argument, is transferred to the human body and it is judged that the fingerprint of the human mind is operated through the stage of encoding and re-encoding due to the action potential. In addition, it was predicted that the neurotransmitters such as dopamine and the secretion of hormones would be promoted and the healing level would be increased. In results, we conclude that the function of argument and functor which contains the fingerprint of the mind in the third sound step on the last sentence of Gosijo is transferred to the human body and is especially heavily focused and operate with healing.

A Study on Will as Modal or Non-modal

  • Lee, Young Mi;Kang, Mun Koo
    • 영어어문교육
    • /
    • 제18권3호
    • /
    • pp.175-190
    • /
    • 2012
  • The purpose of this article is to explain the meanings and uses of the English auxiliaries will morpho-syntactically, and answer the question of whether will is a tense auxiliary or a modal one. Some writers even exclude will completely from the semantics of the modal auxiliaries. They argue that the semantics of will is fundamentally non-modal and has only a few modal-like uses. There are some people who treat will to be semantically separate from the other modal auxiliaries. In the light of modal will, the semantics of will basically remains anchored in volition because the lack of required speaker subjectivity, but has undergone so much semantic bleaching that it may also express future time without volition. On the other hand, the semantics of will in the exclusionist view is erroneous and that its semantics is in fact closely related to the semantics of the other modals. This view reinforces the argument that the morpho-syntactic kinship of will, can, may and must also reflects semantic kinship. It is suggested that all the modal auxiliaries show that the correspondence relation is non-verified but potential. And the specific place that will holds is that the correspondence is unverified at the time of utterance but will turn out to become verified. The overall conclusion is that idiosyncratic morpho-syntax shared by the modals reflects the semantics and pragmatics of the English modal auxiliaries and is forced also to include will.

  • PDF