• 제목/요약/키워드: Ontology learning

검색결과 123건 처리시간 0.029초

Improving methods for normalizing biomedical text entities with concepts from an ontology with (almost) no training data at BLAH5 the CONTES

  • Ferre, Arnaud;Ba, Mouhamadou;Bossy, Robert
    • Genomics & Informatics
    • /
    • 제17권2호
    • /
    • pp.20.1-20.5
    • /
    • 2019
  • Entity normalization, or entity linking in the general domain, is an information extraction task that aims to annotate/bind multiple words/expressions in raw text with semantic references, such as concepts of an ontology. An ontology consists minimally of a formally organized vocabulary or hierarchy of terms, which captures knowledge of a domain. Presently, machine-learning methods, often coupled with distributional representations, achieve good performance. However, these require large training datasets, which are not always available, especially for tasks in specialized domains. CONTES (CONcept-TErm System) is a supervised method that addresses entity normalization with ontology concepts using small training datasets. CONTES has some limitations, such as it does not scale well with very large ontologies, it tends to overgeneralize predictions, and it lacks valid representations for the out-of-vocabulary words. Here, we propose to assess different methods to reduce the dimensionality in the representation of the ontology. We also propose to calibrate parameters in order to make the predictions more accurate, and to address the problem of out-of-vocabulary words, with a specific method.

지식베이스 구축을 위한 한국어 위키피디아의 학습 기반 지식추출 방법론 및 플랫폼 연구 (Knowledge Extraction Methodology and Framework from Wikipedia Articles for Construction of Knowledge-Base)

  • 김재헌;이명진
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.43-61
    • /
    • 2019
  • 최근 4차 산업혁명과 함께 인공지능 기술에 대한 연구가 활발히 진행되고 있으며, 이전의 그 어느 때보다도 기술의 발전이 빠르게 진행되고 있는 추세이다. 이러한 인공지능 환경에서 양질의 지식베이스는 인공지능 기술의 향상 및 사용자 경험을 높이기 위한 기반 기술로써 중요한 역할을 하고 있다. 특히 최근에는 인공지능 스피커를 통한 질의응답과 같은 서비스의 기반 지식으로 활용되고 있다. 하지만 지식베이스를 구축하는 것은 사람의 많은 노력을 요하며, 이로 인해 지식을 구축하는데 많은 시간과 비용이 소모된다. 이러한 문제를 해결하기 위해 본 연구에서는 기계학습을 이용하여 지식베이스의 구조에 따라 학습을 수행하고, 이를 통해 자연어 문서로부터 지식을 추출하여 지식화하는 방법에 대해 제안하고자 한다. 이러한 방법의 적절성을 보이기 위해 DBpedia 온톨로지의 구조를 기반으로 학습을 수행하여 지식을 구축할 것이다. 즉, DBpedia의 온톨로지 구조에 따라 위키피디아 문서에 기술되어 있는 인포박스를 이용하여 학습을 수행하고 이를 바탕으로 자연어 텍스트로부터 지식을 추출하여 온톨로지화하기 위한 방법론을 제안하고자 한다. 학습을 바탕으로 지식을 추출하기 위한 과정은 문서 분류, 적합 문장 분류, 그리고 지식 추출 및 지식베이스 변환의 과정으로 이루어진다. 이와 같은 방법론에 따라 실제 지식 추출을 위한 플랫폼을 구축하였으며, 실험을 통해 본 연구에서 제안하고자 하는 방법론이 지식을 확장하는데 있어 유용하게 활용될 수 있음을 증명하였다. 이러한 방법을 통해 구축된 지식은 향후 지식베이스를 기반으로 한 인공지능을 위해 활용될 수 있을 것으로 판단된다.

An Investigation on Semantic Web-based Business Support: Ontology development and inference framework for the course recommendation

  • 김진성
    • 한국지능시스템학회논문지
    • /
    • 제20권4호
    • /
    • pp.554-561
    • /
    • 2010
  • As a fundamental knowledge source in a global learning environment, it is feasible to apply the relational database management systems (RDBMS), object-oriented database management systems (OODBMS), and other traditional DBMS. However, the traditional DBMSs are not feasible in semantic knowledge/ontology representation and inference. One of the reasonable ways to overcome the limitations is the semantic web-based business support framework. Especially, in this study, we focused on the development of semantic web ontology and natural language (NL)-based inference framework. To validate the efficiency of the proposed framework, we considered a reasonable scenario for course recommendation in a university.

딥러닝 기반 기계번역 개념을 활용한 Text-to-Ontology 변환 사례 (A case study on Text-to-Ontology transformation on the basis of neural translation)

  • 신유진;이지항
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.891-894
    • /
    • 2021
  • 온톨로지(Ontology)는 사람과 컴퓨터, 또는 컴퓨터 간의 개념 및 개념 표현을 공유하기 위한 개념화의 명시적 규약을 의미한다. 기존의 온톨로지 생성은 전문가에 의한 수작업에 의존되어 비용과 시간이 많이 드는 한계가 있다. 이에 본 논문에서는 딥러닝(Deep learning)기반의 기계번역 개념을 적용한 사례를 활용하여, 수작업의 의존성이 감소한 방법으로 텍스트로부터 온톨로지를 생성하는 방법을 구현하였다. 특히 기존 연구에서 제안한, 딥러닝을 이용해 텍스트로부터 지식 표현 시퀀스를 추출한 정보를 활용하여, 지식 표현 구조를 온톨로지로 변환하고 지식 베이스로 확장하는 과정을 통해 자동화 된 Text-to-Ontology 변환 방법론을 제안하고자 한다.

텍스트 내용 기반의 철학 온톨로지 구축 및 교육에의 응용 (Building a Philosophy Ontology based on Content of Texts and its Application to Learning)

  • 정현숙;최병일
    • 정보교육학회논문지
    • /
    • 제9권2호
    • /
    • pp.257-270
    • /
    • 2005
  • 철학을 비롯한 인문학의 연구에 있어서 연구자들에게 텍스트는 지식을 습득하는 중요한 매체이다. 그러나 현재의 서지정보 중심의 문헌 검색으로는 연구자들이 여러 텍스트들로부터 필요한 지식만을 선택적으로 습득하는데 많은 시간과 노력을 들인다. 본 논문에서는 텍스트 내용에 의거한 지식 검색이 가능하도록 철학 고전 텍스트를 대상으로 철학 온톨로지를 구축하였다. 철학 온톨로지는 전문가에 의해 동서양의 철학 고전 텍스트로부터 분석된 주요 철학 개념과 의미 기반 계층관계 및 연관관계 정의하고 있으며 개념 해설서를 비롯한 온오프라인의 철학 지식 자원들을 연결하고 있다. 본 논문에서는 철학 온톨로지 구축 과정을 3개의 단계와 14개의 세부과정으로 나열함으로써 다른 분야의 학문 온톨로지 구축을 위한 하나의 가이드라인을 제시하고 있으며 철학 온톨로지의 응용사례로서 대학의 철학 수업에서의 교수자와 학습자 사이의 철학 온톨로지에 기반한 지식 습득 및 교류가 가능함을 보였다.

  • PDF

온톨로지 기반의 웹 페이지 분류 시스템 (Web Page Classification System based upon Ontology)

  • 최재혁;서혜성;노상욱;최경희;정기현
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.723-734
    • /
    • 2004
  • 본 논문은 온톨로지(ontology)에 기반 한 자동화된 웹 페이지 분류 시스템을 제안한다. 웹 페이지의 분류를 위하여 첫 번째 단계에서는 각 웹 페이지가 속한 범주(category)를 대표할 수 있는 단어를 선정하며, 이를 위하여 단어빈도와 문서빈도를 곱한 값을 계산한다. 두 번째 단계에서는 첫 번째 단계에 의해 선택된 단어의 정보이득(information gain)을 계산해 분류 확률이 높은 단어를 우선적으로 선정한다. 두 단계를 통하여 선정된 단어들과 웹 페이지의 분류 정보를 가지고, 기계학습에 의하여 컴파일 된 규칙(compiled rules)을 생성한다. 생성된 규칙은 임의의 웹 페이지들을 도메인 온톨로지에 의해 정의된 범주 별로 분류할 수 있도록 한다. 본 논문의 실험에서는 주어진 웹 페이지 집합에서 각 범주 별로 평균 240개의 단어로부터 78개의 단어를 결과적으로 선정하였으며, 이를 바탕으로 웹 페이지 분류 규칙을 생성하였다. 실험 결과에서 제안한 시스템의 평균 분류 정확도는 약 83.52%로 측정되었다.

온톨로지 기반 중학교 기술. 가정교과 영양소의 질의응답 시스템 설계 및 구현 (Design and Implementation of an Ontology-based Access System of Nutrition and Food Guide Tower in Middle School Home Economics)

  • 조영선;백현기;김정겸;유정수
    • 정보교육학회논문지
    • /
    • 제11권3호
    • /
    • pp.317-327
    • /
    • 2007
  • 본 연구에서는 온톨로지 이론을 고찰하고, 중학교 기술 가정 교과의 영양소와 식품구성탑 내용을 지원하는 온톨로지 기반 검색 시스템을 설계 및 구현하여 학습을 효율적으로 수행할 수 있도록 하는 방안을 제시하였다. Protege-2000 프레임워크를 기반으로 하여 영양소와 식품구성탑 검색 시스템을 구현하였다. 본 시스템은 XML 기반을 두고 있으므로 차세대 인터넷 기술인 시맨틱 웹과의 연동이 가능하며, 영양학 분야에 공유될 수 있는 의미구조를 제공하여 상호운용이 가능한 지식정보 시스템의 기반을 마련하였다. 아울러 학습자는 스스로 정보검색을 통해 지식을 구조화할 수 있으며, 교수자 역시 이를 교수 학습 과정에 직접 투입하여 학습자들의 학습 성취도 및 흥미 등을 파악할 수 있다. 또한 학습자는 본 시스템을 통해 교수학습과정 뿐 아니라 앞으로의 실생활에서도 온톨로지를 통해 지식을 내면화함으로써 균형 잡히고 건강한 생활을 영위할 수 있을 것으로 생각된다.

  • PDF

기초 온톨로지 기반 한의 진단 시스템 (Traditional Korean Medicine Diagnosis System Based on Basic Ontology)

  • 김상균;장현철;김진현;오용택;김철;예상준;송미영
    • 동의생리병리학회지
    • /
    • 제24권6호
    • /
    • pp.1111-1116
    • /
    • 2010
  • We in this paper design and implement a traditional korean medicine diagnosis system based on basic ontology. If doctors put the symptoms or tongues or pulses of a patient in the diagnosis system, they can be recommended for the diagnosis results. To support the doctors decision, the diagnosis system make the inference based on the basic ontology and compute the similarity between symptoms of patient and those of ontology. The diagnosis systems also provide the learning mechanism about diagnosis results which save the results in the ontology and reuse them in the next diagnosis. Thus, doctors can share their knowledge for the diagnosis by exchanging their ontology each other. In future, we will expand the knowledge of the basic ontology continuously so that doctors can get the more accurate diagnosis results. We also implement the prescription function and integrate it to the diagnosis system.

이기종 플랫폼을 지원하는 온톨로지 기반 스마트러닝 시스템 설계 및 구현 (Design and Implementation to Support Cross-Platform Smart Learning System based on Ontology)

  • 전승연
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.960-963
    • /
    • 2013
  • 정보통신기술의 급격한 발전에 의해 교육은 스마트러닝으로 접어들고 있다. 학습자는 종이책을 내려놓고 다양한 스마트 디바이스를 활용한 학습을 하고 있으며, 이 순간에도 수없이 많은 플랫폼에 각각 들어맞는 학습 시스템이 등장하고 있다. 플랫폼 종속적인 시스템이 이기종 플랫폼에 적용되기 위해서는 많은 시간과 비용이 필요하며, 시스템이 보유하고 있는 학습 콘텐츠의 양이 많아질수록 이러한 현상은 더욱 심화된다. 불필요한 자원의 낭비를 줄이고 학습 콘텐츠를 효과적으로 제공하기 위해서 이기종 플랫폼을 지원하는 러닝 시스템의 연구가 필요하다. 이를 실현하기 위해서는 기존에 존재하는 수많은 학습 콘텐츠를 불필요한 중복 없이 통합할 수 있는 데이터베이스 모델의 연구가 선행되어야 한다. 이에 본 논문에서는 기존의 학습 콘텐츠를 통합할 수 있는 데이터베이스의 대안으로 온톨로지 기반의 메타데이터 모델을 제안하고, 이를 활용해 이기종 플랫폼을 지원하는 스마트러닝 시스템을 설계하고 구현한다.

  • PDF