• 제목/요약/키워드: Ontology Extraction

검색결과 76건 처리시간 0.028초

"동의보감"에 기재된 인체 용어 관계를 이용한 검색효율성 향상 방법 (Method for improving search efficiency using relation of anatomical structure from Donguibogam(東醫寶鑑))

  • 송인우;이병욱
    • 대한한의학원전학회지
    • /
    • 제25권4호
    • /
    • pp.105-113
    • /
    • 2012
  • Objectives : Acquiring information from symptoms is one of the important method to gain clinically available information in korean medicine. Therefore, up to now, study of symptom terms was frequently implemented in promotion of various information project. In data extraction methods using symptom information from DB, information search using synonym and method using ontology is studied and utilized. However, considering concept of symptom has essential information of appeared body area and phenomenon we think that extending synonym and ontology relationship in symptom terms can be useful for search and set to this study. Methods : We collect terms relevant to human body area and structure described in Donguibogam. Synonymous relationship between collected terms is organized. Relationship between collected terms is build to human-body-knowledge table which has form of Concept+Relation+Concept. Type of relationship is limited on a range of expressing content about parts of human body. Result & Conclusion : Search condition is generated automatically using relationship of the upper area in knowledge table contents. Information of next and previous acupuncture point, upper and lower acupuncture point, left and right acupuncture point can be searched using information of acupuncture point location, order, relative position in area, direction in knowledge table contents.

퍼지를 이용한 도메인 검색용어 중요성의 표시 (An Expresson of Domain Searching Term Weight using Fuzzy)

  • 진현수;홍유식
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권4호
    • /
    • pp.139-144
    • /
    • 2009
  • 최근의 여러분야에서 검색되어지고 있는 인터넷 도메인 용어의 전문성의 표시화는 온톨리지를 통한 지식의 축적의 목표가 되고 있다. 도메인 용어의 중요성을 표시화 한다면 기계가 온톨리지를 이용하여 정보의 관리 및 해석을 스스로 하는 것이 가능할 것으로 본다. 본 논문에서는 온톨로지의 중요성 (weight)을 구성하는 속성을 확장된 퍼지를 사용하여 기존 웹문서의 구조정보로부터 추출하는 알고리즘을 제안하였다. 특히 속성정보로 구성된 도메인 지식을 표시화 함으로써 속성추출 알고리즘을 개선하고, 추출결과의 품질을 향상시킨다. 5만문서를 대상으로 제안된 알고리즘을 적용한 결과 약 94%의 신뢰도의 속성정보를 추출할 수 있었다.

  • PDF

자질별 관계 패턴의 다변화를 통한 온톨로지 확장 (Incremental Enrichment of Ontologies through Feature-based Pattern Variations)

  • 이신목;장두성;신지애
    • 정보처리학회논문지B
    • /
    • 제15B권4호
    • /
    • pp.365-374
    • /
    • 2008
  • 본 논문에서는 패턴의 다변화를 통하여 관계를 점진적으로 추출함으로써 온톨로지를 확장하는 모델을 제안한다. 패턴 다변화 과정에서 위키피디아로부터 추출한 관계 패턴 후보를 자질별로 다변화시킨다. 다변화된 패턴 후보로부터 말뭉치 빈도수에 따른 신뢰도를 이용하여 패턴을 선별한다. 선별된 패턴은 위키피디아로부터 관계를 추출하는 데 사용되며, 추출된 관계는 다시 관계 패턴 확장에 사용된다. 본 논문에서는 점진적 학습 과정에서의 패턴 다변화를 통하여 패턴 선택의 범위를 확장함으로써, 선택되는 패턴이 점진적으로 정제되는 모델을 제시한다. 이를 통하여, 관계의 확장성과 정확도를 향상시키고자 하였다. 단일 자질 패턴 모델에 대한 실험을 통하여, 어휘, 중심어, 상위어 정보는 신뢰도에, 품사, 구문 정보는 확장성에 유리하며, 구문 단위 유형별로 필요한 자질 유형이 다름을 관찰하였다. 이와 같은 특성에 기반하여 현재 연구 진행 중인복합 자질 패턴 모델을 제안한다.

온톨로지 및 사례기반추론을 이용한 맞춤형 통합 정보 생성 프레임워크의 제안 (Framework for Information Integration and Customization Using Ontology and Case-based Reasoning)

  • 이현정;손미애
    • 지능정보연구
    • /
    • 제15권4호
    • /
    • pp.141-158
    • /
    • 2009
  • 다양한 정보자원들로부터 사용자가 요구하는 맞춤화된 정보를 추출해 내는 것은 더욱 어려워지고 있다. RSS를 비롯하여 개선된 다양한 정보 수집 방법들이 개발되었지만, 여전히 정보가공자인 사람의 도움 없이 필요한 정보들을 수집하여 정리 및 가공하는 작업이 쉽지는 않다. 따라서 본 연구에서는 정보사용자들이 사용 목적에 맞게 정보를 가공하는 부담을 줄여주기 위해 사례기반추론과 온톨로지에 기반한 맞춤형 통합정보생성 프레임워크를 제안한다. 본 프레임워크는 세 단계로 구성된다. 첫째, 수집된 웹 정보를 정보가공의 용이성을 위해 사례로 변환한다. 둘째, 동적 유사도 검색을 통해 수집된 사례들로부터 정보 사용자의 동적 요구사항에 적합한 사례를 검색한다. 셋째, 전 단계에서 추출된 사례를 정보사용자의 요구사항에 보다 적합한 지식으로 가공하기 위해 집중 유사도를 적용한다. 본 프레임워크는 여행자들의 정보수집을 위한 여행정보시스템에 적용되어 그 효과를 입증하였다.

  • PDF

국방 디지털 아카이브의 효율적 연관정보 검색을 위한 자동화된 비즈니스 서비스 식별 (An Automatic Business Service Identification for Effective Relevant Information Retrieval of Defense Digital Archive)

  • 변영태;황상규;정찬기
    • 정보관리학회지
    • /
    • 제27권4호
    • /
    • pp.33-47
    • /
    • 2010
  • 정보기술혁명 및 네트워크 기반 정보공유 대중화는 국방 분야 디지털콘텐츠 수를 증가시켰다. 이에 따라 급격하게 그 수가 증가한 장기 보존된 디지털화된 공공정보 가운데 사용자 본인에게 적합한 공공정보를 찾는 것은 매우 중요한 문제로 대두되고 있다. 디지털콘텐츠는 원 자료의 출처 및 생산 시기에 따라 그 형태가 매우 다양하고, 디지털콘텐츠간에는 많은 상호 연관 관계가 존재한다. 비즈니스 서비스 온톨로지는 공공분야 디지털 아카이브 정보 생산자와 정보 이용자 간의 상호 지식을 명시화하고 지식을 공유할 수 있는 방안을 제공함으로써 디지털 공공정보 검색능력을 증진시키는데 많은 도움을 줄 수 있다. 비즈니스 서비스 온톨로지는 정보 생산자와 정보 이용자 간의 교량과 같은 인터페이스 역할을 수행하는 것이다. 그러나 업무 처리절차에 대한 의미 지식 추출의 어려움으로 인하여, 비정형의 업무 활동들로부터 정형화된 비즈니스 서비스로의 매핑 정보를 제공하는 비즈니스 서비스 온톨로지 자동화는 실용화하기가 매우 힘든 실정이다. 이러한 문제점을 해결하고자 본 연구에서는 비즈니스 서비스 온톨로지 구축을 위한 첫단계로써 전사적 아키텍처(ITA/EA)로부터 단위 비즈니스 서비스 식별 자동화 방안을 제안한다.

온톨로지 시각화를 활용한 사용자 리뷰 분석 기반 영화 추천 시스템 (Movie Recommended System base on Analysis for the User Review utilizing Ontology Visualization)

  • 문성민;김기남;최경철;이경원
    • 디자인융복합연구
    • /
    • 제15권2호
    • /
    • pp.347-368
    • /
    • 2016
  • 최근 소비자 구전정보에 대한 연구들은 소비자가 제품 구매 과정에서 다른 소비자의 구전에 의한 정보를 활용한다는 연구 결과를 시사하고 있다. 본 연구는 제품에 대한 소비자의 의견을 파악하고 활용할 수 있도록 오피니언 마이닝과 시각화를 통해 도움을 줄 수 있는 방법을 제안하고자 한다. 이를 위해 최근 들어 관람할 영화를 선택할 때 인터넷 상의 영화리뷰를 참고 하는 상황이 증가함을 고려하여 "영화" 도메인의 온톨로지를 구축하고 오피니언 마이닝을 수행하여 시각화 한 후 그 결과에 대해 논하고자 한다. 온톨로지를 구축하는 과정에서 평가요소에 대한 속성 분류뿐만 아니라 평가요소에 대한 서술어 사전을 구성하였다는 점에서 기존의 연구와 차별성이 있으며 분석 결과를 통해 이러한 방법이 오피니언 마이닝에 유효함을 증명하고자 한다. 연구를 통해 도출한 결과는 크게 세 가지로 나누어 볼 수 있다. 첫째, 본 연구에서는 기존에 구축된 온톨로지를 활용하지 않고 키워드 추출과 토픽모델링을 활용하여 영화 도메인에 대한 온톨로지를 구축하는 방법에 대해 서술하였다. 둘째, 개별 영화에 대한 시각화 분석을 시행하여 영화에 대한 관객의 종합적인 의견을 한눈에 파악할 수 있도록 하였다. 셋째, 제품에 대한 평가 결과에 따라 유사한 평가를 받은 제품끼리 군집화 되는 것을 발견하였으며 본 연구의 분석에 사용된 130개의 영화는 크게 3개의 집단으로 군집화 됨을 보였다.

Natural language processing techniques for bioinformatics

  • Tsujii, Jun-ichi
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2003년도 제2차 연례학술대회 발표논문집
    • /
    • pp.3-3
    • /
    • 2003
  • With biomedical literature expanding so rapidly, there is an urgent need to discover and organize knowledge extracted from texts. Although factual databases contain crucial information the overwhelming amount of new knowledge remains in textual form (e.g. MEDLINE). In addition, new terms are constantly coined as the relationships linking new genes, drugs, proteins etc. As the size of biomedical literature is expanding, more systems are applying a variety of methods to automate the process of knowledge acquisition and management. In my talk, I focus on the project, GENIA, of our group at the University of Tokyo, the objective of which is to construct an information extraction system of protein - protein interaction from abstracts of MEDLINE. The talk includes (1) Techniques we use fDr named entity recognition (1-a) SOHMM (Self-organized HMM) (1-b) Maximum Entropy Model (1-c) Lexicon-based Recognizer (2) Treatment of term variants and acronym finders (3) Event extraction using a full parser (4) Linguistic resources for text mining (GENIA corpus) (4-a) Semantic Tags (4-b) Structural Annotations (4-c) Co-reference tags (4-d) GENIA ontology I will also talk about possible extension of our work that links the findings of molecular biology with clinical findings, and claim that textual based or conceptual based biology would be a viable alternative to system biology that tends to emphasize the role of simulation models in bioinformatics.

  • PDF

국가이미지 분석을 위한 위키피디아 실시간 동적 온톨로지 구축 알고리즘 및 적용 (Dynamic ontology construction algorithm from Wikipedia and its application toward real-time nation image analysis)

  • 이영환
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권4호
    • /
    • pp.979-991
    • /
    • 2016
  • 이 연구에서는 국가이미지를 실시간 측정하기 위하여 위키피디아의 키워드를 추출하여 반자동 동적 온톨로지를 구축하는 알고리즘을 개발하였다. 이 DCDKC (double-crossing double keyword collection)라 명명된 알고리즘에 의해 추출된 국가이미지 온톨로지인 위키온토 (WikiOnto)는 동적으로 변화하는 국가이미지를 실시간으로 자동 측정하여 제공할 수 있도록 하였다. 따라서 국가이미지 관리에 효율성을 기하고 뜻밖에 있을 지도 모르는 국가이미지의 급박한 변화에 선제적으로 대응할 수 있는 도구를 개발하고자 하였다. DCDKC 알고리즘은 과거 오프라인 설문조사에 상당부분 의존하던 각종 국가브랜드지수 모델과는 달리 온라인 실시간 동적 국가이미지 모니터링 시스템에 잘 적용될 수 있음을 보여주었다. DCDKC 알고리즘을 적용한 시스템의 유용성을 검증하기 위하여 아시아의 3대 수출국인 한중일 삼국의 국가이미지를 측정하기 위한 동적 온톨로지 위키온토를 구축하고 국가 이미지의 동적 변화를 실시간으로 추적가능함을 확인하였다. 결론적으로 DCDKC를 이용한 위키온토의 구축을 통한 국가이미지 실시간 관리체계에 대한 가능성을 확인하였을 뿐더러 저렴하고 탁월한 솔류션이 될 수 있음을 증명하였다.

한국어 서술어와 지식베이스 프로퍼티 연결 (Linking Korean Predicates to Knowledge Base Properties)

  • 원유성;우종성;김지성;함영균;최기선
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1568-1574
    • /
    • 2015
  • 본 논문은 자연언어 문장을 지식베이스의 지식 골격에 맞추어 지식의 형태로 변환하기 위한 과정 중의 하나인 관계추출(Relation Extraction)을 목표로 한다. 특히, 문장 내에 있는 서술어(Predicate)에 집중하여 서술어와 관련성 높은 지식베이스 프로퍼티(Property or Relation)를 찾아내고, 이를 통해 두 개체(Entity)간의 의미를 파악하는 관계추출에 초점을 둔다. 이에 널리 활용되는 원격지도학습(Distant Supervision) 접근 방식에 따라, 지식베이스와 자연언어 텍스트로부터 원격 학습이 가능한 레이블(Labeled) 데이터를 자동으로 마련하여 지식베이스 프로퍼티에 대한 어휘화 작업을 수행한다. 즉, 두 개체 사이의 관계로 표현되는 서술어와, 온톨로지로 정의할 수 있는 프로퍼티와의 연결을 통해, 텍스트로부터 구조적 정보를 생성할 수 있는 기반을 마련하고 최종적으로 지식베이스 확장의 가능성을 열어준다.

Design and Implementation of an Ontology-based Knowledge Management System

  • Hideki-Mima;Yoon, Tae-Sung;Katsumori-Matsushima
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2004년도 e-Biz World Conference
    • /
    • pp.107-111
    • /
    • 2004
  • The purpose of the study is to develop an integrated knowledge management system for the domains of genome and nano-technology, in which terminology-based literature mining, knowledge acquisition, knowledge structuring, and knowledge retrieval are combined. The system supports integrating different types of databases (papers and patents, technologies and innovations) and retrieving different types of knowledge simultaneously. The main objective of the system is to facilitate knowledge acquisition from documents and new knowledge discovery through a terminology-based similarity calculation and a visualization of automatically structured knowledge. Implementation issue of the system is also mentioned.

  • PDF