• Title/Summary/Keyword: Knowledge extraction

Search Result 384, Processing Time 0.025 seconds

Incremental Ontology Building Using Open Information Extraction (무제한 정보 추출을 이용한 지식베이스 확장)

  • Kim, Byungsoo;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.228-232
    • /
    • 2014
  • 지식 베이스(Knowledge Base)는 주어진 질의 문에 대한 잠재적인 답과 답에 대한 단서가 될 수 있는 구조화된 형태의 정보를 포함하고 있기 때문에 질의응답 시스템에서 매우 중요하다. 하지만 비록 DBpedia, Freebase, YAGO 등과 같이 이용 가능한 여러 개의 지식 베이스가 존재함에도 불구하고 이러한 지식 베이스에 포함되어 있는 정보는 웹(Web)상에 존재하는 정보에 비하면 매우 제한적이다. 본 논문에서는 무제한 정보 추출 기술을 이용하여 정형화되지 않은 텍스트로부터 트리플(Triple)을 추출하고, 추출된 트리플의 각 개체 및 관계 어휘를 대상 온톨로지(Ontology) 상의 어휘에 사상시킴으로써 지식 베이스를 확장 시키는 방법을 제안한다. 이를 통하여 무제한 정보 추출 방법과 명확화(Disambiguation) 기술이 지식 베이스를 확장시키는데 어떻게 사용될 수 있고, 어떠한 요소가 전체 시스템의 주된 성능 저하를 일으키며 개선되어야 하는지 알아보도록 한다.

  • PDF

Road Image Understanding System Based on the Blackboard Architecture (블랙보드 구조를 갖는 도로 영상이해시스템)

  • 권영빈
    • Korean Journal of Cognitive Science
    • /
    • v.5 no.2
    • /
    • pp.47-73
    • /
    • 1994
  • In this paper, a blackboard-based road image understanding system is implemented. The 7 useful information which organized by the hierarchical manner are stored in the blackboard system. The 6 Knowledge source modules and the blackboard make the communications under the supervision of the control module. For a scene, each hypothesis is generated and then verified for every meaningful object. On the simulation results, the correct recognition ratio can be reached out 90%. It shows that the extraction of road information for the autonomous navigation can be obtained using the blackboard architecture.

  • PDF

Wavelet based Feature Extraction of Human Face

  • Kim, Yoon-ho;Lee, Myung-kil;Ryu, Kwang-ryol
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2001.05a
    • /
    • pp.656-659
    • /
    • 2001
  • Human have a notable ability to recognize faces, which is one of the most common visual feature in our environment. In regarding face pattern, just like other natural object, a geometrical interpretation of face is difficult to achieve. In this paper, we present wavelet based approach to extract the face features. Proposed approach is similar to the feature based scheme, where the feature is derived from the intensity data without detecting any knowledge of the significant feature. Topological graphs are involved to represent some relations between facial features. In our experiments, proposed approach is less sensitive to the intensity variation.

  • PDF

Optimized Entity Attribute Value Model: A Search Efficient Re-presentation of High Dimensional and Sparse Data

  • Paul, Razan;Latiful Hoque, Abu Sayed Md.
    • Interdisciplinary Bio Central
    • /
    • v.3 no.3
    • /
    • pp.9.1-9.5
    • /
    • 2011
  • Entity Attribute Value (EAV) is the widely used solution to represent high dimensional and sparse data, but EAV is not search efficient for knowledge extraction. In this paper, we have proposed a search efficient data model: Optimized Entity Attribute Value (OEAV) for physical representation of high dimensional and sparse data as an alternative of widely used EAV. We have implemented both EAV and OEAV models in a data warehousing en-vironment and performed different relational and warehouse queries on both the models. The experimental results show that OEAV is dramatically search efficient and occupy less storage space compared to EAV.

Sketch Feature Point Extraction using Hierarchical Knowledge-based Noise Elimination (계층적 지식기반 잡음제거를 이용한 스케치 특징점 검출)

  • Cho, Sun-Young;Byun, Hye-Ran
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2008.06c
    • /
    • pp.498-502
    • /
    • 2008
  • 본 논문에서는 스케치 보정을 위한 계층적 지식 기반 잡음 제거 방법을 제안한다. 제안하는 잡음 제거 방법은 방향 정보, 후보 영역간의 내적, 갈고리 잡음영역 검출이라는 세 개의 계층적 휴리스틱(heuristic) 방법으로 구성된다. 첫 번째 단계에서 방향정보를 이용하여 특징점 후보들이 검출되고, 두 번째 단계에서는 각 후보들 사이의 벡터 간 내적을 이용하여 부적절한 후보들이 제거되며, 세 번째 단계에서는 갈고리모양의 잡음영역을 검출하여 근거리에 모여있는 특징점들을 병합한다. 실험을 통해 제안하는 방법이 잡음에 민감한 실제 응용 환경에 적합하며 효율적임을 보였다.

  • PDF

Extraction of Canine Cataract Object for Developing Handy Pre-diagnostic Tool with Fuzzy Stretching and ART2 Learning

  • Kim, Kwang Baek
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • v.16 no.1
    • /
    • pp.21-26
    • /
    • 2016
  • Canine cataract is developed with aging and can cause the blindness or surgical treatment if not treated timely. The first observation must be made by pet owners but they do not have proper equipment and knowledge to see the abnormalities. In this paper, we propose an intelligent image processing method to extract canine cataract suspicious object from non-professional equipment such as ordinary digital camera and cellular phone photographs so that even casual owners of pet dog can make a pre-diagnosis of such a surgery-needed disease as soon as possible. The experiment shows that the proposed method is successful in most cases except the dog has similar colored hair to the color of cataract.

Semantic Indexing for Soccer Videos Using Web-Extracted Information (웹에서 축출된 정보를 이용한 축구 경기의 시맨틱 인덱싱)

  • Hirata, Issao;Kim, Myeong-Hoon;Sull, Sang-Hoon
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.10c
    • /
    • pp.41-45
    • /
    • 2007
  • The rapid growing of video content production leads to the necessity of developing more complex indexing systems in order to efficiently allow searching, retrieval and presentation of the desired segments of videos. This paper presents a method for indexing soccer video through automatic extraction of information from internet. The proposed paper defines a metadata structure to formally represent the knowledge of soccer matches and provides an automatic method to extract semantic information from web-sites. This approach improves the capability to extract more reliable and richer semantic Information for soccer videos. Experimental results demonstrate that the proposed method provides an efficient performance.

  • PDF

Wavelet based Feature Extraction of Human face

  • Kim, Yoon-Ho;Lee, Myung-Kil;Ryu, Kwang-Ryol
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.5 no.2
    • /
    • pp.349-355
    • /
    • 2001
  • Human have a notable ability to recognize faces, which is one of the most common visual feature in our environment. In regarding face pattern, just like other natural object, a geometrical interpretation of face is difficult to achieve. In this paper, we present wavelet based approach to extract the face features. Proposed approach is similar to the feature based scheme, where the feature is derived from the intensity data without detecting any knowledge of the significant feature. Topological graphs are involved to represent some relations between facial features. In our experiments, proposed approach is less sensitive to the intensity variation.

  • PDF

Design of a Contextual Lexical Knowledge Graph Extraction Algorithm (맥락적 어휘 지식 그래프 추출 알고리즘의 설계)

  • Nam, Sangha;Choi, Gyuhyeon;Hahm, Younggyun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.147-151
    • /
    • 2016
  • 본 논문에서는 Reified 트리플 추출을 위한 한국어 개방형 정보추출 방법을 제시한다. 시맨틱웹 분야에서 지식은 흔히 RDF 트리플 형태로 표현되지만, 자연언어문장은 복수개의 서술어와 논항간의 관계로 구성되어 있다. 이러한 이유로, 시맨틱웹의 대표적인 지식표현법인 트리플을 따름과 동시에 문장의 의존구조를 반영하여 복수개의 술어와 논항간의 관계를 지식화하는 새로운 개방형 정보추출 시스템이 필요하다. 본 논문에서는 문장 구조에 대한 일관성있는 변환을 고려한 새로운 개방형 정보추출 방법을 제안하며, 개체 중심의 지식과 사건중심의 지식을 함께 표현할 수 있는 Reified 트리플 추출방법을 제안한다. 본 논문에서 제안한 방법의 우수성과 실효성을 입증하기 위해 한국어 위키피디아 알찬글 본문을 대상으로 추출된 지식의 양과 정확도 측정 실험을 수행하였고, 본 논문에서 제안한 방식을 응용한 의사 SPARQL 질의 생성 모듈에 대해 소개한다.

  • PDF

Query Expansion based on Knowledge Extraction and Latent Dirichlet Allocation for Clinical Decision Support (의학 문서 검색을 위한 지식 추출 및 LDA 기반 질의 확장)

  • Jo, Seung-Hyeon;Lee, Kyung-Soon
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.31-34
    • /
    • 2015
  • 본 논문에서는 임상 의사 결정 지원을 위한 UMLS와 위키피디아를 이용하여 지식 정보를 추출하고 질의 유형 정보를 이용한 LDA 기반 질의 확장 방법을 제안한다. 질의로는 해당 환자가 겪고 있는 증상들이 주어진다. UMLS와 위키피디아를 사용하여 병명과 병과 관련된 증상, 검사 방법, 치료 방법 정보를 추출한다. UMLS와 위키피디아를 사용하여 추출한 의학 정보를 이용하여 질의와 관련된 병명을 추출한다. 질의와 관련된 병명을 이용하여 추가 증상, 검사 방법, 치료 방법 정보를 확장 질의로 선택한다. 또한, LDA를 실행한 후, Word-Topic 클러스터에서 질의와 관련된 클러스터를 추출하고 Document-Topic 클러스터에서 초기 검색 결과와 관련이 높은 클러스터를 추출한다. 추출한 Word-Topic 클러스터와 Document-Topic 클러스터 중 같은 번호를 가지고 있는 클러스터를 찾는다. 그 후, Word-Topic 클러스터에서 의학 용어를 추출하여 확장 질의로 선택한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS) 2014 테스트 컬렉션에 대해 비교 평가한다.

  • PDF