• 제목/요약/키워드: Semantic Classification

검색결과 329건 처리시간 0.027초

전자정부내 의미기반 기술 도입에 따른 기능 및 정책 연구 (Research on Function and Policy for e-Government System using Semantic Technology)

  • 장영철
    • 한국산업정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.22-28
    • /
    • 2008
  • 본 논문에서는 전자정부 시스템의 대 국민 사용성과 효율성을 증진시키기 위한 의미기반 문서 분류 방법(CoWDC)을 제시한다. 기존 의미기반 문서분류 방법에서 많은 양의 키워드들의 계층적 컨셉들을 이용하는 것을 지양하고 사용자들이 사용하는 키워드들 간의 관계를 중심으로 문서를 분류한다. 즉, 문서의 컨텍스트(context)에 근거하여 깊고 정확한 의미를 키워드 간 관계를 분석하여 적은 양의 정보로 효율적인 문서분류를 하게 된다. 이를 위해 제안한 CoWDC(Concept Wright Document Classification) 시스템은 기존의 시소러스/온톨로지의 의존도를 줄이고 키워드 관계, 관계의 경중 고려, 상하위 개념으로 변환 등을 통한 실험과 평가가 이루어졌다. 전자정부 시스템의 구조 및 특징 분석을 통해 CoWDC 실험 결과는 대국민 서비스 향상을 위해 매우 필요함을 인지하고 이를 접목하기 위한 기술적, 정책적 제언을 제시하였다. CoWDC를 통해 의미기반 검색기술의 우수함을 입증하였고 이는 전자정부 시스템의 지식베이스 구축, 운영체제의 운용, 시소러스의 구성 등의 과정에서 체계적으로 통합 운영되어야 한다.

  • PDF

지도적 잠재의미색인(LSI)기법을 이용한 의견 문서 자동 분류에 관한 실험적 연구 (An Experimental Study on Opinion Classification Using Supervised Latent Semantic Indexing(LSI))

  • 이지혜;정영미
    • 정보관리학회지
    • /
    • 제26권3호
    • /
    • pp.451-462
    • /
    • 2009
  • 본 연구에서는 의견이나 감정을 담고 있는 의견 문서들의 자동 분류 성능을 향상시키기 위하여 개념색인의 하나인 잠재의미색인 기법을 사용한 분류 실험을 수행하였다. 실험을 위해 수집한 1,000개의 의견 문서는 500개씩의 긍정 문서와 부정 문서를 포함한다. 의견 문서 텍스트의 형태소 분석을 통해 명사 형태의 내용어 집합과 용언, 부사, 어기로 구성되는 의견어 집합을 생성하였다. 각기 다른 자질 집합들을 대상으로 의견 문서를 분류한 결과 용어색인에서는 의견어 집합, 잠재의미색인에서는 내용어와 의견어를 통합한 집합, 지도적 잠재의미색인에서는 내용어 집합이 가장 좋은 성능을 보였다. 전체적으로 의견 문서의 자동 분류에서 용어색인 보다는 잠재의미색인 기법의 분류 성능이 더 좋았으며, 특히 지도적 잠재의미색인 기법을 사용할 경우 최고의 분류 성능을 보였다.

소프트웨어 부품의 재사용을 위한 개선된 패싯 분류 방법과 의미 유사도 측정 (Advanced Faceted Classification Scheme and Semantic Similarity Measure for Reuse of Software Components)

  • 강문설
    • 한국정보처리학회논문지
    • /
    • 제3권4호
    • /
    • pp.855-865
    • /
    • 1996
  • 본 논문에서는 재사용가능한 소프트웨어 부품의 분류 과정을 자동화하여, 소프트 웨어 부품 라이브러리에 구조적으로 저장하는 방안을 제안한다. 효율적이고 자동화 된 소프트웨어 부품의 분류를 위하여 자연어로 기술된 소프트웨어 부품 설명서로부터 의미 정보와 문장 구성 정보 등의 특징을 획득하여 소프트웨어 부품의 특성을 표현하 는 패싯을 결정하고각각의 패싯에 해당하는 항목들을 자동으로 추출하여 소프트웨어 부품 식별자를 구성하였다. 그리고 분류된 소프트웨어 부품들 사이의 의미 유사도를 측정하여 비슷한 특성을 갖는 소프트웨어 부품들을 인접한 장소에 저장시켜 구조화된 소프트웨어 부품 라이브러리를 구축하였다. 제안한 방법은 소프트웨어 부품의 분류 과정이 간단하고, 유사한 소프트웨어 부품을 쉽게 식별할 수 있었으며, 또한 소프트 웨어 부품을 라이브러리에 구조적으로 저장할 수 있다.

  • PDF

Deep Image Annotation and Classification by Fusing Multi-Modal Semantic Topics

  • Chen, YongHeng;Zhang, Fuquan;Zuo, WanLi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권1호
    • /
    • pp.392-412
    • /
    • 2018
  • Due to the semantic gap problem across different modalities, automatically retrieval from multimedia information still faces a main challenge. It is desirable to provide an effective joint model to bridge the gap and organize the relationships between them. In this work, we develop a deep image annotation and classification by fusing multi-modal semantic topics (DAC_mmst) model, which has the capacity for finding visual and non-visual topics by jointly modeling the image and loosely related text for deep image annotation while simultaneously learning and predicting the class label. More specifically, DAC_mmst depends on a non-parametric Bayesian model for estimating the best number of visual topics that can perfectly explain the image. To evaluate the effectiveness of our proposed algorithm, we collect a real-world dataset to conduct various experiments. The experimental results show our proposed DAC_mmst performs favorably in perplexity, image annotation and classification accuracy, comparing to several state-of-the-art methods.

시멘틱세그멘테이션을 활용한 태양광 패널 고장 감지 시스템 구현 (Implementation of Photovoltaic Panel failure detection system using semantic segmentation)

  • 신광성;신성윤
    • 한국정보통신학회논문지
    • /
    • 제25권12호
    • /
    • pp.1777-1783
    • /
    • 2021
  • 대단위 신재생 에너지 발전단지의 효율적인 유지관리를 위해 드론의 활용이 점차 증가하고 있다. 오래전부터 태양광 패널을 드론으로 촬영하여 패널의 유실 및 오염 등을 관리하고 있다. 본 논문에서는 열화상카메라를 장착한 드론을 이용하여 획득된 태양광패널 이미지에서 아크, 단선, 크랙 등의 고장 유무를 판별하기 위해 시멘틱세그멘테이션 기법을 이용한 분류모델을 제안한다. 또한 적은 데이터셋으로도 강인한 분류 성능을 보이는 U-Net의 튜닝을 통해 효율적인 분류모델을 구현하였다.

The Concept and Application Methods of Intelligent Content

  • Yoon Yong-Bae;Chae Song-Hwa;Kim Won-Il
    • International Journal of Contents
    • /
    • 제2권3호
    • /
    • pp.1-5
    • /
    • 2006
  • Intelligent Content is defined as detailed information or fragment of content which contains a semantic data structure. This semantic structure makes possible to do various intelligent operations. There are wide range of content-oriented applications such as classification, retrieval, extraction, translation, presentation and question-answering. The concept of Intelligent Content is applied to various fields like MPEG and Semantic Web. In this paper, we discuss the several important researches of Intelligent Content and how to apply this conception to these fields.

  • PDF

시맨틱 텍스트 마이닝을 위한 온톨로지 활용 방안 (Using Ontologies for Semantic Text Mining)

  • 유은지;김정철;이춘열;김남규
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제21권3호
    • /
    • pp.137-161
    • /
    • 2012
  • The increasing interest in big data analysis using various data mining techniques indicates that many commercial data mining tools now need to be equipped with fundamental text analysis modules. The most essential prerequisite for accurate analysis of text documents is an understanding of the exact semantics of each term in a document. The main difficulties in understanding the exact semantics of terms are mainly attributable to homonym and synonym problems, which is a traditional problem in the natural language processing field. Some major text mining tools provide a thesaurus to solve these problems, but a thesaurus cannot be used to resolve complex synonym problems. Furthermore, the use of a thesaurus is irrelevant to the issue of homonym problems and hence cannot solve them. In this paper, we propose a semantic text mining methodology that uses ontologies to improve the quality of text mining results by resolving the semantic ambiguity caused by homonym and synonym problems. We evaluate the practical applicability of the proposed methodology by performing a classification analysis to predict customer churn using real transactional data and Q&A articles from the "S" online shopping mall in Korea. The experiments revealed that the prediction model produced by our proposed semantic text mining method outperformed the model produced by traditional text mining in terms of prediction accuracy such as the response, captured response, and lift.

변이의 통사ㆍ의미론적 고찰 (A Syntactic and Semantic Analysis of Alternations)

  • 김현효
    • 한국산학기술학회논문지
    • /
    • 제4권3호
    • /
    • pp.134-138
    • /
    • 2003
  • 본 연구는 언어학의 학파를 떠나 주목받고 있는 논항변이의 현상을 통사 ㆍ 의미론적으로 분석하고자 하였다. 논항변이의 현상을 동사의 특성에 따라 분류한 Levin(1993)을 기초로 Dowty의 의미론적인 해석을 시도하였다. 통사적으로 동일한 구조를 보이는 문장에서 동사의 논항이 바뀌면 의미의 변화가 있는 경우가 연구의 초점이 되고 있다. 의미변화가 초래됨을 기초로 각 동사의 유형을 통사적으로 분류하는데 그치지 않고, 그 부류의 문장들의 의미가 어떠한 영향을 받게 되는가를 고찰하였다. 우선 논항변이 현상을 보이는 동사를 Touch형, Hit형 Cut형, 그리고 Break형 동사로 분류하고 각 동사가 보이는 논항변이 현상에 따라 Middle alternation, Body-part possessor Ascension, Conative Alternation에 각각 어떻게 나타나는지를 점검한다. 이러한 분류에 기초하여 각각의 alternation에 의미론적인 해석을 하고자 시도한 것이다.

  • PDF

지능적인 웹문서 분류를 위한 구조 및 프로세스 설계 연구 (A Study on Building Structures and Processes for Intelligent Web Document Classification)

  • 장영철
    • 디지털융복합연구
    • /
    • 제6권4호
    • /
    • pp.177-183
    • /
    • 2008
  • This paper aims to offer a solution based on intelligent document classification to create a user-centric information retrieval system allowing user-centric linguistic expression. So, structures expressing user intention and fine document classifying process using EBL, similarity, knowledge base, user intention, are proposed. To overcome the problem requiring huge and exact semantic information, a hybrid process is designed integrating keyword, thesaurus, probability and user intention information. User intention tree hierarchy is build and a method of extracting group intention between key words and user intentions is proposed. These structures and processes are implemented in HDCI(Hybrid Document Classification with Intention) system. HDCI consists of analyzing user intention and classifying web documents stages. Classifying stage is composed of knowledge base process, similarity process and hybrid coordinating process. With the help of user intention related structures and hybrid coordinating process, HDCI can efficiently categorize web documents in according to user's complex linguistic expression with small priori information.

  • PDF

절 경계와 트리 거리를 사용한 2단계 부분 의미 분석 시스템 (A Two-Phase Shallow Semantic Parsing System Using Clause Boundary Information and Tree Distance)

  • 박경미;황규백
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권5호
    • /
    • pp.531-540
    • /
    • 2010
  • 본 논문은 최대 엔트로피 모형에 기반한 두 단계 부분 의미 분석 방법을 제안한다. 먼저, 의미 논항의 경계를 인식하고, 그 다음 단계에서 확인된 논항에 적절한 의미역을 할당한다. 두 단계 부분 의미 분석에서는 두 번째 단계인 논항 분류가 논항 확인 단계의 결과에 기반하여 수행되기 때문에 논항 확인의 성능이 매우 중요하다. 본 논문은 논항 확인의 성능을 향상시키기 위하여 논항 확인의 전처리 단계에 구문 지식을 통합한다. 구체적으로, 절 인식 결과로부터 술어의 인접절 및 상위절들을 확인하고, 구문 분석 결과로부터 술어의 부모 노드로부터 구문 구성 요소의 부모 노드까지의 트리 거리를 추출하여 전처리 단계에서 활용한다. 실험을 통해, 구문 지식을 활용하는 것이 부분 의미 분석 성능에 기여함과 제안하는 두 단계 방법이 한 단계 방법보다 우수한 성능을 낼 수 있음을 보인다.