• 제목/요약/키워드: semantic features

검색결과 376건 처리시간 0.024초

Web Image Clustering with Text Features and Measuring its Efficiency

  • Cho, Soo-Sun
    • 한국멀티미디어학회논문지
    • /
    • 제10권6호
    • /
    • pp.699-706
    • /
    • 2007
  • This article is an approach to improving the clustering of Web images by using high-level semantic features from text information relevant to Web images as well as low-level visual features of image itself. These high-level text features can be obtained from image URLs and file names, page titles, hyperlinks, and surrounding text. As a clustering algorithm, a self-organizing map (SOM) proposed by Kohonen is used. To evaluate the clustering efficiencies of SOMs, we propose a simple but effective measure indicating the accumulativeness of same class images and the perplexities of class distributions. Our approach is to advance the existing measures through defining and using new measures accumulativeness on the most superior clustering node and concentricity to evaluate clustering efficiencies of SOMs. The experimental results show that the high-level text features are more useful in SOM-based Web image clustering.

  • PDF

'막'의 운율적 특성과 담화적 기능 (Prosodic features and discourse functions of discourse marker 'mak'('막'))

  • 송인성
    • 한국어학
    • /
    • 제65권
    • /
    • pp.211-236
    • /
    • 2014
  • The aim of this study is to investigate categorical characteristics of 'mak' and their discourse functions through analyzed the prosodic features of 'mak'. The previous studies of 'mak' focused on grammatical or semantic characteristics, but this study focuses on the prosodic features of 'mak' based on speech data. As a result, adverb 'mak' and discourse marker 'mak' are distinguished from prosodic boundary, duration, pause and sort of number tonal patterns. Functions of discourse marker 'mak' is as follows: Maintenance of utterance, Attention, Delay, Expression negative manner. These functions have salient prosodic features related to their functions. Consequently prosodic features are important to analyze categorical characteristics and to establish functions of 'mak'.

Bag of Visual Words Method based on PLSA and Chi-Square Model for Object Category

  • Zhao, Yongwei;Peng, Tianqiang;Li, Bicheng;Ke, Shengcai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권7호
    • /
    • pp.2633-2648
    • /
    • 2015
  • The problem of visual words' synonymy and ambiguity always exist in the conventional bag of visual words (BoVW) model based object category methods. Besides, the noisy visual words, so-called "visual stop-words" will degrade the semantic resolution of visual dictionary. In view of this, a novel bag of visual words method based on PLSA and chi-square model for object category is proposed. Firstly, Probabilistic Latent Semantic Analysis (PLSA) is used to analyze the semantic co-occurrence probability of visual words, infer the latent semantic topics in images, and get the latent topic distributions induced by the words. Secondly, the KL divergence is adopt to measure the semantic distance between visual words, which can get semantically related homoionym. Then, adaptive soft-assignment strategy is combined to realize the soft mapping between SIFT features and some homoionym. Finally, the chi-square model is introduced to eliminate the "visual stop-words" and reconstruct the visual vocabulary histograms. Moreover, SVM (Support Vector Machine) is applied to accomplish object classification. Experimental results indicated that the synonymy and ambiguity problems of visual words can be overcome effectively. The distinguish ability of visual semantic resolution as well as the object classification performance are substantially boosted compared with the traditional methods.

의미적 유사성에 기반한 온톨로지 선택 랭킹 모델 (Ontology Selection Ranking Model based on Semantic Similarity Approach)

  • 오선주;안중호;박진수
    • 한국전자거래학회지
    • /
    • 제14권2호
    • /
    • pp.95-116
    • /
    • 2009
  • 지식 재사용 측면에서 기존의 온톨로지를 재사용할 수 있다면 많은 자원을 절약할 수 있을 것이다. 그러나 기존의 온톨로지를 활용하기 위해서는 보다 발전된 온톨로지 검색 기능이 요구된다. 현재까지 이루어진 관련 연구들에서는 주로 렉시컬 매칭기법을 사용하여 온톨로지를 검색하였다. 그러나 의미적 측면에서 문제점이 있으므로 본 연구에서는 관계의 의미적 유사성에 기반한 온톨로지 선택 랭킹 모델을 제안한다. 본 연구는 개념간 계층 구조와 관계를 온톨로지 검색에 이용함으로써 온톨로지의 선택 랭킹을 효과적이며 실질적으로 개선하였다. 또한 실험을 통해 연구 모델의 결과와 선행 연구의 결과, 온톨로지 전문가의 랭킹 결과를 비교 분석하고 연구 모델의 타당성을 검증하였다. 본 연구 결과는 온톨로지 검색 연구를 이론적으로 발전시켰을 뿐 아니라 실무적인 측면에서 실무자들이 온톨로지를 쉽게 찾아 재사용할 수 있도록 한다.

  • PDF

이상은(李商隱) 시(詩) 구주(舊注) 중에 나타난 시어(詩語)의 음의관계(音義關係) 연구(硏究) (A Phonetic and Semantic Analysis on the Annotations of Li ShangYin (李商隱)'s Poetry)

  • 염재웅
    • 비교문화연구
    • /
    • 제52권
    • /
    • pp.341-369
    • /
    • 2018
  • 이상은(李商隱)은 만당(晩唐)시기를 대표하는 시인으로 590여수의 시를 남겼다. 본 논문에서는 이상은(李商隱) 시(詩)에 대한 역대 학자들의 주석(注釋)을 통하여 시어(詩語) 속에 담긴 다양한 음의관계(音義關係)와 특징을 탐색했다. 그 결과 "시어(詩語)의 음의관계(音義關係)를 설명(說明)한 용례" 12개와 "시어(詩語)의 특징(特徵) 및 운율(韻律)을 설명(說明)한 용례" 5개의 핵심적인 용례를 찾아냈다. 특히 "시어(詩語)의 음의관계(音義關係)를 설명(說明)한 용례"를 분석해보니 이상은(李商隱) 시어(詩語)의 주석(注釋)과 고대(古代) 중국어의 음의관계가 일치하는 유형과 그렇지 않은 유형으로 분류되었다. 본 연구에서는 각 유형에 대한 세부 분석을 위해서 시율(詩律)의 평측(平仄)을 적용했다.

딥러닝 기반의 Semantic Segmentation을 위한 Residual U-Net에 관한 연구 (A Study on Residual U-Net for Semantic Segmentation based on Deep Learning)

  • 신석용;이상훈;한현호
    • 디지털융복합연구
    • /
    • 제19권6호
    • /
    • pp.251-258
    • /
    • 2021
  • 본 논문에서는 U-Net 기반의 semantic segmentation 방법에서 정확도를 향상시키기 위해 residual learning을 활용한 인코더-디코더 구조의 모델을 제안하였다. U-Net은 딥러닝 기반의 semantic segmentation 방법이며 자율주행 자동차, 의료 영상 분석과 같은 응용 분야에서 주로 사용된다. 기존 U-Net은 인코더의 얕은 구조로 인해 특징 압축 과정에서 손실이 발생한다. 특징 손실은 객체의 클래스 분류에 필요한 context 정보 부족을 초래하고 segmentation 정확도를 감소시키는 문제가 있다. 이를 개선하기 위해 제안하는 방법은 기존 U-Net에 특징 손실과 기울기 소실 문제를 방지하는데 효과적인 residual learning을 활용한 인코더를 통해 context 정보를 효율적으로 추출하였다. 또한, 인코더에서 down-sampling 연산을 줄여 특징맵에 포함된 공간 정보의 손실을 개선하였다. 제안하는 방법은 Cityscapes 데이터셋 실험에서 기존 U-Net 방법에 비해 segmentation 결과가 약 12% 향상되었다.

은닉 마코프 모델을 이용한 골프 비디오의 시멘틱 이벤트 검출 (Semantic Event Detection in Golf Video Using Hidden Markov Model)

  • 김천석;추진호;배태면;진성호;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제7권11호
    • /
    • pp.1540-1549
    • /
    • 2004
  • 본 논문에서는 은닉 마코프 모델을 이용하여 골프 비디오의 시멘틱한 이벤트들을 검출하는 알고리즘을 제안한다. 본 논문의 목적은 하이라이트에 기반한 비디오의 색인 및 요약을 용이하도록 이벤트들을 식별하고 분류하는 것이다. 제안된 알고리즘은 먼저 골프 비디오의 분석을 통하여 4개의 이벤트를 정의하고, 각 이벤트를 구성하는 상태를 이용하여 HMM 모델을 설계한다. 또한 각 이벤트의 HMM을 구성하는 파라메타를 구하기 위해 MPEG-7 시각 기술자에 기반한 10개의 시각 정보 특징들을 이용한다. 실험 결과 제안된 방법은 다양한 골프 이벤트들을 식별하는데 있어 양호한 성능의 검출 결과를 보여 주고 있다.

  • PDF

Syslog 데이터의 의미론적 검색을 위한 XML 기반의 모델링 (XML-based Modeling for Semantic Retrieval of Syslog Data)

  • 이석준;신동천;박세권
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.147-156
    • /
    • 2006
  • 이벤트 로깅은 시스템 및 네트워크 관리에 있어 그 역할이 증대되고 있으며, syslog는 해당 분야에 있어 사실상의 표준으로 사용되고 있다. 그러나 대부분의 로그 분석은 반구조적 특징을 보이는 로그 형식으로 인하여 빈번히 출현하는 패턴에만 집중하고 있다. XML은 syslog 데이터를 구조화하는 데 있어 유용한 방식을 제공하고 정보 탐색을 용이하게 해 준다. 하지만 이전의 XML 형식들 및 어플리케이션들은 로그 데이터를 위한 순위 기반 검색이나 유사도 측정 등과 같은 의미론적 접근에 적합하지 않다. 본 논문에서는 XML 기반의 순위 키워드 검색 기법을 기초로, 새로운 로그 데이터 모델링을 통해 syslog 데이터를 위한 XML 트리 구조를 제안한다. 그리고 기존의 XML 구조보다 의미론적 검색에 적합함을 보인다.

Towards Agile Application Integration with M2M Platforms

  • Chen, Menghan;Shen, Beijun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제6권1호
    • /
    • pp.84-97
    • /
    • 2012
  • M2M (Machine-to-Machine) Technology makes it possible to network all kinds of terminal devices and their corresponding enterprise applications. Therefore, several M2M platforms were developed in China in order to collect information from terminal devices dispersed all over the local places through 3G wireless network. However, when enterprise applications try to integrate with M2M platforms, they should be maintained and refactored to adapt the heterogeneous features and properties of M2M platforms. Moreover, syntactical and semantic unification for information sharing among applications and devices are still unsolved because of raw data transmission and the usage of distinguished business vocabularies. In this paper, we propose and develop an M2M Middleware to support agile application integration with M2M platform. This middleware imports the event engine and XML-based syntax to handle the syntactical unification, makes use of Ontology-based semantic mapping to solve the semantic unification and adopts WebService and ETL techniques to sustain multi-pattern interactive approach, in order to agilely make applications integrated with the M2M platform. Now, the M2M Middleware has been applied in the China Telecom M2M platform. The operation results show that applications will cost less time and workload when being integrated with M2M platform.

FEROM: Feature Extraction and Refinement for Opinion Mining

  • Jeong, Ha-Na;Shin, Dong-Wook;Choi, Joong-Min
    • ETRI Journal
    • /
    • 제33권5호
    • /
    • pp.720-730
    • /
    • 2011
  • Opinion mining involves the analysis of customer opinions using product reviews and provides meaningful information including the polarity of the opinions. In opinion mining, feature extraction is important since the customers do not normally express their product opinions holistically but separately according to its individual features. However, previous research on feature-based opinion mining has not had good results due to drawbacks, such as selecting a feature considering only syntactical grammar information or treating features with similar meanings as different. To solve these problems, this paper proposes an enhanced feature extraction and refinement method called FEROM that effectively extracts correct features from review data by exploiting both grammatical properties and semantic characteristics of feature words and refines the features by recognizing and merging similar ones. A series of experiments performed on actual online review data demonstrated that FEROM is highly effective at extracting and refining features for analyzing customer review data and eventually contributes to accurate and functional opinion mining.