• 제목/요약/키워드: Semantic region

검색결과 94건 처리시간 0.028초

딥러닝을 위한 영역기반 합성곱 신경망에 의한 항공영상에서 건물탐지 평가 (Evaluation of Building Detection from Aerial Images Using Region-based Convolutional Neural Network for Deep Learning)

  • 이대건;조은지;이동천
    • 한국측량학회지
    • /
    • 제36권6호
    • /
    • pp.469-481
    • /
    • 2018
  • 딥러닝은 인간의 학습 및 인지능력을 닮은 인공지능을 실현하기 위해 여러 분야에서 활용하고 있으며, 높은 사양의 컴퓨팅 파워가 요구되고 연산 시간이 많이 소요되는 복잡한 구조의 인공신경망에 의한 딥러닝은 컴퓨터 사양이 향상됨에 따라 성능이 개선된 다양한 딥러닝 모델이 개발되고 있다. 본 논문의 주요 목적은 영상의 딥러닝을 위한 합성곱 신경망 중에서 최근에 FAIR (Facebook AI Research)에서 개발한 Mask R-CNN을 이용하여 항공영상에서 건물을 탐지하고 성능을 평가하는 것이다. Mask R-CNN은 영역기반의 합성곱 신경망으로서 픽셀 정확도까지 객체를 의미적으로 분할하기 위한 딥러닝 모델로서 성능이 가장 우수한 것으로 평가받고 있다. 딥러닝 모델의 성능은 신경망 구조뿐 아니라 학습 능력에 의해 결정된다. 이를 위해 본 논문에서는 모델의 학습에 이용한 영상에 다양한 변화를 주어 학습 능력을 분석하였으며, 딥러닝의 궁극적 목표인 범용화의 가능성을 평가하였다. 향후 연구방안으로는 영상에만 의존하지 않고 다양한 공간정보 데이터를 복합적으로 딥러닝 모델의 학습에 이용하여 딥러닝의 신뢰성과 범용화가 향상될 것으로 판단된다.

이웃 장면들의 특성을 이용한 비디오 디졸브 검출 (Video-Dissolve Detection using Characteristics of Neighboring Scenes)

  • 원종운;최재각;박철현;김범수;곽동민;오상근;박길흠
    • 한국정보과학회논문지:정보통신
    • /
    • 제30권4호
    • /
    • pp.504-512
    • /
    • 2003
  • 본 논문에서는 디졸브 모델링 오차를 이용한 디졸브 검출 방법을 제안한다. 디졸브 모델링 오차는 디졸브 구간을 구성하는 두 장면 사이에 상관성이 없는 이상적인 디졸브 모델과 상관성이 존재하는 실제 디졸브 사이의 차이로 정의된다. 제안된 방법은 두 단계로 구성된다. 첫 번째 단계에서는 분산 곡선에서 나타나는 디졸브 구간의 특성인 아래로 볼록한 포물선을 검출하여 디졸브 후보 구간을 설정한다. 두 번째 단계에서는 선택된 후보 구간 자각에 대해 디졸브 모델링 오차를 정의하고 모델링 오차가 기준치와 비교한다. 기준치는 목표 모델링 오차로 각 후보 구간의 분산과 사용자에 의해 주어지는 목표 상관성에 대한 함수로 표현됨으로 제안된 기준치, 목표 모델링 오차는 각 후보 구간의 분산 변화에 적응적이다. 제안한 디졸브 검출 방법은 디졸브 구간을 구성하는 두 장면의 상관성을 고려하므로, 의미론적 디졸브 검출 방법이 될 수 있다. 제안된 방법을 다양한 동영상에 적용하여 성능을 평가하였다. 실험 결과 제안한 방법이 다양한 분산의 변화에도 불구하고 기존의 방법보다 정확하고 신뢰성 높은 디졸브 검출 결과를 나타내었다.

Salient Object Detection Based on Regional Contrast and Relative Spatial Compactness

  • Xu, Dan;Tang, Zhenmin;Xu, Wei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제7권11호
    • /
    • pp.2737-2753
    • /
    • 2013
  • In this study, we propose a novel salient object detection strategy based on regional contrast and relative spatial compactness. Our algorithm consists of four basic steps. First, we learn color names offline using the probabilistic latent semantic analysis (PLSA) model to find the mapping between basic color names and pixel values. The color names can be used for image segmentation and region description. Second, image pixels are assigned to special color names according to their values, forming different color clusters. The saliency measure for every cluster is evaluated by its spatial compactness relative to other clusters rather than by the intra variance of the cluster alone. Third, every cluster is divided into local regions that are described with color name descriptors. The regional contrast is evaluated by computing the color distance between different regions in the entire image. Last, the final saliency map is constructed by incorporating the color cluster's spatial compactness measure and the corresponding regional contrast. Experiments show that our algorithm outperforms several existing salient object detection methods with higher precision and better recall rates when evaluated using public datasets.

A Study of Efficiency Information Filtering System using One-Hot Long Short-Term Memory

  • Kim, Hee sook;Lee, Min Hi
    • International Journal of Advanced Culture Technology
    • /
    • 제5권1호
    • /
    • pp.83-89
    • /
    • 2017
  • In this paper, we propose an extended method of one-hot Long Short-Term Memory (LSTM) and evaluate the performance on spam filtering task. Most of traditional methods proposed for spam filtering task use word occurrences to represent spam or non-spam messages and all syntactic and semantic information are ignored. Major issue appears when both spam and non-spam messages share many common words and noise words. Therefore, it becomes challenging to the system to filter correct labels between spam and non-spam. Unlike previous studies on information filtering task, instead of using only word occurrence and word context as in probabilistic models, we apply a neural network-based approach to train the system filter for a better performance. In addition to one-hot representation, using term weight with attention mechanism allows classifier to focus on potential words which most likely appear in spam and non-spam collection. As a result, we obtained some improvement over the performances of the previous methods. We find out using region embedding and pooling features on the top of LSTM along with attention mechanism allows system to explore a better document representation for filtering task in general.

의미 구역에 기반한 관련 웹 페이지 요약 기법 (Summarizing relevant web pages based on semantic region)

  • 이시은;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.597-599
    • /
    • 2003
  • 웹 상의 정보는 여러 페이지들에 걸쳐 표현되고 있으나 대부분의 웹 브라우저는 웹 페이지 단위로 정보를 다루고 있기 때문에 사용자는 원하는 정보를 얻기 위해 여러 웹 페이지들을 방문해야 한다. 본 논문에서는 사용자의 요구에 부합되는 정보를 검색해 여러 페이지 상에 흩어져 있는 정보들에 대해 쉽게 이해할 수 있도록 컬렉션 페이지를 제공한다. 컬렉션 페이지는 검색된 웹 페이지들의 링크 관계를 제공하여 페이지들 사이에서의 정보의 구성을 알 수 있게 하고, 관련도 높은 페이지들의 주요 내용을 미리 가져와 보여 줌으로써 정보에 대한 접근성을 높인다. 이를 위해 페이지 안에서 시각적으로 구분되는 동일한 주제의 정보를 담은 블록을 의미 구역으로 정의하고 웹 페이지를 실제 정보의 단위인 의미 구역으로 나누었다. 또한 의미 구역단위의 검색으로 여러 주제의 정보를 담고 있는 웹 페이지에 대한 검색 결과의 정확성을 높인다.

  • PDF

Siamese Network for Learning Robust Feature of Hippocampi

  • Ahmed, Samsuddin;Jung, Ho Yub
    • 스마트미디어저널
    • /
    • 제9권3호
    • /
    • pp.9-17
    • /
    • 2020
  • Hippocampus is a complex brain structure embedded deep into the temporal lobe. Studies have shown that this structure gets affected by neurological and psychiatric disorders and it is a significant landmark for diagnosing neurodegenerative diseases. Hippocampus features play very significant roles in region-of-interest based analysis for disease diagnosis and prognosis. In this study, we have attempted to learn the embeddings of this important biomarker. As conventional metric learning methods for feature embedding is known to lacking in capturing semantic similarity among the data under study, we have trained deep Siamese convolutional neural network for learning metric of the hippocampus. We have exploited Gwangju Alzheimer's and Related Dementia cohort data set in our study. The input to the network was pairs of three-view patches (TVPs) of size 32 × 32 × 3. The positive samples were taken from the vicinity of a specified landmark for the hippocampus and negative samples were taken from random locations of the brain excluding hippocampi regions. We have achieved 98.72% accuracy in verifying hippocampus TVPs.

이미지 주석 시스템을 위한 의미 정보 모델링 (Semantic Information Modeling for Image Annotation System)

  • 최준호;곽효승;김원필;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.787-790
    • /
    • 2002
  • 의미 기반 영상 검색은 Color, Texture, Region 정보, Spatial Color Distribution등의 저차원 특징 정보와 이미지 데이터에 의미를 부여하기 위해 주서 처리하는 것이 일반적이다. 그리고 부여된 키워드나 시소러스와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 이에 본 논문에서는 시각 데이터에 존재하는 객체들과 그 객체 사이의 개념관계를 Ontology의 한 형태인 WordNet을 이용하여 의미 정보로 표현할 수 있도록 한다. 이를 활용하면 영상 데이터의 자동 주석 시스템이나 검색 시스템에서 인간이 인식하는 개념적인 사고방식에 더욱 접근할 수 있는 결과물을 얻을 수 있을 것이다.

  • PDF

언어적 측면에서 고찰한 도서관의 커뮤니케이션에 관한 연구 -의미전달을 중심으로-

  • 손연옥
    • 한국도서관정보학회지
    • /
    • 제8권
    • /
    • pp.69-96
    • /
    • 1981
  • We all know that we can not keep a proper social life without language. Yet language is so much a part of our environment that we hardly realize it is there. The purpose of this study is to provide an understanding of the linguistical aspect of communication process in order to carry out a successful human relations in the operation of libraries. Human development rests upon man's capacity to digest large quantities of knowledge and it is language which allows facts to be communicated, stored, and disseminated. An attempt was made in this study to illustrate the elementary meaning-of-words aspect of communication. In order to share the most commonly agreed meanings in interpersonal communication, a careful study of semantic noises is important. In a constant struggle to meet client needs, staff and administrators, librarian must understand communication dialogues, their messages and be able to read all level of meanings. In order to perform a successful function of the librarian, to act as a link-man or communicator and to cope with its ever growing information, it is suggested that the deep understanding of the following linguistical aspect of communication elements is essential. 1. Characteristics of Language: (1) Words have different meanings to different people. (2) Words vary in the degree of abstraction. (3) Language is incomplete by its nature. (4) Language reflects not only the personality of the individual but also the culture of man's society. 2. Noises in transmitting meanings: (1) Mechanical or Technical noises. (2) Semantic Noises (3) Noises caused by the psychological factors a. attention b. perception, sensation, cognition and perceptual field. 3. Linguistic Stratum Languages differ considerably in vocabulary by the physical and cultural environment setting as well as situation of individual living. There are seven different language stratum which reflects different region, sex, age, profession, special social stratum, academic and tabooed words.

  • PDF

감성공학을 이용한 국산 승용차 이미지 분석 (Image Analysis of Korean Automobiles Using Sensory Engineering)

  • 이진춘;홍성일
    • 한국산업정보학회논문지
    • /
    • 제11권2호
    • /
    • pp.69-78
    • /
    • 2006
  • 본 연구는 감성공학을 이용하여 승용차의 이미지분석을 하는데 관련된다. 본 연구에서는 감성공학적 접근법으로 제품의 이미지를 표현하는 적합한 형용사 조합을 도출한 다음 의미변별법을 이용하여 감성평가를 실시하고 그 결과를 요인분석법으로 처리하여 형용사 조합을 소수의 요인으로 축약한다. 다음으로 소수의 요인을 축으로 하여 이미지 공간을 구축하고 공간 내에서 개별 제품의 이미지 위치를 파악하는 것이다. 본 연구에서는 국산 승용차 12개 모형에 대해서 감성공학적 접근법으로 이미지 평가실험을 하였는데, 감성평가에는 127명의 패널이 참가하였으며 14개 형용사 조합에 대해서 요인분석으로 이미지 공간을 구성하는 2개의 축, 즉, 요인을 도출하고 이미지공간에서의 개별 제품의 위치를 파악하였다. 그 결과 대체로 자동차 3사가 목표하는 이미지를 달성하고 있음이 나타났다.

  • PDF

A Study on the Land Cover Classification and Cross Validation of AI-based Aerial Photograph

  • Lee, Seong-Hyeok;Myeong, Soojeong;Yoon, Donghyeon;Lee, Moung-Jin
    • 대한원격탐사학회지
    • /
    • 제38권4호
    • /
    • pp.395-409
    • /
    • 2022
  • The purpose of this study is to evaluate the classification performance and applicability when land cover datasets constructed for AI training are cross validation to other areas. For study areas, Gyeongsang-do and Jeolla-do in South Korea were selected as cross validation areas, and training datasets were obtained from AI-Hub. The obtained datasets were applied to the U-Net algorithm, a semantic segmentation algorithm, for each region, and the accuracy was evaluated by applying them to the same and other test areas. There was a difference of about 13-15% in overall classification accuracy between the same and other areas. For rice field, fields and buildings, higher accuracy was shown in the Jeolla-do test areas. For roads, higher accuracy was shown in the Gyeongsang-do test areas. In terms of the difference in accuracy by weight, the result of applying the weights of Gyeongsang-do showed high accuracy for forests, while that of applying the weights of Jeolla-do showed high accuracy for dry fields. The result of land cover classification, it was found that there is a difference in classification performance of existing datasets depending on area. When constructing land cover map for AI training, it is expected that higher quality datasets can be constructed by reflecting the characteristics of various areas. This study is highly scalable from two perspectives. First, it is to apply satellite images to AI study and to the field of land cover. Second, it is expanded based on satellite images and it is possible to use a large scale area and difficult to access.