• Title/Summary/Keyword: 의미적 분할

Search Result 876, Processing Time 0.035 seconds

Fast motion estimation coding and semantic region recognition using segmented region information (영역 분할 정보를 이용한 고속 움직임 추정 부호화 및 의미 영역 인식)

  • 이봉호;서정구;곽노윤;강태하;황병원
    • Proceedings of the IEEK Conference
    • /
    • 1998.06a
    • /
    • pp.665-668
    • /
    • 1998
  • 본 논문에서는 초저속 동영상 부호화에 관한 것으로, 움직임 추정 효율을 개선하기 위해 분할된 영역별로 움직임 정보를 추정하여 부호화를 수행할 뿐만 아니라 분할된 영역중 의미있는 부분을 선택적으로 부호화할 수 있는 영역분할 기반 영상부호화 기법에 관한 것이다. 첫째로, 움직임 추정은 분할된 영역 정보를 이용한 가변 탐색 영역 설정을 통해 전역 탐색 움직임 추정시 소모되는 많은 연산량을 줄이고, 둘째로, 움직임 추정 후 추정된 움직임 정보를 이용해 영역의 재분할 과정을 통해 분할된 영역별로 움직임 정보를 부호화 함으로써 개선된 부호화 효율을 보이며, 셋째로, 분할된 영역 중 얼굴과 같은 의미를 갖는 영역을 선택적으로 부호화하고 전송하기 위한 인식 기법을 제안하고자 한다.

  • PDF

Semantic Segmentation using Convolutional Neural Network with Conditional Random Field (조건부 랜덤 필드와 컨볼루션 신경망을 이용한 의미론적인 객체 분할 방법)

  • Lim, Su-Chang;Kim, Do-Yeon
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.12 no.3
    • /
    • pp.451-456
    • /
    • 2017
  • Semantic segmentation, which is the most basic and complicated problem in computer vision, classifies each pixel of an image into a specific object and performs a task of specifying a label. MRF and CRF, which have been studied in the past, have been studied as effective methods for improving the accuracy of pixel level labeling. In this paper, we propose a semantic partitioning method that combines CNN, a kind of deep running, which is in the spotlight recently, and CRF, a probabilistic model. For learning and performance verification, Pascal VOC 2012 image database was used and the test was performed using arbitrary images not used for learning. As a result of the study, we showed better partitioning performance than existing semantic partitioning algorithm.

A Shape Decomposition of Handwritten Hangul Patterns Using Convex Hull (볼록 헐을 이용한 필기 한글 패턴의 모양 분해)

  • 박정선;오일석
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.440-442
    • /
    • 2000
  • 필기 한글 문자 인식을 위해서는 패턴을 구성하는 획 성분을 분석하는 작업이 필수적이다. 획 성분 추출을 위해 사용한 세선화 방법은 입력 영상을 왜곡하는 단점을 가지고 있다. 이를 극복하기 위하여 본 논문은 입력 영상을 왜곡하지 않고 의미 있는 부품 단위로 분할하는 방법을 제안한다. 의미 있는 부품이란 유사 볼록하게 분할된 영역을 의미한다. 분할 방법은 먼저 입력 영상에 볼록 헐 연산을 적용하여 오목 영역을 생성한다. 이 오목 영역에서 분할 기준(anchor point)점을 탐지하고 획의 반대편 외곽선 상에서 분할 끝(terminal point)점을 찾아 분할 경로를 구성하여 획을 분할한다. 모든 부품이 유사 볼록 조건을 만족할 때까지 위 과정을 반복 수행한다. 제안한 방법은 두 개의 파라미터만을 가지며 간단한 프로시져로 구성되어 있다. 또한 필기 한글 패턴뿐 아니라 여러 언어에 적용 가능하다는 장점을 갖는다.

  • PDF

Design of a Semantic Segmentation Model Usingan Attention Module Based on Deformable Convolution (Deformable Convolution 기반 어텐션 모듈을 사용한 의미론적 분할 모델 설계)

  • Jin-Seong Kim;Se-Hoon Jung;Chun-Bo Sim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.11-13
    • /
    • 2023
  • 의미론적 분할(Semantic Segmentation)은 이미지 내의 객체 및 배경을 픽셀 단위로 분류하는 작업으로 정밀한 탐지가 요구되는 분야에서 활발히 연구되고 있다. 기존 어텐션 기법은 의미론적 분할의 다운샘플링(Downsampling) 과정에서 발생하는 정보손실을 완화하기 위해 널리 사용됐지만 고정된 Convolution 필터의 형태 때문에 객체의 형태에 따라 유동적으로 대응하지 못했다. 본 논문에서는 이를 보완하고자 Deformable Convolution과 셀프어텐션(Self-attention) 구조기반 어텐션 모듈을 사용한 의미론적 분할 모델을 제안한다.

Implementation of Content-based News Video Retrieval System for Efficient Video Data Management (효율적인 데이터 관리를 위한 내용기반 뉴스 비디오 검색 시스템 구현)

  • Nam, Yun-Seong;Yang, Dong-Il;Bae, Jong-Sik;Choi, Hyung-Jin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2005.11a
    • /
    • pp.755-758
    • /
    • 2005
  • 뉴스 데이터를 구조적으로 분할하고 의미적으로 분류하여 내용별로 세분화하여 검색하는 방법을 제안한다. 구조적 분할은 공간 밝기 분포와 명암도의 불연속성 그리고 시간적인 관계 등 프레임간의 상관 정보를 이용하여 장면을 분할한다. 의미적 분류는 키 프레임에서 추출된 특징 정보를 사전 지식 정보와 비교하여 뉴스 비디오의 세부 내용을 기사별로 분류한다. 뉴스의 진행이 앵커 프레임을 중심으로 주기적으로 반복된다는 특징을 이용하여 앵커 장면과 비 앵커 장면으로 기사를 분류한다. 비 앵커 장면은 연설장면, 인터뷰장면, 일반 장면으로 세분화하고 기사별로 분류하여 검색하도록 한다. 또한 뉴스 아이콘에 의한 요약 검색 기능 그리고 자막 통합 처리에 의한 자막 검색을 하여 뉴스 비디오를 내용별로 분류하고 인덱싱하여 신속하게 뉴스 비디오를 검색할 수 있도록 설계한다.

  • PDF

Automatic 3D Face Segmentation (3D 얼굴 모델 자동 분할 기술)

  • Lim, Seong-Jae;Hwang, Bon-Woo;Yoon, Seung-Uk;Jun, Hye-Ryeong;Park, Chang-Joon;Choi, Jin-Sung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1448-1450
    • /
    • 2015
  • 본 논문은 3D 스캐너 및 센서 등으로 캡처되어 3D로 복원된 얼굴 객체의 부위별 의미 있는 영역에 대한 분할을 자동으로 수행하는 기술을 제안한다. 3D 스캔된 얼굴 모델을 모델링, 애니메이션, 3D 프린팅 등의 다양한 응용분야에 활용하기 위해서는 스캔된 영역의 의미 있는 부위별 인식이 필수적이다. 본 논문에서는 부위별 의미 있는 영역 레이블링이 된 템플릿 모델을 입력된 3D 복원 모델로 전이하여 복원된 3D 모델의 부위별 의미 있는 영역을 자동으로 분할하고 분할된 영역의 일관성을 유지하는 알고리즘을 제안한다.

Post-processing Algorithm Based on Edge Information to Improve the Accuracy of Semantic Image Segmentation (의미론적 영상 분할의 정확도 향상을 위한 에지 정보 기반 후처리 방법)

  • Kim, Jung-Hwan;Kim, Seon-Hyeok;Kim, Joo-heui;Choi, Hyung-Il
    • The Journal of the Korea Contents Association
    • /
    • v.21 no.3
    • /
    • pp.23-32
    • /
    • 2021
  • Semantic image segmentation technology in the field of computer vision is a technology that classifies an image by dividing it into pixels. This technique is also rapidly improving performance using a machine learning method, and a high possibility of utilizing information in units of pixels is drawing attention. However, this technology has been raised from the early days until recently for 'lack of detailed segmentation' problem. Since this problem was caused by increasing the size of the label map, it was expected that the label map could be improved by using the edge map of the original image with detailed edge information. Therefore, in this paper, we propose a post-processing algorithm that maintains semantic image segmentation based on learning, but modifies the resulting label map based on the edge map of the original image. After applying the algorithm to the existing method, when comparing similar applications before and after, approximately 1.74% pixels and 1.35% IoU (Intersection of Union) were applied, and when analyzing the results, the precise targeting fine segmentation function was improved.

The Method of Episode Segmentation using Tagging-Icon on Video of Omnibus Type (옴니버스 형태의 동영상에서 태깅아이콘을 이용한 에피소스 분할 방법)

  • Joo, Sung-Il;Choi, Hyung-Il
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2010.07a
    • /
    • pp.117-119
    • /
    • 2010
  • 본 논문에서는 옴니버스 형태의 동영상을 각 프로그램 별로 자동 분할하는 방법에 대해 제안하고자 한다. 국내 TV 프로그램의 경우 대부분의 개그 프로그램에서는 코너 별로 상단 또는 하단의 일정 위치에 코너명을 캡션으로 삽입하여 옴니버스 형태의 영상을 서비스한다. 이러한 코너명을 태깅아이콘으로 하여 지속되는 구간을 검출하여 시작시점과 종료시점을 검출함으로써 동영상을 의미적으로 분할 할 수 있다. 하지만 태깅아이콘의 경우 매우 높은 투명도를 갖는 경우가 많으므로 본 연구에서는 에지와 시간적인 지속성을 이용하여 에피소드를 분할하는 방법을 제안하고, 옴니버스 형태의 다양한 개그 프로그램에 대해 실험하여 제안한 방법의 우수성을 보인다.

  • PDF

Color Quantization of Natural Images for Content-Based Retrieval (내용기반 검색을 위한 자연 영상의 칼라양자화 방법)

  • 길연희;김성영;박창민;김민환
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2000.11a
    • /
    • pp.266-270
    • /
    • 2000
  • 내용기반 영상검색시스템에서 객체 단위로 영상을 검색하기 위해서는 영상에서 의미있는 객체를 추출하는 과정이 필수적이며, 이를 위해 영역 분할을 효율적으로 수행하기 위한 양자화가 선행되어야 한다. 일반적인 칼라 양자화 기법은 칼라 수를 줄이되 양자화 된 영상이 원시 영상과 가능할 비슷해 보이도록 하는 것을 목적으로 하지만, 영역 분할을 위한 칼라 양자화에서는 칼라의 표현보나는 의미있는 객체를 용이하게 추출할 수 있도록 양자화 하는 것을 목적으로 한다. 본 논문에서는 기존의 Octree 양자화 방법과 K-means 알고리즘의 장점을 조합하여 영역 분할에 용이한 양자화 결과를 얻을 수 있는 방법을 제안한다. 먼저, Octree 양자화 방법을 수행하여 얻어진 양자화 된 칼라들 중에서 시각적으로 유사한 칼라를 병합함으로써, Octree 양자화 방법의 단점인 강제 분할 문제점을 해결한다. 이어서, 병합 후의 양자화 된 칼라에 대해서만 K-means 알고리즘을 수행함으로써, 보다 빠른 시간 내에 영역 분할에 적합한 양자화 된 영상을 얻는다. 실험을 통해 제안한 방법의 효용성을 확인하였다.

  • PDF

Converting Triangulated 3D Indoor Mesh Data to OGC IndooGML (삼각분할된 3차원 실내공간데이터를 OGC IndoorGML로 변환하는 방법)

  • Li, Ki-Joune;Kim, Dong Min
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.36 no.6
    • /
    • pp.499-505
    • /
    • 2018
  • Most of 3D indoor spatial data recently constructed by many projects merely focus on the visualization rather than geospatial information applications. The 3D indoor data for visualization in 3DS or COLLADA format are based on triangular mesh representation. In order to implement meaningful applications, we need however more meaningful information in 3D indoor spatial data than visualization data in triangular meshes. For this reason, an OGC (Open Geospatial Consortium) standard, called IndoorGML(Indoor Geographic Markup Language) was published to meet the requirements on 3D indoor spatial data for several geospatial applications for indoor space more than simple visualization. It means that it becomes a critical functional requirement to convert triangular mesh representation in 3DS or COLLADA to IndoorGML. In this paper we propose a framework of the conversion, which consists of geometric, topological, and semantic construction of data from triangular meshes. An experiment carried out to validate the proposed framework is also presented in the paper.