• 제목/요약/키워드: 의미적 분할

검색결과 876건 처리시간 0.031초

영역 분할 정보를 이용한 고속 움직임 추정 부호화 및 의미 영역 인식 (Fast motion estimation coding and semantic region recognition using segmented region information)

  • 이봉호;서정구;곽노윤;강태하;황병원
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 하계종합학술대회논문집
    • /
    • pp.665-668
    • /
    • 1998
  • 본 논문에서는 초저속 동영상 부호화에 관한 것으로, 움직임 추정 효율을 개선하기 위해 분할된 영역별로 움직임 정보를 추정하여 부호화를 수행할 뿐만 아니라 분할된 영역중 의미있는 부분을 선택적으로 부호화할 수 있는 영역분할 기반 영상부호화 기법에 관한 것이다. 첫째로, 움직임 추정은 분할된 영역 정보를 이용한 가변 탐색 영역 설정을 통해 전역 탐색 움직임 추정시 소모되는 많은 연산량을 줄이고, 둘째로, 움직임 추정 후 추정된 움직임 정보를 이용해 영역의 재분할 과정을 통해 분할된 영역별로 움직임 정보를 부호화 함으로써 개선된 부호화 효율을 보이며, 셋째로, 분할된 영역 중 얼굴과 같은 의미를 갖는 영역을 선택적으로 부호화하고 전송하기 위한 인식 기법을 제안하고자 한다.

  • PDF

조건부 랜덤 필드와 컨볼루션 신경망을 이용한 의미론적인 객체 분할 방법 (Semantic Segmentation using Convolutional Neural Network with Conditional Random Field)

  • 임수창;김도연
    • 한국전자통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.451-456
    • /
    • 2017
  • 컴퓨터비전에서 가장 기본적이고, 복잡한 문제를 수반하는 의미론적 분할(Semantic segmentation)은 이미지의 각 픽셀을 특정 객체로 분류하며, 레이블(label)을 지정하는 작업을 수행한다. 기존에 연구되어온 확률적 그래프 모델인 MRF와 CRF는 픽셀 수준의 라벨링 작업의 정확도를 높이는 효과적인 방법으로 연구되어왔다. 본 논문에서는 최근 각광받고 있는 딥러닝의 한 부류인 CNN과 확률 모델인 CRF를 결합한 형태의 의미론적 분할 방법을 제안하였다. 학습과 성능 검증을 위하여 Pascal VOC 2012 이미지 데이터베이스를 사용하였고, 학습에 사용되지 않은 임의의 이미지를 이용하여 테스트를 진행 하였다. 연구의 결과로서 기존 의미론적 분할 알고리즘보다 더욱 뛰어난 분할 성능을 보여주었다.

볼록 헐을 이용한 필기 한글 패턴의 모양 분해 (A Shape Decomposition of Handwritten Hangul Patterns Using Convex Hull)

  • 박정선;오일석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.440-442
    • /
    • 2000
  • 필기 한글 문자 인식을 위해서는 패턴을 구성하는 획 성분을 분석하는 작업이 필수적이다. 획 성분 추출을 위해 사용한 세선화 방법은 입력 영상을 왜곡하는 단점을 가지고 있다. 이를 극복하기 위하여 본 논문은 입력 영상을 왜곡하지 않고 의미 있는 부품 단위로 분할하는 방법을 제안한다. 의미 있는 부품이란 유사 볼록하게 분할된 영역을 의미한다. 분할 방법은 먼저 입력 영상에 볼록 헐 연산을 적용하여 오목 영역을 생성한다. 이 오목 영역에서 분할 기준(anchor point)점을 탐지하고 획의 반대편 외곽선 상에서 분할 끝(terminal point)점을 찾아 분할 경로를 구성하여 획을 분할한다. 모든 부품이 유사 볼록 조건을 만족할 때까지 위 과정을 반복 수행한다. 제안한 방법은 두 개의 파라미터만을 가지며 간단한 프로시져로 구성되어 있다. 또한 필기 한글 패턴뿐 아니라 여러 언어에 적용 가능하다는 장점을 갖는다.

  • PDF

Deformable Convolution 기반 어텐션 모듈을 사용한 의미론적 분할 모델 설계 (Design of a Semantic Segmentation Model Usingan Attention Module Based on Deformable Convolution)

  • 김진성;정세훈;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.11-13
    • /
    • 2023
  • 의미론적 분할(Semantic Segmentation)은 이미지 내의 객체 및 배경을 픽셀 단위로 분류하는 작업으로 정밀한 탐지가 요구되는 분야에서 활발히 연구되고 있다. 기존 어텐션 기법은 의미론적 분할의 다운샘플링(Downsampling) 과정에서 발생하는 정보손실을 완화하기 위해 널리 사용됐지만 고정된 Convolution 필터의 형태 때문에 객체의 형태에 따라 유동적으로 대응하지 못했다. 본 논문에서는 이를 보완하고자 Deformable Convolution과 셀프어텐션(Self-attention) 구조기반 어텐션 모듈을 사용한 의미론적 분할 모델을 제안한다.

효율적인 데이터 관리를 위한 내용기반 뉴스 비디오 검색 시스템 구현 (Implementation of Content-based News Video Retrieval System for Efficient Video Data Management)

  • 남윤성;양동일;배종식;최형진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 추계학술발표대회 및 정기총회
    • /
    • pp.755-758
    • /
    • 2005
  • 뉴스 데이터를 구조적으로 분할하고 의미적으로 분류하여 내용별로 세분화하여 검색하는 방법을 제안한다. 구조적 분할은 공간 밝기 분포와 명암도의 불연속성 그리고 시간적인 관계 등 프레임간의 상관 정보를 이용하여 장면을 분할한다. 의미적 분류는 키 프레임에서 추출된 특징 정보를 사전 지식 정보와 비교하여 뉴스 비디오의 세부 내용을 기사별로 분류한다. 뉴스의 진행이 앵커 프레임을 중심으로 주기적으로 반복된다는 특징을 이용하여 앵커 장면과 비 앵커 장면으로 기사를 분류한다. 비 앵커 장면은 연설장면, 인터뷰장면, 일반 장면으로 세분화하고 기사별로 분류하여 검색하도록 한다. 또한 뉴스 아이콘에 의한 요약 검색 기능 그리고 자막 통합 처리에 의한 자막 검색을 하여 뉴스 비디오를 내용별로 분류하고 인덱싱하여 신속하게 뉴스 비디오를 검색할 수 있도록 설계한다.

  • PDF

3D 얼굴 모델 자동 분할 기술 (Automatic 3D Face Segmentation)

  • 임성재;황본우;윤승욱;전혜령;박창준;최진성
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1448-1450
    • /
    • 2015
  • 본 논문은 3D 스캐너 및 센서 등으로 캡처되어 3D로 복원된 얼굴 객체의 부위별 의미 있는 영역에 대한 분할을 자동으로 수행하는 기술을 제안한다. 3D 스캔된 얼굴 모델을 모델링, 애니메이션, 3D 프린팅 등의 다양한 응용분야에 활용하기 위해서는 스캔된 영역의 의미 있는 부위별 인식이 필수적이다. 본 논문에서는 부위별 의미 있는 영역 레이블링이 된 템플릿 모델을 입력된 3D 복원 모델로 전이하여 복원된 3D 모델의 부위별 의미 있는 영역을 자동으로 분할하고 분할된 영역의 일관성을 유지하는 알고리즘을 제안한다.

의미론적 영상 분할의 정확도 향상을 위한 에지 정보 기반 후처리 방법 (Post-processing Algorithm Based on Edge Information to Improve the Accuracy of Semantic Image Segmentation)

  • 김정환;김선혁;김주희;최형일
    • 한국콘텐츠학회논문지
    • /
    • 제21권3호
    • /
    • pp.23-32
    • /
    • 2021
  • 컴퓨터 비전 분야의 의미론적 영상 분할(Semantic Image Segmentation) 기술은 이미지를 픽셀 단위로 분할 하여 클래스를 나누는 기술이다. 이 기술도 기계 학습을 이용한 방법으로 성능이 빠르게 향상되는 중이며, 픽셀 단위의 정보를 활용할 수 있는 높은 활용성이 주목받는 기술이다. 그러나 이 기술은 초기부터 최근까지도 계속 '세밀하지 못한 분할'에 대한 문제가 제기되어 왔다. 이 문제는 레이블 맵의 크기를 계속 늘리면서 발생한 문제이기 때문에, 자세한 에지 정보가 있는 원본 영상의 에지 맵을 이용해 레이블 맵을 수정하여 개선할 수 있을 것으로 예상할 수 있었다. 따라서 본 논문은 기존 방법대로 학습 기반의 의미론적 영상 분할을 유지하되, 그 결과인 레이블 맵을 원본 영상의 에지 맵 기반으로 수정하는 후처리 알고리즘을 제안한다. 기존의 방법에 알고리즘의 적용 한 뒤 전후의 정확도를 비교했을 때 평균적으로 약 1.74% 픽셀 정확도와 1.35%의 IoU(Intersection of Union) 정확도가 향상되었으며, 결과를 분석했을 때 성공적으로 본래 목표한 세밀한 분할 기능을 개선했음을 보였다.

옴니버스 형태의 동영상에서 태깅아이콘을 이용한 에피소스 분할 방법 (The Method of Episode Segmentation using Tagging-Icon on Video of Omnibus Type)

  • 주성일;최형일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2010년도 제42차 하계학술발표논문집 18권2호
    • /
    • pp.117-119
    • /
    • 2010
  • 본 논문에서는 옴니버스 형태의 동영상을 각 프로그램 별로 자동 분할하는 방법에 대해 제안하고자 한다. 국내 TV 프로그램의 경우 대부분의 개그 프로그램에서는 코너 별로 상단 또는 하단의 일정 위치에 코너명을 캡션으로 삽입하여 옴니버스 형태의 영상을 서비스한다. 이러한 코너명을 태깅아이콘으로 하여 지속되는 구간을 검출하여 시작시점과 종료시점을 검출함으로써 동영상을 의미적으로 분할 할 수 있다. 하지만 태깅아이콘의 경우 매우 높은 투명도를 갖는 경우가 많으므로 본 연구에서는 에지와 시간적인 지속성을 이용하여 에피소드를 분할하는 방법을 제안하고, 옴니버스 형태의 다양한 개그 프로그램에 대해 실험하여 제안한 방법의 우수성을 보인다.

  • PDF

내용기반 검색을 위한 자연 영상의 칼라양자화 방법 (Color Quantization of Natural Images for Content-Based Retrieval)

  • 길연희;김성영;박창민;김민환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.266-270
    • /
    • 2000
  • 내용기반 영상검색시스템에서 객체 단위로 영상을 검색하기 위해서는 영상에서 의미있는 객체를 추출하는 과정이 필수적이며, 이를 위해 영역 분할을 효율적으로 수행하기 위한 양자화가 선행되어야 한다. 일반적인 칼라 양자화 기법은 칼라 수를 줄이되 양자화 된 영상이 원시 영상과 가능할 비슷해 보이도록 하는 것을 목적으로 하지만, 영역 분할을 위한 칼라 양자화에서는 칼라의 표현보나는 의미있는 객체를 용이하게 추출할 수 있도록 양자화 하는 것을 목적으로 한다. 본 논문에서는 기존의 Octree 양자화 방법과 K-means 알고리즘의 장점을 조합하여 영역 분할에 용이한 양자화 결과를 얻을 수 있는 방법을 제안한다. 먼저, Octree 양자화 방법을 수행하여 얻어진 양자화 된 칼라들 중에서 시각적으로 유사한 칼라를 병합함으로써, Octree 양자화 방법의 단점인 강제 분할 문제점을 해결한다. 이어서, 병합 후의 양자화 된 칼라에 대해서만 K-means 알고리즘을 수행함으로써, 보다 빠른 시간 내에 영역 분할에 적합한 양자화 된 영상을 얻는다. 실험을 통해 제안한 방법의 효용성을 확인하였다.

  • PDF

삼각분할된 3차원 실내공간데이터를 OGC IndoorGML로 변환하는 방법 (Converting Triangulated 3D Indoor Mesh Data to OGC IndooGML)

  • 이기준;김동민
    • 한국측량학회지
    • /
    • 제36권6호
    • /
    • pp.499-505
    • /
    • 2018
  • 지금까지 만들어지고 있는 실내공간데이터는 공간적 활용을 위한 데이터라고 하기 보다는 삼각분할로 표현된 3DS나 COLLADA 형식의 가시화 데이터이다. 의미 있는 공간분석이나 실내응용서비스를 개발하기 위하여서는 단순히 삼각분할로 만들어진 가시화데이터가 아니라 의미적 공간정보가 필요하다. OGC (Open Geospatial Consortium) 표준인 IndoorGML(Indoor Geographic Markup Language)은 가시화가 아니라 실내공간 분석을 비롯한 다양한 응용을 위하여 만들어진 공간데이터 형식이다. 따라서 삼각분할로 표현된 3DS나 COLLADA형식의 실내 공간데이터를 OGC IndoorGML 형식으로 변환하는 것은 중요한 작업이 된다. 본 논문에서는 이 문제를 해결하기 위하여, 삼각분할 형식으로 표현된 원시 실내 공간데이터를 기하, 위상, 그리고 의미적으로 유용한 IndoorGML로 변환하는 방법을 제시한다. 또한 이 변환 방법의 타당성을 위하여 개발된 도구도 함께 소개한다. 실제 데이터를 통한 실험을 통하여 이 방법과 개발된 도구를 검증하였다.