• 제목/요약/키워드: Candidate Image

검색결과 578건 처리시간 0.021초

계층화된 3차원 피부색 모델을 이용한 피부색 분할 (Skin Color Region Segmentation using classified 3D skin)

  • 박경미;윤가림;김영봉
    • 한국정보통신학회논문지
    • /
    • 제14권8호
    • /
    • pp.1809-1818
    • /
    • 2010
  • 피부색 영역의 검출을 위한 기존 연구들은 영상의 각 픽셀을 피부에 속하는 픽셀(피부픽셀)과 속하지 않는 픽셀(비피부픽셀)로 나누게 된다. 이때 정확한 피부색 영역을 검출하는 작업은 영상의 조명효과 및 화장에 의한 피부색 변형 등으로 매우 어려운 작업이다. 본 논문에서는 피부 영역 검출을 어렵게 하는 여러 가지 요인을 포함한 영상들로부터 효율적으로 피부영역을 검출하기 위해 계층화된 피부 모델과 컨텍스트 정보를 통합하여 피부 영역 검출의 성능을 향상시키는 방법을 제안한다. 먼저, 획득된 영상들로부터 뽑아낸 피부색 색깔 값들의 확률분포를 YCbCr칼라 공간에 만들고, 그 확률 값에 따라 피부(Skin), 피부후보(Skinness), 비피부(Non-skin)의 3계층으로 분류한 3차원 피부색 모델을 만든다. 계층화된 피부색 모델을 이용하여 각 픽셀의 피부색 여부를 결정하고, 피부후보(Skinness)색에 해당하는 경우에는 이웃 화소의 정보를 고려하여 피부색 또는 비 피부색으로 정하게 된다. 제안 방법의 사용으로 피부색이 왜곡 되었거나 피부색과 유사한 객체가 포함된 다양한 영상들에서도 효율적으로 피부 영역을 분할할 수 있었다.

CTR 예측을 위한 비전 트랜스포머 활용에 관한 연구 (A Study on Utilization of Vision Transformer for CTR Prediction)

  • 김태석;김석훈;임광혁
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.27-40
    • /
    • 2021
  • Click-Through Rate(CTR) 예측은 추천시스템에서 후보 항목의 순위를 결정하고 높은 순위의 항목들을 추천하여 고객의 정보 과부하를 줄임과 동시에 판매 촉진을 통한 수익 극대화를 달성할 수 있는 핵심 기능이다. 자연어 처리와 이미지 분류 분야는 심층신경망(deep neural network)의 활용을 통한 괄목한 성장을 하고 있다. 최근 이 분야의 주류를 이루던 모델과 차별화된 어텐션(attention) 메커니즘 기반의 트랜스포머(transformer) 모델이 제안되어 state-of-the-art를 달성하였다. 본 연구에서는 CTR 예측을 위한 트랜스포머 기반 모델의 성능 향상 방안을 제시한다. 자연어와 이미지 데이터와는 다른 이산적(discrete)이며 범주적(categorical)인 CTR 데이터 특성이 모델 성능에 미치는 영향력을 분석하기 위해 임베딩의 일반화(regularization)와 트랜스포머의 정규화(normalization)에 관한 실험을 수행한다. 실험 결과에 따르면, CTR 데이터 입력 처리를 위한 임베딩 과정에서 L2 일반화의 적용과 트랜스포머 모델의 기본 정규화 방법인 레이어 정규화 대신 배치 정규화를 적용할 때 예측 성능이 크게 향상됨을 확인하였다.

오인식률 감소를 위한 이동 물체 검출 및 추적 기법 (Moving Object Detection and Tracking Techniques for Error Reduction)

  • 황승준;고하윤;백중환
    • 한국항행학회논문지
    • /
    • 제22권1호
    • /
    • pp.20-26
    • /
    • 2018
  • 본 논문에서는 오인식률 감소를 위한 다중 프레임 특징점 추적 정보 기반 이동 물체 검출 및 추적 알고리즘을 제안한다. 기존의 연구에서는 이동 물체 탐지의 오인식과 추적의 속도 문제가 존재 하였다. 본 연구에서는 이를 보완하기 위해 먼저, 카메라 이동 보상과 물체의 추적을 위해 다중 프레임의 코너 특징점과 옵티컬 플로우를 계산한다. 다음으로 다중 프레임 전-후방향 추적으로 옵티컬 플로우의 추적 오류를 감소시키고, 카메라 이동 보상을 위해 호모그래피와 RANSAC 알고리즘 기반으로 추적된 코너 특징점을 배경영역과 이동 물체 후보 영역으로 구분한다. 변환된 코너 특징점들 중 RANSAC에 의해 제거되는 이상점들을 군집화하고 일정 크기 이상의 이상점 군집 영역을 이동 물체 후보군으로 구분한다. 이동 물체 후보군으로 구분된 물체는 라벨 추적 기반 데이터 상관 분석에 따라 라벨 번호를 할당하고 추적한다. 이동 물체 후보군으로 구분된 물체는 라벨 추적 기반 데이터 상관 분석에 따라 라벨 번호를 할당하고 추적한다. 본 논문에서는 제안한 알고리즘이 기존 알고리즘에 비해 Precision과 Recall 모두 향상됨을 쿼드로터 영상기반 탐지 및 추적 성능 실험으로 확인하였다.

VVC에서 360 비디오를 위한 랩-어라운드 움직임 벡터 예측 방법 (Wrap-around Motion Vector Prediction for 360 Video Streams in Versatile Video Coding)

  • 이민훈;이종석;박준택;임웅;방건;심동규;오승준
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.313-324
    • /
    • 2020
  • 본 논문에서는 360 비디오의 특성을 이용하여 픽쳐 경계에서 코딩 효율을 증가시키는 움직임 벡터 예측 방법을 제안한다. VVC의 화면간 예측에서 움직임 벡터 후보군을 구성할 때 주변 블록의 위치가 픽쳐의 경계 바깥이면 후보군 구성 과정에서 제외되어 픽쳐 경계에서 코딩 효율이 감소하게 된다. 이를 해결하기 위해 360 비디오의 부/복호화를 위한 투영 방법의 특성을 이용하여 이미 복호화된 정보로부터 픽쳐의 경계에서 추가로 후보군을 구성하는 방법을 제안한다. 제안하는 방법의 성능 평가를 위하여 JVET-360 CTC의 임의 접근 환경에서 VTM6.0 및 360Lib9.1와 비교한다. 그 결과로써 제안하는 방법은 추가 계산 복잡도 없이 휘도 성분에서 평균 0.02%, 색차 성분에서 각각 평균 0.05%, 0.06%의 비트율 감소를 보이고, 픽쳐의 경계에서는 비트율이 휘도 성분에서 평균 0.29%, 색차 성분에서 각각 평균 0.45%, 0.43% 감소하였다. 그리고 DSCQS (Double Stimulus Continuous Quality-Scale) 방법을 통해 제안하는 방법의 주관적 화질 평가를 수행하여 MOS (Mean Opinion Score)값을 얻는다. MOS값은 평균 0.03 향상되었고, MOS값과 비트량을 이용하여 BD-MOS를 구한다. 그 결과, 제안하는 방법의 성능이 최대 8.78%, 평균 5.18% 향상하였다.

피부 영역 분할과 신경 회로망에 기반한 칼라 영상에서 얼굴 검출 (Face Detection in Color Images Based on Skin Region Segmentation and Neural Network)

  • 이영숙;김영봉
    • 한국콘텐츠학회논문지
    • /
    • 제6권12호
    • /
    • pp.1-11
    • /
    • 2006
  • 많은 연구 데모용 프로그램들과 상업적 응용물들이 얼굴 검출과 얼굴 인식 시스템들을 개발하기 위해 시도되고 있다. 인간의 얼굴 검출은 접근 제어 및 비디오 감시 시스템, 휴먼 컴퓨터 인터페이스, 신원 인증 등과 같은 많은 응용 프로그램들에 중요한 역할을 한다. 일반적으로 스킨 영역 분할 후 배경과 연결된 얼굴, 스킨 칼라로 인한 연결된 얼굴들, 여러 개의 작은 부분들로 분할된 하나의 얼굴과 같은 몇 가지 특별한 문제점들이 있다. 많은 얼굴 검출 기법들이 첫 번째 와 두 번째 문제를 해결하도록 허락되어진다. 그러나 세 번째 문제에서 다른 조명 효과들로 인해서 여러 영역들로 분할된 하나의 얼굴이 검출되어지는 것은 쉽지가 않다. 그러므로 우리는 기존 영역 분할 알고리즘은 이용될 수 없기 때문에 이 문제를 해결하기 위해 효율적인 수정된 스킨 분할 알고리즘을 제안한다. 본 알고리즘은 전체 영상에 대해 피부 영역을 검출한 후 피부 분할 알고리즘을 사용하여 얼굴 후보 영역들을 생성한다. 각 얼굴 피부 후보 영역에 대해 그림자 등의 조명 효과로 인해 한 명의 얼굴이 여러 영역으로 분할되는 경우를 처리하기 위해 동차적 영역간의 인접성을 활용하여 하나의 큰 영역으로 만드는 병합 작업을 시도하였다. 다른 크기의 얼굴 검출을 위해 다양한 가변 크기의 탐색 윈도우와 선택된 각 얼굴 후보 영역에 얼굴이 존재하는지를 판단하기 위해 역전파 알고리즘에 기반한 얼굴 검출 분류기를 사용하였다.

  • PDF

고정 카메라에서의 시공간적 경계 정보를 이용한 이동 객체 윤곽선 검출 방법 (Moving Object Contour Detection Using Spatio-Temporal Edge with a Fixed Camera)

  • 곽재호;김회율
    • 방송공학회논문지
    • /
    • 제15권4호
    • /
    • pp.474-486
    • /
    • 2010
  • 본 논문에서는 시간적, 공간적 경계 정보를 이용한 이동 객체의 윤곽선 검출 방법을 제안한다. 일반적으로 이동 객체의 경우 객체의 윤곽선(contour)을 구성하는 경계(edge) 픽셀에서 시간 축과 공간 축을 중심으로 큰 변화량(gradient)을 가진다. 따라서 시간 축과 공간 축을 중심으로 변화량이 큰 경계 픽셀을 구하면 이동 객체의 윤곽선을 검출할 수 있다. 본 논문에서는 임의의 픽셀에 대하여 시간 축을 중심으로 한 경계 정보를 구하기 위해 Temporal Edge라는 새로운 형태의 변화량 계산 방법을 제안한다. Temporal Edge는 시간 t와, t-2에서 입력된 두 그레이 스케일 영상의 차를 시간 축을 기준으로 x방향, y방향으로 Sobel Mask를 적용하여 구한다. 검출된 Temporal Edge를 이용하여 이동 객체의 윤곽선이 존재하는 후보 영역을 검출하고, 검출된 후보 영역을 중심으로 공간적 경계 정보를 구하여 이동 객체의 대강의 윤곽선을 검출 한다. 후처리 과정에서 검출된 대강의 윤곽선으로부터 배경 경계와 노이즈 픽셀을 제거한 후 최종적으로 이동 객체의 윤곽선을 검출한다. 제안한 방법은 기존의 배경 차 방법과는 다르게 별도의 배경 영상을 만들지 않기 때문에 배경 차 방법이 가지는 문제점을 극복하였으며, 빠른 연산 속도로 실시간 적용이 가능하다. 실험을 통하여 야간에도 강인한 윤곽선을 검출할 수 있음을 확인하였고, 엔트로피 방법과의 비교를 통해 제안하는 방법의 우수성을 보였다.

우편물 자동구분기의 구분율 향상을 위한 문자인식기의 구현 방법 (An Implementation Method of the Character Recognizer for the Sorting Rate Improvement of an Automatic Postal Envelope Sorting Machine)

  • 임길택;정선화;장승익;김호연
    • 한국산업정보학회논문지
    • /
    • 제12권4호
    • /
    • pp.15-24
    • /
    • 2007
  • 우편물의 자동구분을 위해서는 주소영상의 인식이 필수적이다. 주소영상의 인식 과정은 주소영상 전처리, 문자인식, 주소해석의 과정으로 이루어져 있다. 주소영상 전처리 과정을 통해 추출된 문자영상들은 인식과정으로 전달되고 이 과정에서 각 문자영상마다 다수의 후보문자와 인식 스코어가 생성된다. 주소해석기는 후보문자와 인식 스코어의 집합을 이용하여 유효한 최종 주소를 생성한다. 우편물의 자동구분 율은 주소영상의 인식과정에 포함된 모든 과정의 성능에 따라 좌우되는데 특히 문자인식 성능이 중요한 요인이다. 주소인식에서 좋은 문자인식기란 주소해석이 용이할 수 있도록 신뢰도 높은 후보문자를 생성하는 것이라 할 수 있다. 본 논문에서는 문자인식기에서 신뢰도 높은 후보문자를 생성하는 방법을 제안한다. 논문에서는 현행 우편물 자동구분기의 주소인식 시스템에서 사용되고 있는 MLP 인식기를 개별 문자인식을 위한 인식기로 사용한다. MLP 인식기는 인식 속도와 인식률 측면에서 가장 우수한 인식기의 하나로 알려져 있지만, false alarm과 같은 잘못된 결과를 생성하기도 하는데 이는 주소해석을 어렵게 만드는 주요 요인이 된다. 본 논문에서는 주소해석을 쉽게 하고 우편물 구분율을 높이기 위해 기 구현된 MLP 인식기의 출력값을 재추정하는 방법을 제안한다. 재추정값의 신뢰도를 높이기 위한 인식기의 통계적 동작특성을 생성하는 방법과, 기존 MLP와 신뢰도 재추정기로서 동작하는 Subspace 인식기를 결합하는 방법을 제안한다. 제안 방법의 타당성을 확인하기 위해 우체국에 설치된 우편물구분기로부터 획득한 문자영상을 이용하여 실험하였다. 실험 결과 제안 방법이 개별 문자 및 비문자에 대한 오류율과 기각률 측면에서 높은 신뢰도를 보임을 확인할 수 있었다.

  • PDF

일반화된 문자 및 비디오 자막 영역 추출 방법 (A Generalized Method for Extracting Characters and Video Captions)

  • 전병태;배영래;김태윤
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.632-641
    • /
    • 2000
  • 기존의 문자 영역 추출 방법은 전체 영상에 대하여 컬러 축소(color reduction), 영역 분할 및 합병(region split and merge), 질감 분석(texture analysis)등과 같은 방법을 이용하여 문자 영역을 추출했다. 이 방법들은 많은 휴우리스틱(heuristic) 변수와 추출하고자 하는 문자의 사전 지식에 의해 임계치 값을 설정함으로서 알고리즘을 일반화하기 어렵다는 문제점이 있다. 본 논문에서는 문자의 지형학적 특징점 추출 방법과 점-선-면 확장법을 이용하여 문자 영역을 추출함으로서 기존 문자 영역 추출의 문제점인 휴우리스틱 변수의 사용을 최소화하고 임계치 값을 일반화함으로 서 일반화된 문자 영역 추출 방법을 제안 하고자 한다. 실험결과 일반화된 변수와 임계값을 사용함으로서 문자의 사전 지식 없이도 문자 영역을 추출함을 볼 수 있었다. 비디오 영상의 경우 후보 영역 추출율 100%, 검증을 통한 자막 영역 추출율은 98% 이상임을 볼 수 있었다.

  • PDF

Infrared and Radio observations of a small group of protostellar objects in the molecular core, L1251-C

  • Kim, Jungha;Lee, Jeong-Eun;Choi, Minho;Bourke, Tyler L.;Evans II, Neal J.;Di Francesco, James;Cieza, Lucas A.;Dunham, Michael M.
    • 천문학회보
    • /
    • 제40권1호
    • /
    • pp.67.4-68
    • /
    • 2015
  • We present a multi-wavelength observational study of a low-mass star-forming region, L1251-C, with observational results at wavelengths from the near-infrared to the millimeter. Spitzer Space Telescope observations confirmed that IRAS 22343+7501 is a small group of protostellar objects. The extended emission to east-west direction with its intensity peak at the center of L1251A has been detected at 350 and 850 mm with the CSO and JCMT telescopes, tracing dense envelope materials around L1251A. The single-dish data from the KVN and TRAO telescopes show inconsistencies between the intensity peaks of several molecular line emission and that of the continuum emission, suggesting complex distributions of molecular abundances around L1251A. The SMA interferometer data, however, show intensity peaks of CO 2-1 and $^{13}CO$ 2-1 located at the position of IRS 1, which is both the brightest source in IRAC image and the weakest source in the 1.3 mm dust continuum map. IRS 1 is the strongest candidate for being the driving source of a newly detected the compact CO 2-1 outflow. Over the whole region ($14^{\prime}{\times}14^{\prime}$) of L125l-C, 3 Class I and 16 Class II sources have been detected, including three YSOs in L1251A. A comparison with the average projected distance among 19 YSOs in L1251-C and that among 3 YSOs in L1251A suggests L1251-C is an example of low-mass cluster formation, where protostellar objects are forming in a small group.

  • PDF

Automatic Segmentation of Product Bottle Label Based on GrabCut Algorithm

  • Na, In Seop;Chen, Yan Juan;Kim, Soo Hyung
    • International Journal of Contents
    • /
    • 제10권4호
    • /
    • pp.1-10
    • /
    • 2014
  • In this paper, we propose a method to build an accurate initial trimap for the GrabCut algorithm without the need for human interaction. First, we identify a rough candidate for the label region of a bottle by applying a saliency map to find a salient area from the image. Then, the Hough Transformation method is used to detect the left and right borders of the label region, and the k-means algorithm is used to localize the upper and lower borders of the label of the bottle. These four borders are used to build an initial trimap for the GrabCut method. Finally, GrabCut segments accurate regions for the label. The experimental results for 130 wine bottle images demonstrated that the saliency map extracted a rough label region with an accuracy of 97.69% while also removing the complex background. The Hough transform and projection method accurately drew the outline of the label from the saliency area, and then the outline was used to build an initial trimap for GrabCut. Finally, the GrabCut algorithm successfully segmented the bottle label with an average accuracy of 92.31%. Therefore, we believe that our method is suitable for product label recognition systems that automatically segment product labels. Although our method achieved encouraging results, it has some limitations in that unreliable results are produced under conditions with varying illumination and reflections. Therefore, we are in the process of developing preprocessing algorithms to improve the proposed method to take into account variations in illumination and reflections.