• 제목/요약/키워드: 이미지 정규화

검색결과 104건 처리시간 0.028초

A Facial Image Segmentation for Video Coding and its Recognition Based on DWT

  • Lim, Chun-Hwan;Park, Jong-An
    • 한국통신학회논문지
    • /
    • 제26권3B호
    • /
    • pp.338-346
    • /
    • 2001
  • 이 논문에서는 잡음에 대해 유연성이 있는 신경망과 차영상법-DCT를 이용한 얼굴인식 알고리즘을 제안한다. 동일환경(조도의 세기, 얼굴에서 카메라까지의 거리)에서 연속적으로 두 개의 영상을 캡쳐했다. 이 때 한 영상은 얼굴을 포함하지 않고 다른 영상은 얼굴을 포함하게 된다. 차영상 방법을 이용하여 두 개의 이미지로부터 얼굴영상과 배경영상을 분리하고 그 다움에 분리된 얼굴영역에서 사각영역을 추출하여 이 영역을 얼굴의 특징영역으로 이용하였다. 이 사각 영역은 눈, 코, 입, 눈썹 등이 포함된다. 다음으로 이 영역에 대해 DWT 연산을 수행한후 특징 백터를 추출하였고, 추출된 특징벡터는 정규화 되어 신경망의 입력벡터로 사용되었다. 시뮬레이션 결과 학습된 얼굴영상에 대해서는 100% 인식률을 보였고 학습되지 않는 얼굴 영상에 대해서는 92.25%의 인식률을 보였다.

  • PDF

시점에 독립적인 제스처 인식을 위한 볼륨 모션 템플릿 (Volume Motion Template For View Independent Gesture Recognition)

  • 신호근;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.844-846
    • /
    • 2005
  • 본 논문은 시점에 독립적인 제스처 인식을 위하여 볼륨 모션 템플릿을 제안한다. 기존 제스처 연구에서 시점 문제와 행동 속도의 편차는 중요하면서도 어려운 문제이다. 첫째, 시점 문제는 하나의 단안 카메라나 스테레오 카메라를 이용하는 단방향 카메라 환경에서 발생하며 해결하기 어려운 문제이다. 모든 시점에서 학습시켜야 하는 기존 연구의 단점을 해결하기 위해, 다양한 시점입력에 독립적으로 인식을 할 수 있는 볼륨 모션 템플릿을 제안한다. 볼륨 모션 템플릿은 깊이 정보와 모션의 방향성 통해 최적의 가상 시점을 제공한다. 또한 볼륨 모션 템플릿을 이용하여 시스템의 신뢰성과 확장성 또한 개선하였다. 두 번째, 제스처가 발생 시마다 생기는 속도의 편차 문제이다. 입력 제스처의 시간-정규화를 통해 해결할 수 있는데, 시간 정보 대신 모션 량을 사용하여 이를 해결하였다. 볼륨 모션 템플릿을 이용하여 다양한 시점 입력에 대해 실험하였고, 기존 모션 히스토리 이미지와 비교하여 시점에 독립적인 결과를 얻었다.

  • PDF

SOFM 신경망을 이용한 수화 형상 인식 (Sign Language Shape Recognition Using SOFM Neural Network)

  • 박경우
    • 통합자연과학논문집
    • /
    • 제3권1호
    • /
    • pp.38-42
    • /
    • 2010
  • 인간은 정보전달을 위하여 언어 이외에 동작, 표정과 같은 비언어적인 수단을 이용한다. 이러한 비언어적인 수단을 정확히 분석 할 수 있다면 인간과 컴퓨터간의 자연스럽고 지적인 인터페이스를 구축할 수 있게 된다. 본 논문은 별도의 센서를 부착하지 않은 단일 카메라 환경에서 손 형상을 입력정보로 사용하여 손 영역만을 분할한 후 자기 조직화 특징 지도(SOFM: Self Organized Feature Map) 신경망 알고리즘을 이용하여 손 형상을 인식함으로서 수화인식을 위한 보다 안정적이며 강인한 인식 시스템을 구현하고자 한다. 제안 방법으로는 피부색 정보를 이용하여 배경으로부터 손 영역만을 추출한 후 추출된 손 영역의 형상을 인식한다(전처리과정으로 모델이미지의 사이즈와 압축 및 컬러에 대한 정보를 정규화 시켰다). 또한 인식 효율을 높이기 위해 SOFM 신경망 알고리즘을 적용함으로서 보다 안정적으로 손 형상을 인식할 수 있게 되었으며, 손 형상 인식률에 대한 안전성과 정확성을 향상시킬 수 있었다. 그리고 인식된 손 형상의 의미를 텍스트로 보여줌으로서 사용자의 의사를 정확하게 전달할 수 있다.

이원 양상을 이용한 기울어진 차량 번호판 영역 추출 알고리즘 (The Slanted License Plate Extraction Algorithm Using Bimodality)

  • 김보은;송원석;이승래
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.339-342
    • /
    • 2014
  • 현재 차량의 출입통제 및 주정차 단속 등이 차량 번호판 자동 인식 시스템을 통해 자동화 되고 있다. 본 논문은 촬영 각도에 따라 기울어지거나 왜곡된 번호판에 대해서도 잘 동작하는 번호판 영역 추출 알고리즘을 제안한다. 번호판의 배경과 문자의 밝기 대비가 커서 그 분포가 이원 양상을 보인다는 점을 이용하여 번호판의 중심부와 대략적인 후보 영역을 추출한다. 이후 허프 변환을 통하여 번호판의 네 모서리에 해당하는 직선을 검출한다. 이들 네 직선의 교점이 번호판의 꼭짓점이 된다. 네 꼭짓점의 좌표를 이용하여 왜곡된 번호판을 실제 번호판의 가로와 세로 비율에 맞는 정규화 된 모양으로 변환한다. 차량의 측면 1m~3m 사이의 다양한 거리에서 촬영한 이미지로 실험한 결과 일반적인 실외 조명 아래에서 차체의 색에 관계없이 번호판 영역 추출에 성공하였다.

  • PDF

주성분 분석과 서포트 벡터 머신을 이용한 침입 탐지 시스템 (An Intrusion Detection System Using Principle Component Analysis and Support Vector Machines)

  • 정성윤;강병두;김상균
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.314-317
    • /
    • 2003
  • 기존의 침입탐지 시스템에서는 오용탐지모델이 널리 사용되고 있다. 이 모델은 낮은 오판율(False Alarm rates)을 가지고 있으나, 새로운 공격에 대해 전문가시스템(Expert Systems)에 의한 규칙추가를 필요로 한다. 그리고 그 규칙과 완전히 일치되는 시그너처만 공격으로 탐지하므로 변형된 공격을 탐지하지 못한다는 문제점을 가지고 있다 본 논문에서는 이러한 문제점을 보완하기 위해 주성분분석(Principle Component Analysis; 이하 PCA)과 서포트 벡터 머신(Support Vector Machines; 이하 SVM)을 이용한 침입탐지 시스템을 제안한다. 네트워크 상의 패킷은 PCA를 이용하여 결정된 주성분 공간에서 해석되고, 정상적인 흐름과 비정상적인 흐름에 대한 패킷이미지패턴으로 정규화 된다. 이러한 두 가지 클래스에 대한 SVM 분류기를 구현한다. 개발하는 침입탐지 시스템은 알려진 다양한 침입유형뿐만 아니라, 새로운 변종에 대해서도 분류기의 유연한 반응을 통하여 효과적으로 탐지할 수 있다.

  • PDF

세그멘테이션 기반 차선 인식 네트워크를 위한 적응형 키포인트 추출 알고리즘 (Adaptive Key-point Extraction Algorithm for Segmentation-based Lane Detection Network)

  • 이상현;김덕수
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권1호
    • /
    • pp.1-11
    • /
    • 2023
  • 딥러닝 기반의 이미지 세그멘테이션은 차선 인식을 위해 널리 사용되는 접근 방식 중 하나로, 차선의 키포인트를 추출하기 위한 후처리 과정이 필요하다. 일반적으로 키포인트는 사용자가 지정한 임계값을 기준으로 추출한다. 하지만 최적의 임계값을 찾는 과정은 큰 노력을 요구하며, 데이터 세트(또는 이미지)마다 최적의 값이 다를 수 있다. 본 연구는 사용자의 직접 임계값 지정 대신, 대상의 이미지에 맞추어 적절한 임계값을 자동으로 설정하는 키포인트 추출 알고리즘을 제안한다. 본 논문의 키포인트 추출 알고리즘은 차선 영역과 배경의 명확한 구분을 위해 줄 단위 정규화를 사용한다. 그리고 커널 밀도 추정을 사용하여, 각 줄에서 각 차선의 키포인트를 추출한다. 제안하는 알고리즘은 TuSimple과 CULane 데이터 세트에 적용되었으며, 고정된 임계값 사용 대비 정확도 및 거리오차 측면에서 1.80%p와 17.27% 향상된 결과를 얻는 것을 확인하였다.

Advanced AAM 기반 정서특징 검출 기법 개발 (Development of Emotional Feature Extraction Method based on Advanced AAM)

  • 고광은;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제19권6호
    • /
    • pp.834-839
    • /
    • 2009
  • 지능로봇시스템과 같은 HCI 환경에서 사람의 감정을 인식하기 위한 매개정보인 얼굴영상 기반 정서특징 검출문제는 관련분야의 매우 중요한 이슈이다. 본 논문에서는 보편화된 시스템 기반에서 임의의 사용자에 대한 정서 인식을 수행하기 위해 사람의 얼굴에서 나타나는 최적의 정서특징을 가장 효율적으로 추출하기 위한 연구로서 본 연구실에서 기존에 제안한 FACS와 AAM을 이용한 Bayesian Network 기반 얼굴표정 인식 시스템을 보완한 Advanced AAM을 기반 얼굴영상 정서 특징을 검출 시스템에 대한 연구를 진행하였다. 이를 수행하기 위하여 정규화된 이미지에서의 Statistical Shape Analysis로서 Advanced AAM과 얼굴 표정 분석 시스템인 FACS를 이용하여, 임의의 사용자에 대한 자동적인 정서특징 검출이 가능하도록 연구를 진행하였다.

분류 및 회귀문제에서의 분류 성능과 정확도를 동시에 향상시키기 위한 새로운 바이어스 스케줄링 방법 (A New Bias Scheduling Method for Improving Both Classification Performance and Precision on the Classification and Regression Problems)

  • 김은미;박성미;김광희;이배호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권11호
    • /
    • pp.1021-1028
    • /
    • 2005
  • 분류 및 회계문제에서의 일반적인 해법은, 현실 세계에서 얻은 정보를 행렬로 사상하거나, 이진정보로 변형하는 등 주어진 데이타의 가공과 이를 이용한 학습에서 찾을 수 있다. 본 논문은 현실세계에 존재하는 순수한 데이타를 근원공간이라 칭하며, 근원 데이타가 커널에 의해 사상된 행렬을 이원공간이라 한다. 근원공간 혹은 이원공간에서의 분류문제는 그 역이 존재하는 문제 즉, 완전해가 존재하는 문제와, 그 역이 존재하지 않거나, 역의 원소 값들이 무한히 커지는 불량조건 흑은 특이조건인 두 가지 형태로 존재한다. 특히, 실제 문제에 있어서 완전 해를 가진 문제이기 보다는 후자에 가까운 형태로 나타나게 된다. 결론적으로 근원데이타나 이원데이타를 이용한 문제를 해결하기 위해서는 많은 경우에 완전 해를 갖는 문제로 변형시키는 정규화과정이 필요하다. 본 논문에서는 이러한 정규화 인수를 찾는 문제를 기존의 GCV, L-Curve, 그리고 이원공간에서의 데이타를 RBF 신경회로망에 적용시킨 커널 학습법에 대한 각각의 성능을 비교실험을 통해 고찰한다. GCV와 L-Curve는 정규화 인수를 찾는 대표적인 방법으로 두 방법 모두 성능면에서 동등하며 문제의 조건에 따라 다소 차이를 보인다. 그러나 이러한 두 방법은 문제해를 구하기 위해서는 정규화 인수를 구한후 문제를 재정의하는 이원적인 문제해결이라는 취약점을 갖는다. 반면, RBF 신경회로망을 이용한 방법은 정규화 인수와 해를 동시에 학습하는 단일화된 방법이 된다. 이때 커널을 이용한 학습법의 성능을 향상하기 위해, 전체학습과 성능의 제한적 비례관계라는 설정아래, 각각의 학습에 따라 능동적으로 변화하는 동적모멘텀의 도입을 제안한다. 동적모멘트는 바이어스 학습을 포함한 방법과 포함하지 않은 방법에 각각 적용분석하였다. 끝으로 제안된 동적모멘텀이 분류문제의 표준인 Iris 데이터, Singular 시스템의 대표적 모델인 가우시안 데이타, 그리고 마지막으로 1차원 이미지 복구문제인 Shaw데이타를 이용한 각각의 실험에서 분류문제와 회계문제 양쪽 모두에 있어 기존의 GCV, L-Curve와 동등하거나 우수한 성능이 있음을 보인다.

딥러닝 알고리즘을 이용한 강우 발생시의 유량 추정에 관한 연구 (A study on discharge estimation for the event using a deep learning algorithm)

  • 송철민
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.246-246
    • /
    • 2021
  • 본 연구는 강우 발생시 유량을 추정하는 것에 목적이 있다. 이를 위해 본 연구는 선행연구의 모형 개발방법론에서 벗어나 딥러닝 알고리즘 중 하나인 합성곱 신경망 (convolution neural network)과 수문학적 이미지 (hydrological image)를 이용하여 강우 발생시 유량을 추정하였다. 합성곱 신경망은 일반적으로 분류 문제 (classification)을 해결하기 위한 목적으로 개발되었기 때문에 불특정 연속변수인 유량을 모의하기에는 적합하지 않다. 이를 위해 본 연구에서는 합성곱 신경망의 완전 연결층 (Fully connected layer)를 개선하여 연속변수를 모의할 수 있도록 개선하였다. 대부분 합성곱 신경망은 RGB (red, green, blue) 사진 (photograph)을 이용하여 해당 사진이 나타내는 것을 예측하는 목적으로 사용하지만, 본 연구의 경우 일반 RGB 사진을 이용하여 유출량을 예측하는 것은 경험적 모형의 전제(독립변수와 종속변수의 관계)를 무너뜨리는 결과를 초래할 수 있다. 이를 위해 본 연구에서는 임의의 유역에 대해 2차원 공간에서 무차원의 수문학적 속성을 갖는 grid의 집합으로 정의되는 수문학적 이미지는 입력자료로 활용했다. 합성곱 신경망의 구조는 Convolution Layer와 Pulling Layer가 5회 반복하는 구조로 설정하고, 이후 Flatten Layer, 2개의 Dense Layer, 1개의 Batch Normalization Layer를 배열하고, 다시 1개의 Dense Layer가 이어지는 구조로 설계하였다. 마지막 Dense Layer의 활성화 함수는 분류모형에 이용되는 softmax 또는 sigmoid 함수를 대신하여 회귀모형에서 자주 사용되는 Linear 함수로 설정하였다. 이와 함께 각 층의 활성화 함수는 정규화 선형함수 (ReLu)를 이용하였으며, 모형의 학습 평가 및 검정을 판단하기 위해 MSE 및 MAE를 사용했다. 또한, 모형평가는 NSE와 RMSE를 이용하였다. 그 결과, 모형의 학습 평가에 대한 MSE는 11.629.8 m3/s에서 118.6 m3/s로, MAE는 25.4 m3/s에서 4.7 m3/s로 감소하였으며, 모형의 검정에 대한 MSE는 1,997.9 m3/s에서 527.9 m3/s로, MAE는 21.5 m3/s에서 9.4 m3/s로 감소한 것으로 나타났다. 또한, 모형평가를 위한 NSE는 0.7, RMSE는 27.0 m3/s로 나타나, 본 연구의 모형은 양호(moderate)한 것으로 판단하였다. 이에, 본 연구를 통해 제시된 방법론에 기반을 두어 CNN 모형 구조의 확장과 수문학적 이미지의 개선 또는 새로운 이미지 개발 등을 추진할 경우 모형의 예측 성능이 향상될 수 있는 여지가 있으며, 원격탐사 분야나, 위성 영상을 이용한 전 지구적 또는 광역 단위의 실시간 유량 모의 분야 등으로의 응용이 가능할 것으로 기대된다.

  • PDF

NCC기법을 이용한 무인항공기용 차종 식별 알고리즘 개발 (Development of Car Type Classification Algorithm on the UAV platform using NCC)

  • 정재원;김정호;허진우;한동인;이대우;성기정
    • 한국항공우주학회지
    • /
    • 제40권7호
    • /
    • pp.582-589
    • /
    • 2012
  • 본 논문은 무인 항공기에서 지상의 차량을 촬영하여 차종을 인식하기 위한 알고리즘의 개발에 대해 논하고 있다. NCC(Normalized Cross-Correlation) 방법을 이용하여 영상에서 목표물의 기하학적인 정보를 정합하도록 하였고, 실제 비행영상을 통해 획득한 템플릿 이미지와 위성 지도를 통해 획득한 템플릿 이미지를 이용하여 영상의 정합을 수행하였다. 실내 기반 실험을 통해 정합 가능성을 평가하였으며, 위성 지도를 이용한 모의실험을 통해 NCC 알고리즘을 이용하여 차량의 종류를 식별할 수 있음을 확인하였다. 마지막으로 실제 비행 실험을 통해 획득한 영상을 통해 동일한 차량을 전체 영상에서 정합하는 실험을 수행하였다. 비행 실험 결과 승용차의 위치가 정확하게 탐지되었으며, 정합 결과 0.6점이상의 유사도가 나타남을 확인할 수 있었다. 또한 유사한 색상을 지닌 트럭은 정합하지 않음으로서 이종 차량의 구분이 가능함을 확인하였다.