• 제목/요약/키워드: robust features

검색결과 718건 처리시간 0.028초

옥외영상의 개선된 차량번호판 인식기술 (An Improved License Plate Recognition Technique in Outdoor Image)

  • 김병준;김동훈;이준환
    • 한국지능시스템학회논문지
    • /
    • 제26권5호
    • /
    • pp.423-431
    • /
    • 2016
  • 일반적으로 옥외영상에서의 자동차 번호판 인식은 인위적인 환경에서와는 다르게 기하학적으로 왜곡되어 있을 뿐만 아니라 조명 변화도 크기 때문에 단순환 문제가 아니다. 본 논문에서는 일반 CCTV 카메라로 옥외에서 촬영된 영상에서 자동차 번호판 인식을 위한 개선된 기술들을 제안한다. 먼저 다양한 특징을 상보적으로 사용하는 직렬구조의 다단계 Adaboost 검출기를 제안한다. 제안하는 검출기는 MB-LBP 및 Haar-like 특징을 사용하는 Adaboost 구조를 직렬로 연결하여 번호판 검출의 검출성능을 향상시켰다. 또한 검출된 번호판의 기하학적 왜곡을 보정하고 번호판의 타입을 먼저 결정하여 영상처리를 용이하게 하는 방법을 제안한다. 이런 방법은 그래이 변환, 문자/숫자 분리, 분리된 영상의 영상처리 등에서 사전지식 없이 전체 번호판 영상을 이용하는 경우보다 효율적이다. 본 논문에서 DBN(Deep Belief Network)를 문자/숫자 인식기로 사용하여 영상처리과정에서 기인한 획 손실이나 기울어짐 같은 기하학적인 왜곡에서도 강건한 인식률을 달성하였다.

초음파 도플러를 이용한 음성 인식 (Automatic speech recognition using acoustic doppler signal)

  • 이기승
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.74-82
    • /
    • 2016
  • 본 논문에서는 음성 신호 대신 초음파 도플러 신호를 이용하여 음성을 인식하는 새로운 음성 인식 방법을 제안하였다. 제안된 방법은 주변 잡음에 대한 강인성과 무 접촉식 센서 사용에 따른 사용자의 불편함 감소를 포함하는 기존의 음성/무음성 인식 방법에 비해 몇 가지 장점을 갖는다. 제안된 방법에서는 40 kHz의 주파수를 갖는 초음파 신호를 입 주변에 방사하여, 반사된 신호를 취득하고, 취득된 신호의 도플러 주파수 변화를 이용하여 음성 인식을 구현하였다. 단일 채널 초음파 신호를 사용하는 기존의 연구와 달리, 다양한 위치에서의 취득된 초음파 신호를 음성 인식에 사용하기 위해 다채널 취득 장치를 고안하였다. PCA(Principal Component Analysis)특징 변수를 사용한 음성 인식에는 좌-우 모델을 갖는 은닉 마코프 모델을 사용하였다. 제안된 방법의 검증을 위해 60개의 한국어 고립어에 대해 6명의 화자로부터 취득된 초음파 도플러 신호를 인식에 사용하였으며, 기존 음성기반 음성인식 기법과 비교할 만한 수준의 인식율을 얻을 수 있었다. 또한 실험 결과 제안된 방법은 기존의 단일 채널 음성 인식 방법과 비교하여 우수한 성능을 나타내었으며, 특히 잡음 환경에서도 90 % 이상의 인식율을 얻을 수 있었다.

새로운 비디오 자막 영역 검출 기법 (A new approach for overlay text detection from complex video scene)

  • 김원준;김창익
    • 방송공학회논문지
    • /
    • 제13권4호
    • /
    • pp.544-553
    • /
    • 2008
  • 최근 영상 편집 기술의 발달과 더불어 시청자의 이해를 돕기 위해 인위적으로 자막을 삽입하는 경우가 늘고 있다. 인위적으로 삽입된 자막은 해당 장면의 내용이나 편집자의 의도를 잘 표현하고 있기 때문에 비디오 정보 검색(video information retrieval)이나 비디오 색인(video indexing)과 같은 응용에 유용하다. 기존의 자막 영역 추출 방법은 에지(edge), 색상(color), 텍스처(texture) 정보와 같은 하위 계층(low-level) 특징을 기반으로 하기 때문에 다양한 필체나 밝기 대비를 가진 자막이 동시에 나타나거나 복잡한 배경에 포함된 자막 영역의 경우 잘 검출하지 못한다. 이에 본 논문은 기존의 방법과는 전혀 다른 천이 영역 기반의 새로운 영상 내 자막 영역 검출 기법을 제안하고자 한다. 먼저, 영상 내 삽입된 글자 주변은 시청자에게 영상으로부터의 높이 감을 주기 위해 해당 글자와 다른 색으로 표현된다는 관찰 결과를 바탕으로 천이 지도를 생성한다. 생성된 천이 지도를 이용하여 후보 영역을 추출하고 상태 밀도 개념을 바탕으로 후보 영역 중에서 삽입된 자막 영역을 추출한다. 제안하는 알고리즘은 글자 색, 크기, 위치, 필체, 밝기 대비에 관계없이 적용이 가능하며, 다양한 언어에 관계없이 뛰어난 성능을 보인다. 또한, 프레임 간 자막 영역 업데이트를 통해 자막 영역 추출의 효율을 높였다. 다양한 영상에 대한 실험을 통해 제안하는 알고리즘이 효율적인 비디오 자막 영역 추출 방법임을 보이고자 한다.

Dialectics of Motherhood-based Existence - Focusing on Charlotte's Web -

  • 윤정미;이수경
    • 만화애니메이션 연구
    • /
    • 통권45호
    • /
    • pp.345-366
    • /
    • 2016
  • "샬롯의 거미줄"은 주요 등장인물들이 모성성을 바탕으로 한 관계 맺기를 통해 서로를 성장시키면서 새로운 생명으로 이어지도록 돕는 이야기이다. 또한 삶과 죽음의 교차는 우리가 살아가는 세계의 법칙을 직접적이면서도 상징적으로 암시하고 있다. 이러한 작품의 분석을 위해 크리스테바의 기호계, 상징계, 코라의 개념을 차용하였다. 크리스테바는 기호계와 상징계의 변증법적 관계와 언어의 의미화 과정에 있는 주체의 사회적 상황과 관계들에 주목했다. 이에 이 작품에 등장하는 인물들의 특성을 상징적으로 크리스테바의 주요개념들과 연관시켜 이들이 어떻게 성장해 갔는지 분석하였다. 또한 주요 등장인물들의 관계의 바탕에 있는 모성성은 여성주의적인 관점에서 모든 생명에 대한 보호와 배려, 관심 등을 통해 상호 발전할 수 있는 사회적 관계 혹은 인간으로서 갖추어야할 미덕이라는 넓은 범위로 상정하였다. "샬롯의 거미줄"은 이러한 모성성을 바탕으로 하여 각각의 존재들이 가진 기호적 특성과 상징적 특성들이 서로 상호작용하면서 발전적인 변화를 이끌어내고, 풍부한 의미를 만들어내고 있음을 보여준다. 세상은 서로 대립적인 요소로서 배타적으로 구성되어 있는 것처럼 보이지만 그 요소들은 서로 결합되어 있으며, 그러한 요소들의 상호작용을 통해 얼마나 아름답고 조화로운 세계가 만들어지는지를 문학적으로 형상화하고 있다. 또한 주요 등장인물의 특성을 한 인간의 내면에 있는 두 가지 양상으로 간주하여 작품 전체적으로는 인간의 성장과정으로도 이해할 수 있음을 제시하였다.

인터넷상의 비디오 데이타 전송에 효과적인 오류 은닉 기법 (An Effective Error-Concealment Approach for Video Data Transmission over Internet)

  • 김진옥
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권6호
    • /
    • pp.736-745
    • /
    • 2002
  • 압축한 비디오 데이타를 전송할 때 인터넷과 같이 네트워크 채널이 불안정한 경우 패킷이 분실될 가능성이 높다. 패킷 분실은 연속적 비트 열에 오류가 발생하는 버스트 오류 형태로 일어난다. 본 논문에서는 버스트 오류를 은닉 처리하는데 효과적인 오류 내성 기법을 적용하는 동시에 데이타 숨김을 이용하여 디코더의 계산 복잡도를 줄인 빠른 오류 은닉 방법을 제안한다. 오류 은닉 효과를 높이기 위해, 인코더에서는 네트워크 채널의 버스트 오류에 강건하도록 비디오 데이타에 공간적, 시간적 영역에 대한 오류 내성 기법을 적용한다. 공간적 오류 내성 기법으로는 패킷 분실이 발생한 오류 블록을 분리하는데 효과적인 블록 셔플링을 적용하고 시간적 오류 내성 기법으로는 움직임 벡터의 프레임간 패리티 비트를 데이터 숨김 방법으로 내용 데이타에 삽입, 전송하여 디코더에서 분실된 패킷을 처리한다. 비디오 데이타는 전송 후 디코더에서 오류 은닉 처리하는데 디코더에서 주변 정보를 이용하여 오류 비디오 블록을 보간하는 것은 계산이 복잡하여 비용이 많이 든다. 따라서 본 연구에서는 비디오 인코딩 단계에서 비디오 블록의 에지 특징을 추출 후 이 특징 데이타를 원 데이타에 숨겨 전송하고 전송 시 비디오 데이타가 손상되면 디코더에서 숨겨 온 비디오 블록의 특징을 추출하여 쌍선형 보간법을 통해 전송 시 발생한 오류를 은닉 처리한다. 데이타 숨김을 이용하면 디코더의 계산 복잡도는 낮아진다. 본 논문의 실험 결과는 제안 방법이 비디오의 패킷 분실이 30%에 달하는 경우에도 이를 은닉 처리하여 인지 가능한 품질의 비디오 데이타를 보장한다.

원격작업 지시를 이용한 생물산업공정의 생력화 (I) -대상체 인식 및 3차원 좌표 추출- (Automation of Bio-Industrial Process Via Tele-Task Command(I) -identification and 3D coordinate extraction of object-)

  • 김시찬;최동엽;황헌
    • Journal of Biosystems Engineering
    • /
    • 제26권1호
    • /
    • pp.21-28
    • /
    • 2001
  • Major deficiencies of current automation scheme including various robots for bioproduction include the lack of task adaptability and real time processing, low job performance for diverse tasks, and the lack of robustness of take results, high system cost, failure of the credit from the operator, and so on. This paper proposed a scheme that could solve the current limitation of task abilities of conventional computer controlled automatic system. The proposed scheme is the man-machine hybrid automation via tele-operation which can handle various bioproduction processes. And it was classified into two categories. One category was the efficient task sharing between operator and CCM(computer controlled machine). The other was the efficient interface between operator and CCM. To realize the proposed concept, task of the object identification and extraction of 3D coordinate of an object was selected. 3D coordinate information was obtained from camera calibration using camera as a measurement device. Two stereo images were obtained by moving a camera certain distance in horizontal direction normal to focal axis and by acquiring two images at different locations. Transformation matrix for camera calibration was obtained via least square error approach using specified 6 known pairs of data points in 2D image and 3D world space. 3D world coordinate was obtained from two sets of image pixel coordinates of both camera images with calibrated transformation matrix. As an interface system between operator and CCM, a touch pad screen mounted on the monitor and remotely captured imaging system were used. Object indication was done by the operator’s finger touch to the captured image using the touch pad screen. A certain size of local image processing area was specified after the touch was made. And image processing was performed with the specified local area to extract desired features of the object. An MS Windows based interface software was developed using Visual C++6.0. The software was developed with four modules such as remote image acquisiton module, task command module, local image processing module and 3D coordinate extraction module. Proposed scheme shoed the feasibility of real time processing, robust and precise object identification, and adaptability of various job and environments though selected sample tasks.

  • PDF

Burst OFDM 시스템을 위한 차동 상관 기반의 프레임 동기 알고리즘 (Frame Synchronization Algorithm based on Differential Correlation for Burst OFDM System)

  • 엄중선;도주현;김민구;최형진
    • 한국통신학회논문지
    • /
    • 제30권10C호
    • /
    • pp.1017-1026
    • /
    • 2005
  • 버스트 방식 OFDM 시스템에서의 프레임 동기는 수신된 프레임의 시작 위치를 판단하고, 정확한 FPT-window 위치 추정을 위해 가장 우선적으로 수행되어야 한다. 유효 OFDM 심볼 내의 규정된 반복 패턴 또는 보호 구간의 상관을 이용하는 기존의 일반적인 프레임 동기 방식은 연속적으로 증가하다 감소하는 상관 출력 특성에 의해 정확한 프레임 시작 지점 검출이 어려우며, 수신 신호와 기준 신호 간의 상관 특성을 이용하는 방식은 주파수 옵셋으로 인한 성능 열화를 초래한다. 따라서, 본 논문에서는 프레임 동기 방식으로서 주파수 옵셋에 강인하고 정확한 프레임 시점 검출이 가능한 차동 상관(Differential Correlation) 방식을 기반으로 한 새로운 알고리즘을 제안하였다. 그러나, 일반적인 차동 신호의 상관 결과는 프리앰블의 반복 구조에 의해 다수의 Peak를 가지게 되며 이로 인하여 정확한 프레임 동기의 검출 성능이 열화된다. 본 논문에서는 이러한 차동 검출 방식의 단점을 보완하기 위하여 차동 신호 생성 시 반복되는 동일 패턴 구간의 샘플을 이용하여 단일 상관 Peak를 갖는 알고리즘을 제안한다. 또한 다중경로 페이딩 채널 환경에서 페이딩에 의한 프레임 시작 위치 검출 에러를 줄이기 위하여 신호 전력으로 상관 출력 값을 정규화하는 블록을 도입함으로써 고속 이동 채널 환경에서의 프레임 시작 지점 검출 확률을 높였다.

조영 전후의 폐 CT 영상 정합을 위한 특징 기반의 비강체 정합 기법 (Feature-based Non-rigid Registration between Pre- and Post-Contrast Lung CT Images)

  • 이현준;홍영택;심학준;권동진;윤일동;이상욱;김남국;서준범
    • 대한의용생체공학회:의공학회지
    • /
    • 제32권3호
    • /
    • pp.237-244
    • /
    • 2011
  • In this paper, a feature-based registration technique is proposed for pre-contrast and post-contrast lung CT images. It utilizes three dimensional(3-D) features with their descriptors and estimates feature correspondences by nearest neighborhood matching in the feature space. We design a transformation model between the input image pairs using a free form deformation(FFD) which is based on B-splines. Registration is achieved by minimizing an energy function incorporating the smoothness of FFD and the correspondence information through a non-linear gradient conjugate method. To deal with outliers in feature matching, our energy model integrates a robust estimator which discards outliers effectively by iteratively reducing a radius of confidence in the minimization process. Performance evaluation was carried out in terms of accuracy and efficiency using seven pairs of lung CT images of clinical practice. For a quantitative assessment, a radiologist specialized in thorax manually placed landmarks on each CT image pair. In comparative evaluation to a conventional feature-based registration method, our algorithm showed improved performances in both accuracy and efficiency.

통계학적 학습을 이용한 머리와 어깨선의 위치 찾기 (Localizing Head and Shoulder Line Using Statistical Learning)

  • 권무식
    • 한국통신학회논문지
    • /
    • 제32권2C호
    • /
    • pp.141-149
    • /
    • 2007
  • 영상에서 사람의 머리위치를 찾는 문제에 있어서 어깨선 정보를 이용하는 것은 아주 유용하다. 영상에서 머리 외곽선과 어깨선의 형태는 일정한 변형을 유지하면서 같이 움직이므로 이를 ASM(Active Shape Model) 기법을 사용해서 통계적으로 모델링 할 수 있다. 그러나 ASM 모델은 국부적인 에지나 그래디언트에 의존하므로 배경 에지나 클러터 성분에 민감하다. 한편 AAM(Active Appearance Model) 모델은 텍스쳐 등을 이용하지만, 사람의 피부색, 머리색깔, 옷 색깔 등의 차이로 인해서 통계적인 학습방법을 쓰기가 어렵고, 전체 비디오에서 외모(Appearance)가 시간적으로 변한다. 따라서, 본 논문에서는 외모(Apperance) 모델을 변화에 따라 바꾸는 대신, 영상의 각 화소를 머리, 어깨, 배경으로 구분하는 분별적 외모 모델(discriminative appearance)를 사용한다. 실험을 통해서 제안된 방법이 기존의 기법에 비해서 포즈변화와 가려짐, 조명의 변화 등에 강인함을 보여준다. 또한 제안된 기법은 실시간으로 작동하는 장점 또한 가진다.

표면거리 및 표면곡률 최적화 기반 다중모달리티 뇌영상 정합 (Multimodal Brain Image Registration based on Surface Distance and Surface Curvature Optimization)

  • 박지영;최유주;김민정;태우석;홍승봉;김명희
    • 정보처리학회논문지A
    • /
    • 제11A권5호
    • /
    • pp.391-400
    • /
    • 2004
  • 서로 다른 종류의 영상을 정확하게 연관시켜 복합적인 정보를 제공하는 다중모달리티 의료 영상정합기법 중 표면정보 기반 영상정합에서는 일반적으로 동일 대상에 대한 서로 다른 모달리티에서 추출된 표면 윤곽정보 사이의 거리를 최소화함으로써 매칭이 이루어진다. 그런데 동일대상에 대해 취득되는 서로 다른 두 모달리티는 관심 영역 상의 표면 특성이 서로 유사하다. 그러므로 다중모달리티 영상정합에서 표면거리와 함께 표면의 형태 특성을 고려하여 두 영상을 매칭하는 방법이 정합결과의 정확도를 향상시킬 수 있다. 본 연구에서는 동일 대상의 서로 다른 두 모달리티 뇌영상 간의 표면거리와 표면곡률을 최적화하는 정합기법을 제안한다. 영상정합은 참조영상과 테스트영상에 대한 표면정보 생성과 이 두 개의 표면정보를 최적화하는 단계로 구성된다. 표면정보 생성 단계에서는 두 모달리티로부터 관심영역의 윤곽선을 추출하고, 이 중 참조 볼륨의 윤곽선에 대해서는 표면거리맵과 표면곡률맵을 구성하게 된다. 최적화 단계에서는 표면거리맵과 표면곡률맵을 참조하는 최적화 평가함수(cost function)에 의해 두 객체의 표면거리 차이와 표면곡률 차이를 최소화하는 정합 변환 값이 결정되고, 이것이 테스트영상의 변환에 적용되어 결과적으로 두 영상이 정합 되게 된다. 제안된 최적화 평가함수는 표면거리 정보만을 사용하는 평가함수에 비해 보다 견고한 정합 정확도를 보였으며 또한 본 연구는 정합결과의 볼륨 가시화를 통해 효율적인 영상 분석 수단을 제공하고자 하였다.