본 논문에서는 하이브리드 항법변수 추정 시스템의 일부분인 IRS 위성영상을 이용한 절대위치 추정기법을 다룬다. 빠른 에지 기반 정합을 위하여 accumulator cell로 이루어진 accumulated buffer (AB)를 이용한 정합방법을 제안하였다. 항공기에서 촬영한 두 가지 실제 연속 영상들을 이용한 실험 결과로부터 제안한 AB 정합 방법의 성능을 분석하고, 거리 오차 측면에서 전체 항법변수 추정 시스템에서의 절대위치 추정기법의 효율성을 보였다.
DCT(Discrete Cosine Transform)는 공간 영역과 주파수 영역을 균등하게 분할함으로써 인간의 시각특성을 제대로 반영하지 못하는 단점이 있다. DCT의 영역 분할에 대한 단점을 극복할 수 있는 알고리듬으로 웨이브렛 변환을 이용하여 영상을 부호화하는 여러 가지 기법들이 있지만, 본 논문에서는 DCT와 웨이브렛 변환의 장점을 결합한 새로운 알고리듬을 제안한다. 제안 방법은 DCT의 DC 계수에 에너지 집중도가 좋은 장점을 효과적으로 이용함과 더불어 이들 계수들을 웨이브렛 변환 형식에 적용한다. 웨이브렛 상의 대역간 상관 관계와 대역내 상관 관계를 동시에 효율적으로 이용하고 각 대역 특성별로 양자화를 수행하며, 부호화 방법에 대해서도 중요 계수 정보·지 양자화 계수들은 대칭적인 분포를 나타내며 절대값이 커질수록 발생확률이 감소하는 특징을 이용하여 알고리듬이 간단하고 복호화 시간이 빠른 장점을 가지는 대칭적 양방향 트리 구조의 새로운 방법을 제시한 전지 영상 압축 부호화 알고리듬을 제안하였다. JPEG 알고리듬과 제안 알고리듬을 비교하였을 때, 동일한 비트율에서 제안 알고리듬이 객관적 화질뿐만 아니라 주관적으로도 높은 화질의 영상을 얻을 수 있었다.
본 논문은 영상변형 검출을 목적으로 한 사용자 Key기반 Fragile 워터마크 삽입방법을 제안한다. 원 영상은 8×8 DCT를 거쳐 DCT 계수값으로 변환된 뒤, 사용자가 미리 준비한 워터마크 (Embedding 또는 Authentication Data) 이진 영상이 삽입된다. 이때, 삽입여부 및 삽입위치의 노출을 최소화시키기 위해, 사용자의 Key를 이용한 랜덤화 방법을 사용하도록 제안하였다. 각 DCT 블록에는 한 비트의 데이터가 감추어지게 되며, 각 블록에 삽입된 한 비트 데이터들은 전체적으로 저작권자 고유의 이진영상을 나타나게 된다. 5개의 실제 영상으로 실험한 결과, 제안한 방법은 영상변형 여부뿐만 아니라 그 위치도 알 수 있음을 실험적으로 확인하였다. 그러나, 50%이상의 압축이 가해지는 경우, 삽입된 워터마크가 많이 소실되어, 향후 압축공격에 대한 성능 개선이 필요한 것으로 나타났다.
본 논문에서는 프로그램 가능한 하드웨어 장치에서 영상 처리를 효율적으로 수행하기 위한 새로운 메모리 어드레스 지정 방법(addressing mode)을 제안한다. 기존의 어드레스 지정 방법은 음성과 같은 일차원적인 형태의 데이터 처리에 적합한 반면, 제안된 메모리 어드레스 지정 기법은 영상 데이터의 이차원적인 특성을 고려한 새로운 메모리 어드레스 지정 기법이다. 제시된 기법은 기존의 메모리 구조를 바꾸지 않으면서도 이차원 데이터의 위치를 표시할 수 있는 두개의 오퍼랜드를 입력으로 메모리에 저장된 영상데이터 값을 처리는 명령어이다. 이차원적인 특성을 지니는 새로운 메모리 어드레스 지정 기법은 다음과 같은 장점을 지닌다. 먼저, 기존 하드웨어에서 여러 명령어에 걸쳐 수행해야 할 작업을 통합함으로써, 수행해야 할 프로그램의 코드 사이즈를 줄여 하드웨어의 성능을 높임과 동시에 근래 무선 응용 분야에서 요구되는 저전력 동작을 가능하게 한다. 아울러, 영상 데이터가 가지는 이차원적인 특성을 그대로 반영하므로, 사용자가 보다 쉽게 어셈블러를 통해 어플리케이션을 프로그램 할 수 있다. 이와 같은 이차원적인 메모리 어드레스 지정 기법은 각종 DSP, media processor, 그래픽 장치 등에 이용될 수 있다. 본 논문에서는 이러한 이차원 메모리 어드레스 지정 기법의 개념을 제안함과 동시에, 이를 효율적으로 구현하기 위한 하드웨어 구조를 제시한다.
본 논문에서는 zoom 영상 세트로부터 최적의 깊이와 텍스쳐 정보를 추출하는 효과적인 영상 코딩 알고리듬을 제안하였다. 제안된 알고리듬은 깊이 추출 단계와 텍스쳐 추출의 2단계로 구성되어 있다. 물체 공간에서 X-Y면을 삼각패치로 나누고 각 삼각패치 노드의 깊이 값은 깊이 추출 단계에서 결정한 후, 두 번째 단계에서 각 삼각패치의 텍스쳐를 추출한다. 깊이 추출 단계에서는 각 삼각패치의 노드를 중심으로 이루어진 사각형 윈도우 영역에 대하여 블록에 기반한 변이 보상 방법을 적용함으로 노드의 깊이를 결정한다. 텍스쳐 추출 단계에서는 아휜 변환에 기반한 변이 보상 모델을 이용하여 zoom 영상으로부터 삼각패치의 텍스쳐가 추출된다. 영상의 화질을 개선하기 위하여, 영상 평면에서 보정하는 대신 물체 공간에서 보정을 수행하였다.
전역탐색알고리즘(full-search algorithm, FSA)은 탐색영역의 범위가 커짐에 따라 방대한 양의 계산을 필요로 하기 때문에 이에 따른 알고리듬의 처리시간이 커지고, 하드웨어로 구현했을 때 회로가 복잡해진다는 문제점을 안고 있다. 본 논문에서는 이러한 문제점을 개선하기 위한 방안으로 비트플레인 정합에 의한 움직임 추정기의 VLSI 구조를 제안한다. 제안된 움직임 추정기에서는 비트 플레인 정합기준을 이용하여 기존의 전역 탐색 알고리즘을 하나의 이진영상으로 적용함으로써 움직임 추정에 소요되는 연산의 양을 크게 줄이면 서도 전역탐색 알고리듬과 유사한 움직임 추정 성능을 갖도록 하였으며, 제안된 VLSI 구조에서는 두 개의 프로세싱 코어를 채택하여 데이터 흐름을 시스톨릭 (systolic) 어레이의 형태로 제어하여, 시스템 내부의 SRAM을 제거하여 동작 속도 상의 이득뿐만 아니라, 메모리 공정을 필요로 하지 않는 저가의 공정을 사용 가능하게 함으로써 제작상의 비용을 절감할 수 있는 해결책을 제시하였다. 구현된 하드웨어는 VHDL을 이용하여 설계하고, 기능 검증을 수행한 후 0.6-μm three-metal CMOS 공정을 이용하여 8.15 X 10.84㎟의 크기로 집적하였다.
본 논문에서는 먼저 영역 기반 부호화를 위한 새로운 결합 분할 척도를 정의하고 이를 이용한 새로운 영상 분할 알고리즘을 제안한다. 결합 분할 척도는 기존의 밝기 분할 척도, 움직임 분할 척도 및 제안한 변화 검출기로부터 정의되는 변화 분할 척도의 가중 합으로 구성된다. 변화 분할 척도는 기존의 변화 검출기의 결과 영상에 포함되어있는 많은 부정확한 요소들을 제거하기 위하여 수리 형태학에 기반한 녹임 필터링된 영상으로부터 한 화소와 이와 인접한 화소간의 변화 차의 절대값으로 정의된다. 변화 분할 척도는 움직임이 있는 이동체 영역과 배경 영역간의 정차한 분할을 하는데 있어서 효과적인 분할 척도로 사용될 수 있다. 그러므로 제안한 결합 분할 척도는 영역 기반 영상압축의 영상 분할과정에서 추정된 움직임 정보가 부정확하고, 움직임이 있는 이동체 영역과 배경 영역간의 경계 부분에서의 밝기가 유사하더라도 이들간의 경계를 정확히 분할할 수 있다.
대형 디스플레이 화면에 대한 소비자의 선호도가 증가함에 따라 3관식 프로젝션 (projection) 텔레비전의 수요가 늘고 있다. 그러나 3관식 HD (high definition) 프로젝션 TV에서는 직시형 CRT (Cathode Ray Tube)를 사용하는 TV보다는 단위 면적당 절대 밝기가 어둡다. 또한 프로젝션 TV에 사용되는 인광체의 색재현 영역 (gamut)이 기존의 NTSC (National Television System Committee) 표준과 다른 것을 사용하고 있다. 본 논문에서는 3관식 프로젝션 HDTV의 RGB 인광체 좌표와 RGB 빔 전류비의 관계를 색온도 변화에 대하여 해석하고, 전류비에 따른 빔 프로파일의 변화에 의한 영상의 열화와 시각 특성인 Helmholtz-Kohlrausch 효과를 고려하여 시청자가 느끼는 밝기를 최대화하기 위한 기준 백색 (reference white)의 범위를 제안하였다.
최근 2차원 실시간 영상통신기술들이 급속한 발전을 거듭하여 여러 제품에 상용화되고 있는 추세이다. 그러나 이 기술들은 2차원 영상의 시각적 전송이므로 가상현실의 도래로 인해 수반된 3차원 현실감을 다루기에는 불충분하다고 할 수 있다. 이밖에 컴퓨터 그래픽 분야의 3차원 가상현실 연구가 합성 영상에 국한되어 연구되어졌기 때문에 실 영상에 대한 가상현실의 구현이 어려운 실정이다 그러므로 본 논문에서는 스테레오 시각을 이용하여 실 영상 가상현실 구현에 적용될 수 있는 유전자 알고리즘 기반의 새로운 3차원 객체 추출기법을 제시한다. 제안한 방법은 저장공간의 낭비와 알고리즘의 복잡성을 줄이기 위해서 확률벡터와 반복학습에 기반한 개체군기반 증가 학습이라는 소형 유전자 알고리즘을 정합 환경에 맞게 변형시켰다. 그 결과 정합 성능이 기존의 스테레오 정합 기법보다 우수하며, 간단하고 빠른 정합 알고리즘을 제시할 수 있었다. 또한, 영상의 특성에 무관하게 알고리즘의 변경 없이 안정된 결과를 얻을 수 있다는 장점이 있었다.
본 논문에서는 인간시각시스템 모델에 기반하여 회전과 이동은 물론 유손실 압축과 잘라내기 및 신축에 대해서도 견고한 디지털 영상 워터마킹을 제안하였다. 기존의 퓨리에 변환과 로그폴라맵핑을 이용하여 회전및 이동에 불변하도록함과 동시에 인간시각스템 모델의 공간주파수 감도를 감안하여 비가시성이 떨어지지 않는 범위 내에서 워터마크 에너지를 최대한 인가하고, 각 워터마크 비트들의 정보를 임의 섞음하여 전 영역에 분산 삽입하였다. 이와 같이 함으로써 잘라내기와 유손실 압축과 같은 영상처리나 회전, 이동 및 신축과 같은 기하학적 변형 등에 대해 워터마크 견고성을 더욱 향상시켰다. 또한 워터마크와 템플릿을 교차하지 않게 삽입함으로써 이들의 교차로 인한 비가시성과 견고성의 저하를 방지하였다. 실험을 통하여 제안한 워터마킹 방법은 유손실 압축, 잘라내기 및 신축에 대하여 기존방법보다 약 30∼75 [%]정도 더 견고성이 향상됨을 확인하였다.
본 논문에서는 EBMF(Edge Based Median Filter)와 3-Step AMPDF(Adaptive Minimum Pixel Difference Filter) 기반의 움직임 적응 디인터레이싱 알고리즘을 제안 한다. 움직임 적응 방법에서 중요한 요소인 motion missing에 의한 에러를 방지하기 위해 입력 영상을 4 가지 유형으로 구분하여 각 영상에 따라 다른 임계 값을 사용하여 정확한 화소 값을 보간 하는 AMPDF를 사용하며 움직이는 대각선 에지의 효과적인 보간을 위하여 에지에 따라 가변적인 후보 픽셀을 선택하는 EBMF를 사용하여 성능을 향상시켰다. 또한 성능을 높이기 위해 입력되는 영상을 움직임 영역, 정지 영역, 경계 영역으로 나누어 적응적으로 보간 하였으며 모의 실험을 통해 기존의 방법들에 비해 성능이 우수함을 보였다.
본 논문에서는 음성신호의 발성길이와 상관없이 일정한 크기의 파라미터를 얻을 수 있는 새로운 방법을 제안하였다. 음성인식기의 성능은 음성신호에서 추출된 파라미터간의 유사도(패턴간의 거리)를 어떻게 비교하는지에 따라 결정된다. 그러나 화자에 따른 음성신호의 변이나 발성속도의 차이는 음성신호에서 일정한 크기의 파라미터 추출을 어렵게 한다. 제안한 방법은 음성신호에서 얻어진 파라미터를 스펙토그램의 형태로 표현한 뒤 2차원 DCT(Discrete Cosine Transform)를 이용해 일정한 크기의 파라미터로 정규화시키는 방법이다. 제안한 방법의 유효성을 입증하기 위해 청각세포를 모델링한 32개의 대역통과 필터로부터 얻어진 음성신호의 파라미터를 2차원 DCT 방법으로 가공한 후, 신경 회로망의 입력으로 사용하였다. 또한 기존 방법과의 인식률 비교를 위해 기존의 정규화된 입력을 구하는 방법 중 하나를 선택하여 비교 실험을 수행하였다. 실험결과 제안한 방법은 기존 방법에 비해 화자종속 및 화자독립 고립단어 인식에서 더 높은 인식률과 빠른 인식속도를 얻을 수 있었다.
MBE(Multi-Band Excitation) 음성부호화 방식은 프레임 단위로 유/무성음을 구분하는 기존의 분석-합성 방식과는 달리 한 프레임 내에서의 주파수 영역을 여러 대역으로 나누고, 각 대역별로 유/무성음 구간을 판정하여 그에 맞는 여기신호를 이용하여 음성을 합성한다. 이러한 MBE 방식은 프레임 단위로 유/무성음을 구분하는 기존의 방식들이 갖는 합성음의 buzziness 영향이나 잡음이 섞인 음성을 분석할 때 생길 수 있는 유/무성음 판정 오류의 영향을 최소화함으로써 음질 향상을 이룰 수 있다. IMBE-LP 방식은 MBE 방식을 이용하여 2.4 kbps의 저전송률을 얻기 위한 음성부호화 알고리즘으로 MBE 모델에서 사용되는 각 대역별 스펙트럼 정보를 LP(Linear Prediction) 계수로 모델링 한다. 본 연구에서는 2.4 kbps IMBE-LP 알고리즘을 구현하고, 주파수대역 정보를 이용하여 분석프레임의 음성특성에 따라 LP차수를 달리 함으로써 전송률을 줄일 수 있는 방법을 제안하고 실험하였다.
Tracking the targets of interest has been one of the major research areas in radar surveillance system. We formulate the tracking problem as an incomplete data problem and apply the EM algorithm to obtain the MAP estimate. The resulting filter has a recursive structure analogous to the Kalman filter. The difference is that the measurement-update deals with multiple measurements and the parameter-update can estimate the system parameters. Through extensive experiments, it turns out that the proposed system is better than PDAF and NNF in tracking the targets. Also, the performance degrades gracefully as the disturbances become stronger.