Proceedings of the IEEK Conference (대한전자공학회:학술대회논문집)
The Institute of Electronics and Information Engineers (IEIE)
- 기타
2000.09a
-
DSL 서비스에서 보다 고속의 데이터 전송을 위하여 심볼률을 확장하면 부분적으로 대역이 겹치는 반향신호가 발생한다. 이에 기존의 다상 반항제거기를 적용하면 높은 심볼률로 인하여 엄청난 연산량을 필요로 한다. 본 논문에서는 부분적으로 대역이 겹치는 반향신호를 기존의 절반이하의 연산량으로 제거하는 새로운 반향제거기 구조를 제안한다. 이는 다중률 필터링을 통하여 신호처리의 속도를 낮춘 것으로서, 뛰어난 연산절감과 아울러 기존의 반향제거기와 방불한 성능을 보인다.
-
This paper focuses on the development of speech enhancement techniques for hands-free audio terminals, including two major problems : noise cancellation and acoustic echo cancellation. The objective is to find a joint structure to get a near-end speech signal with minimum distortion and low levels of echo and noise. To solve the two problems, a new promising technique is studied and tested in computer simulation conditions.
-
현장감 있는 원거리 회의를 위해서는 두 채널 이상의 신호를 전송하는 스테레오 시스템이 필요하다. 이러한 원거리 회의 시스템의 경우 스피커와 마이크로폰간의 커플링에 의해 발생하는 음향 반향을 제거하기 위해 스테레오 음향 반향 제거기가 요구된다. 본 논문에서는 스테레오 음향 반향제거기의 성능을 효과적으로 개선하기 위하여 인간의 청각 특성과 음성 신호 특성을 이용한 전처리단을 제안한다 제안한 전처리단은 마스킹 현상을 이용하여 청각적으로 인지할 수 없는 크기의 부가 잡음을 음성 신호 분석을 통해 발생시켜 원 신호에 더해줌으로 두 채널 신호의 상호 상관 관계를 낮추어 준다. 또한 본 논문에서는 적응 반향 제거 알고리즘인 Affine Projection(AP) 알고리즘이 Cram-Schmidt(GS) 직교화 과정을 통한 벡터 연산으로 갱신될 수 있음을 이용하여, 별도의 음성 분석 과정 없이 AP알고리즘의 GS 직교화단으로 제안한 전처리단을 구현할 수 있음을 보이고, 최종적으로 전처리단과 적응 알고리즘이 결합된 스테레오 음향반향 제거를 위한 적응 알고리즘을 제안한다.
-
회전기에서 발생하는 소음성 잡음의 경우 능동잡음 제어를 이용 진폭이 상대적으로 큰 주기성 저주파 잡음 제어로 상당한 감쇄효과를 얻을 수 있다. 본 논문에서는 주기적 저주파 잡음을 효과적으로 제거하는 부밴드 능동잡음제어 구조를 제안하였다 이 구조에서는 QMF를 이용, 진폭이 큰 주기적 저주파신호를 분리하여 적응측엽제거 원리를 적용하여 저주파 신호를 제거한다. QMF에서 발생하는 지연은 각 필터를 통과한 신호경로에 적응필터를 사용하여 보상하였다. 그리고 적응필터 성능향상을 위해 최적 적응이득을 해석적으로 구하여 사용하였다.
-
최근 이동전화의 사용이 급격히 확산됨에 따라 핸즈프리 단말기를 이용한 전화통신의 필요성이 대두되고 있다. 차량내 핸즈프리 통신상황의 경우 근거리에 위치한 스피커와 마이크로폰의 커플링에 의해 발생하는 음향반향과 차량내에 존재하는 배경잡음은 통화 품질을 크게 저하시킨다. 본 논문에서는 이동통신에 적합한 음향반향제거기와 잡음제거기의 결합시스템을 제안하고, 이를 고정 소수점 DSP를 이용하여 실시간 구현하였다. 실시간 구현을 위하여 음향반향제거기에는 NLMS 알고리즘에 의해 구동되는 제한된 차수의 적응반향제거기법을 사용하였다. 잔여반향 및 배경잡음제거를 위해 CDMA방식의 셀룰라 이동통신에 사용되는IS-127 EVRC음성 부호화기의 표준안에 포함된 잡음제거방식을 사용하였다. 제안된 시스템을 16 비트 고정소수점DSP인 OAK DSP Core를 이용하여 약 18.6MIPS의 연산량으로 실시간 구현되었다.
-
In this paper, we choice multicarrier direct-sequence code division multiple access using bandwidth effectively in communication system. Because this system is based on DS-CDMA the same problem is raised. That is, the degradation of the performance is due to multiple access interference. To solve this problem, we proposed the blind adaptive receiver for MC DS-CDMA system. Simulation results show that the proposed blind receiver has more about 0.5(dB) value of SNR than conventional receiver.
-
시변 페이딩 채널환경에서 DS-CDMA 다중 사용자 환경의 이동통신 시스템에서 채널의 효율을 높이기 위해 학습 신호열을 사용하지 않는 새로운 블라인드 등화 기법을 제안한다. 블라인드 등화 기법 중에서 가장 성능이 좋은 CMA(Constant Modulus Algorithm)는 가변하는 페이딩 채널환경에서 채널등화에 효과적이지 못하다. 따라서 Kalman 필터와 CMA를 결합한 새로운 등화 기법은 자승 오차와 Eye-Pattern의 성능 비교를 통해 기존의 방법 보다 우수함을 확인할 수 있었다.
-
DS-CDMA (direct sequence-code division multiple access) 시스템에서 여러 사용자가 동일 주파수 대역을 공유함으로써 다중 접속 간섭 (multiple access interference; MAI)이 발생하고 시스템의 성능을 크게 제한한다. 이러한 다중 접속 간섭을 제거하여 전송 신호의 질을 높이고 용량을 증대시키는 중요한 신호 처리 기술 가운데 하나가 적응 간섭 억제 기술이다. 적응 간섭 억제 기술 가운데 CMA (constant modulus algorithm) 기반의 블라인드 적응 간섭 억제기는 훈련수열을 필요로 하지 않고 빠른 수렴을 통하여 간섭을 효과적으로 제거할 수 있으나, 다중 경로 환경에서 심벌간 간섭 (intersymbol interference; ISI)이 증대되어 기존의 적응 수신기보다 악화된 성능을 보인다. 본 논문에서는 CMA를 기반으로 훈련 수열 없이 빠른 수렴을 하며 MAI와 ISI를 효과적으로 제거하기 위한 다이버시티 결합기 구조의 적응 간섭 억제기를 제한한다. 다중 경로 페이딩 채널 환경에서 기존의 블라인드 적응간섭 억제기와의 성능 비교 결과, 제안된 방식이 다중경로에 의한 ISI의 영향을 효과적으로 제거하여 우수한 성능을 얻을 수 있음을 확인하였다.
-
기존의 신호 공간 추적 방법을 이용한 blind multiuser detector는 nonstationary 환경에서 새로운 환경에 적응하기 위해 비교적 긴 시간을 필요로 한다 본 논문은 가변 망각 인자를 도입한 확장 PASTd (Projection Approximation Subspace Tracking with Deflation) 알고리즘을 이용하여 환경 변화에 좀더 신속히 적응하는 성능 향상을 모의실험을 통해 보이고자 한다.
-
In this paper, we analyze the performance of W-CDMA systems using turbo code in the wideband multipath channel. The strength of each multipath component is assumed to be Rayleigh distributed. Turbo codes of long block sizes have been known to show very good performance in a AWGN channel. Recently, turbo codes of short block sizes suitable for real time communication systems have attracted a lot of attention. Thus, in this paper we consider the turbo code of 1/3 code rate and short frame size of 192 bits in wideband mobile multipath channel. We analyze the performance of W-CDMA systems with 10MHz bandwidths in the case of employing RAKE receiver with not only MRC diversity but also turbo code.
-
In the Multirate DS/CDMA system based on VSL(Variable Spreading Length), the problem of the multiple access interference and effect similar to near-far effects in current system is generated. This problem can degrade performance of the system badly. Therefore, In this paper we proposed Hybrid Interference Cancellation to overcome this problems, Simulation result presents that the proposed Hybrid Interference Cancellation has the better performance than the conventional decorrelator, Parallel Interference Cancellation.
-
차세대 초고속 무선 전송을 위한 OFDM (orthogonal frequency division multiplexing) 방식에서는 전송 신호의 진폭이 큰 PAPR (peak-to-average power ratio)을 갖게 되어 송신기에서 사용되는 고출력 증폭기의 비선형성에 의해 큰 왜곡을 받게 된다. 이러한 왜곡의 보상을 위하여 우리는 고정점 반복 (fixed point iteration)에 기반한 사전왜곡기 (predistorter)를 제안하였으나, 이는 고출력 증폭기의 특성이 변화하지 않는다는 가정에서 구현되었다. 본 논문에서는 구간 선형 근사에 기반하여 고출력 증폭기의 시변 특성을 추종하는 새로운 기법과 이렇게 근사된 고출력 증폭기 특성을 이용하는 적응적인 고정점 반복 사전왜곡기의 구현을 제안한다. 모의실험 결과, 제안된 고출력 증폭기 근사 방법은 랜덤한 증폭기 특성 변화를 매우 효과적으로 추종하며 이러한 근사 결과를 이용한 고정점 반복 사전왜곡기는 우수한 성능을 보임을 확인하였다.
-
본 논문에서는 제한된 통신 채널의 대역에서 주파수 효율이 높은 OFDM 시스템을 위한 반송파 주파수 동기 알고리즘을 제안한다. OFDM 시스템에서의 반송파 주파수 옵셋은 부반송파 간격의 정수배와 소수배로 나누어진다 소수배 주파수 옵셋이 ± 0.5 근처의 값을 가질 경우에는 정확한 정수배 주파수 옵셋 추정이 어렵고 반송파 동기 PLL이 소수배 주파수 옵셋을 추적하는데 많은 시간이 소요된다. 제안한 알고리즘은 정수배 주파수 옵셋을 제거하기 위해 2개의 심볼 만을 이용하고 다중경로 패널에서도 정확한 정수배 주파수 옵셋의 추정이 가능하다 또한, 소수배 주파수 옵셋이 ± 0.5 근처의 값을 가질 경우 적은 계산량으로 주파수 옵셋을 ± 0.1 이내로 보상할 수 있다.
-
본 논문에서는 실측 데이터를 기준으로 9가지의 다양한 모델을 제안한 JTC(Joint Technical Committee) 모델을 전송 채널 모델로 채택하여 채널의 PDP(Power Delay Profile)의 불규칙성 따른 OFDM (Orthogonal Frequency Division Multiplexing) 통신 시스템의 성능을 분석하였다 전송 채널의 불규칙성은 Main profile의 길이, Peak 위치, Echo profile의 지연 시간, 그리고 Echo profile의 강도로 분류하여 각각에 따른 PDP를 설정하여 각 모델에 따른 OFDM 시스템의 성능 분석을 하였다.
-
It is well-known that the decision rule in the mini-mum mean-squares-error decision feedback equalizer(MMSE-DFE) is biased, and therefore suboptimum with respect to error probability. We present a new family of algorithms that solve the bias problem in the adaptive DFE. A novel constraint, called the constant-norm con-straint, is introduced unifying the quadratic constraint and the monic one. A new cost function based on the constant-norm constraint and Lagrange multiplier is defined. Minimizing the cost function gives birth to a new family of unbiased adaptive DFE. The simula-tion results demonstrate that the proposed method in-deed produce unbiased solution in the presence of noise while keeping very simple both in computation and im-plementation.
-
본 논문에서는 부밴드에서의 수렴 성능 향상을 위하여 새로운 블록 LMS 알고리듬과 부밴드 각 적응필터에 가변 적응이득을 사용하는 가변 적응이득 블록 LMS 알고리듬을 제안한다. 이들 알고리듬들을 유도하기 위해 새로운 비용함수를 제안하며, 유도된 비용함수는 적응 필터 계수에 대해 2차 형식인 특징을 가진다. 제안한 알고리듬의 수렴 성능을 평가하기 위하여 부밴드 LMS 알고리듬과 가변 적응이득 알고리듬을 컴퓨터 모의 실험을 통해 비교함으로서 성능의 우수성을 입증하였다.
-
본 논문에서는 음향반향제거기를 구현하기 위한 적응알고리즘을 제안한다 특히 긴 임펄스 응답을 가지는 시스템의 식별을 위해 웨이블릿 필터를 사용하여 입력신호를 서브밴드로 분해함으로써 기존의 RLS알고리즘의 계산량을 줄여 수렴속도를 향상시켰다. 이 과정에서 적응필터를 다위상 구조로 구성하여 컨벌루션 과정을 병렬처리가 가능하도록 하였다. 제안된 알고리즘의 성능분석을 위하여 실제 음성신호를 입력신호로 하여 컴퓨터 모의실험을 수행하였으며 전대역 RLS알고리즘과 비교하였다.
-
In this paper, the performance of 05-CDMA system with smart antenna is analyzed for different bandwidths (1.25MHz, 5MHz) and different channel environments (rural, urban). For the analysis of smart antenna system, the vector channel having the spatio-temporal correlation is modeled as a time-variant linear filter in time, and each multipath is assumed as a reflective wave from only one direction (only one cluster) in space. Several multipaths within one chip are distinguished into each one and the strongest signal is selected. DS-CDMA system with smart antenna using wider bandwidth present better performance than that using narrow bandwidth. It is shown that the smart antenna is more effective in urban area when using 2D-RAKE receiver.
-
DS/CDMA 이동통신 환경에서 채널의 용량을 제한하는 가장 큰 요인은 다중 사용자 간섭 신호의 영향이다. 본 논문에서는 어레이 안테나와 적응 혼합 다중 사용자 검파기 구조 (MUD: Multi-User Detection)를 이용하여 이러한 문제를 제거한다. 어레이 안테나의 각각의 빔 형성기는 MUD에서 궤환되는 기준 신호를 이용하여 원하는 사용자의 방향으로 빔을 형성하고 간섭 신호 방향으로는 널을 형성하여 제거하게 된다. 수신 신호의 전력이 제어되지 못하여 원근 문제(near-far problem)가 발생할 경우, 제안한 MUD는 적응적으로 지배적인 상관 값에 대해서는 직렬형, 비슷한 크기의 신호들은 병렬형 간섭 제거기를 통하여 제거함으로써 기존의 고정형 간섭 제거기보다 우수한 성능을 나타내었다.
-
Differential channel 정보를 feedback 하는 close loop Tx diversity를 제안한다. 본 Tx diversity는 기존의 channel feedback Tx diversity 보다 W-CDMA의 forward link와 reverse link channel 용량을 더 많이 늘린다. Differential channel 정보를 estimation 하는 방법을 제안한다. 부가적으로 보내는 정보 없이 W-CDMA의 forward power control 에 사용하는 dedicated pilot 심볼을 이용해 differential channel 정보를 estimation한다. 기존에 제안된 channel feedback Tx diversity들과 성능을 비교한다.
-
In this paper, the performance of the W-CDMA system with smart antenna is investigated. The realistic wideband channel is assumed, one of which is JTC(Joint Technique Committee) channel model. It is also assumed that multipaths are clustered. The beamforming-RAKE receiver structure of W-CDMA system is proposed, whose performance is analyzed on the assumption of perfect channel estimation. The probability density function (pdf) of SINR(Signal to Interference and Noise Ratio) for different number of antennas and users is presented, and the BER(Bit Error Rate) is presented based on that. As a result, the performance of the W-CDMA system with smart antenna in the realistic wideband channel has been considerably improved.
-
배열 안테나에서 안테나 소자의 개수의 증가는 안테나의 이득을 증가시킬 수 있으므로 열악한 채널 환경에서도 채널이 필요로 하는 링크 마진을 얻을 수 있다. 그러나, 기존 빔 형성기에서 사용되는 배열 안테나 기법은 많은 계산량과 소모 메모리량 때문에 배열 소자의 개수에 제한이 따르게 된다. 이러한 문제를 해결하기 위하여 본 논문에서는 배열 안테나의 구조에 따른 위상차이를 보상하여 적은 계산량과 메모리를 갖는 배열 위상 차이 보상을 이용한 평행 구조 빔 형성기를 제안한다 배열 위상 차이를 보상하는 기법으로 적은 계산량과 메모리로 개수가 많은 긴 배열 안테나에서 얻을 수 있는 분해능과 안테나 이득을 얻을 수 있다. 제안된 기법의 성능을 비교하기 위해 기존의 빔 형성기법으로delay-sum 빔 형성기와 공분산 행렬의 고유치 해석을 통한 고유벡터 기법의 빔 스펙트럼과 연산량을 비교하였다. 제안된 기법으로 빔 형성을 하면, 배열 안테나의 소자의 개수가 늘어나도 기존의 방법보다 최소 30%의 연산량으로 스펙트럼 상 비슷한 성능을 얻을 수 있다.
-
비디오 데이터의 효율적인 검색, 요약 등에 활용하기 위해서 대용량의 비디오 데이터를 프레임(Frame), 샷(Shot),스토리(Story)의 계층적인 구조로 표현하는 방법들이 요구되고 있으며, 이에 따라 비디오를 샷, 스토리 단위로 분할하는 연구들이 수행되고 있다. 본 논문은 비디오가 샷 단위로 분할되어 있다고 가정한 후, 인접한 샷들을 결합하여 의미 있는 최소 단위인 스토리를 분할하는 방법을 제안한다. 제안하는 방법은 각 샷에서 추출된 대표 프레임들을 비교하기 위한 CCV(Color Coherence Vector) 영상 특징을 추출한다. CCV 특징의 시각적인 유사도의 초기임계값과 일정한 시간 안에 반복되는 프레임들을 찾기 위한 시간적인 유사도의 시간 임계값을 설정하여NN(Nearest Neighbor) 클러스터링 방법을 이용하여 클러스터링을 한다. 클러스터링된 정보와 같은 장면이 한번이상 반복되는 스토리의 특성을 이용해 비디오를 스토리로 분할한다. 영화 비디오 데이터를 이용한 실험을 통해 제안하는 방법의 유효성을 검증하였다.
-
CTI[1]의 응용 영역 중에서 인터넷 폰이 최근 뜨거운 관심의 대상으로 떠오르고 있다. 인터넷을 이용한 음성전달 기술은 인터넷의 성장 보급과 더불어 나날이발전 하고 있는데, 이러한 음성전달기술을 이용해 개발된 소프트 웨어를 통칭해서 인터넷 폰이라고 부르고 있다. 이러한 변화 속에서 비용의 절감과 비디오 전화, 영상회의와 같은 응용에 적용할 수 있는, 본 개발은 One Encoder One Decoder 지원의 VoIP(Voice over Internet Protocol) Phone에 관한 것으로, 특히 압축하여 인터넷 망에 접속시켜 사용할 수 있는 PC 장착형 One Board 형태의 시스템을 구현하였다. 이 Board에 사용 된 칩셋은 국내 회사인 C&S Technology 사의SEAGUL723이며, PC인터페이스는 PCI(Peripheral Component Interconnect) 버스 방식을 이용하였다. 주요 연구내용에 있어서 하드웨어 부분은 내선제어모듈,PCI 모듈, 칩셋을 이용한 음성신호처리 모듈, Board제어 모듈 등이 있으며, 소프트 웨어 설계 부분에 있어서는 하드웨어 구동을 위한 시스템 드라이브, Application과 인터넷 상의 VoIP 통신을 위한 소프트웨어, 사용자를 위한 User Interface 소프트 웨어 등이 있다.
-
An algorithm for the reduction of blocking artifacts is pro-posed. Instead of filtering the pixels by a digital filter, the proposed algorithm considers the compressed image as continuous-time ,signal and replaces it by a pre-designed lowpass filter outputs. The algorithm shows better performance than the conventional methods in low activity region, and comparable or a little worse objective performance in high activity region. Hence, by applying the proposed algorithm to the low activity region and the conventional ones to the high activity region, the objective and subjective performances are improved in most cases.
-
본 논문에서는 probabilistic principal component analysis (PPCA)를 이용하여 extended maximum a posteriori (EMAP)에 기반한 화자적응 시스템의 성능을 향상시키는 방법을 제시하고자 한다. PPCA는 각각의 hidden Markov model (HMM) 사이의 상관계수 행렬을 강인하게 예측하는데 적용된다. 이렇게 구한 상관계수 행렬은 화자적응 시스템에 사용된다. PPCA는 연산이 효율적이고, EMAP에서 기존에 사용되었던 방법에 비해 향상된 성능을 보여준다. 여러 차례의 음성인식 실험을 통하여, PPCA를 적용한 EMAP은 적은 양의 적응 데이타에서 좋은 성능을 보인다는 것을 확인할 수 있다.
-
인터넷이 일상생활에 다양하게 활용되면서 인터넷 채널을 통한 정보의 형태는 문자와 이미지 외에 음성, 오디오 신호 및 동영상 부분까지 확대되고 있다. 본 논문에서는 MPEG4-CELP를 인터넷 화상 통신의 음성 코덱용으로 사용하기 위한 최적화 기법 및 알고리듬의 개선을, DSP칩이 내장된 보드가 아닌 인터넷의 터미널로 사용되고 있는 펜티엄 프로세서를 장착한 PC에 초점을 맞추어 수행하였다. MPEG4-CELP VM C소스를 분석 및 프로파일(Profile)한 결과를 토대로 패라미터 추출을 위해 많은 연산을 수행하는 부호화기에 대해서 CPU상에 부하를 많이 주는 함수들을 제 1차 최적화 대상 함수들로 선정하고, CPU에 부하를 많이 주지는 않으나 호출되는 회수가 많은 함수를 2차 최적화 대상 함수로 선정해, C소스 레벨의 소프트웨어 파이프 라이닝(Software Pipelinging) 기법들을 적용하여 최적화를 수행하였다. 또한 1차 최적화 대상 함수의 경우에는 소프트웨어 파이프라이닝의 적용과 함께 연산량 감소를 위한 알고리듬 변형까지 수행하였다. 위의 과정을 거쳐 최적화 된 MPEG4-CELP는 펜티엄Ⅲ 450㎒ PC에서 음성을 부호화 하는데 원 VM소스에 비해 약 2배정도의 시간이 단축되는 것을 확인하였다.
-
STC(Sinusoidal Transform Coding) 방식은 음성신호의 주파수 영역에서 스펙트럼 피크치들을 정현파로 모델링하여 합성하는 방식을 말한다. 저전송률 STC 방식에서는 전송되는 정보량을 줄이기 위해 스펙트럼 피크를 대신해 음성신호의 스펙트럼 포락선 정보와, 피치정보를 이용하여 얻어지는 고조파 성분들을 정현파로 모델링하여 음성을 합성한다. 본 논문에서는 음성신호의 정현파 모델에 기반하여 2.4kbps 전송속도를 갖는 음성부호화 알고리즘을 제안하였으며, 실험결과로 합성음의 파형과 스펙트럼 특성, 위상특성, 그리고 MOS(Mean Opinion Score) 테스트를 이용한 합성음의 음질을 비교/분석 하였다.
-
현재까지 발표된 음성 부호화기 중에서 저전송률에서 양호한 음질을 제공하는 CELP 계열 보코더에 대한연구가 가장 많이 이루어지고 있다. 그 중에서 G.723.1부호화기는 인터넷 폰이나 화상회의 등 상용서비스로 개발되었다. G.723.1 부호화기에서는 음성신호의 선형예측 방법 중 LSP 파라미터를 이용하는 방법이 많이 사용된다. 이것은 LSP 파라미터의 전송형 특징 중 낮은 전송률에서도 왜곡이 적고 선형보간 특성이 뛰어나기 때문이다. 하지만 LPC 계수를 LSP 파라미터로 변환하기 위해서는 많은 계산시간이 소요된다[1]. 본 논문에서는 G.723.1 보코더에서 LSP 변환 시 다항식의 근을 찾는 순서를 음성신호의 LSP 분포 특성에 맞게 조정함으로써 전체 계산시간을 평균 2% 단축하였다.
-
본 논문에서는 고성능 고정 소수점 DSP (Digital Signal Processor) 코어인 Vincent6 코어 [1]를 이용하여 ITU-T C.728 음성 부호화기를 실시간으로 구현하였다 G.728 은 16 kb/s전송률의 ITU-T표준 음성 부호화기이며, 입력신호는 8 kHz로 샘플링되며 샘플 당 16 bit 로 양자화된 PCM 신호이다. G.728 은 LD-CELP(Low Delay Code Excited Linear Prediction)라고도 하며, 알고리 듬 delay는 0.625ms 이다. Vincent6 DSP core 는 VLIW (Very-Long Instruction Word) 특성을 가지므로 다중 명령 (multiple instruction)을 수행할 수 있다 이를 위해서 G.728 annex G를 이용하여 고정 소숫점 연산으로 코드를 작성한 후, 이를 vincent6 어셈블리 코드로 구현하였다. 최종적으로 구현된 코드는 ITU-T 의 test vector 에 대 해 bit exact 한 결과를 보이며 34 MCPS (Million Cycles Per Second)의 계산량을 가지며 사용 메모리크기는 데이터 메모리가 약 9KByte, 프로그램 메모리가 약 57 KByte 이다.
-
본 논문에서는 DSP Group사의 16 비트 고정 소수점 DSP인 OaKDSP Core를 사용하여 유럽의 이동통신에서 표준으로 사용되고 있는 음성 부호화기 알고리즘인 GSM-EFR (Global System for Mobile communications -Enhanced Full Rate) 을 실시간으로 구현하였다. 구현된GSM-EFR 음성 부호화기의 계산량은 약 24 MIPS가 소요되며, 7.06K 워드의 코드 메모리와 12.19K 워드의 데이터 메모리를 사용하였다. 구현된 음성 부호화기는 ETSI에서 제공하는 시험 벡터 샘플을 모두 통과하였으며, 객관적 평가 툴을 이용하여 지각 평가를 수행한 결과, 32kbps ADPCM과 비슷한 음질을 보였다. 본 논문에서 실시간으로 구현된 GSM-EFR 음성 부호화기는 IMT2000 비동기 방식의 음성 부호화기 표준인 GSM-AMR의 최상위 전송률 모드로서. 앞으로 IMT-2000 비동기식 단말기용 모뎀 ASIC에 탑재할 GSM-AMR 음성부호화기의 구현을 위한 기본 구조로 이용될 예정이다.
-
일반인들은 음성인식을 이용한 생활보조기구들의 필요성이 적지만 장애인이나 노인들은 가족이나 주변인의 도움을 받지 않고서는 가전제품의 작동이나 전화통화 등과 같은 일을 스스로 하기에는 쉽지 않다. 이러한 사람들에게 각 가정에 널리 보급되어 있는 PC를 이용하여서 타인의 도움을 받지 않고서도 간편하게 사용할 수 있게 음성을 이용한 생활보조기구들 제어에 응용하였다본 음성인식기는 음성의 끝점 검출, 음성의 특징계수 추출, 백터 양자화 학습 및 인식, HMM학습 그리고 HMM인식으로 나누어져 있다. 그리고 그 인식 결과에 따라 생활보조기구등을 제어하였다. 이러한 음성인식기를 만드는 것은 노인이나 장애인들에게 자신이 혼자할수 없는 생활의 편리함을가져다 주기 위함이고 일반정상인에게도 많은 편리함을 가져다 주기 위함이다. 그러나 언어 학습과정에서 노인이나 환자는 학습에 어려움이 있어 적은 학습으로도 인식되어야하는 과제가 남아있다.
-
이 논문에서는 2차원 얼굴 좌표데이터를 합성하기 위한 음성과 영상 동기화 알고리즘을 제안한다. 영상변수의 획득을 위해 화자의 얼굴에 부착된 표시를 추적함으로써 영상변수를 획득하였고, 음소정보뿐만 아니라 운율정보들과의 영상과의 상관관계를 분석하였으며 합성단위로 시각소에 기반한 코퍼스를 선택하고, 주변의 음운환경도 함께 고려하여 연음현상을 모델링하였다. 입력된 코퍼스에 해당되는 패턴들을 lookup table에서 선택하여 주변음소에 대해 기준패턴과의 음운거리를 계산하고 음성파일에서 운율정보들을 추출해 운율거리를 계산한 후 가중치를 주어 패턴과의 거리를 얻는다. 이중가장 근접한 다섯개의 패턴들의 연결부분에 대해 Viterbi Search를 수행하여 최적의 경로를 선택하고 주성분분석된 영상정보를 복구하고 시간정보를 조절한다.
-
본 연구에서는 기존의 통계 이론에 근거한 음성 검출 기법을 제안하는 음성 스펙트럼 모형화기법을 통해 개선시키고자 한다 기존의 방법과는 달리 음성을 하나의 단일 모형이 아닌 여러 클래스(class) 모형의 결합체로 간주한다. 각 클래스 모형의 추정을 위해 신호원 부호화(source coding)의 클러스터링(clustering)과 유사한 기법을 제안하고, 이를 이용한 두 가지의 검출 기법을 제안한다. 하나는 각각의 클래스에 대해 LRT(likelihood ratio test)를 수행하고, 이를 최종적으로 통합하는 기법이고 다른 하나는 각 클래스의 모형으로부터 혼합모형(mixture model)을 구하여 이를 이용하여 LRT를 수행하는 방법이다. 제안한 두 가지 방법 모두 비교적 적은 연산량 증가에도 불구하고 실험 결과 기존 방법에 비해 매우 우수한 성능을 보였다.
-
본 논문에서는 음성 인식률 향상을 위한 여러 가지방법들 중에서 음성특징 파라미터 추출 방법에 관한 한가지 방법을 제시하였다. 본 논문에서는 청각 특성을 기반으로 한 MFCC(met frequency cepstrum coef-ficients)와 성능 향상을 위한 방법으로 GFCC (gamma-tone filter frequency cepstrum coefficients)를 제시하고 음성 인식을 수행하여 성능을 분석하였다. MFCC에서 일반적으로 사용하는 임계 대역 필터로 삼각 필터(triangular filter) 대신 청각 구조의 기저막(basilar membrane)특성을 묘사한 gammatone 대역 통과 필터를 이용하여 특징 파라미터를 추출하였다. DTW 알고리즘으로 인식률을 분석한 결과 삼각 대역 필터를 이용한 것보다 gammatone 대역 통과 필터를 이용한 추출법이 약 2∼3%의 성능 향상을 보였다.
-
In the generally a voice conversion has used VQ(Vector Quantization) for partitioning the spectral feature and has performed by adding an appropriate offset vector to the source speaker's spectral vector. But there is not represented the target speaker's various characteristics because of discrete characteristics of transformed parameter. In this paper, these problems are solved by using the LMR(Linear Multivariate Regression) instead of the mapping codebook which is determined to the relationship of source and target speaker vocal tract characteristics. Also we propose the method for solved the discontinuity which is caused by applying to time aligned parameters using Dynamic Time Warping the time or pitch-scale modified speech. In our proposed algorithm for overcoming the transitional discontinuities, first of all, we don't change time or pitch scale and by using the LMR change a speaker's vocal tract characteristics in speech with non-modified time or pitch. Compared to existed methods based on VQ and LMR, we have much better voice quality in the result of the proposed algorithm.
-
본 논문은 CD-ROM Title 컨텐츠의 검색과 제어를 위한 음성인식 시스템 개발을 목적으로 한다. 인식명령어는 학교 졸업앨범 또는 회사홍보용 CD-ROM Title컨텐츠의 타이틀(상품안내, 회사소개, 업무실적 등)로 구성된다. 모델은 지속시간을 고려한 DMS 모델, 인식은 OSDP를 사용하였다.
-
일반적인 한국어 대용량 어휘인식에 사용되는 triphone 모델은 한국어의 특성을 잘 표현한다는 장점이 있으나 인식시간이 길어지게 된다. 이러한 triphone 모델의 단점을 극복하기 위해 음절단위 HMM 모델을 사용하는 방법이 있는데 이 모델은 인식시간을 줄일 수 있으나 triphone 모델에 비해서 인식률이 낮다. 본 논문에서는 음성 인식시간을 단축시키고 조음현상을 고려하기 위하여 초성과 종성 자음은 각각의 biphones으로 나타내고 중성 모음은 1개의 monophone으로 나타내는 모델을 제안하였다. PBW445 음성 데이터베이스에 대한 실험결과, 제안한 인식모델이 triphone 모델에 가까운 인식률을 나타내었으며, 인식시간을 크게 단축하였다.
-
In this paper, we improve statistical-model-based speech detector using the probability that a speech occupies a frequency bin. While the previous method assumes speech energy occupies all the frequency components and use them with equal weights in the likelihood ratio test for speech detection, the proposed method assumes speech energy occupies just some frequency componets and use them with different weights in accordance with the probabilities of spectral occupancy in the test. The probability is iteratively up-dated for speech frames to contribute to the likelihood ratio test. The proposed method well reflects the characteristic distribution of speech spectrum, and yields better detection performance.
-
음성의 발성속도가 빠른 경우에는 발성속도가 느린 경우보다 적은 정보만으로도 부호화가 가능하다 음성의 발성속도가 빠른 경우에는 청취시 낮은 주파수 대역의 정보가 높은 주파수대역의 정보보다 중요하게 된다. 음성 부호화 기술은 전송를과 복잡도를 줄이고 음질을 향상시키는 방향으로 진행되고 있다. 현재 상용화되고 있는 CELP형 보코더는 낮은 전송를에 비해 우수한 음질을 제공하지만, 기존 방식은 음성의 발성속도에 대해서 처리를 달리하지 않고 사용하고 있다. 음성의 발성속도를 측정하여 발성속도가 빠를 경우에, 발성속도가 느린 경우보다 낮은 대역의 정보만 전송한다면 전송율을 감소시킬 수 있다. 본 논문에서는 CELP 부호화기의 전송률 감소를 위해 발성속도를 측정하는 방법을 제안한다. LSP 파라미터가 가지고 있는 정보로 음소의 변화율을 측정하였다. 각각 다른 발성속도를 갖는 음성시료에 대하여 음소 변화율을 구한 결과 발성속도가 다른 경우, 뚜렷하게 다른 음소 변화율을 갖는 것을 알 수 있었고. 빠르게 발성한 경우가 느리게 발성한 경우보다 42.8%가 높게 나왔다.
-
본 논문은 DARC 시스템 제어기를 구현하기 위해 음성인식기와 입술인식기를 결합하여 멀티모달 시스템을 설계하였다. DARC 시스템에서 사용하고 있는 22개 단어를 DB로 구축하고, HMM을 적용하여 인식기를 설계하였다. 두 모달간 인식 확률 결합방법은 음성인식기가 입술인식기에 비해 높은 인식률을 가지고 있다는 가정 하에 8:2 비율의 가중치로 결합하였고, 결합시점은 인식 후 확률을 결합하는 방법을 적용하였다. 시스템간 인터페이스에서는 인터넷 프로토콜인 TCP/IP의 소켓을 통신모듈로 설계/구현하고, 인식실험은 테스트 DB를 이용한 방법과 5명의 화자가 실시간 실험을 통해 그 성능 평가를 하였다.
-
본 논문은 인간이 양귀로 3차원 공간상의 음의 위치를 파악하는 원리를 이용하여 만들어진 입체음향을 청취자의 안귀에 가장 효과적으로 재생시킴으로써 완벽한 입체음향을 재현하는 장치로 3차원 게임, 가상현실 시뮬레이터, 놀이공원에서 사용될 수 있는 A/V용 입체음향 재생기 구현 기법이다. 본 개발 품은 전방 30도에 스피커를 배치하는 기존 제품에 비해 안정된 정면 음상 정위와 후면 음상 정위가 가능하고, 청취자의 머리 움직임에 따른 입체음향 효과의 저하를 막을 수 있으며, 인지적 특성을 고려한 역 필터링으로 과도한 신호처리로 인한 음질 저하를 개선할 수 있고, 다중 사용자에게 동일한 음질을 골고루 전달할 수 있어 카 오디오나 영화관에서도 사용되어질 수 있다.
-
본 논문에서는 청각 장애인의 보다 향상된 보청 환경을 조성하고자 청각손실을 심리음향 모델을 적용하여 감음 신경성 난청을 보정하는 알고리즘을 제안한다. 제안한 알고리즘에서는 난청의 유형은 내이에서부터 중추 뇌에 걸친 감음계와 신경계의 장애에서 비롯되는 감음신경성 난청(sensorineural hearing loss)으로 주파수 영역상에서 MTH(minimum hearing threshold)가 균일하지 않게 상승하게되어 가청영역이 좁아지는 문제점을 해결하기 위한 방법으로 각각의 주파수 밴드마다 멀티밴드 압축 알고리즘을 적용하였다. 그러나 이 경우 각각의 주파수 밴드에 따른 서로 다른 가청 영역의 영향에 의한 변형된 스펙트럼 모양으로 인해 spectral contrast reduction과 변형된 마스킹 특성으로 인해 음성 변별력에 제한을 가하게 된다. 이것은 주변 주파수 성분들에 의한 마스킹 효과에 의한 것으로, 신호에 대한 난청인이 느끼는 지각 영역(perceptual domain)에서의 해석과 심리음향 모델 파라미터를 통한 보청기의 개발이 이루어져야 하며, 본 논문에서 그 알고리즘을 적용하였다.
-
An stereophonic acoustic echo canceller cannot exactly estimate the echo path in the receiving room, because of the cross-correlation between stereo signals. In this paper, the new preprocessing filter is proposed to reduce the cross-correlation between the signals without influence on stereophonic sound. Two channel signals are linearly decorrelated by using orthogonality principles and the attenuated absolute values of the decorrelated signals are added to each channel input signals. Assuming that the power of each channel signal is larger than that of the cross-correlation, computational burden is reduced.
-
본 논문은 VR시스템에 사용되는 실시간 음향제시를 위한 시스템 구현에 관한 것이다. 2개의 Speaker 또는 헤드폰을 사용하여 음상제어, 음장제어의 두 부분으로 구성되어 있다. 음상제어 부분은 각각의 음원의 위치를 정위하고, 음장제어 부분은 레이 트레이싱(Ray Tracing)기법을 이용하여 음장을 시뮬레이션하고 가상 공간의 음장 파라미터를 추출하여 음원에 적용하면서 실시간으로 음장효과를 렌더링 한다. 이 시스템은 펜티엄-Ⅱ333MHz 시스템에서 구현하였다. 최종적으로 청취자는 2개의 스피커 또는 헤드폰을 이용하여 3D음장을 경험하게 된다.
-
사물놀이 소리는 천지인의 삼재사상에 근본하는 우리 문화의 정신적 근간들이 생생히 살아 숨쉬는 음악이다. 꽹과리 소리는 하늘의 소리이고, 북소리는 땅의 소리를 나타내고, 여기에 보태어지는 사람의 목소리는 하늘과 땅을 수직으로 이어주는 인성이다. 그리고, 사물놀이 소리는 긴장과 이완, 음양의 원리를 독특하게 지니고 있다. 느린 장단에서 빠른 장단으로 이행되는 점층적 전개 위에서 긴장과 이완의 원리가 날줄과 씨줄로 교직 되어 이끌어 간다. 또한 소리의 음양 조화 측면에서 살펴보면 금속성악기와 가죽악기, 날카로운 소리와 부드러운 소리, 잘게 쪼개어지는 소리와 크게 뭉치는 소리 등이 나타난다. 따라서 세계인들이 "사물놀이는 신을 부르는 소리"라고 극찬하고 있다[1]-[3]. 사물놀이 소리를 들었을 때 그 가락에 쉽게 도취도는 것은, 4가지 악기가 서로 다른 소리의 높낱이 색깔특성에 의해 소리의 음양 조화를 이루고 있을 뿐만 아니라, 우리가 귀로 느낄 수 있는 소리의 범위를 완전히 커버하고 있다는 사실을 우리는 처음으로 밝혀내었다. 즉, 소리를 빛깔로 나타낸다면, 북은 빨강, 징은 노랑, 장구는 초록, 꽹과리는 보라 빛을 의미하며, 이들 색깔은 각자의 아름다움을 특징적으로 나타내고 있다. 그리고, 징과 장구 소리를 들었을 때 다시 한번더 듣고 싶은 친근감을 느끼게 되는데, 그 원인으로는 징소리와 장구의 기본 진동수가 사람의 남녀 목소리 기본진동수와 각각 근접하기 때문에 우리의 가슴과 일치를 이루게 된다는 사실도 이번에 밝혀 내었다. 즉, 징소리와 장구소리를 들으면 사람의 목소리로 응답하는 듯한 친근함과 정다움을 느끼게 된다. 또한 인간은 소리를 귀로만 느끼지 않고 피부를 통해 진동으로도 느끼게 되는데, 사물놀이에서 북, 징, 장구는 그러한 특성이 두드러지게 나타난다. 결론적으로 우리 민족의 지혜와 숨결이 스며있는 사물놀이 소리의 특성과 그 신비를 객관적으로 규명함으로서 사물놀이 소리의 우수성을 입증하과, 문화민족의 자부심으로 새천년을 개척해 나아가는 원동력을 얻고자한다.
-
본 논문에서는 신호를 해석하는데 유용한 웨이블렛 변환을 적용하여 장면전환 요소 중 cut과 fade를 검출하는 알고리즘을 제안한다. 제안된 방법은 웨이블렛 저대역 부밴드로부터 각 프레임의 히스토그램을 구한 후 이전 프레임과 현재 프레임사이의 히스토그램 차를 구하여 이 값이 임계값 이상이면 급격한 장면전환(abrut shot transition)인 cut으로 분류한다. 다음으로 페이드인(fade in)이나 페이드 아웃(fade out)등 컷의 지점이 불분명한 점진적 장면전환(gradual scene transition)을 검출하기 위하여 고대역 부밴드에서 추출한 에지성분에 모멘트를 계산하여 인접한 프레임 사이의 변동율을 분석하여 값이 증가하면 페이드 인을 검출하고 반면에 감소하면 페이드 아웃을 검출하게된다. 성능평가를 위하여 실제의 비디오 분할에 적용한 결과 웨이블렛 적용 방법론이 매우 높은 Precision을 갖는다는 것을 알 수 있으며 윤곽정보에 모멘트 정보를 더함으로써 기존의 방법보다 정확한 페이드(fade) 구간을 검출할 수 있었다.
-
최근 정보통신의 급속한 발달로 비디오의 내용기반 검색은 많은 응용분야에서 중요성이 증가하고 있다. 자동적인 비디오 검색에 있어서 장면전환의 검출은 없어서는 안될 필수적인 과정이다. 그래서, 압축 영역이나 비압축 영역에서의 장면전환검출 기법들이 많이 제안되었다. 특히, 비디오가 대용량화됨에 따라 압축 영역에서의 검출 기법의 연구가 활발히 진행되고 있다. 본 논문에서는 압축비디오에서 I-프레임의 DC 영상과 B-프레임의 매크로 블록 타입만을 이용하여 정확한 컷의 위치를 찾아내고자 한다. 그리고, 비디오 구조화의 수행에 적합한 성능과 정보를 얻을 수 있는 방법을 제안한다.
-
디지털 비디오 데이터를 효율적으로 브라우징 하는데 필요한 비디오 분할에 관한 연구가 활발하게 진행되고 있다. 본 연구에서는 비디오 데이터를 Shot단위로 분할하고, Shot내부에서 카메라 동작과 객체 움직임 분석을 이용한 sub-shot으로 분할하고자 한다. 연구 방법으로는 I-frame의 DC 영상을 이용하여 픽쳐그룹을 Shot(장면이 바뀐 경우), Move(카메라 동작,객체움직임), Static(영상의 변화가 거의 없는 경우)로 세분화하고 해당 픽쳐 그룹의 P, B-frame을 검사하여 정확한 컷 발생 위치, 디졸브, 카메라동작, 객체 움직임을 검출하게 된다. 픽쳐그룹 분류에서 정확성을 높이기 위해 계층적 신경망과 다중 특징을 이용한다. 정확한 컷 발생위치 검출하기 위해서 P, B프레임의 메크로블럭 타입을 이용한 통계적 방법을 이용하고, 디졸브, 카메라 동작, 객체 움직임을 검출하기 위해서 P, B-frame의 메크로블럭 타입과 움직임 벡터를 이용한 신경망으로 검출한다. 본 연구에서는 계층적 탐색을 이용하여 시간을 단축할 수 있고, 계층적 신경망과 다중 특징을 이용하여 픽쳐 그룹을 세분화 할 수 있고, 메크로 블록 타입과 통계적 방법을 이용하여 정확한 컷 검출을 할수 있고, 신경망을 이용하여 디졸브, 카메라 동작, 객체움직임을 검출 할 수 있음을 확인한다.
-
수많은 종류의 비디오 데이터를 효율적으로 검색하기 위해서는 데이터를 분석하여 사용자에게 먼저 전체 비디오의 요약을 제시하는 것이 효과적이다. 본 논문에서는 기사 단위로 분할된 뉴스 기사 전체를 보여주지 않으면서도 기사의 내용을 왜곡됨이 없이 요약하여 효과적으로 사용자에게 보여주기 위한 방법을 제안한다. 본 논문에서는 사용자에게 시각적인 요약 정보를 앵커 프레임 추출 및 대표 프레임 추출을 통해 필름 스트림(film trip)의 형태로 제시하고, 기사를 소개하는 앵커의 첫 대사를 폐쇄 자막(closed-caption)을 이용하여 추출하여, 이를 기사의 내용에 대한 요약으로 필름 스트립과 같이 제시하도록 하였다. 앵커 프레임을 추출하기 위해 본 논문에서는 폐쇄 자막에서의 "앵커:" 태그가 존재하는 시간 구간과 동기된 프레임을 선정한다. 또한 대표 프레임은 공개형 자막(open-cpation)이 존재하는 프레임과 빈도에 기반한 가중치가 높은 .폐쇄 자막에서의 키워드와 동기된 프레임을 선정하도록 하였다. 본 논문의 뉴스 기사 요약 시스템은 시각적인 프레임제시와 함께 기사의 내용을 바탕으로 하는 기사 요약문을 같이 사용자에게 제공함으로써 기존의 필름 스트립형태만 제공하던 시스템에 비하여 사용자 중심의 지능형 요약 서비스가 가능함을 실험을 통해 보인다.
-
본 논문에서는 2차의 격자 IIR 노치 필터를 이용하여DS-CDMA 시스템에서 협대역 간섭신호를 제거한다. 본 노치필터는 구조가 간단하고 다양한 간섭 신호 모델에 따라 필터의 계수를 조절할 수 있어 간섭신호의 효과적인 제거가 가능하다. 노치필터의 앞단에는 주파수 추정부를 평행하게 구성하여 간섭신호 주파수의 위치와 파워를 검출한다. 제안된 적응 필터링 알고리듬은 이러한 정보를 이용하여 노치필터의 주파수를 조절하고 간섭 신호의 파워와 대역폭에 따라 노치의 넓이와 깊이를 조절한다. 즉, IIR 노치 필터의 특성을 이론적으로 분석하여 출력 신호대 잡음비를 입력과 필터의 파라미터에 관한 수식으로 유도하였고 이를 이용하여 주어진 입력에 따른 최적의 필터 파라미터를 구하여 적용시키는 것이다. 입력의 간섭 주파수와 파워를 검출하는 방법에는 여 러가지가 있지만 본 논문에서는 비교적 간단한 IIR ALE[6]를 사용하였다. 제안된 알고리듬을 사용한 결과 신호대 잡음비와 에러율에 있어서 FIR 필터를 사용한 기존의 방법[4]에 비하여 좋은 성능을 보임을 알 수 있다.
-
Orthogonal frequency division multiplexing(OFDM) has meanwhile become part of several telecommunicati ons standards, such as satellite and terrestrial digital audio broadcasting(DAB), digital terrestrial TV broad casting(DVB), asymmetric digital subscriber line(ADSL) for high-bit-rate digital subscriber services on twisted-pair channels, and broadband indoor wireless systems. In his paper, we show that OFDM signals contain sufficient structure to accomplish blind channel estimation using second order statistics only. This method doesn't require redundancy as cp in transmitter. And the result is compared with PSAM channel estimation as least square, linear minimum mean square, singular value decomposition.
-
In this paper, we consider a code acquisition of W-CDMA signals over multipath Rayleigh fading channel when double-dwell serial search code acquisition is used for initial synchronization. We derive the detection and false alarm probability, and mean acquisition time mathematically by taking into account of multiple H
$_1$ cells and double-dwell serial search. It is noteworthy that the more the number of the post-detection integration, the shorter the mean acquisition time in low SNR. -
CDHA환경에서 단말기 위치 결정은 여러 부가적인 서비스 응용에 대한 필요성 때문에 활발히 연구가 진행되고 있다. 그러나 기존의 위치 결정 알고리즘은 현재의 정보만을 활용했기 때문에 위치 오차에 대한 성능 향상에 한계점을 드러내고 있다. 따라서 이전 시간의 단말기 위치 정보가 포함된 Kalman Filter를 사용한다면 위치 에러에 대해 향상된 성능을 보일 것이다 그렇지만 실제 단말기 사용자의 움직임은 Meneuvering Target에 가깝기 때문에 단순히 Kalman Filter를 이용한 위치 오차 성능 개선보다는, 여러 개의 Kalman Filter Model들을 응용하는 IMM을 이용하는 경우에 보다 나은 결과가 도출될 것이다. 실제로 단말기 위치 오차에 대한 Kalman Filter와 IMM을 적용한 경우의 비교 분석 결과, IMM을 적용한 경우가 위치 에러를 최소화 할 수 있었다.
-
본 논문에서는 처리 구조, 계산량, 그리고 압축 성능 측면을 동시에 고려하여 head-and-shoulder 영상에 효과적으로 적용될 수 있는 움직임 추정 방법을 제안한다. 제안된 방법은 두 단계로 구성되며, 첫번째 단계에서는 등간격 전역 탐색을 수행하고, 두번째 단계에서는 경계를 갖는 지역 탐색을 수행한다 제안 방법을 head-and-shoulder영상에 적용한 결과, 탐색 영역 8 인 경우 전역 탐색과 비교할 때 PSNR 은0.06 dB 이하로 차이가 나며, 부호화시 발생 데이터양도 103 % 이하로 거의 차이가 나지 않았다 그러나 계산량에 있어서는 전역 탐색과 비교할 때 91% 의 계산량 절감 효과가 있다. 이것은 부호화기 전체 계산량 대비 전역 움직임추정 계산량이 34.71% 를 차지한다는 사실을 고려해볼 때, 부호화기의 계산량을 31.6%줄이는 결과를 의미한다.
-
본 논문에서는 MPEG-2 AAC 오디오 복호화 시스템을 효율적으로 설계하고 구현하였다. 구현된 시스템은 2채널의 메인 프로필 MPEG-2 AAC 비트열을 실시간으로 복호화하고, 32, 44.1, 48kHz의 표본화 주파수를 지원하여, 표준안에서 제안하는 툴 중 커플링 채널을 제외한 모든 툴을 지원한다. 설계된 시스템은 허프만 복호화와 예측 과정을 수행하는 두개의 독립된 모듈과 Programmable DSP 코어의 혼합 구조(hybrid architecture)로 최적화된 구조를 갖는다.
-
본 논문은 IBAC(FM In Band Adjacent Channel) 방식의 디지털 오디오 방송(DAB; Digital Audio Broadcasting) 시스템 구현을 기술한 것이다. 구현한DAB 시스템은 현재 방송중인 FM방송의 인접 대역을 사용하기 위한 것으로, DAB 방송을 위해 주파수대역을 추가로 할당할 필요가 없으므로 주파수대역의 효율을 높일 수 있고 가용주파수 대역이 부족한 지역의 주파수할당에 대한 문제점을 해결할 수 있다.
-
본 논문에서는 효율적인 면적의 저전력 FIR 필터를 제안한다. 제안된 필터는 6 비트 8 탭의 구조를 갖는PRML(Partial-Response Maximum Likelihood) 디스크드라이브 read channel용 FIR 필터이다 제안된 구조는 병렬연산 구조를 채택하고 있으며 네 단의 파이프라인 구조를 가지고 있다. 곱셈을 위하여 부스 알고리즘이 사용되며 압축기를 이용하여 덧셈을 수행한다. 저전력을 위해 CMOS 패스 트랜지스터를 사용하였으며 면적을 줄이기 위해 single-rail 로직을 사용하였다 제안된 구조를 0.65㎛ CMOS 공정을 이용하여 설계하였으며1.88 × 1.38㎟의 면적을 차지하였고 HSPICE 시뮬레이션 결과 3.3V의 공급전압에서 100㎒로 동작시 120㎽의 전력을 소모한다. 제안된 구조는 기존의 구조들에 비해 약 11%의 전력이 감소했으며 약 33%의 면적이 감소하였다.
-
본 논문은 전탐색 블럭매칭 움직임추정 VLSI 구조에서 클럭당 두연산(하나는 클럭의 상향에지, 하나는 하향에지에서 동작)을 수행하는 PE(Processing Element)를 교번적으로 결선, 클럭의 상향에지는 물론 하향에지에서도 동작하도록 하는 방식으로 클럭 사이클수를 줄이는 VLSI 구조를 제안한다 기존 구조에 그대로 적용되는 본 방법은 공급 데이타폭이 2 배, PE 의 HW 복잡도가 1.5 배 절대차 합 연산의 복잡도가 2 배로 늘어나 전체 하드웨어가 복잡해지나, PE수를 2배로 하여 클럭사이클수를 줄이는 방법에 비해서는 매우 효율적이다. 본 제안 구조는 계층적 움직임 추정 알고리듬을 사용한 MPEG-2 움직임 추정기 개발의 설계에 적용하여 기능과 HW 복잡도를 확인하였다.
-
본 논문에서는 영상데이터의 효율적인 압축과 전송을 위하여 이산 웨이블릿 변환(Discret Wavelet Trans-form)과 MPEG 부호화 방법을 이용한 영상 부호화 방법을 제안하였다. 이 방법은 다해상도를 제공하는 계층적 피라미드 구조를 이용한다. DWT로 영상을 여러 개의 밴드들로 분해한 다음, 각 밴드에서 MPEG 부호화기에서 사용하는 방법을 그대로 이용하여, 광범위하게 쓰이는 MPEG 하드웨어나 소프트웨어를 재 사용한다는 이점을 가진다. 기존의 DWT-MPEG 방법[1]은 MPEG 부호화 방법을 쓰기 전에 웨이블릿 필터 분해를 여러번을 하여, 움직임 추정을 정확하게 하지 못하였으나, 제안한 방법은 웨이블릿 필터 분해를 한 번만 하고, MPEG 부호화를 할 때, 웨이블릿 분해를 한번 더 사용하여, 움직임 추정과 보상을 좀 더 개선되게 하였다. 실험 결과, 기존의 DWT-MPEG 방법보다 제안한 방법이 화질이나 압축면에서 좀 더 향상된 결과를 얻을 수가 있었다.
-
본 논문에서는 연속되는 동영상 시퀸스의 9개의 프레임에서 이웃하는 프레임간의 차분 프레임으로 이루어진 8개의 차분 데이터를 3D-DCT 처리 후 특성에 맞는 프레임 차분 체적 양자화기(FDVQ)를 설계하고, 이것으로 처리된 영상데이터를 부호화하여 복원영상 데이터의 압축 효과를 분석하였다. 여러가지 동영상 시퀀스를 시험 대상으로 사용한 결과, 제안한 FDVQ를 적용한 3D-DCT 방법은 유사한 해상도에서 차분 영상 데이터에 대한 압축률은 2D-DCT 방법에 비하여 평균 20.3% 향상된 압축 효율을 얻었다. 체적 양자화(VQ:Volume Quantizer)를 이용한 3D-DCT 방법과 비교했을 때는 유사한 압축률을 보였다. 특히, 움직임 성분이 많은 영상에 대해서는 제안한 FDVQ를 이용한 방법이 압축률을 높일수록 2D-DCT방법과 VQ를 이용한 방법보다 압축률 0.05bpp이하에서 약 1.0dB 개선된 결과를 나타내었다.
-
3차원 영상은 2차원 영상에 비해 데이터량이 매우 방대하다. 따라서 3차원 데이터를 효율적으로 압축하는 것은 매우 중요하다. 현재까지 대부분의 연구는 데이터량이 체적소(voxel)에 비해 월등히 적은 메쉬(mesh)를 기반으로 하여 이루어져 왔다. 하지만, 메쉬를 이용한 데이터 압축의 경우 체적소에 비해 데이터 자체의 규칙성이 떨어져 체적소를 이용한 압축에 비해 압축 효율이 낮다. 그리고, 체적소 데이터를 이용할 경우, 이를 스켈레톤화 하여 데이터량을 더욱 줄일 수 있다. 따라서 본 논문에서는 3차원 체 적소 데이터의 규칙성과 스켈레톤을 이용한 압축 기법을 제안할 것이다.
-
본 논문에서는 MPEG-2 시스템 층의 하나인 방송 및 전송을 위한 Transport Stream (TS)상에 MPEG-4 데이터를 구조화하여 MPEG-4 Over MPEG-2 TS 비트스트림을 만드는 방법과 이를 저장 매체 포맷중 하나인 MP4 파일로 변환 설계에 관한 연구이다. MPEG-4는 객체 단위의 부호화 비트스트림으로 구성되어 있기 때문에 이들 객체의 속성을 표현하는 객체기술자, 객체들간의 시공간 관계를 표현하는 장면기술자가 필요하며 또한 모든 객체들간의 복호와 정보와 객체간의 동기화를 위해 여러 가지 기술자들이 필요한데 바로 이런 다양한 MPEG-4 비트스트림을 어떻게 MPEG-TS 규격에 맞게 전송하는가에 초점을 두었다.
-
This paper proposes context-based coding methods for variable length coding of inter-frame DCT coefficients. The proposed methods classify run-level symbols depending on the preceding coefficients. No extra overhead needs to be transmitted, since the information of the previously transmitted coefficients is used for classification. Two entropy coding methods, arithmetic coding and Huffman coding, are used for the proposed context-based coding. For Huffman coding, there is no complexity increase from the current standards by using the existing inter/intra VLC tables. Experimental results show that the proposed methods give ~ 19% bits gain and ~ 0.8 dB PSNR improvement for adaptive inter/intra VLC table selection, and ~ 37% bits gain and ~ 2.7dB PSNR improvement for arithmetic coding over the current standards, MPEG-4 and H.263. Also, the proposed methods obtain larger gain for small quantizaton parameters and the sequences with fast and complex motion. Therefore, for high quality video coding, the proposed methods have more advantage.
-
본 논문은 threshold 에 기반한 (threshold-adjusted) EZW(Embedded Zerotree Wavelet) 부호화 모듈의 설계와 구현에 대하여 소개한다. EZW 부호화는 먼저 입력된 정지 영상에 대하여 Haar 웨이브릿 변환을 수행한다. Haar 웨이브릿 변환된 영상은dominant와 subordinate의 2-pass과정을 거쳐 zerotree를 구성함으로서 EZW 부호화 과정을 수행한다. Threshold에 기반한 EZW는 부호화 과정에서 인간의 시각 체계를 고려하여 threshold 값을 적절히 조절함으로서 효율적인 출력 영상을 얻을 수 있도록 구현하였다.
-
본 논문에서는 웨이브릿 변환영역에서 개선된 모폴로지와 적응양자화를 이용한 영상부호화 방법을 제안한다 제안한 방법은 제로트리를 기반으로 한 기존의 방법들과 유사한 코딩성능을 가지면서 EZW, SFQ 등에서 나타나는 복잡성을 모폴로지를 사용하여 유효정보를 클러스터링 함으로써 복잡성을 줄일 수 있다. 그러나 클러스터의 개수가 많아지면 클러스터를 나타내는 부가정보의 양도 많아진다. 이러한 부가정보의 비율이 실제데이터에서 많은 비중을 차지하기 때문에 개선된 모폴로지를 적용하여 효율적으로 부호화 함으로써 영상의 화질을 개선하였다. 또한 고주파 대역에서의 유효계수를 효율적으로 코딩하기 위해 적응양자화를 적용하여 양자화 시 오차범위를 줄일 수 있다. 따라서 제안한 방법은 양자화 시 발생하는 많은 비교연산을 줄일 수 있으며, 기존의 방법에 비해 화질을 개선하였다.
-
본 논문에서는 WPEG가 적합성 검사를 위해 표준안에 명시된 조건하에서 검사를 수행한다. MPEG-4 encoder의 각 부분을 제어함으로써 shape coding에 대한 test를 수행하고 또한 검사하려는 항목을 고려하여 부호화 변수를 조절하면서 여러 종류의 test비트열을 생성하여 비교함으로써 MPEG-4 decoder의 객체기반 형상 부호화에 대한 적합성 검사를 수행한다.
-
최근에 새로운 텍스트 압축방법인 BWT(Burrows and Wheeler transformation)가 소개되었다. 이 변환은 우수한 텍스트 압축성능을 가지지만 텍스트와 영상의 다른 성질로 인해 영상에 직접 적용될 때 그다지 우수한 압축성능을 기대할 수 없다. 본 논문에서는L-SSKF(Lossless Symmetric Short Kernel Filter)를 사용하여 영상을 대역분할한 후에 BWT를 수행하여 무손실이면서 우수한 압축성능을 가지는 무손실 영상압축방법을 제안한다. 또한 압축성능의 향상을 위해 두과정의 중간에 화소예측방법인GAP(Gradient Adjusted Prediction)를 적용하여 성능개선을 비교하였다.
-
IP 네트웍을 통해 실시간 비디오를 전송할 때 네트윅 특성을 고려하여 비디오 데이터를 부호하면 패킷 손실로 인한 품질 열화를 최소화하여 더 좋은 품질의 비디오를 얻을 수 있다. 이를 위해 현재 네트윅의 정보를 빠르고 정확하게 얻어내는 메커니즘과 부호화 변수를 네트윅 상황에 적응적으로 조절하여 패킷 손실에 강인한 압축 및 전송 메커니즘의 두 가지 기능이 요구된다. 첫번째 메커니즘은 RTP(Real Time Transport Protocol)을 통해 구현될 수 있으며, 두 번째 메커니즘을 위해 본 연구에서는 다중기술 변환부호화(Multiple Description Transform Coding) 기법을 적용한 비디오 부호화 알고리즘을 제안한다. RTP에서 제공하는 RTCP(Real Time Control Protocol) 정보를 이용하여 현재 네트웍 정보를 얻을 수 있으며, 다중기술 변환부호화 기법을 이용하여 현재의 패킷 손실률에서 최적의 품질을 보장하도록 부호화 변수를 조절할 수 있다. 본 논문에서는 다중기술 변환부호화 기법을 비디오 부호화에 적용하여 순수 비디오 정보에 추가되는 잉여 정보량과 패킷 손실에 대한 강인성 사이의 관계를 도출함으로써 다중기술 변환부호화 기법이 네트웍 적응적 부호화 방식에 적합한 방식임을 제시한다.
-
최근에 국내에서도 DTV 시험방송을 하고 있고 고해상도의 DTV 수상기도 개발되고 있다. DTV 수상기는 기본적인 TV 기능에 다양한 멀티미디어 기능을 더해 멀티미디어 단말기로서 역할을 할 것으로 기대된다. 이러한 DTV 수상기가 다양한 멀티미디어 인터페이스를 갖도록 하는 것은 기본 요구 사항이 될 것이다. 이중에 최근에 널리 보급되고 있는 디지털 카메라의 출력을 DTV 수상기를 이용하여 디스플레이 하는 것은 필수적인 기능이라 할 수 있다. 이러한 정지영상을 DTV 수상기에 디스플레이 하는 기능은 DTV set-top에서 Monitor를 통한 OSD(On Screen Display)에 적용할 수 있다. 따라서 본 논문에서는 JPEG 포맷의 정지영상 파일을 MPEG-2와 호환되는 파일로 변환하여 DTV 수상기에 출력하는 시스템을 개발하였다 Windows 환경에서GUI(Graphic User Interface)를 통해 JPEG Image를 디코딩 하여 영상의 픽셀 정보를 복원한 후에 다시 MPEG-2로 압축하여Transport Stream으로 변환하고. 이 stream을 PCI Card를 이용하여 VSB modulator의 요구 타이밍에 맞추어 LVDS 레벨로 출력하도록 하였다.
-
본 논문에서는 동적 다중경로 환경에 대한 DTV수신 성능 개선을 위하여 정보 데이터 세그먼트 부분에서는 Stop and Go 알고리즘을 사용하고 313 세그먼트 중 한 개만이 훈련열로 쓰이는 기존의 ATSC 표준의 데이터 프레임 구조보다 더 많은 훈련열이 들어있는 새로운 데이터 프레임 구조를 제안한다. 정보가 없는 널 패킷을 훈련열로 대체하기 때문에 데이터의 손실 없이 더 많은 훈련열을 사용하여 특히 동적 다중경로 환경에서 등화기의 수렴 특성을 개선할 수 있다. 전산 모의 실험을 통하여 동적 다중경로 환경의 도플러 천이에 대한 시스템 수신 성능의 개선을 확인하였다.
-
본 논문은 양방향 디지털 텔레비전에서 데이터의 전송을 위해 데이터 전송 스트림을 생성하는 스트리밍 서버의 구조 및 기능, 시스템 구현에 관해 서술한다 이 시스템은 ATSC 데이터 방송 규격에서 정의하는 비동기데이터, IP 데이터그램, 동기 및 동기화된 데이터의 전송 기능을 지원하며 국제 전송 규격인 MPEG-2 시스템규격 및 ATSC 데이터 방송 규격에 따라 PC 환경하에서 소프트웨어적으로 구현 되었다.
-
본 논문에서는 새로운 방식의 스프라이트 생성 방법을 논하였다 스프라이트로부터 원 영상을 예측해 그 오차(SAD : Sum of Absolute Difference)를 제어하는 방법으로 다좌표계 스프라이트(MCS : Multi-Coordinate Sprite)를 제안하였다. 예측 오차를 제어함으로써 기존에 제안된 방법으로 생성된 정적 스프라이트 보다 좋은 화질을 갖는 원 영상을 예측할 수 있음을 보여준다. 특히, MCS 생성 기법은 기존의 방법으로 생성된 스프라이트로부터 영상을 예측했을 때 화질 열화가 심한 카메라의 확대 움직임이 심한 영상들을 포함한 영상열에 대해서도 제한된 오차를 갖는 원 영상을 복원해 낼 수 있다는 것을 보여준다.
-
In this paper, we describe an intelligent method to detect types of vehicles using Support Vector Machines focused to the Intelligent Transportation System (ITS) applications such as in the CCD based Electronic Toll Collection System (ETCS). This algorithm can be used the various fields of ITS applications. Support Vector Machines employed in this paper has been recently proposed as a very effective method for 3D image recognition. And our proposed feature extraction method using the singluar values that directly come from pixels at input images. Consequently, The low calculation load and the high recognition rate in spite of image rotation and various noises are one of merits of proposed method.
-
This paper presents the method for the decision of eye states using the eye blink in video sequences. The entire procedure consists of two steps: in the first step, the accurate eye position is found in the input image by using symmetry information of faces and projection, and in the second step, the eye open/close state is decided by the horizontal and vertical projection. The method in this paper is also used for detecting drivers' fatigue in the drowsiness detection system.
-
비디오객체 추출 기법은 MPEG-4 및 MPEG-7의 응용을 목표로 최근 활발하게 연구되고 있다. 이들 연구는 객체 추출의 전체적인 구조와 정확한 윤곽선 검출 알고리즘의 개발에 초점을 맞추고 있으며 제한적인 조건하에서 만족할 만한 성능을 내고 있다 그러나, 카메라 움직임, 객체의 빠른 움직임, 비강체 운동 등 보다 일반적인 상황에서는 객체 추출의 안정성이 떨어진다. 본 논문에서는 객체 추출의 안정성을 높이기 위해 칼라, 움직임 정보 등의 특징정보(feature)가 균일한 영역으로 사전분할하고, 분할된 균일영역을 추적하는 알고리즘을 제안한다. 추적된 균일 영역간의 경계는 각 영역의 통계적 분포와 영역경계의 윤곽선으로 정의된 에너지를 레벨셑 방법으로 최소화함으로 조정된다.
-
본 논문에서는 복잡한 배경이나 조명 변화가 심한 영상에서도 피부영역을 정확하게 검출할 수 있는 피부영역 검출방법을 제안한다. 제안된 방법은 오프라인(off-line) 훈련과정과 온라인(on-line) 검출과정의 두 단계로 나누어진다. 훈련단계에서는 다양한 조명하에서 얻은 피부영상과 배경영상으로 구성된 훈련영상을 다차원의 열벡터로 표현하고 열벡터에 LDA(linear discriminant analysis)를 적용하여 선형변환된 특징벡터를 가지고 인덱싱 테이블을 생성한다. 검출단계에서는 카메라로 들어온 칼라영상을 여러 개의 조각영상으로 나누고 각각의 조각영상에 대하여 LDA를 적용하여 선형변환된 특징벡터를 구한다. 구해진 특징벡터를 미리 생성한 LDA 인덱싱 테이블에서 찾아 피부영역을 검출한다. 제안된 방법을 조명을 변화시킨 다양한 영상에 적용하여 실험한 결과 검출률이 상당히 우수함을 알 수 있었다.
-
본 논문에서는 웨이브릿 변환과 유전자 알고리즘을 이용한 하이브리드 영상복원 방법을 제안한다. 제안한 방법은 영상복원을 위한 전처리로써 분해 및 합성 필터의 이상적인 직교 특성을 가지는 웨이브릿 변환을 이용하여 잡음훼손영상으로부터 고주파성 잡음의 일부를 우선 제거하고 나머지 영상에 대해서는 국부적 최적해로의 고립을 벗어나 전역해 탐색이 가능한 유전자 알고리즘을 적용한다 제안한 하이브리드 방법의 성능평가를 위하여 이진 문자영상과 Lenna 영상을 입력영상으로 인가하여 기존의 단일 유전자 알고리듬을 이용한 방법과 비교실험을 수행하였다. 실험결과 제안한 하이브리드 영상 복원방법이 기존의 방법에 비하여 약 2dB 향상됨으로써 잡음훼손영상의 복원성능이 우수함을 확인하였다.
-
영상으로부터 의미있는 객체를 영역화하기 위하여, 움직임에 의한 시간적 정보를 이용하거나, 형태학적(Morphological) 기법과 같이 공간적 정보를 이용하는 방법이 있다. 그러나, 단지 시간적 정보나 공간적 정보만을 이용하는 방법은 그 한계를 가지고 있으며, 본 논문에서는 시공간 정보를 이용하여 분할하는 방법을 채택하였다. 시간적 분할에서는, 두 프레임에서 움직임 정보를 찾아내었던 기존 방법을 보완하여 연속되는 세 프레임을 사용하도록 하였다. 이렇게 하면 움직임이 미세한 영상에 대해서도 객체를 분리해 낼 가능성을 높일 수 있게 된다. 공간적 분할시에는, Watershed 알고리즘을 이용하는 형태학적 분할(Morphological Segmentation)[1][2]을 하게 되는데, 전처리 과정의 단일척도경사(Monoscale Gradient) 대신 다중척도 경사(Multiscale Gradient)[3][4]를 사용하여 미세한 경사는 누그러뜨리고 에지 부분의 경사만을 강조하게 하였다. 또한 개선된 Watershed 알고리즘을 제안하여 기존의 Watershed 알고리즘의 과분할 문제를 보완하였다.
-
최근 복잡한 실제 사물을 가상 공간상에 표현하기 위해 삼차원 모델을 많이 이용하고 있다. 기존의 삼차원 데이터 처리는 주로 정지 모델에 대해 기하학 정보와 위상학 정보를 표현하거나 다중 해상도(Level of Details, LOD)로 나타내는데 역점을 두었다. 그러나 네트웍을 통한 가상 공간에서 삼차원 애니메이션에 대한 응용이 점차 늘어남에 따라 이러한 데이터를 효율적으로 압축하여 전송하거나 저장할 필요가 생겼다 본 논문에서는 삼차원 애니메이션 모델의 공간적 또는 시간적 상관 관계를 이용하여 삼차원 모델 정보를 부호화하는 방법을 제안한다. 먼저 주어진 모델의 움직임을 분석하고 이를 (r,θ,ø)의 구 좌표계로 변환한 후 (θ,ø)의 분포에 따라 모델을 분할(Segmentation)한다. 그리고 움직임 벡터는 Affine 변환을 이용하여 삼차원 공간에서의 움직임을 정의한다. Key프레임에 해당하는 정지 모델의 기하학 정보와 위상학 정보를 압축하고, LOD 기술을 적용하여 손실 혹은 무손실로 부호화하여 전송한다. 또한 Key프레임 사이의 화면에서는 선형 또는 비선형 보간법으로 각 분할 부분을 복원하고, 이를 조합하여 전체적인 삼차원 모델을 복원한다.
-
본 논문에서는 비디오 영상에서 지역적 움직임 특성을 표현할 수 있는 지역적 움직임 활동(motion activity)에 관한 기술자(descriptor)를 제안한다. 제안된 방법은 화면 전체에 대해 지역적으로 높은 움직임 활동 정도를 갖는 영역에 대한 공간적 정보를 기술하고, 카메라 움직임에 무관하게 물체의 움직임 활동 특성을 정확히 표현하기 위해 움직임 벡터의 통계적 특성과 화면 분할을 이용한다 본 논문에서 제안하는 움직임 활동의 공간적 특성을 이용하면 동영상에서 화면의 일부에서 일어나는 움직임을 이용한 검색이 가능하고, 물체 추적, 감시 시스템에서도 활용이 가능하다. 실험으로 제안한 방법을 이용해서 움직임 활동이 높은 영역의 추출과정을 보이고, 이를 이용한 검색 결과를 보인다.
-
이미지의 한가지 특징(feature)만을 고려한 내용 기반 이미지 검색(content-based image retrieval)은 두가지 이상의 특징 정보를 사용했을 경우와 비교하여 정확도(precision)가 떨어져 성능을 저하시킬 수 있다 따라서 대부분의 검색 시스템에서는 색상(color)이나 형태(shape), 질감(texture) 등과 같은 이미지의 다양한 특징들을 결합하여 검색에 이용하고 있다. 본 논문에서는 이미지의 색상 및 형태 정보를 이용하여 사용자의 질의와 유사한 이미지를 제공하고, 고 차원화된 이미지의 특징들을 클러스터링(clustering) 방법을 이용하여 빠르게 검색할 수 있도록 하였으며, 또한 검색시 그룹 경계 보정 방법을 이용하여 전체 검색을 하지 않고도 전체검색 결과와 동일한 결과를 얻을 수 있는 시스템을 설계 및 구현하였다. 실험에 사용된 데이터는 2022개의 자연 영상이였으며, HSI 색상 정보와 이미지의 에지(edge) 정보를 특징 벡터로 삼았다. 실험 결과, 색상 정보 하나만을 사용한 경우보다 정확도와 재현율면에서 사용자가 원하는 이미지와 보다 유사한 결과를 검출할 수 있었을 뿐만 아니라 클러스터링을 사용함으로써 보다 빠르고, 전체검색 결과와 동일한 검색이 가능하다는 것을 입증하였다.
-
본 논문에서는 영상에서의 칼라 정보를 위한 히스토그램과 단순 히스토그램만을 이용하는 데서 오는 공간정보 부족을 각 칼라 빈 (bin) 의 분포특성을 대표할 수 있는 공간분포좌표를 이용하여 표현하고 또한 이러한 빈 들의 상대적인 위치 정보를 색인 함으로써 영상의 회전이나 이동에 대해서도 강건한 영상색인 및 검색 알고리즘에 대해 기술한다.
-
We propose an efficient method for content-based ultrasound image retrieval using magnitude frequency spectra and implement a retrieval system based on the proposed method. The target images are ultrasound images of adult organs. Trained users often acquire such images so that images of the same kind of organs are very similar, although their locations may not exactly coincide. Therefore, the magnitude frequency spectrum, which has a translation-invariant property, is used as a feature. All the object images in the image DB is pre-classified in the same kind organs. Experimental results show that the proposed method is superior to some well-known conventional methods.
-
In this paper, we propose a novo] content-based image retrieval system using both Hidden Markov Model(HMM) and an improved chain code. The Gaussian Mixture Model(GMM) is applied to statistically model a color information of the image, and Deterministic Annealing EM(DAEM) algorithm is employed to estimate the parameters of GMM. This result is used to segment the given image. We use an improved chain code, which is invariant to rotation, translation and scale, to extract the feature vectors of the shape for each image in the database. These are stored together in the database with each HMM whose parameters (A, B,
$\pi$ ) are estimated by Baum-Welch algorithm. With respect to feature vector obtained in the same way from the query image, a occurring probability of each image is computed by using the forward algorithm of HMM. We use these probabilities for the image retrieval and present the highest similarity images based on these probabilities. -
본 논문은 움직임이나 장면에 제약되지 않는 카메라로부터 획득한 여러장의 디지털 영상을 한장의 통힙된 영상으로 자동적으로 모자이킹 하는 방법에 대해 기술한다. 우선 영상을 세그멘테이션과 레이블링으로 영상의 영역을 분할하고, 특징 점을 찾는다. 같은 영역으로 분할된 곳의 특징점을 각각의 그룹으로 하고 영역안의 특징점을 hausdorff distance를 이용영상을 비교하여 대응점을 구한 후 비선형 이승오차 최적화 알고리즘을 이용해 최적의 변환 행렬로 하나의 영상을 자동적으로 구성하는 과정에 대해서 기술한다.
-
본 논문에서는 영상처리 기법 중 하나인 이진 영상에 대한 골격화를 이용한 새로운 형상 기술자를 제안한다. 내용기반 영상 검색에서 형상을 이용하는 것은 가장 우세하고 인간이 가장 쉽게 인지할수 있는 방법 중의 하나이다. 형상을 이용한 검색을 위해 서는 인간이 인지하는 형상에 대한 정보를 간략화시킬 수 있는 기술자가 필요하다. 본 논문에서 제안하는 골격을 이용한 형상 기술자는 물체의 중요한 정보 중 하나인 골격을 영상 검색에 이용함으로써 기존의 물체가 갖고 있는 복잡한 형상 정보들을 여러개의 직선의 조합으로 간략하게 표현하고 이를 검색에 사용하는 것이다. 이를 위해서 단순한 골격화 외의 다른 형태학적 영상 처리를 이용하여 효과적인 직선 추출을 위한 여건을 마련한다. 그리고 근사화된 직선들이 추출되면 스케일에 대해 정규화 하여 골격을 이루는 직선들의 양 끝점을 형상 기술자로 얻을 수 있다. 각 특징벡터에 대한 정합은 각각의 회전에 대해 유클리디안 거리를 이용한다. 실험 결과, 제안된 방법이 자세한 부분보다는 대략적인 형상 검색과 동일한 카테고리의 데이타 집합에서 부분적인 변화에 대해 우수한 성능을 나타낸다는 것을 알 수 있다.
-
In this paper, we propose a novel post processing method of deconvolution for SAR images based on phase extension inverse filtering, which improves spatial resolution as well as effectively eliminates sidelobes with low computational complexity. It extends the bandwidth only to control the magnitude of the processed SAR data without distortions of the phase in frequency domain unlike the other techniques such as spatially variant apodization (SVA), and other deconvolution techniques. We compare the image processed by the proposed method with images processed by uniform weighting function, Hamming weighting function whose coefficient is 0.75, and SVA.
-
본 논문에서는 영상의 화소값으로부터 추출된 유사 특징점(quasi-feature point)을 이용한 이미지 모자이킹 알고리즘을 제안한다. 유사 특징점의 선택은 전역 정합(global matching)의 결과로부터 중첩된 영역을 4개의 부영역(sub-area)으로 분할하고, 각각의 분할된 부 영역에서 국부 분산(local variance)의 크기가 큰 블록을 선정, 이 블록의 중심 화소를 유사 특징점으로 선택한다. 유사 특징점에 대한 정합은 카메라 이동에 따른 왜곡(distortion)과 조명의 변화를 고려한 블록 정합 알고리즘(block matching algorithm)을 이용한다.
-
In this paper, we present a regularized mixed norm multichannel image restoration algorithm. The problem of multichannel restoration using both within- and between- channel deterministic information is considered. For each channel a functional which combines the least mean squares (LMS), the least mean fourth(LMF), and a smoothing functional is proposed, We introduce a mixed norm parameter that controls the relative contribution between the LMS and the LMF, and a regularization parameter that defines the degree of smoothness of the solution, both updated at each iteration according to the noise characteristics of each channel. The novelty of the proposed algorithm is that no knowledge of the noise distribution for each channel is required, and the parameters mentioned above are adjusted based on the partially restored image.
-
본 논문에서는 저비트율 영상통신에서 발생되는 블록화현상과 컬러 번짐 현상을 효과적으로 줄임으로써, 주관적 화질을 개선하는 후처리 필터를 제안한다. 저비트율 영상통신에서 8*8 블록 단위의 DCT 수행은 블록화 및 컬러 번짐 현상과 같은 화질 열화를 초래한다. 이러한 화질 열화를 개선하기 위하여 밝기 영역과 컬러 영역에서 각기 다른 후처리 필터를 본 논문에서 제안한다. 밝기 부분의 후처리 필터에서는 일률적인 후처리 필터에서 발생하게 되는 새로운 artifact 인 geometric pattern 을 방지하기 위해 각 화소의 공간영역에서 블록 경계 좌우로 filtering range 를 다르게 수행하고, 컬러부분의 후처리 필터에서는 컬러번짐 현상을 최대한 억제하기 위해 블록간 컬러 값의 차이에 따라 다르게 수행되는 후처리 필터를 제안한다. 제안된 실험을 통하여 후처리 필터를 수행한 영상화질이 H.263 baseline 에 비해 월등히 나아짐을 확인할 수 있었으며, H.263 Annex J의 deblocking filter mode에 비해서도 떨어지지 않는 화질을 얻을 수 있었다.
-
본 논문에서는 3차원 웨이블릿 부호화 방식으로 압축된 영상 시퀸스를 정칙화 기반 영상복원 방법으로 후처리하는 알고리듬을 제안한다. 우선, 웨이블릿 압축 시스템을 적절한 영상 열화 시스템으로 모델화한다. 그리고, 시간축에 관하여 프레임 간의 같은 위치에 있는 각 픽셀에 대하여 복원을 수행한다. 그 다음으로 2차원 영상 신호에 대하여 복원을 수행하는데. 즉 웨이블릿 변환 계수 정보를 이용하여 영상 및 시간 정보를 여러 스케일의 에지로 분류한 다음, 에지의 방향에 따른 적응적인 제약조건을 사용한다. 이는 각각의 에지 방향에 적합한 고주파 성분을 유지하고, 신호의 각 특성에 적합한 적응적인 정칙화 매개변수를 적용한다. 마지막으로 시간 축에서의 복원과 그것에 이어지는 적응적인 공간 복원에 대한 실험 결과를 보여준다.
-
우리가 일반적으로 모니터에서 작업을 하는 경우 주로 백열등이나 형광등의 조명을 켠 상태에서 하게된다 이런 경우 모니터 상의 동일한 색도는 주위 조명이 바뀜에 따라 다르게 느껴지며 특히 주위 조명의 색도와 모니터의 색도가 틀린 경우는 더욱더 다르게 느껴진다[1]~[3]. 이 논문에서는 우리가 생활하는 일반 환경인 백열등이나 형광등 아래의 모니터 상에 영상을 재현 시 주위 조명의 영향을 고려한 색 재현 알고리즘을 제안한다. 임의의 환경에서 사람의 색 인식에 영향을 미치는 요소는 장면에 존재하는 조명의 색 특성과 물체의 색 특성에 의존한다. 단순한 물체의 표면 반사가 아닌 모니터 등의 조명 역할을 하는 표면이 존재하는 경우는 두 개 이상의 조명이 있는 형태이다. 두개 이상의 조명이 존재하는 경우, 사람들이 느끼는 백색점(white point)은 각 조명의 색도 벡터(chromaticity vector)의 조합으로 표현된다. 본 논문에서는 임의 환경에서 사람이 인식하는 백색점을 모델링하기 위하여 주위 환경이 백색점의 인식에 미치는 영향을 분석하였으며 모니터 상의 색 재현시 주위 조명의 영향을 주위 조명에 의해 생성되는 모니터 표면의 경면 반사(specular reflection)에 의한 영향과 인간 시각의 색 순응(color adaptation) 백색점의 변화 두 가지로 나누어 분석하였다.
-
렌즈의 초점이 맞지 않아 흐려지고 잡음으로 훼손된 영상을 복원하는 경우에 일반적으로 정칙화 반복복원방법이 사용된다. 기존의 방법은 영상의 국부적인 특성을 고려하지 않고 영상전체에 일률적으로 정칙화를 행함으로써 윤곽부분에서는 리플잡음을 초래하고 평면부분에서도 잡음중폭을 피할 수 없으며, 또한 시각적으로 효율적이지 못한 면이 있다. 이러한 문제점을 개선하기 위하여, 본 논문에서는 영상을 방향이 없는 평면영역과 4가지 방향을 갖는 윤곽영역으로 나누어, 윤곽방향을 고려한 방향성 정칙화 연산자를 사용하여 평면영역과 윤곽영역의 방향특성에 따라 적응적으로 처리하는 반복복원방법을 제안한다. 제안한 방법은 기존의 방법과 비교하여 평면영역에서의 잡음 평활화가 개선되고 시각적으로 중요한 윤곽부분 복원에 효율적임을 실험결과를 통해 알 수 있었으며 ISNR 면에서도 우수하였다.
-
본 논문에서는 MPEG-4 의 형상 정보 부호화에 사용되는 움직임 추정부의 고속 알고리즘을 제안한다. 형상정보 부호기에서 사용되는 움직임 추정부는 기존의 텍스처 기반의 움직임 추정부와는 다른 특성을 가지는데 형상 정보 추정기에서 사용되는 움직임 추정부는 CAE(Context-based Arithmetic Encoding)에서 사용될 컨텍스트를 만들기 위해 수행된다는 점과 움직임 벡터의 공간적 상관성, 그리고 형상정보가 이진성을 가진다는 점이 그것이다. 이러한 세가지 특성을 사용한 제안된 알고리즘은 움직임 추정부의 수행 속도를 비약적으로 향상시킨다. 실험 결과에 의하면 계산량은 최악의 경우에도 10% 이하로 떨어지는 것을 볼 수 있다. 따라서 본 논문에서 제안한 알고리즘은 실시간 소프트웨어의 구현에 적합한 알고리즘이라고 할 수 있다.
-
본 논문에서는 Pan/Tilt 움직임이 있는 카메라 영상에서 실시간으로 이동하는 물체를 검출하고 추적하기 위한 라인매칭(Line-matching)알고리즘을 제안한다. 또한 물체를 추적하기 위해 색상 성분의 분포와 물체의 움직임을 동시에 이용하여 특징 값을 매칭 하는 모션-칼라 매칭(Motion-Color matching)방법을 제안한다. 본 논문에서 제시한 라인매칭 알고리즘은 움직이는 카메라 영상 안에서 움직이는 물체를 추적하는데 있어 효율적으로 카메라의 움직임을 보정하며, 그에 따른 연산 시간도 현저히 줄일 수 있는 방법이다. 실험에 의하면 카메라로부터 입력되는 영상에서 움직임을 검출 추적하는데에 있어 초당 10∼12 frame의 연산 속도를 보였으며, 추적하는 대상에 대하여 배경의 움직임이나 주위의 환경에 영향을 받지 않는 강인한 추적 결과를 보였다.
-
We propose a new frame rate up-conversion algorithm for high quality video. In the proposed scheme bidirectional motion estimation (ME) is performed to construct the motion vector. (MV) field for the frame to be interpolated. Unlike conventional motion-compensated interpolation (MCI) algorithms, the proposed technique does not produce any overlapped pixel and hole region in the interpolated frame, and thus can utilize the overlapped block motion compensation technique to reduce the blocking artifacts. The proposed algoritm is very simple to implement on consumer products when compared to conventional MCI methods. Computer simulation shows a high visual performance of the proposed frame rate up-conversion algorithm.
-
본 논문에서는 웨이블렛에 기반한 FLD(Fisher Linear Discriminant) 방법을 제안한다. 본 논문은 얼굴인식에 대한 속도와 정확성을 다룬다. 128×128의 해상도를 가진 영상은 웨이블렛 변환을 통해 16×16의 부영상들로 분해된 후에, 저대역과 중대역에 해당하는 두 개의 부영상을 사용하여 학습과 인식을 한다. 실험 결과, 제안된 방법은 기존의 FLD 방법의 인식률을 유지하며, 보다 더 빠른 속도를 가진다. 우리의 실험에서는 약 6배의 속도 향상을 보인다.
-
본 연구는 손의 동작변화로 인한 손 영역의 국부적인 조명변화와 복잡한 배경환경에서 손 영역의 검지좌표를 안정적으로 검출, 추적하여 마우스 포인터를 제어하는 핑거 마우스 시스템을 제안하였다. 손의 동작변화로 인한 국부적인 조명변화에 강인한 손 영역 검출을 위한 적응적인 on-line학습법을 제안하였으며 복잡한 배경에서도 안정적인 손 영역 추적이 가능하도록 칼만 트렉킹과 차영상을 이용한 모션 세그멘테이션을 복합적으로 적용하였다. 실험결과 복잡한 배경과 손의 움직임에 상관 없이 검지 좌표를 안정적으로 추적 할 수 있었다.
-
인간은 일상 생활에서 제스처, 표정과 같은 비언어적인 수단을 이용하여 수많은 정보를 전달한다. 따라서 자연스럽고 지적인 인터페이스를 구축하기 위해서는 제스처 인식에 관한 연구가 매우 중요하다. 본 논문에서는 영상 시퀸스의 각 영상들이 가지고 있는 정적인 양이 아닌, 영상과 이웃하는 영상들의 변화량을 수치적으로 측정하고 이를 주성분 분석법(PCA : Principal Component Analysis)과 은닉 마르코프 모델(HMM : Hidden Markov Model)을 이용하여 인식하는 방법을 소개한다.
-
본 논문은 다중의 사람을 동시에 검지 및 추적하기 위한 방법을 제안한다 여러 명의 검지된 사람들이 교차해서 움직이거나 폐색(occlusion) 되어 움직이는 경우 이를 검지하고 신뢰적으로 추적하기 위한 방법을 제시한다. 카메라의 시야 범위 안에 나타난 표적은 일정한 크기를 가지는 오브젝트이므로, 배경영상에서 전경 영상만을 분리하는 과정에서 오브젝트의 크기를 고려하여 표적을 검지 한다. 표적의 검지는 환경적인 요인에 의한 부가요소에 적응적으로 대치하기 위해 적응적인 영상처리기법을 사용한다. 최종적으로 검지 된 표적을 동시에 추적하기 위해 본 논문에서는 JPDA(Joint Probability Data Association) 필터를 이용하며 ,표적간의 폐색을 처리하기 위한 방법으로 전이모델을 첨가해서 사용한다. 다중 표적의 추적에 관한 실험의 유효성 및 강인함은 다양한 실제 영상의 실험을 통해 입증한다.
-
본 논문에서는 색상정보를 이용한 얼굴 검출 알고리즘에 대해 소개하고자 한다. 여러 개의 얼굴 검출에 적용되는 이 알고리즘은 피부색의 학습 과정과 입력영상에 대한 얼굴 검출 과정으로 크게 두 가지로 나눌 수 있다. 특히 본 연구에서는 피부색이 본 논문에서 제안한 새로운 RGB 영역에서 직선을 이루는 특징을 이용하여 학습 data를 구성한다. 이렇게 구성된 data를 입력영상에 적용함으로써 1차 얼굴 후보영역을 결정한다. 그런 후 1차 후보영역을 세로방향과 가로방향으로 투영시킴으로써 최종 얼굴 영역을 찾아낸다. 실험을 통해 이 알고리즘은 기존의 색상정보를 이용한 얼굴검출 방법에 비해 얼굴 개수에 상관없이 높은 검출 성공률을 보여주었다.
-
본 연구는 HWT를 이용하여 인체상반신 영상에서 얼굴부위만을 분할하기 위한 알고리즘을 제안하였다. 제안한 알고리즘은 배경을 제거하기 위하여 인체 상반신영상을 2치화 영상으로 만들고, HWT를 적용하여 평균영상과 복원영상에서 고립점, 돌출부위, 경계중복점을 제거한 후 세선화과정을 통하여 경계검출을 수행한다. 다음으로 얼굴부위의 단순경계만을 갖는 마스크를 만들고, 원영상에 마스킹하여 효과적으로 얼굴부위만을 분할한다.
-
본 논문에서는 복잡한 배경과 조명의 영향과 그리고 얼굴의 크기가 변화하는 경우에도 주어진 영상으로부터 얼굴을 검출하는 새로운 효율적인 방법을 제안한다. 정면 얼굴의 경계선이 타원과 유사한 형태를 가지며 얼굴을 수직으로 이등분하는 직선을 기준으로 얼굴의 좌우 외곽선은 반사 대칭 (reflection symmetry) 의 조건을 만족한다. 이러한 반사 대칭의 조건을 허프 (Hough) 변환과 유사한 타원 모델링에 결합하여 주어진 영상에서 얼굴을 검출한다. 얼굴이 포함된 다양한 영상에서 실험을 통하여 제안한 얼굴 검출방법의 타당성을 확인하였다.
-
얼굴 영상은 똑같은 표정의 같은 사람이라도 조명에 따라 매우 다른 얼굴 영상으로 나타난다. 따라서 본 논문에서는 조명 변화에 강인한 얼굴 인식 방법을 제안한다. 제안된 방법은 오프라인 훈련(off-line training)과 온라인 인식(on-line recognition)의 두 부분으로 이루어져 있다. 오프라인 훈련은 PCA(principal component analysis)를 기반으로 한다. 온라인 인식에서는 조명 변화에 대한 보상, 얼굴 특징의 추출, 그리고 인식을 위한 분류 과정의 3 단계로 구성되어 있다. 오프라인 훈련에서는 전체 훈련 얼굴 영상 데이터에 PCA를 적용하여 조명 변화가 최대한 제외된 특징 벡터 공간을 생성한다. 실제 인식 단계에서는 첫 번째로 입력 영상으로 들어온 얼굴 영상에서 조명의 영향을 보상하기 위해 준동형 필터링(homomorphic filtering) 후 밝기 정규화(normalization)를 취한다. 두 번째 단계에서는 입력 데이터의 차원을 줄이고 얼굴 특징 벡터를 구하기 위해 PCA를 수행한다. 마지막 과정으로서 입력 영상의 특징 벡터들과 오프라인에서 미리 구하여진 특징 벡터들의 유사도를 측정하여 얼굴을 인식하게 된다. 실험 결과 제안된 방법은 기존의 Eigenface 방법에 비해 우수한 성능을 나타내었다.
-
In this paper, we present multisample DSP coding technique for StarCore, SC 140 DSP. The multisample programming is a pipelining technique that exploits operand reuse both coefficients and variables within kernel. A coefficient or operand is loaded once from memory and then the value may be used by multiple ALUs. It is possible to evaluate one intermediate product from each of four output sample calculations in parallel . Therefore, parallelization has been achieved by processing multiple samples in parallel rather than multiple intermediate products belonging to only one sample. The benefits of decreasing the number of memory moves per sample is to increase the algorithm perforomance. In this paper, the multisample technique has been implemented in FIR filter calculation using Motorola StarCore DSP development tool.
-
제 3세대 이동통신 IMT-2000의 상용화를 앞두고 세계의 관심이 고조되고 있는 가운데 미국의 cdma2000진영과 유럽, 일본의 WCDMA 진영에서 각각 다른 표준안을 가지고 세계시장 선점을 위한 치열한 경쟁을 벌이고 있다 특히 WCDMA 방식은 미국의 군사위성에 의해 셀(cell)간의 동기를 맞추는 cdma2000 방식에 비해 군사위성을 필요치 않고, 혼합화 코드(scrambling code)에 의해 셀을 식별하게 되므로 셀 식별에 있어 많은 시간을 소비하게 된다. 따라서 본 논문에서는WCDMA방식의 표준화 기구인 3GPP(3rd generation partnership project)에서 규정한 3단계 셀 탐색방법의 이차동기 패널구조의 개선을 통한 빠른 셀 탐색 방법을 제시한다.
-
다중경로 채널의 시변 특성은 OFDM(orthogonal frequency division multiplexing) 신호의 직교성을 파괴시키며 이는 인접 채널간 간섭(ICI: interchannel interference)을 발생시켜 도플러 주파수에 비례하는 오류를 발생시킨다. 본 논문에서는 채널 시변의 원인을 주파수 옵셋과 도플러효과로 규정하고, 주파수 옵셋을 보정하기 위해 기존의 선형보간법(LI: linear interpolation method)대신 선형위상보간법(LPI: linear phase interpolation)과 도플러효과에 의한 ICI 를 제거하기 위해 기존의 주파수영역 등화기법보다 효과적인 시간영역 등화기법을 제안한다. 제안된 기법이 주파수 옵셋이 있는 시변 다중경로 페이딩 환경에서 OFDM 시스템에 적합함을 컴퓨터 모의실험을 통해 확인한다.
-
심전도에서 QRS complex와 R-wave의 검출은 부정맥 진단, 심전도의 특성점 검출 기준, heart rate variability(HRV) 측정에 있어서 중요하나, 시시각각 변화하는 생리적 변화와 여러 가지 노이즈로 인해 검출이 쉽지 않다 제안된 알고리듬에서는 wavelet filter banks를 이용하여 대칭적 enhanced 신호와 noise 와 같은 very high frequency 성분이 제거된 ECG에 근사화 된 approximated 신호를 얻는다. Enhanced 신호로부터 QRS complex의 위치를 검출하고, 검출된 위치의 주변에서 대칭적 wavelet의 특성이 반영된 dominant한 peak의 위치정보, 즉 R wave의 후보점을 얻는다. 이 위치 정보를 이용하여 enhanced 신호에서 각 peak에서의 크기, approxi-mated 신호에서 각 peak 주변에서의 기울기 변화, 기울기 부호 등을 고려하여 R-wave의 위치를 원래의 ECG 신호에서 얻는다. MIT/BIH database에 적용한 결과 99.6%의 QRS complex검출률과 92.9%의 R-wave 검출률을 보였다.
-
본 논문에서는 영상 항법 변수 추출 알고리듬의 실시간 구현에 관해 연구하였다. 영상 항법 변수 추출 알고리듬은 이전 위치를 기준으로 현재 위치를 추정해내는 상대위치 추정 알고리듬과 상대위치 추정에 의해 누적되는 오차를 보정하기 위한 절대위치 보정 알고리듬으로 구성된다. 절대위치 보정 알고리듬은 고해상도 영상과 IRS (Indian Remote Sensing) 위성영상을 기준영상으로 이용하는 방법 및 DEM (Digital Elevation Model) 을 이용하는 방법으로 구성된다. 하이브리드 영상 항법 변수 추출 알고리듬을 실시간으로 구현하기 위해 MVP (Multimedia Video Processor)로 명명된 TMS320C80 DSP (Digital Signal Processor) 칩을 사용하였다. 구현된 시스템은 MVP의 부동 소수점 프로세서인 MP (Master Processor) 를 고정 소수점 프로세서인 PP (Parallel Processor) 를 제어하거나 삼각함수 계산과 같은 부동 소수점 함수를 계산하는데 사용하였고, 대부분의 연산은 PP를 사용하여 수행하였다. 처리시간이 많이 필요한 모듈에 대해서는 고속 알고리듬을 개발하였고, 4개의 PP를 효율적으로 사용하기 위한 영상분할 방법에 대해 제안하였다. 비행체에서 캡코더를 이용해 촬영한 연속 항공 영상과 비행체의 자세정보를 입력으로 실시간 시뮬레이션 하였다. 실험결과는 하이브리드 항법 변수 추출 알고리듬의 실시간 구현이 효과적으로 구현되었음을 나타내고 있다.
-
본 논문에서는 TMS320C6201 DSP (Digial Signal Processor)를 이용하여 실시간 영상 부호화기를 구현하였다. 기본적인 영상 압축 방법으로는 baseline-JPEG을 사용하였고 이에 움직임 검출 알고리즘을 부가하여 영상의 시간적인 중복성을 제거하였다. 특히 저속 메모리와 고속 메모리의 효율적인 분배 사용, 계산량이 많은 모듈의 최적화, 데이터의 병렬 연산과 DMA (Direct Memory Access)를 이용한 데이터 전송 등의 방법을 통하여 실시간 영상 부호화기의 고속 영상 처리에 중점을 두었다.
-
본 논문에서는 TTS 알고리듬을 16 비트 고정 소수점 DSP인 TMS320C6201을 이용해 다채널 실시간 구현하였으며, 실제로 음성처리 부가 서비스 시스템에 보드 형태로 구현하여 응용하였다. 구현된 TTS는 최적화 작업을 통해 최대 40 MHz 클록으로 채널 당 2초의 합성음 생성하도록 했으며, 개발된 TTS 보드는 두 개의 DSP를 사용하여 DSP 당 8 채널씩 총 16 채널을 수용하였다 실험 결과, 모든 채널에서 실시간적으로 음성 합성이 수행됨을 확인하였다.
-
근본적으로 방대한 양의 실시간 연산을 요구하는 영상 신호처리, 소나, 레이다와 같은 시스템에서는 시스템의 성능을 최대화하기 위해 병렬 신호처리 시스템의 사용이 불가피하다. 본 논문은 방대한 양의 데이터를 실시간으로 처리할수 있는 병렬 신호처리보드를 설계 및 구현하였다. 이 보드는 DSP칩간의 통신과 보드간의 통신이 가능하며, DSP칩이 마스터가 되어 EMIF(External Memory Interface Port)포트를 통해 다른 DSP칩의 지역메모리를 액세스 할수 있다. 또한 외부의 호스트 프로세서가 보드 내의 DSP칩에 프로그램을 다운로딩 할수 있다. 보드간의 통신은 PCI 버스를 통하여 이루어지며, DSP칩간의 통신과 DSP칩과 그의 지역메모리와의 통신은 지역버스를 통해 직접적으로 이루어진다. 보드에서 가장 핵심인 DSP-to-PCI제어기는 하드웨어 언어인 VHDL로 설계하였으며, 시뮬레이션 환경은 Synopsys & ALTERA MaxplusⅡ를 사용하여 검증하였으며, 최종적으로 CPLD(Complex Programable Logic Device)칩을 사용하여 구현하였다.
-
본 논문에서는 16채널 혹은 8채널의 센서를 통해 들어오는 저주파대역의 아날로그 신호를 수집하고. 수집된 데이터를 실시간으로 처리하기 위한 고속의 신호처리 기능이 결합된 통합 DSP (Digital Signal Processor)시스템을 구현하였다. 구현된 시스템은 휴대가 용이하도록 소형으로 설계되어 있으며 노트북 등의 이동형 장비에 활용되도록 USB 인터페이스를 채택하였으며, 장치간의 네트워크 구성이 가능하도록 Ethernet 인터페이스를 추가하였다 Digital Signal Processor는 Texas Instrument 사의 TMS320C6701 부동소수점 연산방식의 고성능 DSP를 사용하여 16채널의 실시간 신호 분석이 가능하게 하였으며, ICP 센서 구동용 전류 공급부를 내장하여 센서 선택의 폭을 넓히었고, programmable gain amplifier인 PGA202증폭기를 사용하여 입력신호가 작을 경우 최대 1000배, 즉 60dB까지 입력신호를 증폭하여 수집 및 분석할 수 있다. 200kSPS의 샘플링 레이트와 16bit resolution을 가지는 AD976 A/D converter를 사용하여 채널당 0~6kHz의 신호대역폭을 가지며,differential 입력시 8 채널,single ended 입력시 16 채널의 입력 신호의 수집 및 분석이 가능하다. Windows 응용프로그램에서는 사용자가 원하는 입력신호 및 스펙트럼 실시간 분석, 입력신호 기록 및 저장, RPM 측정 및 분석, 외부 트리거 및 레벨 트리거를 이용한 입력신호 제어와 수집된 데이터를 바탕으로 원하는 제어가 가능한 응용프로그램 제작에 활용될 라이브러리가 포함된다.
-
디지털 워터마킹이란 디지털 컨텐츠의 저작권을 보호하기 위해 보이지 않는 임의의 데이터를 미디어에 삽입하는 방법이다. 본 논문에서는 주파수 영역으로 변환된 원 데이터를 임의의 방향으로 정의된 데이터와 내적(Inner Product)하여 이를 워터마크 정보에 따라 변화시키는 방법을 제안한다. 이 방법은 비밀키가 워터마크 데이터와 연관된 것이 아니기 때문에 어떠한 종류의 데이터도 삽입할 수 있다는 장점이 있다. 사용되는 비밀키는 주파수 영역으로 변환된 원 데이터와 내적되는 임의의 데이터를 만드는데 사용된다. 또한 워터마크의 견고성을 높이기 위해, 주파수 영역으로 변환된 원 데이터와 내적된 임의의 데이터는 잡음처럼 되므로 이를 인간 시각 특성을 사용하여 모델링 하였다. 제안된 방법은 원 영상 없이 워터마크를 검출할 수 있으며. 워터마크의 견고성 실험을 위해 JPEG, Cropping, Resizing. Gaussian 잡음 등을 적응하였다.
-
디지털 워터마킹(Digital Watermarking)은 디지털 미디어 창작물에 대해 불법적인 사용과 인위적인 조작으로부터 소유권과 저작권을 보호하기 위하여 입증 가능한 정보(워터마크)를 사람이 인지하지 못하도록 삽입하는 기술이다. 본 논문에서는 JPEG 2000에서 지원하는 Daubechies 9/7 필터를 이용한 lifting 기반의 DWT(Discrete Wavelet Transform) 중간에 임의의 파라메터를 추가한 lifting 단계를 구성하여 이 부분에 워터마크를 삽입한 후, 다양한 신호처리 왜곡을 가하여 제안한 방법의 성능을 평가하였다. 실험은 8-bit 512×512크기의 영상을 사용하였으며, 무작위로 발생시킨 1과-1을 워터마크 신호로 하여 DWT 시 추가한 lifting 단계에서의 임의의 파라메터 값과 워터마크를 삽입할 각 웨이블릿 변환의 해상도 레벨을 조절해 가면서 선택한 웨이블릿 계수값에 무작위로 발생시킨 워터마크 신호를 삽입하였다. 실험 결과 영상의 일반적인 변형(압축, 필터링 등)에 대해서 제안한 방법의 워터마킹 기법의 성능이 전반적으로 강인함을 확인하였다.
-
Digital watermarking has been proposed as a solution to the problem of copyright protection of the multimedia documents. In this paper a new watermarking method for digital images operating in the frequency domain is proposed. In our approach, DCT coefficients of the watermark are added to the low frequency region of the host image, and extract it using the Wiener Filter. Due to the characteristic of the wiener filtering, the watermark is robust to various image processing techniques. Experimental results show that it is possible to reliably extract the watermark without degrading image quality.
-
본 논문에서는 임의의 모양을 가지는 영상 객체(image object)에 적용 가능한 모양적응 이산변환(PSADT : Polar coordinates shape adaptive discrete transform)에 기반한 새로운 워터마킹 기법을 제안한다. 대수-극 좌표계(log-polar coordinates)와 모양적응 이산변환을 이용하여 제안된 기법은 MPEG-4의 VOP와 같은 임의의 모양을 가지는 영상 객체에 적용할 수 있을 뿐만 아니라 기존 기법에 비하여 회전과 크기 변화와 같은 기하학적인 공격에 대하여 우수한 강인성을 제공한다.
-
현재까지 제안된 대부분의 워터마킹 방법들은 전체 프레임 기반이기 때문에 전체영상은 보호할 수 있지만, 공격자가 영상을 구성하는 특정한 객체만을 잘라내어 사용할 경우 객체 그 자체는 보호하기가 어려워 멀티미디어 데이터를 보호하는데 있어서 그 한계가 있다. 따라서 본 논문에서는 영상을 구성하는 특정한 임의의 객체를 추출한 후, 영상의 왜곡을 최소화하기 위해 객체보다 큰 배경영상을 사용, 인간시각 특성을 이용한 웨이브릿 영역에서의 객체기반 워터마킹 방법을 제안한다 제안한 방법은 영상을 구성하는 각각의 객체를 선별하여 워터마크를 삽입함으로서 전체 영상뿐 아니라 각각의 객체를 보호할 수 있어 기존의 방법이 객체공격에 취약한 단점을 보완하였다.
-
We consider the design of quadrature amplitude modulation (QAM) transceivers f3r fixed wireless communications. The use of adaptive power control in the transmitter (Tx) can provide BER performance robust to fading and improved BER performance. The BER performance is evaluated by analytical and simulation results when multi-level QAM transceiver employing power control in the Tx is applied to fixed wireless channel with flat fading and frequency selective fading. The effect of power control parameters such as power control range and power control step size is investigated
-
일반적으로 음향 반향 제거에서 반향의 임펄스 응답이 큰 경우 주파수 영역의 알고리듬은 시간 영역 알고리듬에 비해 긴 임펄스 응답에 따른 많은 계산량과 입력신호의 통계적 특성에 의한 영향을 줄일 수 있다. 그러나 주파수 영역 알고리듬에서는 시간 영역의 신호를 주파수 영역으로 변환시킬 때 필터 차수의 2배의 FFT 연산이 필요하게 되어, 긴 차수로 인한 실행 시간 지연이 발생하고 많은 메모리가 필요하다. 이러한 문제점을 감소시키고 수렴성능을 향상시키기 위한 MDF 알고리듬이 제안되었으나 계산량이 많은 단점이 있고, UMDF와 AUMDF 알고리듬은 계산량은 감소되나 수렴성능이 저하되는 문제점이 있다. 본 논문에서는 기존의 MDF 알고리듬과 거의 동일한 수렴성능을 유지하면서 연산량과 메모리를 줄일 수 있는 수정된 AUMDF 알고리듬을 제안하였으며, 모의 실험을 통해 결과를 확인하였다.
-
본 논문은 부밴드별 반향제거 필터 뱅크를 구현하기 위한 가중 Overlap-add 적응필터를 이용한 단일 채널 음향 반향 제거기를 제안한다. 기준 입력 신호의 고유치 분포율에 의존하여 수렴 특성이 결정되는 NLSM알고리즘을 사용하여 전대역 처리 과정에서 발생하는 수렴성능의 저하를 방지하고, 효율적인 블록별 병렬 처리가 가능한 부밴드 처리기법인 가중 Overlap-add 방식을 적용한 적응 반향제거기의 성능을 고찰한다 또한 본 논문에서는 동시 통화 검출을 위한 전용 필터와 에너지 비교 방법을 동시에 사용하는 새로운 형태의 동시통화 검출 기법을 제안한다.
-
Adaptive array systems are hard to remove all the interferences when incident signals are coherent with a desired signal. In this paper, we propose a modified Duvall beamformer, which performs spatial smoothing using spatial interpolation technique to maintain the degree of freedom. The propose algorithm can minimize the loss on the degree of freedom due to spatial smoothing by forming subarrays with interpolated signals. Simulation results show that the proposed algorithm can remove all the interferences while conventional beamformer cannot.
-
본 논문에서는 주파수 영역 배열안테나의 계산량을 감소시키기 위한 센서링 부분적응 알고리듬을 제안한다. 제안한 알고리듬은 입력신호를 주파수 영역으로 변환한 후 CFAR(constant false alarm rate) 검파기법을 이용하여 간섭신호가 존재하는 주파수 대역을 찾아내고 이에 해당하는 가중치에 대해서만 적응 신호처리를 수행한다. 이때 CFAR 검파기의 오경보율은 출력신호의 전력 변화량을 이용하여 환경에 맞게 적응적으로 변화시켜서 최적 값으로 설정한다.
-
This paper proposes an adaptive linearization method of Volterra nonlinear systems using DWT(Discrete Wavelet Transform)and an LMS-type predistorter. In particular, the proposed wavelet transform-domain lineatization method leads to diagonalization of the input vector auto-correlation matrix which yields improvement of the convergence rate of the corresponding transform-domain LMS algorithm. Furthermore, the adaptive Volterra predistorter followed by a corresponding weakly Volterra nonlinear system(here. a TWT amplifier model in a satellite communication system) is utilized to compensate for the distortion in the output. Also,12-PSK and 4-QAM are applied as the input to the nonlinear system to be tested. Some simulation results show that the proposed linearization approach has better performance than DCT-based or conventional normalized LMS algorithms do.
-
LSP 파라미터는 일정한 ,스펙트럼 민감도와 낮은 스펙트럼 왜곡을 보이고 선형보간이 용이하다는 장점을 갖는다. 피러나 LPC 계수를 LSP 파라미터로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다. 기존의 LSP 변환 방법 중 음성 부호화기에 주로 사용되는 Real Root 방법은 근을 구하기 위해 주파수 역을 순차적으로 검색하기 때문에 계산시간이 많이 소요된다. 본 논문에서 제안하는 방법은 음성 특성을 이용하는 것으로, 묵음의 경우는 묵음 구간에서 일정하게 나타나는 LSP 파라미터의 분포 특성을 이용하여 검색하고 유/무성음에 대해서는 LSP 파라미터의 분포도에 따라 검색구간의 순서와 검색간격을 달리한다. 또한, 모음에 대해서는 제1 포만트와 제2 포만트의 연관성을 고려하여 검색구간을 조절한다. 기존의 Real Root 방법과 제안한 방법을 비교한 결과 검색시간이 평균 46.5% 단축되었다.
-
MPEG-4 CELP의 알고리즘은 전송환경에 따라 선택할 수 있는 다양한 전송률을 지원하며 각종 옵션을 추가함으로써 다양한 기능을 부가할 수 있도록 구성되어 있다. 본 논문에서는 MPEG-4 오디오 CELP 부호화기를 VHDL(Very High Speed Intergrated Circuit Hardware Description Language)을 이용하여 구현하였다. MPEG-4 CELP의 부호화 과정을 크게 3부분으로 나누어 LPC 분석부, 코드북 검색부, 비트열 생성부로 나누어 설계하였으며, 내부 메모리의 크기를 줄이기 위하여 중복적인 성격을 갖거나 계산과정에서 나오는 중간 결과 값들을 저장하지 않도록 알고리즘을 최적화하였다. 또 계산 값의 동적 범위(Dynamic Range)가 크거나 정밀도가 요구되는 부분에 대해서는 배밀도(Double Precision) 연산을 사용하여 값의 오차를 줄였다.
-
본 논문에서는 data-driven 반향제거기 구조에서 타이밍 지터의 보상 방법을 제안한다. V.90PCM 모뎀환경에서 네트윅 클록에 동기가 되어 동작하는 사용자 터미널 모뎀이 디지털 PLL (DPLL)을 이용하여 타이밍 복원을 하면 타이밍 지터 성분이 반향제거기의 성능을 순간적으로 악화 시키게 된다. 제안된 방법은 두개의 계수세트 들로부터 타이밍 지터 발생시 필요한 계수를 디콘볼루션 알고리듬을 이용하여 FIR 필터링을 통해 구하며 발생하는 지터 성분 의 대부분을 보상 해 준다. 또한 제안 방법은 waveform driven 반향제거기에 비해 약간의 성능열화가 있지만 적은 연산량으로 타이밍 지터보상을 할 수 있는 장점이 있다.
-
본 논문에서는 DSSS(Direct Sequence Spread Spectrum)를 사용한 무선 감시용 카메라를 위한 모뎀을 제안한다 무선 환경에서 발생할 수 있는 여러 가지 간섭과 다중 경로에 의한 오류 발생 확률 등을 고려해야 하고 또한 여러 대의 카메라를 설치하고 각각의 카메라로부터의 신호를 선택적으로 모니터하기 위해 각각의 신호를 구분할 수 있는 변조 방식의 사용이 필요하다. 이를 위해 컴퓨터 모의 실험을 통한 성능 분석과 실제 FPGA설계 및 제작으로 이를 확인한다.
-
현재 사용되고 있는 CDMA 시스템에서는 기지국 내에 사용되는 고출력 증폭기(high power. amplifier)의 비선형 특성으로 인해, 시스템의 송신 신호는 심각한 비선형 왜곡을 겪게되고 이는 결국 시스템의 성능을 크게 악화시키는 요인으로 작용한다. 이러한 고출력 증폭기의 비선형성은 출력 신호 레벨을 선형 영역으로 충분히 backing-off 시킴으로써 감소시킬 수 있으나, 이는 송신 신호의 출력을 과도하게 감소시키게 되어 결국 fade margin을 감소시키는 결과를 가져온다. 본 논문에서는 이러한 고출력 증폭기에서 발생하는 비선형 왜곡을 보상할 수 있는 디지털 사전왜곡기를 하드웨어적으로 직접 구현하여 고출력 증폭기의 특성이 변할 때,LMS 알고리듬을 이용하여 LUT의 값을 갱신함으로써 보다 효과적인 적응 사전왜곡기를 설계하는데 목적이 있다.
-
본 논문에서는 비동기식 Zipper 방식의 VDSL(Very High Blt-rate Digital Subscriber Line) 시스템에서 cyclic extension 을 최소화 하는 기법을 제안하고, 전형적인 전화채널 환경 하에서 제안된 방식의 성능을 분석한다. Zipper 방식에서는 각 DMT(discrete-multitone) 블록에cyclic prefix(CP) 와 cyclic suffix(CS)가 추가로 사용되는데, 여기서 CP 는 심볼간 간섭과 부채널간 간섭을 방지하기 위하여 삽입되며, CS는 upstream 과 downstream 부반송파간의 직교성을 유지하기 위하여 추가되어 near-end crosstalk (NEXT)을 방지한다. 이 방식이 동기식 Zipper 방식으로 CS에 의해 NEXT를 제거하기 위해서는 한 binder 내의 모든 송신단의 동기를 맞추어야 한다. 그러나 비동기식 Zipper 방식은 다른 송신단과의 동기가 맞지 않아 CS가 NEXT에 아무런 영향을 주지 못한다 본 논문에서는 CS를 사용하지 않는 비동기식 Zipper 방식의 VDSL 시스템을 제안한다. 컴퓨터 모의실험을 통하여 제안된 방식이 전형적인 채널환경 하에서 기존 Zipper 방식의 VDSL 시스템과 비교하여 비슷한 전송능력을 갖게 됨을 보인다.
-
홈네트웍은 정보통신 네트웍의 최종단인 가정 내 통신망이다. 이제까지 백본 네트웍이나 엑세스 네트웍 등에 비해 상대적으로 연구가 적었지만 최근 들어서 가정 내에서 복수 개의 PC 의 사용이 증가되면서 홈네트웍에 대한 관심이 증가하고 있다. 본 논문에서는 100Mbps 전송속도를 갖는 Home Network 구현을 위하여 두 가지 방법으로 시스템을 제안한다. 첫번째 방법은 현재 100Mbps 급 홈네트웍의 표준안으로 예상되는 OFDM 변조방식의 일종인 DMT방식을 사용하는 것이고, 두 번째는 최소대역폭 라인코딩 방식을 이용하는 것이다.
-
광대역 무선 서비스에 대한 수요가 증가함에 따라 이미 제정되었거나 현재 제정중인 무선 LAN 표준안으로는 ETSI BRAN의 HIPERLAN, IEEE 802.11, MMAC-PC등이 있다 이러한 표준안들은 상위계층은 서로 다른 반면, 5 GHz 대역에서 OFDM 방식을 사용하는 공통된 물리계층을 정의하고 있다. 본 논문에서는 이중 HIPERLAN/2 물리계층의 구조 및 파라미터를 설명하고 그 성능을 분석한다.
-
무선 LAN은 유선 LAN을 대체하기 보다는 기간망과 이동(Mobile) 사용자간의 수십 미터 이내의 종단 연결점을 제공한다는 개념으로 구성되며, 이동성(Mobility)과 확장성(Scalability)을 발휘할 수 있다는 장점으로 많은 응용 분야에서 각광을 받고 있다. 초광대역 시간 도약(ultra wideband time hopping; UWB/TH) 임펄스 무선기술은 기존 시스템의 정상적인 동작에 거의 영향을 미치지 않기 때문에 별도의 주파수 할당이 필요치 않는 새로운 기술이다. 본 논문에서는 IEEE 802.11의 무선 LAN의 프로토콜을 기적으로 사용하고 전송 방식을 직접수열 확산 스펙트럼 방식을 사용하는 기존의 방법과 임펄스 라디오 방식을 사용하는 경우를 비교하였다.
-
본 논문에서는 UMTS(Universal Mobile Telecommunications System)의 규격에 명시된 SRCF(Square Root Raised Cosine Filter) 와 호환성을 가지면서, 우수한 성능과 구현이 간단한 필터를 설계 및 구현하는 방법에 대하여 소개한다. 또한, VHDL을 이용하여 ALTERA FPGA서 필터를 직접 구현하는 결과를 보이고 있다.
-
Turbo Code는 반복 복호알고리듬을 사용함으로써 백색 가우시안 잡음(AWGN)채널 환경에서 Shannon의 한계에 가까운 성능을 보이는 오류정정 방식으로 제안되었다. 그러나 Turbo code는 반복복호로 인해 매복호시마다 큰 인터리버와 복호기를 거쳐야 하기 때문에 수신과정에서 커다란 지연을 요구하게 된다. 따라서 차세대 무선 멀티미디어 통신에서 실시간으로 음성서비스나 화상서비스를 제공하는데 어려움이 많다. 본 논문에서는 기존의 터보 복호기를 변형하여 매 복호시 각각의 복호기에서 출력시퀀스를 발생시킴으로서 반복 복호 횟수를 줄이는 방법을 제안하였다. 이렇게 함으로서 기존의 Turbo code가 갖는 성능은 크게 변화시키지 않으면서 각각의 정보프레임을 가변적으로 복호함으로서 반복복호로 인한 시간 지연을 줄일수 있었다.
-
본 논문에서는 MCMA(modified constant modulus algorithm) 블라인드 등화 알고리듬을 고속 데이터 통신에 적합한 FSE(fractionally spaced equalize.)에 적용시킨 FS-MCMA를 제안하였다. 제안한 FS-MCMA는 위상 복원문제와 같은 CMA의 단점을 보완하기 위하여 M-ary QAM 신호의 경우 다중레벨로 등화하는 기존의 MCMA 이용하였고 주기 T의 간격으로 수신되는 심볼을 2배 이상으로 샘플링하는 기법, 즉 FSE를 도입하여 높은 테이터율을 요구하는 멀티미디어 통신에 적합하도록 구성하였다. 컴퓨터 모의 실험을 시행한 결과를 residual ISI 측면에서 기준을 정하고 비교하였는데 4dB정도의 성능향상을 보였으며, 또한 기존의 CMA보다 154dB 정도의 성능향상을 보였다.
-
This paper introduces a new structure for the undecimated discrete wavelet transform (UDWT). This structure combines the stationary wavelet transform with a lifting scheme and its design is based on a polyphase structure .where the downsampling and split stage are removed. The suggested structure inherits the simplicity of the lifting scheme, such that the inverse transform is easily implemented. The performanace of the proposed undecimated lifting is verified on a signal denoising application.
-
본 논문에서는 음원에 관한 정보가 미지의 상황에서 마이크로폰 어레이를 사용하여 두 음원신호를 분리하는 ,시스템을 제안한다 이 시스템은 두 단계로 구성되어 있으며, 첫 번째 단계에서는 파워가 큰 제 1음원의 DOA(Direction Of Arrival)를 추정하고, AMUSE(Algorithm for Multiple Unknown Signals Extraction)법을 사용한 Blind Deconvolution에 의해 음원신호의 분리를 행한다 두 번째 단계에서는 파워가 낮은 제 2음원의 강조신호를 사용하여 DSA(Delay and Sum Array)법에 의해 제 2음원의 DOA를 추정하고,AMUSE법의 출력신호와 두 음원의 DOA를 이용하여 ANF(Adaptive Notch Filter)를 구성하고, 두 음원신호의 재 분리를 행한다. 그리고, 시뮬레이션을 통해 제안한 방법의 유효성을 검토한 결과 두 음원 신호가 분리 가능한 것이 확인되었다.
-
무선 인터넷을 위한 기술로써 WAP 표준이 나온 이후로 무선 인터넷을 위한 급속한 발전과 함께 많은 응용기술들이 나오고 또한 이를 적용시키고자 하는 노력이 여러 방면에서 나오고 있다. 특히 무선 인터넷을 위한 응용기술로써 가장 시급한 기술로는 먼저 제한된 환경을 가지고 있는 무선 단말기에서 효율적인 표현 방식과 이와 더불어 무선 환경에서 제한된 자원을 위한 무선망의 접속기술을 들 수 있다. 본 논문에서는 이 중 무선망 접속기술 차원에서 CDMA 기반 WAP의 제한된 데이터 전송률을 향상 시켜보고자 하며, 고속 유무선 전송기술인 OFDM를 접목한 CDMA-OFDM 기술을 WAP 전송매체(Bearer) 부분에 접목함으로서의 효과를 제시한다.
-
In this paper, we propose a method for generating graphic objects having realistic shadows inserted into video sequence for the enhanced augmented reality. Our purpose is to extend the work of [1], which is applicable to the case of a static camera, to video sequence. However, in case of video, there are a few challenging problems, including the camera calibration problem over video sequence, false shadows occurring when the video camera moves and so on. We solve these problems using the convenient calibration technique of [2] and the information from video sequence . We present the experimental results on real video sequences.
-
본 논문에서는 얼굴의 특징 추출을 이용해서 캐리커쳐를 자동으로 생성하는 알고리즘을 제안한다. 제안된 방법은 사진이나 카메라를 이용해서 입력된 영상으로부터 색상정보를 이용하여 얼굴영역을 검출하고 얼굴의 기하학적인 구조를 이용해서 유전자 알고리즘의 추정 파라미터를 설정하여 최적의 특징 점의 위치를 검출한다. 검출된 특징 점 위치를 이용하여 눈, 코, 입, 눈썹, 머리카락 등 얼굴의 특징이 되는 구성요소를 추출한다. 마지막으로 얼굴의 윤곽선을 구한 다음 추출된 얼굴의 구성요소들을 합성하여 간단하면서도 개인의 특징을 잘 반영할 수 있는 캐리커쳐를 생성한다.
-
본 연구는 현 Inner-wear매장에서 판매되어지는 제품을 소비자가 선택할 수 있는 한계 즉, 시각적인 면에 국한된다는 것에 착안하여 현실이 아닌 가상공간에서의 구매 즉 물리적 현실적 제약으로부터 현재 존재하지 않는 미래의 상황을 연출, 미리 볼 수 있도록 가상의 상황을 입체적으로 연출하여 Inner-wear를 쉽게 착용하고 그 모습을 자유롭게 검색하여 볼 수 있도록 하고자 한다. 자신의 신체를 만들어 보고 자신이 구매하고자 하는 제품을 골라 가상공간에서 자신의 신체에 직접 입혀보며 자신의 신체에 얼마나 잘 맞는지 직접 확인해 보고 구매 할 수 있도록 하는데 있다. 이 시스템은 Wed상에서 구동 할 수 있도록 구현되어 일반 소비자들이 어디서나 사이트에 접속하여 구매 할 수 있도록 할 것이다.
-
In this paper, we propose a method for implementing a system for decoding the parameter data based on Facial Animation Parameter (FAP) developed by MPEG-4 Synthetic/Natural Hybrid Coding (SNHC) subcommittee. The data is displayed according to FAP with human mucle model animation engine. Proposed model has the basic properties of the human skin specified by be energy funtional for realistic facial animation.
-
멀티미디어 기술의 총아라고 불리는 차세대 디지털 방송은 현재 선진 각 국에서 표준안 제정에 심혈을 기울이고 있으며 그 핵심적인 기술은 대부분 MPEG-2를 근간으로 하고 있는 실정으로 현재는 양방향 서비스에 대한 논의가 제한적으로 이루어지고 있다. 이에 차세대 영상압축 기술인 MPEG-4에서는 시스템 차원에서 사용자와의 상호작용을 지원할 수 있는 구조로 개발되어 있다. 본 논문에서는 이러한 기술적 차이에 착안해서 현재 제정된 디지털 방송 표준안을 기본으로 하고 사용자와의 상호작용을 지원하는 부가 데이터 방송은 MPEG-4 시스템 표준을 이용하여 양방향성이 강조된 디지털 방송 시스템 모델을 제안한다. 제안된 기술은 별도의 하드웨어의 지원 없이 소프트웨어만으로 처리할 수 있으며 차후 하드웨어로 제작될 디지털 TV 수신기모델을 손쉽게 검증, 제시함으로써 셋톱박스 및 디지털 TV 개발에 응용할 수 있다.
-
본 논문에서는 구름이나 연기와 같은 non-rigid object에 대한 영역 분할 방식에 대해 연구하였다. Non-rigid object의 효과적인 영역 분할을 위해서 object의 윤곽선을 정확히 파악해 낼 수 있는 장점을 가진 watershed 알고리즘을 사용하였다. 하지만 이 알고리즘은 object가 많은 영역으로 분할되는 oversegmentation 현상이 발생하여 본 논문에서는 pre, post-processing을 통해 이 oversegmentation 현상을 극복하고자 하였다. Pre-processing에서는 noise를 제거하고 영상을 단순화하면서 정확한 gradient magnitude를 구할 수 있는 방법에 대해서, post-processing에서는 통계적인 분석을 통한 region merging을 이용하여 object를 최적화 상태로 찾아줄 수 있는 방법에 대하여 연구하였다.
-
의료 영상에서 관심 있는 부위를 3차원으로 재구성 하여 보는 것은, 정확한 진단을 위해서 매우 중요하다. 이러한 3차원 재구성을 위해서는 관심 있는 영역의 분할이 필수적인 선행작업이다. 본 논문에서는 3차원적 정보를 이용한 영상 분할 방법으로 슬라이스 기반의 3차원 영역 확장법을 제안한다. 제안된 방법은 2차원 슬라이스 영상에서 영역 성장법에 의해 영역을 확장시키고, 그 이웃한 슬라이스들에 씨앗을 전달하여 재귀적으로 3차원 영역을 확장하여 영상을 분할한다. 이때, 이웃한 슬라이스 간의 영역의 크기를 이용하여 새나감을 방지한다. 제안된 방법을 튜브 형태의 기관의 분할에 적용한 결과, 새나감 없이 뽀족한 가지들까지도 성공적으로 분할 했으며, 튜브의 중심 축이 고차원 곡선인 경우에도 성공적으로 분할했다.
-
PACS의 보급으로 인하여 CT, MRI 등의 의료영상이 진료에 광범위하게 사용되고 있고, 또 의사가 좀 더 정량적이거나 사실적인 visualization을 위해서 분할은 필수적으로 수행되어져야 할 과정이라고 할 수 있다. 의료 영상에서 watershed 알고리듬을 이용하여 분할을 하는데 있어 가장 큰 문제가 되는 점은 과분할현상(Oversegmentation)이기 때문에 그 분할된 영역을 의미 있는 영역별로 합치는 영역 병합(merge) 과정을 필요로 하게 된다. 의료영상에서 모호한 경계는 매우 빈번하게 나타나기 때문에 기존의 병합 방법을 적용하는데 어려움이 있다. 본 논문에서는 이런 모호한 경계를 갖는 영상에서도 알맞는 병합을 가질 수 있는 적응적 영역 병합 방법을 제안한다. 제안된 분할 방법을 DICOM 영상의 폐 영상과 다리 뼈 영상에서 실험하였다. 그 결과 뼈와 폐영역을 성공적으로 병합하면서 인접한 장기들과는 구분 지을 수 있었다.
-
본 논문에서는 칼라 영역으로 확장된 블록단위 영상분할 알고리듬을 제안한다. 즉, 기존의 휘도 성분을 기반으로 한 블록단위 알고리듬을 HSV 칼라 성분을 기반으로 하는 칼라 영상분할로 확장한다. 기존의 수학적 형태학(mathematical morphology)에 기반한 영상분할기법이나 블록단위 영상분할 기법들이 밝기 정보만을 활용했던 것에 대해 제안된 블록단위 영상분할 기법은 밝기뿐만이 아니라 칼라 성분도 고려하여 영상분할의 정확도를 향상시켰다. 실험의 결과 휘도 성분만을 고려한 영상분할 결과 보다 칼라 성분을 사용한 영상분할의 결과가 더 정확함을 알 수 있었다.
-
본 논문에서는 웨이브릿 영역에서 엔트로피 특징과 웨이브릿 모멘트의 융합에 의한 효율적인 영상기법을 제안한다. 엔트로피 특징은 밝기값의 국부적 변화도에 민감하고 벨리, 에지 등의 특징을 잘 검출한다. 이러한 특징을 밴드별 위치정보와 주파수정보를 모두 가지는 웨이브릿 모멘트와 융합하여 내용기반 영상검색에 효과적으로 적응하였다. 실험에 사용한 DB는 Corel Draw영상을 사용하였으며 실험 결과, 기존의 검색 방법들에 비해 매우 우수한 검색 성능을 보임을 확인하였다.
-
다양한 보간 기법을 정리해 보고 이를 통해서 기존의 보간 기법의 한계를 고찰해 본다. 보간의 효율성과 보간 결과 영상의 화질과는 Trade off 관계가 있으며, 이를 적절한 수준에서 결정하는 것은 중요한 문제이다. 본 논문에서는 Quadratic B-spline을 기저 함수로 하는 윤곽보존형 보간 필터를 사용한 영상확대 알고리즘을 제안한다. Unser의 Cardinal Cubic spline함수에 비해 적은 하드웨어만으로도 이상적인 저역 통과 필터의 특성을 가지며, 입력영상의 윤곽의 방향성을 고려한 적응적인 보간 기법의 적용으로 화질이 우수한 영상확대 알고리즘을 제안한다.
-
본 논문에서는 스테레오 정합시에 발생하는 투영적인 왜곡을 해결하기 위해 윈도우 와핑(warping)을 이용한 새로운 스테레오 정합방법을 제안한다. 투영된 영역에의 왜곡은 고정된 윈도우를 사용해서는 변위값을 추정하기 어렵기 때문에 본 논문에서는 블록정합 시에 윈도우 와핑기법을 사용한다. 와핑이 이루어지는 지점은 이전에 구해진 변위값의 신뢰성에 근거해서 구해진다. 초기의 신뢰성과 변위값은 계층적인 정합에서 구해진다. 실험의 결과는 제안한 방법이 정합이 향상되었음을 보여준다.
-
This paper provides a heuristic theory for modeling and analysis of vector quantization effects in 2-dimensional subband filter banks. This model is used as the basis for optimal filter bank design. The scalar non-linear gain-plus-additive noise quantization model can be used to represent each vector quantizer in 2-band subband codec. The validity and accuracy and of this analytic model is confirmed by comparing the calculated model quantization errors with actual simulation of the optimum LBG vector quantizer. Numerical design examples for the optimum separable paraunitary filter banks are suggested in this paper.
-
In this paper, we present a robust global registration algorithm for multi-frame image mosaics. When we perform a pair-wise registration recovering a projective transformation between two consecutive frames, severe mis-registration among multiple frames, which are not consecutive, can be detected. It is because the concatenation of those pair-wise transformations leads to global alignment errors. To overcome those mis-registrations, we propose a new algorithm using multiple frames for constructing image mosaics. We use a graph to represent the temporal and spatial connectivity and show that global registration can be obtained through the search for an optimal path in the constructed graph. The definition of an adequate objective function characterizing the global registration provides a direct manipulation of the graph. In the presence of moving objects, especially large ones compared with low texture backgrounds, by using the likelihood ratio as the objective function, we can deal with some of the most challenging videos like basketball or soccer Moreover, the algorithm can be parallelized so it can be more efficiently implemented. Finally, we give some experimental results from real videos.
-
This paper presents a parametric line equation on the log-polar mapped plane to detect the straight lines in an original image. The log-polar edge image used in Hough transform is constructed by combining the edge images of both fovea and periphery. The foveal edge image detected by a Sobel mask on the Cartesian plane is transformed to the log-polar plane by forward mapping but the edge detection of the peripheral region is obtained by directly applying the newly developed mask to the log-polar plane. This paper also proposes a analytic method then determining a border between the fovea and the periphery regions.
-
In this paper, a MMSE filter in homomorphic wavelet transform domain is proposed for restoring an ultrasonic images corrupted by speckle noise. In order to remove effectively the speckle noise which is a kind of multiplicative noise, speckle noise is transformed into a form of additive noise and then the additive noise is denoised through the MMSE filter in homomorphic wavelet transform domain. The proposed method shows much higher quality in terms of ISNR and subject quality.
-
본 논문에서는 슬라이스간의 상관성을 이용한 3차원 MR 영상의 효율적인 압축방법을 제안한다. 제안한 알고리즘은 웨이브릿 변환영역에서 동영상 압축에 사용되는 움직임 보상 부호화와 프랙탈 부호화를 이용한다. 제안한 방법에서는 먼저 영상을 웨이브릿 변환한 후, 공간영역에서 같은 위치에 있는 웨이브릿 계수들을 모아서 일정한 크기를 갖는 웨이브릿 블록으로 재배열한다. 배열된 웨이브릿 블록에 대해 움직임 추정을 하고 블록간의 상관성이 크다고 판단되는 블록에 대해서는 움직임 추정 정보만 이용한다. 그러나 상관성이 작다고 판단되는 블록의 경우에는 최상위 계층의 저주파 부대역에 대해서만 움직임 추정을 하고 나머지 대역에 대해서는 프랙탈 부호화를 실행한다. 그리고 움직임 벡터와 프랙탈 부호화에 의해 복원된 슬라이스와 현재 슬라이스의 차인 오차 영상은 SPIHT로 부호화한다. 제안한 방법을 낮은 비트율에서 실험한 결과, 2차원 SPIHT에 비해 향상된 PSNR을 나타낼 뿐만 아니라 블러링이 줄어들어 객관적, 주관적 화질에서 우수하게 나타난다.
-
본 논문에서는 이동 통신에서 사용될 저 복잡도를 갖는 이진 영상 압축 알고리즘을 제안한다. 기존의 이진영상의 부호화에 사용되는 알고리즘에는 JBIG, G.4등과 같은 방식이 있으나, JBIG의 경우 산술 부호화로 인한 높은 복잡도를 필요로 하고, G.4의 경우 일반 A4 문서를 대상으로 하고 있어 이러한 알고리즘을 이동 통신에서 사용하기에는 부적합하다. 따라서 본 논문에서는 단순한 이진 영상에 대해서 낮은 복잡도를 가지며 기존의 부호화 방식들 보다 좋은 성능을 얻을 수 있는 효과적인 압축 방법을 제시한다.
-
RGB 컬러 좌표계상에서는 각 컬러 성분간의 상관도가 매우 높고, 색을 표현할 때 R, G, B 각 성분에 똑같은 대역폭을 주기 때문에 영상의 압축 관점에서 효율적이지 못하다. 대표적인 영상압축 알고리즘인 MPEG-1,MPEG-2, MPEG-4, H.263, JPEG, JPEG-2000등에서는 압축 효율을 높이기 위해서 YCbCr 컬러 좌표계를 사용하고 있다. 본 논문에서는 좀 더 효율적인 영상 압축을 위해서 새로운 컬러 좌표계를 제안하고자 한다. 제안하는 컬러 좌표계는 DCT 커널에 기반을 두고 있다. DCT 컬러 좌표계는 각각의 커널끼리 직교하며, 빠른 연산이 가능하고, 구조가 간단하다. 실험결과, DCT 컬러 좌표계의 신호들의 분산이 YCbCr 컬러 좌표계의 신호들의 분산보다 작은 경향을 보이며, 동일한 비트율에서 작은 MSE (Mean Square Error)를 가지는 것을 실험적으로 알 수 있다.
-
워터마크의 실현방법은 크게 두 가지로 나누어지는데, 하나는 공간영역에서 처리방법이고 다른 하나는 주파수영역에서 처리방법이다. 초기에는 공간영역에서 처리가 많이 연구되었으나 공간영역에서의 워터마크 삽입방법은 주로 least significant bit(LSB)을 조작하기 때문에 주파수영역의 방법보다 각종 신호처리에 의해 워터마크가 쉽게 없어지는 단점이 생긴다. 따라서 현재는 그런 단점들을 잘 극복할 수 있는 방법으로 주파수 영역에서의 워터마크 삽입 방법이 많이 쓰인다. 본 논문에서는 디지털 영상을 위한 다해상도 이산 웨이브렛 변환을 사용한 워터마킹 방법을 제안하였다.
-
In this paper, we focus on digital watermarking for color images. At first, in order to embed the watermark signal in color image, we converted RGB color space to YCbCr color space which is a world-wide digital component video standard. In addition, we adopted the acceptable degree of color difference in order to keep the invisibility.
-
일반적인 LCD의 색 재현 특성은 입력 디지털 값이 낮을수록 gray scale의 상관색온도가 상승하여 정확한 색 재현이 불가능하다. 본 논문에서는 LCD의 입력 디지털 값의 변화에 따른 특성을 조사하고, luminance, contrast 비 등의 특성에 열화없이 gray scale의 입력 잘 변화에 따른 상관색온도의 변화를 보정하기 위해서 입력 디지털 값을 조정하는 새로운 LUT를 제안하였다.
-
본 논문에서는 인터 프레임(P-프레임) 압축으로 인해 발생되는 블록화 현상을 모델링 하고 기존에 정의된 제한요소를 효율적으로(reasonable) 축소하고 축소된 제한요소를 이용한 후처리를 통해 블록경계는 물론 블록 내부의 불연속을 효율적으로 제거하는 방법을 제안한다. 다음 프레임의 예측영상을 블록화가 제거된 영상을 사용함으로써 프레임간 영상 스트림에서도 주관적으로나 객관적으로나 현저하게 블록화가 제거된 영상을 얻을 수 있다. 제안된 알고리즘은 HDTV나 영상통신과 같은 영상 스트림의 후처리 과정에 적합하다.
-
본 논문에서는 프레임간 압축 영상의 열화 과정의 모델과, 동영상에 존재하는 블록화 현상을 제거하는 방법을 제안한다 BDCT기반으로 압축된 정지영상은 DCT계수를 양자화 하는 과정이 블록별로 처리되기 때문에, 블록 경계에 불연속이 발생한다. 동영상의 경우 블록 경계에서 불연속이 발생 할 뿐만 아니라 움직임 보상과정이 합쳐진 혼성 구조로 되어 있어서 블록 내부에서도 불연속이 존재하게 된다. 블록 영계만을 생각한 기존의 처리방법은 동영상의 처리에 있어 적합하지 못하다. 따라서 본 논문에서는 효율적인 블록화 현상 제거를 위해, 양방향 움직임 보상과 반화소 정밀도를 이용한 새로운 평활화 제약조건을 구성하고 차분 영역에서의 정규화 방법을 이용한 알고리듬을 제안한다.
-
H.263의 시험모델인 TMN5를 최대한 적용하여 실험하였으며 분산, 엔트로피, 움직임 크기 등의 퍼지변수를 데이터 영역에서 추출하여 퍼지화하였다. 소속함수를 계산하기 위해 최소값으로 가장 분명한 퍼지값을 추출하였으며 퍼지집합을 위해서는 각 소속함수로부터의 요소를 더하는 의미에서 최대값을 선택하였다. 무게중심기법을 이용하여 최종 퍼지감도를 구하여 TMN5에 부가하였다.
-
This paper presents fingerprint authentication method based on minutiae quadrangle definded by neighboring two Delaunay triangles. In this method, we first make minutiae triangle through Delaunay triangulation which adaptively connect neighboring minutiae according to the local minutiae density distribution, and then use feature vectors in authentication which is extracted from the minutiae quadrangle formed by neighboring two minutiae triangles. This prevents the degradation of matching ratio caused by the errors in image processing or local deformation of the fingerprint, and we can authenticate more discriminately as this method reflects wider local area's topological features than the features extracted from the individual minutiae triangles. To evaluate the proposed algorithm's performance, experiment are conducted on 120 fingerprints, of which size is 256
${\times}$ 364 with 500dpi resolution. Robust authentications are possible with low FRR. -
본 논문에서는 영상검색 기법에서 핵심인 Shot Change Detection 과 Non Linear Browsing 을 H/W기반으로 구현하여, S/W 적으로는 비실시간으로만 가능하였던 video indexing 을 DTV 에 적용하여 실시간으로 구현하는 방법을 제시한다. 이를 위해 H/W part 는 실시간으로 들어오는 방송용 MPEG-2 bitstream 을 full decoding 이 아닌 최소화된 VLD(Variable Length Decoding) 수준의 parsing 으로 picture 내의 luminance와 chrominance 의 DC 값, macroblock type, motion vector 정보를 얻어내어 각각의 histogram을 계산하여 memory interface를 통해 S/W 측에 넘겨주게 되고 S/W 는 각 상황에 맞게 indexing algorithm 을 변화시키며 최적의 video indexing 방법으로 확장할 수 있도록 하였다.
-
대용량 비디오 데이터의 이용에 있어 효과적인 비디오 검색을 위해서는 비디오 데이터의 색인 과정이 필요하다. 효과적인 비디오 데이터의 색인을 위해서는 의미적 단위인 씬(Scene)으로 이루어진 비디오 데이터를 물리적인 경계면인 컷(장면전환점)으로 검출하는 기법이 필수적이며 각 샷에서의 키 프레임 추출 또한 필수적이다. 본 논문에서는 뉴스 비디오데이터의 키 프레임인 앵커 프레임의 효과적인 검색을 위해 DC 성분 추출과 이진 검색기법, 그리고 컬러 클러스터링을 이용하고 있다. 본 논문에서 제하고 있는 방법을 검증하기 위해서 47분 10초 분량의 MPEG-2 로 압축된 뉴스 비디오 데이터에 적용한 결과 91.3%의 정확도와 84.0%의 재현율을 보여 제안한 방법의 우수성을 증명하고 있다.
-
멀티미디어 데이터베이스에서 장면전환 영역을 검출하는 것은 검색과 색인을 위해서 필수적이다. 동영상에서 장면전환 영역은 단순한 장면전환과 점진적인 장면전환으로 나눌 수 있다. 단순한 장면전환은 다음 장면과 구별이 쉬우나, 점진적인 장면전환은 그 구별이 쉽지 않다. 본 논문에서는 압축된 동영상에서 점진적인 장면전환 영역을 검출하는 효과적인 방법을 제시한다. 제안된 알고리즘은 MPEG-1으로 압축된 동영상에서 DC계수를 추출하고, 부호화된 휘도 블럭의 개수를 추출하여 점진적 장면전환 영역을 검출한다. 제안된 알고리즘의 성능은 장면이 점진적으로 바뀌는 영역을 찾아내는 정확도를 기반으로 분석하였다.
-
모뎀이나 통신장비는 선로잡음이나 기타 노이즈의 영향을 고려하여 시스템을 측정하고 평가해야 한다. 그러나 실제의 노이즈환경을 구현하고 측정하기란 매우 어렵고, 비용 또한 무시할 수 없기 때문에 잡음이나 노이즈를 인위적으로 발생시켜 시스템을 측정하게 된다 그러나 시스템이 고속으로 동작하고 스펙이 복잡하면 잡음을 원하는 스펙에 만족하도륵 구현하기가 어렵다. 본 논문에서는 DCT를 이용한 필터계수 생성과, 의사잡음(Pseudo Noise)을 이용한 잡음발생 알고리즘을 제안하며 시스템의 속도와 사용 주파수에 관계없이 스펙을 만족하는 잡음발생 장치를 제안한다.
-
본 논문에서는 고밀도 DVD(Digital Versatile Disc) 시스템(4.7GB~l5GB)을 위한 신호 검출기법을 제안하고 FPGA로 구현한다. 본 논문에서 제안하는 FDTrS/DF (Fixed Delay Trellis Search with Decision Feedback)는 트렐리스 구조를 사용하므로 FDTS/DF나 SSD/DF(Signal Space Detection with Decision Feedback)와 같이 이진 가지 구조를 사용하는 신호검출방식에 비해 더 나은 성능을 얻을 수 있다. 또한 FDTrS/DF는 한 단의 트렐리스 구조를 사용해 역추적을 하지 않으므로 하드웨어의 복잡도와 속도면에서 향상된 결과를 얻을 수 있다. 또한 본 논문에서는 하드웨어 구현 시 동작 속도의 향상을 위해 파이프라인 기법과, 계산량 감소를 위해 절대값 분기거리를 사용한다.
-
본 논문은 복잡한 배경을 가지고 있는 영상에서 우리가 원하는 손의 움직임의 일부인 가위, 바위, 보를 인식함으로써 좀 더 자연스러운 인간과 컴퓨터의 상호작용(HCI, Human and Computer Interface)을 이루고자 하였다. 정규화된 RGB 색상 공간에서 정의한 피부색의 가우시안 분포를 이용하여 조명의 변화나 개인의 차이에도 효과적이고 안정적으로 손 영역을 찾아내고자 하였으며, 추출된 손 영역은 RBF 신경망을 이용하여 가위, 바위, 보로 인식되도록 하고, 다양한 pattern에 대응하는 효율적인 training방법을 사용하였다.
-
본 논문에서는 EVRC 음성 부호화 시스템을 OakDSPCore(R) 를 기반으로 설계된 C&S Technology사의 CSD17C00칩을 이용하여 전 과정을 어셈블리어로 실시간 구현하였다. 구현된 EVRC음성 부호화기는 최대의 계산량이 요구되는8kbps 전송 모드일 때, 인코더부분이 최대24.45MIPS 이며 디코더부분은 3.35MIPS의 복잡도를 나타낸다. 사용된 메모리양은 프로그램 ROM 12.2Kworsd, 데이터 ROM(table) 6.72Kwords 및 RAM2.94Kwords 이다. 구현된 EVRC음성 부호화기는 북미 표준화 기구인Telecommunications Industry Association(TIA)에서 제공하는 19개의 test 벡터들을 모두 통과하였다.
-
본 논문에서는 AMR(Adaptive Multi-Rate)를 이용하여 광대역 음성부호화기를 설계하였다. 16kHz로 샘플링 된 입력 신호를 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 decimation하여 두 개의 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)과 ATC(Adaptive Transform Coding)을 사용하여 각각 부호화되어 전송된다. 두 대역으로부터 부호화된 정보는 20.2kbps에서 12.75kbps까지의 전송률을 갖고, 수신단에서는 각 대역을 AMR과ATC방법으로 역부호화하여 음성신호를 합성한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위해 ITU-T의 표준안인 G.722를 포함하여 MOS 시험을 하였다.
-
멀티미디어 정보의 보다 효율적인 검색을 위해서는 비디오 요약정보의 생성 및 색인 작업이 필요하며, 이러한 요약정보를 만들기 위해서는 많은 시간과 비용이 소요된다. 스포츠 비디오 프로그램의 요약정보를 만들 때 오디오 신호를 이용하여 주요 장면을 검출할 경우 이러한 시간과 비용을 줄일 수 있다. 본 연구에서는 축구경기 비디오에서 주요장면을 나타내는 핵심 사운드로 주심의 호르라기 소리 및 아나운서의 "슛" 음성을 정의하고 이를 오디오 신호에서 검출하는 방법에 대해 연구하였다.
-
본 논문에서는 해저 고정형 선배열센서를 이용하여 다중경로 신호를 이용한 근거리표적의 위치 추정 알고리즘을 제안하였다. 다중경로를 통하여 근거리 표적의 신호가 센서에 도달하는 경우 각 신호의 원추각이 다르므로 신호들의 원추각과 시간차를 추정해서 3차원 표적의 위치를 추정할 수 있다. 원거리표적으로 가정하고 추정한 원추각과 신호들의 시간차에 대한 관계식을 유도하였으며 이들을 연립하여 표적의 위치를 추정하였다. 그러나 표적이 위치한 기하학적인 위치에 따라 신호들의 원추각이 거의 같아지는 지점이 존재한다. 이 경우 부가적인 1차원 탐색으로 표적의 위치를 추정하였다.
-
본 논문에서는 고음질 오디오 신호에 임의로 삽입된 반향(Echo)신호가 음질에 미치는 영향을 조사하고, 이를 이용한 오디오 워터마킹 기법에 대해 다룬다. 일반적으로 오디오 신호에 반향을 첨가하게 되면 음색이 더욱 풍부해지는 효과를 얻을 수 있지만. 이 때 삽입된 반향신호의 시간 지연과 크기가 충분히 작을 경우에는 심리 음향모델의 시간영역 마스킹 효과에 의해 지각되지 않을 수도 있다 한편 오디오 신호의 구간별로 임의 삽입된 반향의 시간지연을 검출할 수 있다면, 이를 이용한 정보 감춤(data hiding)및 워터마킹 기법에 활용할 수 있다. 반향신호를 이용하여 원 신호에 정보를 삽입하게 되면 가우시안 잡음이나 PN 시퀸스를 이용하는 경우처럼 오디오 신호에 이질적인 잡음을 첨가하지 않기 때문에 청감 특성상 유리하며, 오디오 신호 고유의 통계적 특성을 유지 할수 있는 장점이 있다. 그러나 반향의 첨가가 음질의 왜곡은 초래하지 않으면서 정보의 검출이 가능하도록 하기위해서는 원 신호의 특성에 따른 반향 첨가 기술이 요구된다.
-
디지털 워터마킹은 오디오, 이미지, 영상과 같은 고품질 디지털 멀티미디어 컨텐츠의 불법적인 복제와 유통을 막고 저작권을 보호하기 위한 최후의 방어 수단으로 인식되고 있는 신호처리 기술이다. 오디오 신호에 삽입되는 워터마크 신호는 들리지 않아야 하는 특성과 함께, 압축이나 필터링과 같은 신호처리 과정 후에도 추출이 가능한 강인성을 지녀야 한다 본 연구에서는 현재 제안되고 있는 여러가지 오디오 워터마킹 방법 중에서 대역확산을 기반으로 한 PN 시퀸스 오디오 워터마킹 시스템에 대해서 다루었다. 삽입된 워터마크 신호가 들리지 않도록 하기 위해 인간의 청각 시스템에 기반한 심리음향모델을 적용하였으며, 효율적인 검출과 청각상의 특성을 고려한 여러 가지 실험을 수행하였다. 워터마크 정보의 검출에 있어서는 원 신호가 필요하지 않은Blind Detection 방법을 제안하여 효율적인 워터마킹 시스템을 구현할 수 있도록 하였다.
-
2채널의 MPEG-2 Layer-Ⅲ 오디오 복호화 알고리듬이 16비트의 고정소수점 연산기로도 고음질의 오디오출력을 얻을 수 있도록 최적화를 수행하였다. 고음질을 얻기 위하여 고정소수점 연산기에서 발생하는 양자화 오차를 최소화 하였으며 각 복호화 과정 별로 최소의 오차를 발생시키는 알고리듬을 제안하고 사용하였다. 고정소수점 모의실험은 C-언어를 사용하여 수행되었으며, ISO-IEC 13818-4 Compliance Test를 수행하여 최적화된 복호화기가 ISO/IEC 13818-4 audio decoder의 기준을 만족함을 보였다.
-
능동 소오나 시스템에서는 잔향음 제한 환경에서 표적 검출을 하기가 용이하지 못하다. 본 논문에서는 고정된 노치 필터로 제거할 수 없는 시 불변성의 잔향음을 효과적으로 제거할 수 있는 방법을 제안하였다. 제안된 알고리즘은 기존의 적응형 잡음 제거기가 갖고 있는 단점을 보완하기 위하여, Gram-Schmidt 직교화과정을 전처리 기법으로 사용하였다. 아울러, 제안된 잔향음 기법을 동해에서 실측한 자료에 적용함으로써 그 성능을 검증하였다.
-
본 논문에서는 웨이브렛 변환을 적용한 광대역 음성부호화 알고리즘을 제안하였다. 제안한 음성부호화 알고리즘은 split-band 구조를 가지며, 16 kHz로 sampling된 입력신호를 QMF를 이용해서 동일한 대역폭을 갖는 두 개의 subband 신호로 나누고 이를 8kHz의 sampling율을 갖도록 downsampling 한다. 그리고 저대역 신호는 GSM-EFR 음성부호화 알고리즘을 이용하여 부호화하고, 고대역 신호는 DWT(Discrete Wavelet Transform)을 적용하여 subband로 나누어 부호화하였다. 각 subband에서 양자화 된 파라미터는 IDWT(Inverse DWT)과정을 거쳐서 upsampling되고 합성 QMF를 통과시켜 최종 합성음을 구하였다. 제안한 음성부호화기는 저대역 신호의 GSM-EFR 부호화에 12.2 kbps, 웨이브렛 변환을 이용한 고대역 신호의 부호화에 7.8 kbps로 전체 20 kbps의 전송율을 가지면서 G.722 표준안의 56 kbps에서의 합성음과 비슷한 음질을 나타내었다.
-
This paper introduces a new type of representation of the LSPs as a promising alternative used for transmitting the LPC parameters. Major contribution in this paper is that the vocal track information embedded on the spectral envelope can be represented in terms of the reduced number of LSF compared tn the conventional. Hence, it provides a possibility that LPC parameters could be quantized at a reduced bit rate without causing any major spectral distortion. The simulation result illustrates the capability of the proposed LSPs representation as an efficient quantization method via a proper rejection of the redundant pairs of pole and zero along the unit circle.
-
본 논문에서는 TMS320C549 를 사용하여 4 채널 G.729A 음성 부호화기를 실시간 구현하였으며, 실제로 음성 사서함 서비스 시스템에 응용하였다. 구현된 G.729A 는 패널 당 부호화기와 복호화기에 각각 14.5MIPS 와 3.6 MIPS 를 소요하였으며, 메모리는 코드와 데이터 부분에 각각 9.88K 워드, 1.69 K 워드를 필요로 하였다. 결과적으로 개발된 VMS 시스템에는 두 개의 DSP 를 사용하여 DSP 당 4 채널씩 총 8 채널을 수용하였다. 실험 결과, ITU-T에서 제공된 모든 테스트 벡터 결과와 비트 단위로 동일하였다.
-
연속음 인식과 음성 합성을 위해서는 정밀한 음성학적 모델과 연속 음성에 적용 가능한 언어 모델의 개발이 중요하다. 이를 위해서는 음성 데이터 베이스에 대한 인식 단위, 혹은 합성 단위의 분할이 필요한데, 수동음성 분할은 일관성의 유지가 어렵고 긴 시간이 소요되므로 최근에는 자동 분할 기술이 많이 연구되고 있다. 자동 음성 분할 기법으로는 시간 영역이나 주파수 영역특징 벡터의 천이를 분석하는 방법과 특징 벡터간의 상관도를 구하여 경계를 추출하는 방법이 있다. LPC smoothed log amplitude spectra는 음성의 주파수 영역의 특징을 잘 나타내며, 동일 음소 내의 상관도가 서로 다른 음소의 상관도보다 더 크고, 음소의 경계구간에서 급격한 상관도의 변화를 보인다. 이 특성을 이용하여 이웃 프레임에 대한 상관도의 방향성이 특정조건을 만족하는가를 검사하여 음소의 경계를 구하는 방법을 찾았다. 또한 LPC. 이득 인자만으로 묵음 구간을 검출하는 방법을 제시한다. 이렇게 하면 묵음 구간검출과 음소 경계 검출의 일관성을 향상시키고 수행 시간을 단축시킬 수 있다. 제안한 기법으로 허용 오차 20ms 이내에서 연속음성에 대한 음소 경계 검출 실험을 수행한 결과, 수작업으로 행한 경계 검출 지점의 약 88%를 정확히 검출하였다.
-
음성신호처리 분야에서 음성신호의 기본 주파수를 정확히 검출 할 수 있다면 음성인식을 할 때 화자에 따른 영향을 줄일 수 있으므로 인식의 정확도를 높일 수 있고, 음성합성을 할 때 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석을 할 때 피치에 동기시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 위와 같은 피치검출의 중요성 때문에 피치검출에 대하여 다양한 방법 이 제안되었다〔1〕. 본 논문에서는 음성신호의 분석 시 불안정한 구간에 대해 피치 시점을 검출하는 방법을 연구하였다. 음성신호의 분석에 있어서 기존의 자기상관함수법(Autocorrelation Function)은 주기성을 강조할 수 있다는 장점을 가지고 있다. 그러나 자기상관함수는 위상성분을 보존하지 못한다는 단점을 가지고 있다. 따라서, 자기상관함수를 사용하면서 위상성분을 보존할 수 있는 알고리즘을 제안하고자 한다. 실험결과 피치시점을 수동으로 찾은 경우와 비교하였을 때 약 98% 정도의 정확도를 얻을 수 있었다. 위의 결과와 같이 위상 성분이 보존된 자기상관함수를 사용할 경우 음성합성, 코딩, 인식에서 유용하게 쓰일 수 있다.
-
상용 가능한 대규모 음성인식 시스템의 개발을 위해서는 음성 데이터베이스 구축이 중요한 과제의 하나로써, 많은 시간과 노력이 요구되며 특히 세그멘테이션과 라벨링은 그 노력의 상당부분이 된다. 본 논문은 ARS 주식 거래 시스템에서 사용되는 대용량 음성 DB의 효과적 구축을 위해 세그멘테이션 및 라벨링의 자동화에 대한 연구를 하였다. 본 연구를 위해 20대 성인 남녀를 대상으로 증권거래와 관련한 15개의 문장을 발성하도록 하였으며 Dialogic사의 D/41ESC보드를 장착하고, Window NT4.0 플렛폼에서 음성을 수집하였다. 또한 자동 Segmentation과 labeling은 Aligner를 사용하였으며 수동과 비교하기 위해 CSLU speech Tool Kit을 사용하였고 수작업은 숙련도가 있는 전문가가 하도록 하였다.
-
입체음향 시스템에서 모노음에 방향감을 제어하기 위한 방법으로 FIR 필터 형태의 머리전달함수( HRTF : Head-Related Transfer Function)를 사용한다. 그러나 이때 사용되는 FIR형태의 머리전달함수는 높은 차수를 가지고 있어 실시간 음상정위 처리가 어려운 문제점을 가지고 있다. 본 논문에서는 FIR 형태의 머리전달함수를 ARMA 시스템 인지기법을 이용하여 저차의 IIR필터 형태로 모델링하여 실시간 데이터 처리가 가능하도록 하였다. 본 논문에서 제안하는 ARMA 시스템 인지기법을 이용하게 되면 주어진 고차의 FIR형태의 머리전달함수를 다양한 안정성을 갖는 IIR모델들을 얻을 수 있으며, 이들 중 적절한 스펙트럼오차를 갖는 저차의 IIR모델을 선택 할 수 있다.
-
본 논문에서는 AMR 음성 부호화 알고리즘을 분석하고 C프로그램 최적화 과정을 거친후 OakDSPCore?를 기반으로 설계된 C&S Technology사의 CSD17C00A칩을 이용하여 전과정을 어셈블리어로 실시간 구현 하였다. 구현된 코덱은 최대의 계산량을 요구하는 6.7kbps 모드일때, 인코더부분이 최대 20.6MIPS 이며 디코더부분은 약 2.7MIPS 의 복잡도를 나타낸다. 사용된 프로그램 메모리는 약 21.97kwords, 데이터 RAM 메모리는 약 6.64kwords를 가지며 데이터 ROM 메모리는 약 15.1kwords 이다. 구현된 코덱은 최대 약23.29MIPS의 복잡도를 가지고 있으므로 40MIPS의 처리용량을 가지는 CSD17C00A 를 이용한 보드상에서 실시간 동작이 가능함을 확인하였다. 구현된 프로그램은 3GPP에서 제공하는 21개의 test 벡터들을 통하여 bit-exact 함을 확인하였다.
-
본 논문에서는 감정 표현 음성 합성 시스템을 구현하기 위해서, 감정 음성 데이터베이스의 음향학적 특징인 피치, 에너지, 지속시간, 스펙트럼 포락에 대해 분석한 결과와 문법적 요소인 품사에 따른 감정 음성 데이터의 피치 변화를 분석하였다. 분석 결과, 기본 주파수, 에너지, 지속시간, 스펙트럼 포락은 감정 표현에 중요한 영향을 미치는 것으로 나타났으며, 전반적으로 화남과 기쁨의 감정이 평상과 슬픔의 감정 보다 피치 및 에너지의 변화가 크게 나타났으며, 특히 기쁜 감정의 경우 부사, 관형사, 연결어미, 조사, 접미사에서 피치 변화가 많았으며, 화난 감정의 경우, 관형사, 명사, 용언, 접미사에서 피치 변화가 높게 나타났다. 이러한 분석 결과를 적용해 감정 음성을 합성하기 위하여, 평상 음성에 각 감정 음성의 운율 요소를 적용하여 감정 음성을 합성하여 평가한 결과, 기쁜 감정은 기본 주파수의 변화에 의해 86.7%, 화난 감정은 에너지의 변화에 의해 91%, 슬픈 감정은 음절지속시간의 변화에 의해 76.7%가 각각 올바른 감정으로 인지되었다.
-
최근 유아기 아이들을 위한 교육매체의 발달로 각종 CD-ROM이나 테이프 등에서 성우의 목소리로 동화를 읽어주는 시스템이 많이 나와 있고, 또한 Web Book이 점차적으로 보편화가 되 가고 있다. 하지만 이런 획일적이고 균일화된 매체들은 아이들에게 금새 실증을 내게 하기 때문에 흥미 유발을 위해 동화의 주인공을 자기자신이나 친근한 사람의 이름 등으로 바꾸어 발성해 준다면 더욱 친근감 있게 받아들일 것이다. 본 논문에서는 기존의 성우가 발성하는 동화의 주인공 이름을 Test화자가 새로운 이름으로 발성을 해주면 기존 성우의 목소리패턴으로 바꾸어 동화를 읽어주는 시스템에 대해서 제안하고자 한다. 우선 Test화자가 발성한 목소리를 성우의 목소리로 바꾸어 주기 위해서 기존의 성우가 발성한 동화주인공 이름과 Test화자가 발성한 이름과의 운율패턴을 비교하여 성우의 운율패턴에 일치시키고 성우의 목소리 패턴으로 변경된 새로운 주인공의 이름만을 기존의 동화 DB에 삽입하였다. 또한 에너지 패턴조절은 기존의 성우가 발성한 기준패턴에 근사화 시켰고 끝점을 스므딩 시킴으로써 자연스런 발성이 되게 만들어주었다. 결과적으로 Mos Score가 3.873로 비교적 좋은 결과를 얻을 수 있었다.
-
유/무선 통신 시스템에서는 통신망마다 각각 다른 음성 부호화기를 사용하므로 음성신호는 두 번의 부/복호화 과정을 거치게 된다. 이로 인해 음질저하, 계산량 증가, 그리고 전달 지연 증가 등의 문제가 발생된다. 본 논문에서는 위의 문제점들을 개선하기 위하여 패킷 음성통신과 무선 이동 통신에 사용되는 음성 부호화기의 상호부호화를 위한 알고리듬을 제안한다 효율적인 음성 패킷 변환 방법을 제안하였으며, 8 kbps G.729A 패킷을 5.3 kbps G.723.1 패킷으로 변환하는 방법을 제안한다. 제안된 음성 패킷 변환 방법은 LSP 변환과정, 적응코드북 변환과정 그리고 고정 코드북 고속 탐색 과정으로 구성된다. 여러 가지 음성 신호로 모의 실험한 결과, 본 논문에서 제안된 상호부호화 알고리듬이 두 번의 부/복호화 과정을 거친 경우보다 짧은 전달 지연 시간과 적은 계산량으로 동등한 음질의 음성신호로 복호화함을 확인하였다.
-
본 논문에서는 ETSI와 3GPP에서 차세대 이동통신 IMT-2000 서비스의 음성부호화기의 표준안으로 채택한 AMR(Adaptive Multi-Rate)에 대해 알고리즘을 분석하고 Texas Instrument 사에서 제공한 C 컴파일러와 어셈블리 언어를 이용하여 최적화 과정을 수행하였다. 인코더 약 28.2MIPS, 디코더 5.5MIPS로 40MIPS의 사양을 가지는 TMS320C542 보드의 82%를 사용하여 실시간 구현을 하였다. 또한 DSP보드상에서 구현한 결과가 ETSI에서 제공한 ANSI C 소스 프로그램의 결과와 일치됨을 확인하였으며, 마이크 입력과 증폭기를 이용한 스피커 출력의 시스템을 구성하여 지연과 왜곡이 없음을 확인하였다.
-
본 논문은 주파수 전이신호와 시간 전이 신호에 대해서 고조파 잡음 여기 방법과 시간 분리 여기 방법을 적용한 2.4kbps 음성부호화 방법을 제안한다. 혼합 여기 부호화 방법은 주기 신호와 비 주기 신호를 효과적으로 표현하기 위해 하모닉 잡음 모델을 사용한다. 혼합신호에 대한 잡음 성분은 캡스트럴 분석 방법을 사용함으로써 추출되고, AR(Autoregressive Model) 모델에 의해 표현된다. 시간 전이구간 신호에서의 모호한 음성을 효과적으로 제거하기 위한 또 다른 방법이 제안된다. 제안된 시간 분리 방법은 시간 에너지 변화정도를 관찰함으로써 전이 시점을 감지하고 다른 시간 길이를 가지는 두 블록으로 분리하여 분석한다. 시간 분리 방법은 분석을 위한 비대칭 윈도우와 합성에서의 위상 합성 방법을 포함한다. 제안된 방법을 사용한 2.4kbps 음성부호화 방법은 주관적 음질 평가에서 전이구간에서의 지각적 음질의 향상을 보여주었으며, 원본 음성 스펙트럼과의 고조파 비 매칭에 의한 윙윙거리는 기계적인 잡음을 감소시킨다.
-
동영상에서 움직이는 객체 분할 및 모션 예측을 동시에 수행할 수 있는 연구는 다양한 방법으로 시도 되어 왔다. 실제 이미지를 서로 다른 움직임이나 서로 다른 공간적인 특정 영역으로 분리 될 수 있다고 가정 한다면 복수의 객체 또는 객체의 움직임으로 표현 할 수 있다. 객체 분할 측면에서 볼 때 효율적인 분할을 위해서는 특징 입력 벡터의 선택이 중요한 변수로 작용한다. 본 연구에서는 정밀한 객체 분할을 위해 밝기, 질감(Texture) 정보와 같은 정지영상의 특징 입력 벡터와 움직임 벡터 같은 동영상의 특징 입력 벡터를 동시에 사용한다. 분리된 객체는 각각의 클래스를 구성하게 되고 이를 위한 클래스 분류기로서 Median Radial Basis 신경 회로망을 사용한다. 객체 분할과 움직임 예측을 위해서 확률적 방법을 통한 에너지 함수를 구하고 비용함수를 도입한다. 신경 회로망의 각 Basis 함수는 영상의 특정한 영역에서 활성화되며 객체의 분류를 위해 신경 회로망 출력으로 가중치의 합으로서 나타나게 된다.
-
이동 통신 채널과 같이 에러 발생율이 높은 환경에서 부호화된 비디오 스트림을 전송시 발생된 에러는 비디오 화질에 큰 영향을 줄 수 있다. 본 논문에서는 현재 널리 사용되고 있는 H.263의 복호화기에서 전송도중 에러가 발생했을 경우 추가적인 데이터 스트림의 삽입 없이 효율적으로 에러를 은닉할 수 있는 기법에 관하여 연구하였다. 특히 인터프레임 영상에서 손상되거나 손실된 움직임벡터에 대해 시간영역에서 관계가 깊은 이전 프레임에서 손실블록과 같은 위치에 있는 블록의 움직임벡터와 현재 프레임에서 손실블록과 인접한 블록들의 움직임벡터 정보를 이용하여 이 블록들의 움직임 방향을 구하게된다. 이러한 블록의 움직임 방향을 이용하여 동일한 움직임 방향을 갖는 영역을 찾아 손실 블록이 어떤 움직임 영역에 속하는 지를 판단하여 손실된 움직임 벡터를 복원하는 방법을 제안한다.
-
운동(motion) 벡터는 보고 있는 카메라와 관측되는 대상물 사이의 상대적인 움직임에 의해서 발생되는 3차원 물체의 속도가 2차원 영상에 투사되어 맺히는 영상에서의 2차원 속도 벡터를 가리킨다 영상에서 물체의 움직임은 3차원 공간상의 운동을 알 수 있는 중요한 정보로써 물체를 추적하는데 응용되고 있다. 본 논문에서는 여러 장의 연속적인 2차원 밝기 영상으로부터 카메라의 움직임을 추정하는 문제를 다룬다. 기존의 특징 기반 추적 기법에서는 저 단계의 영상 처리 과정에서 모델과 배경의 특징점이 서로 분리되지 않거나, 모델의 특징(feature)이 소실되었을 경우, 추적이 용이하지 못하고, 카메라와 3차원 물체의 병진과 회전 운동에 의해 발생된 움직임의 경우 3차원 표적 특징이 많이 사라져서 오차가 많이 누적되기도 한다. 본 논문에서는 이러한 문제를 해결하기 위하여 목표물 및 배경 특징들을 사용하여 카메라의 운동 정보를 찾아내는 기법을 제안한다. 제안하는 3차원 카메라의 운동 정보 추정 기법은 크게 두 장의 연속된 영상으로부터 3차원 모델과 배경의 많은 특징들에 대한 광류(optical flow) 검색 과정과, 이로부터 취득한 움직임 벡터와 카메라의 비선형 운동 방정식과 Lagrange multiplier를 통한 카메라의 운동 정보 추정 과정으로 구성된다.
-
본 논문은 배경이 고정되지 않은 복잡한 동영상에서의 물체 추적을 위하여 다중 모델 색상 히스토그램 역투영(Multi Model Color Histogram Back-projection)방법을 제안한다. 색상 히스토그램 역투영(Color Histogram Back-projection)을 이용하면 카메라의 움직임 때문에 발생하는 배경의 변화에 관계없이 물체를 추적할 수 있다. 기존의 방법은 추적하려는 물체에 대해 하나의 모델만을 적용했기 때문에, 배경영역 색분포의 영향을 많이 받는다. 이를 해결하기 위해 다중 모델 색상 히스토그램 역투영 방법을 이용하였다. 이 방법은 추적하려는 물체에 대해 여러 개의 모델을 구하여 각각에 대해 색상 히스토그램 역투영을 수행한다 또한 역투영 이진 영상에서 물체의 위치를 결정하기 위한 수평, 수직 프로젝션 방법의 문제점을 레이블링(Labeling)을 사용하여 보완하였다.
-
영상통신에 대한 관심이 다방면에서 증가되고 있고 동영상 압축에 있어서 복원 이미지 개선이나 압축 데이터의 감소에 대한 연구가 활발이 진행되고 있다. 본 논문에서는 움직임 예측 블록에 강한 직선 경계(edge)가 있는 경우 그 경계 주변에 원 이미지와 예측 이미지 간의 움직임 예측 오류가 많다는 점에 착안하여 움직임 예측블록을 개선 할 수 있는 알고리즘을 제안한다. 움직임예측 블록의 화소(pixel)값들을 이용해서 직선 경계의 각도와 움직임 예측 오류를 보상할 값을 구하고 경계위치에 보상함으로써 움직임 예측 오류 블록의 압축데이터가 감소된다. 기존의 동영상 압축 방법에 제안 방법을 첨가한 후 시뮬레이션 한 결과 동일한 PSNR에서 H.263+의 압축 데이터에 비해 평균 약 4% 개선된 압축데이터의 결과를 얻었다.
-
In this letter, The proposed algorithm has processed the motion estimation and compensation only in the region which has the motion. By considering the temporal redundancies between the successive frames, the bit cost for representing the motion are reduced efficiently. The performance of them proposed technique show the superior result to the existing methods' in terms of both PSNR and coding cost.
-
본 논문에서는 물체의 고유 칼라 정보 복원을 통하여 조명의 영향을 받지 않는 칼라 기반 얼굴검출 기법을 제안한다. 즉 주위 조명 영향으로부터 RGB 성분 계수를 파악하여 조명 성분에 영향을 받은 성분을 상쇄시키고, 색포화도와 밝기값 보상을 통해 고유 칼라를 복원(color recover)하는 실험을 하였고, 복원된 영상을 YCbCr 좌표계로 변환시킨 후, CbCr 각각에 대해 살색 성분이 나타내는 일정한 범위내의 부분을 검출하였다. 또한 이 진화 과정에서 생긴 잡음들을 형태학적인 모폴로지 필터를 통해 제거하였으며, 살색 후보 영역 중 같은 영역들은 레이블링하여 얼굴 후보 영역을 생성하였다. 그러나 칼라 정보만으로는 검출된 영역이 얼굴인지를 판단하기가 매우 어렵다. 그러므로 본 연구에서는 인간시각에 기반한 Gabor 필터를 사용하여, 검출된 살색 영역이 최종적으로 얼굴인지를 판별하는 효율적인 알고리즘을 제안한다.
-
본 논문에서 얼굴 검출의 목적은 화상회의나 현금 자동 인출기 같이 복잡한 배경에서 압축이나 인식, 인증 등의 처리를 위해서 한 사람의 얼굴을 검출하는 데에 있다. 본 논문에서는 이러한 얼굴 검출 방법으로 스테레오와 컬러 정보를 이용한 방법을 제안하고자 한다. 제안된 방법은 크게 두 단계로 나눌 수 있는데 첫 번째 단계는 스테레오 영상으로 두개 영상의 차영상을 구해 깊이 정보를 이용하여 얼굴의 영역이 될만한 후보를 추출한다. 두번째 단계로는 후보들중에 크기가 큰 영역의 중심점에 영역성장을 하여서 얼굴 영역을 추출한다. 제안한 알고리즘을 사용한 결과 얼굴의 회전 및 표정 변화 등에 관계없이 얼굴검출을 하였다.
-
본 논문에서는 K-L 변환을 기반으로 한 Fisherface 알고리즘과 Elastic Graph Matching 방법을 사용하여 보다 효율적인 얼굴 인식 방법을 제안하고자 한다. 즉, 얼굴의 모양 정보뿐만 아니라, 영상 픽셀의 그레이 정보를 동시에 이용할 수 있는 Elastic Graph Matching 방법과 통계학적으로 신호의 차원을 줄일 뿐만 아니라 주위 환경의 변화에 강인한 Fisherface 알고리즘을 효율적으로 결합하고자 한다 본 연구에서는 얼굴을 인식하는 데에 있어서 주로 문제가 되는 광원의 위치에 따른 조도의 변화, 얼굴 표정 변화, 안경 착용 여부 등을 고려한 Yale대학 데이터베이스에 대해 기존의 여러 얼굴 인식알고리즘을 실험 및 비교하였다. 또한, 이들을 효율적으로 결합할 수 있는 인식 알고리즘을 제안함으로써 인식률 및 속도 면에서 비교적 만족할 만한 결과를 얻을 수 있었다.
-
본 논문에서는 양방향 움직임 보상에 의한 필드 보간(bi-directional motion-compensated field interpolation) 방법을 사용한 효과적인 디인터레이싱(de-interlacing) 기법을 제안한다. 움직임 추정(motion estimation)을 이용한 일반적인 디인터레이싱 기법은 서로 다른 샘플링 격자(sampling grid) 관계인 연속한 두 필드(field)들간의 움직임 추정을 위해 line average 같은 비교적 간단한 형태의 디인터레이싱 기법이 선행된다. 그러나, 제안한 방법은 보간할 필드(the interpolated field)의 전후 필드들의 같은 샘플링 관계인 존재하는 스캔 라인(the existing scan line)들 사이에서만 움직임 추정이 이루어지므로 구현이 용이하다. 이때 구해진 움직임 벡터는 양방향 움직임 추정을 위한 초기 값으로 사용되어 진다. 제안한 알고리듬은 기존의 움직임 정보를 이용한 기법에 비해 구현이 용이하며, 카메라 움직임이 있는 panning, zooming 영상에 특히 효율적이다.
-
최근 인터넷은 WWW의 대중화에 힘입어 디지털 오디오. 비디오 데이터 전송에 대한 요구가 증가하고 있다. 본 논문에서는 QoS가 보장되지 않는 현재의 인터넷 인프라 환경하에서 클라이언트가 가진 대역폭을 최대한 활용하여 최선의 서비스를 제공할 수 있는 멀티 스트림을 이용한 새로운 비디오 스트림 방법을 제안한다. 제안한 방법은 사용자 측에서 멀티 스트림을 통해 동시에 클라이언트 측으로 전송함으로써 네트워크 트랙픽에 의해 발생하는 전송지연에 민감하지 않을 뿐만 아니라, 클라이언트 측의 대역폭을 최대한 이용할 수 있게되어 최선의 서비스를 제공할 수 있다.
-
MPEG-2는 영상회의에서 HDTV까지 광범위하게 활용되는 국제 동영상 부호화 표준이다. MPEG-2 표준에 맞게 압축된 신호는 유선 통신망이나 공중파를 통하여 전송이 되는데, 특히 공중파 전송과정에 많은 오류가 발생될 것으로 예상이 된다. 이로 인해 영상 출력에 전체적으로 영향을 주는 것, 부분적으로 영향을 주는 것과 아무런 영향을 미치지 않는 것들이 존재하게 된다. 전송 자료 중에서 헤더 정보는 영상의 출력에 심각한 영향을 주는 것이 대부분인데, 오류가 영상 화질에 어떠한 영향을 미치는 가에 대해서 연구가 부족하다. 본 논문에서는 비트스트림의 각 변수들에 발생한 오류가 영상 출력에 미치는 영향을 분석하고자 한다.
-
디지털 기술의 급속한 발전으로 디지털 방송을 위한 DTV가 곧 상용화 될 것으로 보인다. DTV는 단순한 TV수상기 기능 외에 여러 가지 응용 제품으로 발전할 수 있다는 장점이 있다. 그 응용 제품으로 현재 각 국에서 앞 다투어 개발중인 것에는 WEB TV 나 PVR 등을 들 수 있다. 본 논문은 대용량 하드디스크를 이용하여 HD 급 방송 스트림에서도 성능을 발휘하는 DTV의 PVR 기능 추가를 위한 Time-Shifter보드 설계에 관한 것이다. HD급 방송 스트림을 위한 PVR을 개발 할때의 문제점은 읽기와 쓰기가 동시에 발생할 때 최대 40Mbps에 달하는 데이터 엑세스 속도인데 본 논문에서는 현재 시판중인 하드디스크(HDD)를 이용하여 위 속도를 나타내기 위한 효율적인 DMA방식과 버퍼 제어 방법을 제시한다 더불어 저장되었던 스트림을 다시 재생 할 때 문제 될 수 있는 bit rate 제어는 time-stamp방식을 이용하여 해결하였으며 VCR에서의 트릭 모드 재생 기능을 위해 Index 추출 방식을 적용하였다.
-
본 논문에서는 효과적인 De-interlacing을 위한 Edge based Median Filter와 3-Step AMPD(Adaptive Minimum Pixel Difference Filter)를 제안한다. Motion Adaptive De-interlacing 방법에서 중요한 요소인 Motion Hissing에 의한 에러를 방지하기 위해 입력 영상을 4 가지 유형으로 구분하여 각 영상에 따라 다른 임계 값을 적용하여 정확한 화소 값을 보간 하는AMPD(Adaptive Minimum Pixel Difference) Filter를 사용하며 Moving Diagonal Edge의 효과적인 보간을 위해서 방향 필터를 사용하여 Edge Map을 추출한 뒤 Edge에 따라 가변적인 후보 화소를 선택하는 Edge based Median Filter를 사용하여 성능을 향상시켰다. 또한 입력되는 영상을 움직임 영역, 정지 영역, 경계 영역으로 나누어 적응적으로 보간 하여 연산 효율을 높였다. 제안된 방법은 다양한 영상에 대한 모의실험을 통해 기존의 방법에 비해 뛰어난 성능 개선을 보였다.
-
본 논문은 완전한 규격의 비디오 디코더를 구현하는 것이 아니라 하드웨어의 메모리를 절반으로 줄인 비디오 디코더에 관한 것이다. 우선 프레임 메모리를 수평 방향으로 1/2 만큼 축소시키는 방법을 제시하고, 다음으로 이렇게 축소되어 저장된 프레임 메모리를 움직임 보상을 하기 위해 다시 Interpolation하는 방법을 제시한다. 이 때 여러 방법의 모의 실험을 통해 추출된 영상의 특징들을 이용하여 메모리를 줄였을 때 나타나는 화질의 열화와 에러의 누적을 최소화하는 적응적인 알고리즘을 제시하고, 컴퓨터 모의 실험을 통해 기존에 사용하던 방법과 비교하여 제안된 알고리즘의 성능을 검증하고 결론을 맺는다.
-
본 논문에서는 종방향 충돌경보 및 회피시스템(FCWA ; forward collision warning and avoidance)의 일환으로 가변적인 경사도를 가지는 고속도로상의 차선, 차량, 그리고 도로의 곡률을 효과적으로 검출할 수 있는 알고리듬을 제안하였다. 먼저 2D 영상좌표계에 나타나는 투영효과를 제거하기 위한 역투영(IPM; inverse perspective mapping)기법을 소개하였다. 또한 IPM과 필터로부터 차선과 차량을 효과적으로 검출할 수 있는 알고리듬을 소개하였다. 마지막으로 경사가 있는 실제도로영상에 대한 IMP의 수정된 파라미터 보정에 대한 개념 및 실제도로의 곡률 검출을 위한 기하학적 함수 추정기법을 설명하였다 실험결과 제안한 알고리듬이 실제도로영상에서 차선, 차량, 그리고 곡률의 검출에 효과적임을 확인할 수 있었다.
-
A direct authentication from gray-scale image, instead of the conventional multi-step preprocessing, is proposed using Gabor filter-based features from the gray-scale fingerprint around core point. The core point is located as a reference point for the translation invariant matching. And its principal symmetry axis is detected for the rotation invariant matching from its neighboring region centered at the core point. And then fingerprint is divided into non-overlapping blocks with respect to the core point and features are directly extracted form the blocked gray level fingerprint using Gabor filter. The proposed fingerprint authentication is based on the Euclidean distance between the corresponding Gabor features of the input and the template fingerprints. Experiments are conducted on 300
${\times}$ 300 fingerprints obtained from a CMOS sensor with 500 dpi resolution, and the proposed method could lower the False Reject Rate(FRR) to 18.2% under False Acceptance Rate(FAR) of 0%. -
QPSK 복조기는 위상 오차에 따른 문제점을 극복하기 위해 수신단에서는 반송파의 주파수와 위상을 tracking 하는 Carrier recovery loop부분이 필요하다〔1〕. Carrier recovery loop는 multiplier, arm filter, matched filter, decimator, loop filter, NCO로 구성이 된다〔2〕.기존 Carrier recovery loop의 NCO는 sine과 cosine의 lookup table을 갖는 구조로 되어있어, 전력소모가 크다는 문제점을 가지고 있다. 따라서 본 논문에서는 lookup table을 사용하지 않는 저 전력 구조의 QPSK복조기의 Carrier recovery loop의 NCO를 설계했다.
-
본 논문에서는 배터리가 없는 ASK 전송방식의 RFID(Radio Frequency IDentification) Transponder 칩 설계에 관한 내용을 다룬다. Transponder IC는 power-generation 회로, clock-generation 회로, digital block, modulator, overoltge protection 회로로 구성된다. 설계된 칩은 저전력 회로를 적용하여 원거리 transponder칩을 구현할 수 있도록 하였다. 설계된 회로는 0.25㎛ 표준 CMOS 공정으로 레이아웃하여 제작하였다.
-
In this paper, we propose an efficient feature vector extraction and decision fusion methods for the automatic classification of power system disturbances. Here, FFT and WPT(wavelet packet transform) are und to extract an appropriate feature for classifying power quality disturbances with variable properties. In particular, the WPT can be utilized to develop an adaptable feature extraction algorithm using best basis selection. Furthermore. the extracted feature vectors are applied as input to the decision fusion system which combines the decisions of several classifiers having complementary performances, leading to improvement of the classification performance. Finally, the applicability of the proposed approach is demonstrated using some simulations results obtained by analyzing power quality disturbances data generated by using Matlab.
-
본 논문에서는 판단 보조 시스템으로써의 기능을 수행하는 Artificial Neural Network(ANN) 시스템의 응용과 설계를 수행하였다. ANN 시스템의 응용에 있어 실질적으로 활용이 가능한 미 경영대학원 진학 희망자들을 위한 학교 선별 시스템을 구현하였다. 미국 소재의 대부분의 경영대학원에서는 입학 지원자의 평가항목으로써 대학평점(GPA), TOEFL(Test Of English as Foreign Language), GMAT(Graduate Management Admission Test), Essay 그리고 실무 경력을 요구한다. 본 논문에서 소개하는 학교 선별 시스템에서는 이러한 평가 항목 중 객관적인 평가가 가능하고 수치화 할 수 있는 세가지 요소만을 고려했다. 즉, Essay와 실무 경력과 같은 평가항목은 각 학교별 다소 주관적인 평가가 이루어지기 때문에 배제하고 보다 객관적이라고 할 수 있는 GPA, TOEFL. GMAT 만을 평가 항목으로 고려했다. 일반적으로 경영대학원에서는 최소의 TOEFL 점수를 요구하고 있다는 점을 고려해 TOEFL 점수에 우선 순위를 두고 각 학교를 크게 4개의 그룹으로 나누어 4개의 각기 다른 Network를 설계했다 최소 5년 이상의 유학 상담 경험이 있는 현직 전문가들을 통해 본 논문에서 소개하는 시스템의 성능을 검증 받았다.
-
In this paper we address the problem of detecting and estimating an unknown narrow band signal in a noise interference environment A new practical band estimation method, yielding good performance even in case of finite-length data, is presented. More specifically, wavelet packet transform is utilized to detect the more accurate time-variant band, then we estimate the power from wavelet filter-coefficients of the respective band. Also, third-order cumulants, and projection cross-correlation (PCC) criterion are utilized to achieve an effective SNR improvement for the time-variant band estimation. In case of time variant band estimation, the PCC method yields better performance than the correlation method.
-
An acoustic feedback canceller has some problems that are difficult to remove the acoustic feedback through acoustic feedback path. In this paper, a new method of acoustic feedback cancellation scheme is proposed using spectral subtraction. Microphone input signals are subtracted by estimated feedback signals which are estimated by Wiener filter using the correlation between microphone input signals and output signals of receiver.
-
입력영상의 Hough 변환(Hough Transform; HT) 영상으로부터 입력영상인 원호의 중심각의 크기, 반지름의 길이 및 양 끝점의 위치 정보를 구하는 방법을 제안하였다. HT 영역에서 포락선의 정보로부터 원호영상의 외접사각형의 가로 및 세로 길이와 회전 각도를 구한 다음 이로부터 원호영상 정보를 계산하였다.
-
본 논문에서는 음성 인식을 이용하여 전화를 교환해주는 자동 교환 시스템을 구현하고, 성능을 평가하였다. 구현된 시스템에는 필수적인 음성인식 이외에도 DSP 진단 기능, 인식 대상 어휘의 추가 및 변경기능, 음성 수집 기능 등이 구현 되었다. SCHMM (Semi-Continuous Hidden Markov Model)을 이용한 전화망에서의 화자 독립 고립 단어 가변 어휘 인식을 대상으로 하였으며, 실시간 구현을 위하여 Texas Instrument 사의 TMS320C32를 사용하였다〔6〕. 인식 어휘는 부서명 및 인명이고 1300여 단어일 때, 인식 성능은 91.5%이다.
-
본 논문에서는 차량 충돌 방지 시스템으로 많이 사용되고 있는 밀리미터파를 이용한 FMCW(Frequency Modulated Continuous Wave) 레이더의 신호 처리부를 분석 및 설계하였고, 설계한 레이더의 파라미터 값들을 이용하여 선행 차량의 거리와 속도 정보를 검출하는 신호 처리 과정을 시뮬레이션 해 보았다. 최종적으로 FMCW 레이더의 신호 처리부를 TI사의 TMS320C31 DSP을 이용하여 하드웨어로 구현하였다.
-
기계설비의 진동신호와 음향신호에서 결함신호를 검출하기 위해 본 논문에서는 ALE와 트리구조 필터뱅크를 이용 진동분석 시스템을 설계 구현하였다. ALE는 신호를 전처리함으로서 진동신호의 주기성분을 제거하여 결함신호검출을 용이하게 하며 트리구조 필터뱅크는 비정제적 결함신호를 전 대역에서 동일한 분해도로 분해한다. 설계된 진동분석 시스템은 모의실험과 DSP상의 구현을 통해 그 성능이 평가하였다.
-
디지털 데이터 처리 및 전송과 함께 방대한 양의 디지털 데이터에 대한 저장 시스템의 용량 증가를 위한 신호처리 기법에 대해 관심이 날로 증가하고 있는 가운데, 다양한 기록 시스템에 대하여 고안된 여러 가지 채널 코딩 및 신호 검출 알고리즘을 분석, 검증하기 위한 시뮬레이터를 하드웨어적으로 구현하였다. 본 시뮬레이터는 광 기록 저장 채널에 대한 신호처리 시뮬레이션프로그램을 토대로 디지털 신호처리 프로세서(DSP)를 이용하여 RLL 변조 코드에 대한 인코더/디코더 및 채널을 통과한 데이터에 대해 심볼간 간섭을 제거하기 위한 등화기와 등화된 채널 출력 신호로부터 전송된 데이터를 결정하기 위한 여러 가지 신호 검출기를 설계하여 채널을 통과하기 전의 원본 데이터와 통과후의 출력 값에 대한 에러율을 분석, 검증하였다.
-
In this paper, we present a multi-code parallel combinatory CDMA system using bi-orthogonal modulation to reduce envelope variation and improve bit error. .rate (BER) performance. In general, the dynamic range of the amplitude of the transmit signal is very large in the case of conventional multi-code CDMA systems, resulting in severe nonlinear distortion due to high power amplifier and thus significant BER performance degradation. The proposed system exhibits reduction of peak-to-average power ratio (PAPR) of the transmit signal amplitudes and significant performance improvement. We verify the performance of the proposed system by computer simulations under AWGN channel and flat fading channel.
-
본 논문은 음성신호를 이용해 성대의 질환이 있는 환자를 진단하고 병명을 판별하게끔 유도하는 자동 진단 시스템을 개발하기 위한 연구의 일부로, 그중 ARS를 이용하여 환자의 음성을 수집, 분석, 식별의 실험에 대한 연구이다. 본 연구 팀에서는 이미 CSL을 이용한 장애음성 데이터의 수집과 식별에 관한 연구 결과를 발표한바 있다. 하지만 선행연구에서는 방음실에서 디지털 녹음기를 이용하여 수집한 음성을 사용했기 때문에, ARS를 통하여 녹음한 음성과는 샘플링 주파수나 대역폭, 잡음성분등의 데이터의 특성이 상당한 차이가 있다. 이러한 이유로 ARS를 통하여 녹음한 음성에 보다 적합한 파라미터 분석프로그램을 작성하여 파라미터를 구하였다. 이 파라미터들은 Kay사의 MDVP를 기초로하여 작성하였고, 대부분 80%정도의 신뢰성을 가졌다. 수집한 음성의 식별은 정상음성과 양성음성의 두가지 경우로 분리하였다. 식별기법으로는 신경망을 이용하였고, 식별파라미터는 구한 파라미터중 6개의 파라미터를 선별하여 식별한 결과 약 90%정도의 식별율을 가졌다.
-
A heart sound algorithm, which separates the heart sound signal into four parts; the first heart sound, the systolic period, the second heart sound, and the diastolic period has been developed. The algorithm uses discrete intensity envelopes of approximations of the wavelet transform analysis method to the phonocard-iogram(PCG)signal. Heart sound a highly nonstation-ary signal, so in the analysis of heart sound, it is important to study the frequency and time information. Further more, Wavelet Transform provides more features and characteristics of the PCG signal that will help physician to obtain qualitative and quantitative measurements of the heart sound.
-
현재 상용화된 CDMA (code division multiple access)방식은 사용자가 증가함에 따라 다중 사용자 간섭(multiuser interference)에 의해 통화품질 향상 및 가입자 수용 용량 증대에 한계를 가지고 있다. 이러한 문제를 극복하기 위해 다양한 다중 사용자 간섭 제거 알고리즘이 제안되었다 〔1-5〕. 본 논문에서는 여러 형태의 알고리즘들 가운데, 역상관 successive interference cancellation(SIC) , zero-forcing decision-feedback(ZF-DF) 검파기와 parallel interference cancellation(PIC) 검파기를 하이브리드 형태로 구성하는 방법을 제안하였고. 그에 따른 성능 분석 및 Rayleigh 페이딩 환경에서 컴퓨터 시뮬레이션을 통한 성능비교를 하였다. 컴퓨터 모의시험결과, 본 논문에서 제안한 3가지 하이브리드 검파기 모두 기존 검파기에 비하여 우수한 성능을 보였다.
-
본 논문에서는 기동하는 표적을 추적하기 위한 표적의 운동 모델링 방법에 대해서 다룬다. 실제 표적의 운동은 진행방향으로의 가속과 이와는 독립적인 방향 전환으로 이루어진다는 점에 착안하여 표적의 진행방향에 따라 동작 잡음의 분산 행렬이 변화하는 표적 중심 모델을 제안하고, 이를 IMMPDAF(Interacting Multiple Model Probabilistic Data Association Filter)에 적용하였다. 모의실험을 통해 기존의 모델을 사용한 IMMPDAF와 비교하였으며, 그 결과 기동 구간의 오차가 30% 정도 줄어들며 추적 실패율도 낮아짐을 볼 수 있었다.
-
본 논문에서는 4개의 적외선 검출기로 구성된 Crossed Array Tracker를 위한 반대응 기법을 제안한다. 입력 신호로부터 표적 신호만을 추출해 내기 위해서 표적과 섬광탄의 에너지 방사 특성과 대기 투과 특성을 고려하고 2개의 검출 대역을 설정한다. 그리고 두 대역의 입력신호 비를 이용하여 표적에 의한 신호만을 추출해서 효과적인 표적 추적을 가능하게 한다.
-
본 논문에서는 고밀도 광 기록 시스템에서 코드율이 2/3인 (1,7) 코드를 사용하여 부분 응답의 목표를 다양하게 변화시켜 여러 가지 목표 응답에 대해 잡음의 대부분을 차지하는 지터(jitter) 성분만을 고려했을 때와 이에 부가적인 백색잡음(AWGN)만을 고려하였을 경우의 성능을 각각 비교, 분석하였다. 또한, 이 실험 결과를 토대로 고밀도 광 기록 채널에 적용시킬 수 있는 가능한 부분 응답들을 조사하였고, 그 결과 PR(6,6,8,4,3) ML 코드가 고밀도 기록 시스템에서 좋은 데이터 검출 능력을 나타냄을 보였다.
-
In this paper we suggest the adaptive QoS-based VOD system design, which can diagnose and reflect the variable network situation. This system is based on the changeable Forward Error Correction(FEC) coding and re-transmission to enhance system quality by using the measured real-time network value such as loss, delay and jitter.
-
본 논문에서는 저전압(2V) 동작이 가능하도록 완전차동 구조의 아날로그 능동소자에 전압조절을 위한 튜닝 회로를 추가한 능동소자를 제안하였다. 아날로그 능동소자는 이득특성에 영향을 주는 트랜스컨덕턴스값을 증가시키기 위해 CMOS 상보형 캐스코드 방식을 이용하여 구성되었다. 0.25㎛ CMOS n-well 공정 파라미터를 이용한 HSPICE 시뮬레이션 결과, 제안된 아날로그 능동소자는 비우성극점의 제거로 안정성이 향상되었으며, 2V 공급전압하에서 42dB의 이득값과 200MHz의 단위 이득주파수 특성을 나타내었다. 소비전력값은 0.32mW를 나타내었다.