대한전자공학회:학술대회논문집 (Proceedings of the IEEK Conference) (Proceedings of the IEEK Conference)
대한전자공학회 (The Institute of Electronics and Information Engineers)
- 기타
- 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
- 대한전자공학회 2000년도 추계종합학술대회 논문집(3)
- 대한전자공학회 2000년도 추계종합학술대회 논문집(2)
- 대한전자공학회 2000년도 추계종합학술대회 논문집(1)
- 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
- 대한전자공학회 2000년도 ITC-CSCC -2
- 대한전자공학회 2000년도 ITC-CSCC -1
- 대한전자공학회 2000년도 하계종합학술대회 논문집(5)
- 대한전자공학회 2000년도 하계종합학술대회 논문집(4)
- 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
- 대한전자공학회 2000년도 하계종합학술대회 논문집(2)
- 대한전자공학회 2000년도 하계종합학술대회 논문집(1)
대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
-
본 논문에서는 Bipartite 매칭을 이용한 2D/3D 검색 시스템을 제안한다. 2D/3D 검색 시스템에서 3D 물체 사이의 유사도는 각각의 2D 실루엣 이미지들간의 매칭을 통해 얻어진다. 그러나 기존의 매칭 방법은 전체 매칭(Fuii MatchinE) 방법으로 연산량이 많기 때문에 Bipartite 매칭 방법을 사용하여 연산량을 줄이고 검색 속도의 성능을 향상시킨다. 기존의 방법과 제안된 방법의 검색 속도 비교를 통해 Bipartite 매칭을 이용한 2D/3D 검색 시스템의 효율성을 나타낸다.
-
본 논문에서는 HPEG-7의 에지 히스토그램 서술자와 컬러 레이아웃 서술자를 조합하여 검색 성능을 향상시키는 방법을 제안한다. 에지 특징 정보는 영상의 컨텐트를 표현하기 위한 중요한 요소로 고려되어진다. 이것은 특별히 컬러의 단점을 보완하기 위해서 유용하다. 반면 컬런 특징 정보는 구조적인 단순함과 빠른 동작 속도에 의해 영상 검색에 넓게 사용되어진다. 본 논문에서는 앞에서 언급한 두 특징 정보를 잘 표현하는 에지 히스토그램 서술자와 컬러 레이아웃 서술자를 사용하였다. 실험 결과로 제안한 방법이 자연 영상에 대하여 두드러지게 검색 성능을 향상시켜주는 것을 확인할 수 있다.
-
본 논문은 컬러를 이용한 영상 검색 방법에 관한 것으로 영상 데이터의 효율적인 관리를 위해 먼저 전처리 단계로 웨이블릿 변환을 수행한 후 가장 낮은 저주파 부밴드 영상을 획득한다. 그리고, 변환 후 획득된 영상을 클러스터로 구분한 후, 고유치 및 고유 벡터를 이용하여 특징을 추출하여 색인 정보로 이용하였다. 클러스터링은 영상 화소의 컬러공간 상의 3차원 거리를 클러스터링의 기준으로 삼아 순차 영역 분할(Sequential Clustering) 방법을 적용하였다.
-
동영상에서 움직이는 객체 검출은 동영상의 내용을 표현하고 유사한 동영상을 검색하는 데 있어 중요한 특징간을 추출하는 방법으로 사용된다. 그러나 복잡하게 카메라가 움직이는 동영상에서 움직이는 객체 검출은 아직까지 어려운 과제이다. 본 논문에서는 복잡한 카메라의 움직임이 있는 환경에서 움직이는 객체를 강인하게 검출하는 방법을 제안한다. 움직이는 객체 검출 방법은 입력 영상을 색상간의 클러스터링을 이용하여 각 영역으로 구분하는 Mean Shift 알고리즘과 인접한 프레임에서 구분된 영역을 대응시켜 영역의 모션 벡터를 구하는 영역 매칭, 유사한 궤적을 가지는 영역들의 클러스터링을 이용하여 객체를 검출하는 궤적 클러스터링 알고리즘을 사용한다. 제안한 영역 기반 알고리즘은 기존의 픽셀이나 블록 기반의 방법보다 움직이는 객체를 정확하게 검출하였다. 실험 결과 복잡하게 움직이는 카메라의 환경 속에서 움직이는 객체를 강인하게 검출하였다.
-
현재 수 많은 공중파 채널을 비롯하여 각종 케이블 TV 와 위성 TV 등의 채널이 대량으로 디지털화 되어 가고 있지만 파국의 디지털 TV 의 규격은 MPEG2 라는 표준 규격으로 통일 되어 우리에게 전해지고 있다. 이런 수많은 동영상 정보들은 디지털이라는 특성상 기록과 보관이 용이하므로 사용자는 수 많은 정보를 저장, 관리 할 수 있게 되었다. 따라서 방대한 데이터의 바다 속에서 원하는 정보를 검색하는데 있어서 기존의 방식 즉 일정 속도를 가진 검색 엔진을 사용하는 것 보다는 MPEG2 규격의 표준들을 보다 효율적으로 이용하여 사용자들이 동영상 정보 중에 이동하기 원하는 부분으로 이동하기 위한 비선형 검색엔진을 소개한다. 이를 이용한 PVR(Penonal Video Recorder)은 현재 hardware 부분은 완료되었고 일부 software 엔진을 적용하여 개발 중이다.
-
A theory of binary wavelets has been recently proposed by using two-band perfect reconstruction filter banks over binary field . Binary wavelet transform (BWT) of binary images can be used as an alternative to the real-valued wavelet transform of binary images in image processing applications such as compression, edge detection, and recognition. The BWT, however, requires large amount of computations since its operation is accomplished by matrix multiplication. In this paper, a fast BWT algorithm which utilizes filtering operation instead or matrix multiplication is presented . It is shown that the proposed algorithm can significantly reduce the computational complexity of the BWT. For the decomposition and reconstruction or an N
${\times}$ N image, the proposed algorithm requires only 2LN$^2$ multiplications and 2(L-1)N$^2$ addtions when the filter length is L, while the BWT needs 2N$^3$ multiplications and 2N(N-1)$^2$ additions. -
본 논문에서는 입체 영상 시스템 중 원 영상과 오차 영상(residual image)에 대한 효율적인 압축방법을 연구하였으며, 기준영상과 오차영상에 대해 저 비트에서도 양질의 영상품질을 얻을 수 있는 제로트리 기법을 이용하여 압축하는 기법을 제안한다. 제로트리 기법을 이용할 경우 압축 성능과 효율이 좋은 반면, 계산량이 증가한다는 단점이 있는데, 이것을 보완하기 위해 변이추정 방법은 ADLS[1] 방식을 적용하였다. 웨이블릿을 기반으로 하는 제로트리 기법을 이용하여 영상의 압축 효율을 향상시킴으로써 제한된 대역폭 내에서 높은 영상품질을 보존 할 수 있다는 것을 실험을 통하여 보였다.
-
멀티 미디어 기술의 총아라고 불리는 차세대 디지털 방송의 핵심적인 기술인 MPEG-2 표준은 주로 방송용에 적합한 고화질 부호화가 목표였다. 1.5Mbps 이하의 저비트율, 즉 보다 고압축률의 부호화 방식에는 대응하고 있지 않았다. MPEG-4 표준 기술은 방송, 통신, 및 컴퓨터 분야에서 앞으로 차기 허용 대역폭이 증가는 하겠지만, 현재의 네트워크 대역폭이 비디오 데이터를 전송하기에는 저대역폭인 상황에서 전송을 위해 새롭게 사용될 멀티미디어 부호화 기술로서 자연 영상뿐만 아니라 그래픽 합성 영상 등 다양한 멀티미디어 정보를 사용자가 대화형으로 쉽게 접근, 편집 처리할 수 있는 기능을 제공한다. 이에 본 논문에서는 향후 다양한 응용 분야에 적용될 MPEG-4 비디오 부호화기를 직접 설계 및 구현함으로써 응용의 가능성을 검증할 수 있는 시스템을 제안한다. 실험결과는 제안한 부호화기의 구조가 국제표준에 근거하여 다양한 응용 제품의 개발에 적합함을 보여 준다.
-
JBIG2 표준은 그레이 문서를 고압축의 이진 영상으로 부호화 하기위하여 선 영역(region of line-art), 하프톤 영역(region of Halftone), 텍스트 영역(region of Text)으로 세그먼트하여 각각 영역에 최적화 모드를 사용하여 부호화한다. 본 논문에서는 JBIG2에서 제공하는 세가지 모드의 코딩, 즉, 제네릭 영역(region of Generic) 코딩, 텍스트 영역을 위한 패턴 매칭(Pattern Matching) 코딩, 하프톤 영역을 위한 하프톤 코딩을 모두 구현하였다. 그리고, 각 영역을 세그먼트하는 방법을 개선하여 적용하여 세그먼트의 성능 향상을 이루었다. 특히, 부호화량이 많은 하프톤 영역의 세그먼트를 향상시켜 최적화 모드로 부호화 하도록 구현하였다. 팩스 테스트 영상(IEEE-l67a)으로 구현한 JBIC2 CODEC을 실험한 결과, 각 영역에 대한 세그먼트가 [6]의 방법에 의한 세그먼트보다 더 효율적으로 이루어졌으며 주관적 화질 또한 우수하였다.
-
삼각형 메쉬(triangular mesh)로 이루어진 삼차원 영상의 큰 데이터량을 줄이기 위한 메쉬 부호화의 연구가 활발히 진행되고 있다. 그리고, 최근에는 삼차원 부호화 데이터의 네트워크 전송 문제가 대두되어, 점진적 부호화(proressive mesh compression)에 대한 알고리듬들도 제안되고 있다. 본 논문은 꼭지점의 위치 정보 및 간략화 과정의 꼭지점 패턴(vertex pattern) 규칙을 이용하여, 기존의 점진적 부호화 알고리듬의 부호화 성능을 개선한 알고리듬을 제안한다. 꼭지점의 위치 정보를 이용하여 기존의 알고리듬에 비해 낮은 엔트로피(entropy)를 얻었으며, 꼭지점 패턴 정보를 이용하여 복원시 분할 꼭지점(split vertex)의 탐색 범위를 한정하였다. 전산 모의 실험을 통해, 제안하는 알고리듬이 기존의 점진적 메쉬 부호화 연구에 비해, 연결 정보 부호화에서 대략 30%정도 향상된 부호화 성능을 가짐을 확인할 수 있었다.
-
본 논문에서는 프레임 메모리를 줄이는 간이형 비디오 디코더의 다섯가지 알고리즘을 연구하여 성능을 비교한다. fixed-length ADPCM 기법을 적용하여 메모리를 줄이는 알고리즘과 수평 방향으로 decimation 하는 방법, 그리고 DCT 계수를 filtering 하는 방법을 구현하고 이보다 더 압축률을 높여서 수평 방향으로 decimation 하거나 DCT 계수를 filtering 하는 방법에 ADPCM 기법을 결합한다. 이렇게 함으로써 원래의 비디오 디코더 프레임 메모리의 25% 까지 메모리를 줄일 수가 있다. 메모리 크기를 줄이는 이점 이외에, 하나의 비디오 디코더 구조가 몇가지 압축 모드를 구성하므로 원하는 복잡도와 메모리 크기에 따라 응용이 자유롭다.
-
지금까지의 비트 율 조절에 대한 연구는 일정한 프레임 율을 갖는다는 가정 하에서 매크로 블록 단에서의 연구가 대부분이었다. 그러나 저 전송률 환경에서는 사용 할 수 있는 bit 수가 적기 때문에 오히려 이러한 가정이 성능을 저하시킬 수 있다. 우리는 이 논문에서 저 전송률 환경에서 문제가 되는 motion jerkiness 와 flickering effort 를 개선시키고 프레임 skip 을 방지하는 비트율 조절 방법을 제안한다. 제안된 기법은 허용하는 지연 시간 안에서 부호화단에 부가적인 계산량을 거치 부가하지 않기 때문에 실시간 처리에 적합하다. 실험 결과는 우리의 기법이 저 전송률 환경에 적함함을 보여준다.
-
기존에 MPEG-1, 2나 H.261/263 등에 사용되고있는 움직임 예측 방법은 블록 기반의 코딩 방식으로 단순히 영상의 움직임을 선형 모델로 간주하고 영상을 일정한 크기의 사각형으로 나누어, 각 사각형이 어느 곳으로 이동하는지를 추정하는 방식이었다. 그러나 이러한 방식은 블록 당 하나의 움직임 벡터만으로 처리하기 때문에 블록 내의 복잡한 움직임은 추정할 수 없을 뿐만 아니라, 보다 일반적인 움직임인 회전, 뒤틀림, 확대, 축소 등을 추정할 수 없다. 또한, 영상의 내용에 상관없이 일정한 크기의 블록으로 나누어 처리하기 때문에 주어진 영상에 최적화된 움직임 추정을 수행하기가 어렵다. 특히 저속 비트율에서는 이러한 점들이 크게 부각된다. 이러한 점들을 극복하기 위해서 여기에서는 삼각형 메쉬를 이용한 공간 변환 방법을 이용하였다. 여기에 영상을 영상에 따라 적응적으로 분해하여 처리할 수 있는 웨이브렛 패킷 부호화를 사용하여 에너지가 많고 적음에 따라 초기 제어점의 격자를 조절하여 좀 더 우수한 성능을 얻을 수 있다.
-
기존 스케일러빌러티(scalability) 동영상 부호화 알고리듬 의 문제점을 개선하기 위하여 본 논문에서는 다중 레퍼런스 프레임 방법을 기저 계층(base layer)과 확장 계층(enhancement layer)의 움직임 보상시 사용하여, 부호화 효율 및 드리프트 현상을 현저히 감소시키는 효과를 가져온다. 전산 모의 실험을 통하여 제안 알고리듬은 기존의 H.263+ 알고리듬에 비해 스케일러빌러티 모드를 작동하였을 때와 작동하지 않았을 경우 모두에 대해 더 나은 부호화 효율을 보여 주고, 이전 레퍼런스 확장 계층이 네트웍 사정으로 전송되지 않았을 경우에도 제안하는 알고리듬은 거의 화질의 손실이 없이 복원할 수 있음을 보여준다.
-
본 논문에서는 TI사의 TMS320C6201 DSP를 이용하여 H.263 동영상 부호화기를 실시간 구현하고자 한다. 구현한 부호화기는 QCIF 형식의 영상을 사용하여 ITU-T H.263 권고안의 기본 모드를 따라 주로 C 언어와 intrinsics를 사용하여 구현하였다. 특히, 속도 향상을 위해서 고속 메모리의 사용을 극대화하는데 중점을 두었고, 연산량이 많은 모듈에 대한 최적화와 데이터의 병렬 처리 및 DMA (Direct Memory Access) 전송 등을 고려하여 구현하였다.
-
본 논문에서는 디지털 통신 시스템의 블라인드 등화에 있어서, 다중레벨 modulus를 기준 신호로 사용하여 등화기의 탭 계수 갱신 식에 사용되는 오차 신호를 형성함으로써 등화기의 블라인드 수렴 특성을 개선한 다중레벨 modulus 알고리즘들의 성능을 분석하였다. 다중경로 채널 하에서 QAM 신호점에 대해 컴퓨터 모의실험을 통하여 단일/다중레벨 modulus 알고리즘(SMMA)과 기존의 modified constant modulus algorithm(MCMA) 및 최근에 제안된 다중레벨 modulus 알고리즘(MMA) 등의 블라인드 수렴 및 정상 상태 성능을 비교하였다.
-
It is well-known that the convergence rate gets worse when an input signal to an adaptive filter is correlated. In this paper we propose a new adaptive filtering algorithm that makes the convergence rate highly improved even for highly correlated input signals. By introducing an orthogonal constraint between successive input signal vectors, we overcome the slow convergence problem caused by the correlated input signal. Simulation results show that the proposed algorithm yields highly improved convergence speed and excellent tracking capability under both time-invariant and time varying environments, while keeping both computation and implementation simple.
-
최근에 cdma2000-lx 시스템의 역방향에 파일럿 채널이 추가되면서 적은 계산량으로 구현이 가능한 LMS 빔 형성 기법이 연구되고 있다. 그러나 기존의 LMS 빔 형성 방식의 경우 무선 페이딩 채널에 적응하기 위하여 고정된 step-sire parameter를 이용하였다. 하지만 이러한 고정된 step-size parameter를 사용할 경우 MSE가 증가하여 좋은 성능을 얻을 수 없다. 따라서 본 논문에서는 LMS 순 방향 빔 형성 기법에서 채널을 추정하여 추정된 채널과 LMS 가중치의 오차에 적응하는 step-size parameter를 결정함으로써 적은 MSE만으로 가중치 값을 추정하는 CA-LMS(Channel Adaptive Least Mean Square) 방식을 이용한 순방향 빔 형성 기법을 제안한다. 제안한 방식에 대하여 cdma2000-lx 환경에서 다양한 페이딩 환경에 적용하여 제안한 방식이 우수함을 확인 할 수 있다.
-
We propose a novel noise littering method based on adaptive windowing. To restore a noisy signal adaptive filtering methods have been widely researched and used. However, conventional adaptive filtering methods have a trade-off between noise suppression and edge preservation since they adopt fixed size filters. In this paper applying the adaptive windowing concept to adaptive filtering, we overcome the trade-off, The filter size is adaptively selected depending on signal statistics. The visual results of the signal and image restorations convincingly show the superior preservation of edge and detail and suppression of noise for the proposed adaptive windowed adaptive filter compared with conventional methods.
-
In this paper we consider a problem of blind co-channel signal separation, the goal of which is to estimate multiple co-channel digitally modulated signals using an antenna array. We employ the joint maximum likelihood estimation and present a sequential algorithm, which is referred to as sequential joint maximum likelihood (SJML) algorithm. It separates multiple co-channel signal on-line and converges fast in overdetermined noisy communication environment. And the computational complexity of SJML for M-QAM (M=8, 16, 64,...) signals is less expensive compared to the SLSP. Useful behavior of this algorithm are confirmed by simulations.
-
Recently a constant-norm constraint equation-error method was proposed to solve the bias problem in adaptive IIR filtering. However, the method adopts a fixed step-size and thus results in slow convergence for a small step-size and significant misadjustment error for a largestep-size. In this paper, we propose a variable step-size (VSS) algorithm that greatly improves convergence properties of the constant-norm constraint equation-error method. The analysis and the simulation results show that the proposed method indeed achieves both fast convergence and small misadjustment error.
-
The adaptive line enhancer (ALE) is widely used for enhancing narrowband signals corrupted by broadband noise. In this paper, we propose novel ALE methods to improve the enhancing capability. The proposed methods are motivated by the fact that the output of the ALE is a fine estimate of the desired narrowband signal with the broadband noise component suppressed. The proposed methods preprocess the input signal using ALE filter to regenerate a finer input signal. Thus the proposed ALE is driven by the input signal with higher signal-to-noise ratio (SNR). The analysis and simulation results are presented to demonstrate that the proposed ALE has better performance than conventional ALE´s.
-
The brief proposes to reduce the misadjustment of the adaptive filter coefficients that trace the interference signal in the sidelobe. The proposed sidelobe canceller that has the form of Griffiths-Jim sidelobe canceller with an adaptive compensator that reduces the misadjustment. The proposed sidelobe canceller updates the filter coefficients by the error Signet of the adaptive compensator instead of the output signal. This brief shows the Improvement of the performance by comparing the computer simulation of the output signal of the Griffiths-Jim sidelobe canceller to the output signal of the proposed sidelobe canceller.
-
본 논문은 radix-2 FFT를 파이프라인 기법으로 구현할때의 성능 향상을 위한 메모리 어드레싱기법에 대한 새로운 구조를 제안하고자 한다. Fast Fourier Transform(FFT) 프로세서의 속도 및 성능은 파이프라인 싸이클과 클럭에 좌우되므로, 동시에 병렬로 처리하기 위한 입력 데이타에 access 하기 위해 사용되어지는 기존의 메모리 어드레싱 기법은 지연문제로 인해 FFT 프로세서 성능 저하의 원인이 된다. 이 기법은 정확한 메모리 뱅크를 선택하기 위한 주소부 패러티 체크가 필요 없으므로 수행 속도를 빠르게 하고, ROM에 저장된 Coefficient의 실수부와 허수부의 상호교환특성을 이용하여 Coefficient ROM을 반으로 줄일 수 있다. 이 논문에서 제안된 구조는 VHDL을 사용하여 설계하였고, 설계된 회로를 시뮬레이션 및 합성시켰다.
-
In this paper, we propose a multiplication-free DFT kernel computation technique, whose input sequences are approximated into a ring of Algebraic Integers. This paper also gives computational examples for DFT and IDFT. And we proposes an architecture of the DFT using barrel shifts and adds. When the radix is greater than 4, the proposed method has a high Precision property without scaling errors due to twiddle factor multiplication. A possibility of higher radix system assumes that higher performance can be achievable for reducing the DFT stages in FFT.
-
제로트리 부호화 알고리즘 중 효율적이며 잘 알려진 SPIHT는 높은 메모리 요구로 인해 하드웨어 구현에 큰 어려움을 가지고 있다. 이 논문에서는 저 메모리 사용과 빠른 제로트리 부호화 알고리즘을 제안한다. 메모리를 줄이고 빠른 코딩을 위한 방법으로 다음 3가지를 사용한다. 첫 번째, 리프팅을 이용한 웨이블릿 변환은 기존의 필터뱅크 방식의 변환보다 저 메모리와 계산량의 감소를 가진다. 두 번째, 웨이블릿 변환된 계수들은 블럭으로 나누어져 각각 코딩된다. 여기서 블록은 제로트리 구조가 유지되는 STB(spatial tree-based block)이다. 세 번째, Wheeler 와 Pearlman이 제안한 NLS (no list SPIHT)를 이용한 부호화이다. NLS는 효율성에서 SPIHT와 거의 같으며 작고 고정된 메모리와 빠른 부호화 속도를 보여준다.
-
Synthetic aperture radar (SAR) is a promising active remote sensing technique to obtain large terrain information of the earth in all-weather conditions. SAR is useful in many applications, including terrain mapping and geographic information system (GIS), which use SAR display images. Usually, these applications need the enormous data storage because they deal with wide terrain images with high resolution. So, compression technique is a useful approach to deal with SAR display images with limited storage. Because there is some indispensable data loss through the conversion of a complex SAR image to a display image, some applications, which need high-resolution images, cannot tolerate more data loss during compression. Therefore, lossless compression is appropriate to these applications. In this paper, we propose a novel lossless compression technique for a SAR display image using one-step predictor and block arithmetic coding.
-
For efficient transmission of 3DTV video signals, it is necessary to eliminate the inherent redundancy between the stereo image pairs. Though disparity estimation provides a powerful tool for eliminating the redundancy, it is very time consuming. This paper presents a novel disparity estimation scheme based on the human visual property. The disparity vectors of image blocks spatially adjacent to the current block are used as initial guesses fur the disparity vector of the current block. In addition, mixed-resolution coding is applied to reduce the computational complexity of disparity estimation. Through computer simulations on a stereoscopic sequence we show that the proposed method gives rise .to visually pleasing results with much reduced computational complexity.
-
본 논문은 파동분할(Wave partitioning) 방식을 이용한 순차적(Sequential) 메쉬 부호화 방식을 제안한다. 파동분할 방식은 호수에 물방울이 퍼져 나가는 자연 원리를 이용하여 초기 삼각형의 주위에 삼각형을 덧붙여 가면서 하나의 SPB(Small Processing Block)을 만들어내는 방식이다. 이 방식을 이용하여 하나의 모델을 서로 독립적인 SPB로 분할하고, 각각의 SPB 내에서 초기 삼각형을 중심으로 그것에 덧붙여진 삼각형에 의해 만들어진 원 또는 반원을 찾는다. 또한 그 원주를 따라 순차적으로 꼭지점을 구하면 각각의 꼭지점들은 일정한 패턴으로 늘어서게 되고, 이를 이용하여 연결성 정보 없이 부가 정보만 이용하여 모델을 순차적으로 무손실 부호화한다.
-
영역 기반의 영상 압축 방법으로 quadtree 분할 압축 방법이 있다[1][2]. 이 방법은 낮은 bpp환경의 손실 압축에서 우수한 압축성능을 나타내지만 무손실이나 혹은 손실이 거의 없는 그레이 영상 압축에는 적당하지 않다. 본 논문에서는 quadtree 분할 압축을 예측자 및 F함수와 함께 사용하여 무손실이면서 우수한 압축성능을 가지는 무손실 압축 방법을 제안한다.
-
본 논문에서는 3D 레이저 스캐너로 입력된 3차원 얼굴 영상에서 코의 특징 정보를 이용하여 얼굴을 인식하는 알고리즘을 제안하였다. 특히 3차원 영상은 주변의 조명 변화에 크게 영향을 받지 않는 장점이 있다. 이러한 정보를 이용하여, 제안된 알고리즘에서는 얼굴에서 가장 두드러지게 보이는 코의 3차원 정보를 이용하여 인식하는 알고리즘을 제안한다. 먼저 코를 추출한 다음, 회전된 3차원 영상에 대하여 정규화를 실시하고, 등고선을 이용한 영역기반의 방법과 특징기반의 방법을 이온하여 인식을 수행한다. 등고선을 이용한 영역기반은 3차원 얼굴 영상을 코끝의 좌표를 기준 점으로 등고선의 값이 10, 20, 30이 되는 영역을 추출 한 후 데이터 베이스 값들과 비교하여 각각의 차 영역에 대한 무게중심(X, Y), 픽셀 수, 분산을 구하여 순위가 가장 높은 것을 취한다. 특징 기반의 방법으로, 얼굴에 있어서의 실제의 코의 길이, 높이, 너비를 구하여 그 차가 가장 적은 것을 취한다. 위의 2가지 방법을 이용하여 인식을 수행 결과 100%의 인식률을 나타내었다.
-
This paper presents a highly fast and accurate facial region extraction method by using the skin-color-reference map and motion information. First, we construct the robust skin-color-reference map and eliminate the background in image by this map. Additionally, we use the motion information for accurate and fast detection of facial region in image sequences. Then we further apply region growing in the remaining areas with the aid of proposed criteria. The simulation results show the improvement in execution time and accurate detection.
-
본 논문에서는 칼라 CCD 카메라로부터 입력된 얼굴 영상에서 HSI 정보와 눈, 코, 입 등의 얼굴 영역 특징자와 특징자들의 구조적 특징각을 이용한 얼굴 인식 알고리즘을 제안하였다. 제안한 알고리즘에서는 인간의 시각 체계와 비교적 유사한 HSI좌표계 상에서 피부색에 대한 색상 정보와 명암값 정보를 함께 이용함으로써 얼굴영역 추출의 효율을 높였고, 또한 추출된 얼굴 영역에서 얼굴 인식을 개선을 위해 눈, 코, 입 등의 구조적 위치 정보와 특징자들의 구조적 특징각인 θ/sub 1(ACRCD)/, θ/sub 2(ACRMD)/, θ/sub 3(ANRED)/, θ/sub 4(AMRED)/를 이용하여 얼굴 인식율을 개선하였다. 제안한 알고리즘에서는 기존의 명암 정보를 이용하는 방법과는 달리 색상 정보와 명암 정보 그리고 구조적특징각을 함께 이용함으로써 정확한 얼굴 영역의 검출이 가능하였으며 인식 방법에 있어서 특징자들의 구조적 관계값을 이용함으로써 인식 효율을 개선하였다.
-
본 논문에서 는 NTGST(noise-tolerant generalized symmetry transform)[1]를 이용하여 복잡배경 영상으로부터 효과적으로 여러 얼굴을 검출할 수 있는 알고리즘을 제안하였다. 먼저 NTGST를 이용하여 얼굴이 존재할 가능성이 있는 관심영역(region of interest: ROI)을 찾고, 각각의 관심영역 내에서 얼굴의 주된 특징인 눈, 코, 입을 부각시킨 Fovea 영상으로부터 대칭변환의 국부 최대치(local maximum)를 구한다음, 이들간의 관계를 기하학적 상관 관계로 분석 확인함으로써 사람 얼굴만을 검출 하도록 하였다. 여러 얼굴을 포함하는 복잡한 배경 영상에 대해 제안한 알고리즘을 적용한 결과 89.7%의 검출율을 얻을 수 있었다.
-
본 논문의 목적은 범용 USB 카메라 입력 영상으로부터 실시간으로 얼굴을 추적하는 시스템을 구현하는데 있다. 먼저 USB 카메라로부터 영상을 입력받은 후 2차원 RGB 컬러 모델링으로 추출한 살색 영역을 찾고 가로, 세로 프로젝선 정보를 이용하여 얼굴을 찾는다. 기존의 RGB 컬러 모델을 개선하여 빛에 강인한 모델링을 하였으며, 프로젝션 정보를 이용할 때 일어나는 에러를 최소화하기 위하여 누적 히스토그램 영역 결합 알고리즘을 제안하였다. 구현한 시스템은 움직임이 많은 영상에도 빠른 속도를 보였으며, 특히 영상의 움직임이적은 경우 카메라에서 영상을 보여 주는 것과 동시에 얼굴을 찾아내어, 연속적인 프레임을 처리할 수 있는 성능을 보였다.
-
컴퓨터와 주변장치의 급속한 발전은 인간과 컴퓨터 사이의 인터페이스에 많은 변화를 가져왔다. 특히, 인간의 감정을 인식하는 기술은 컴퓨터를 보다 인간 친화적으로 만들기 위한 노력으로, 그 동안 꾸준히 진행되어 왔다. 본 논문에서는 한대의 카메라로 촬영한 영상으로부터 실시간으로 신체움직임이 표현하는 감정을 인식할 수 있는 방법을 제안하고, PC기반의 실시간 감정 인식 시스템을 구현한다.
-
캐릭터의 자동 생성이란 영상처리 기법을 이용하여 사람의 얼굴에서 특징을 추출하고, 이 특징들을 기반으로 독특한 캐릭터를 자동으로 얻어내는 방법을 의미한다. 본 논문에서는 사람마다의 얼굴의 특성에 기반한 캐릭터를 자동으로 생성하기 위하여 얼굴의 각 구성요소들의 특징을 효과적으로 추출하기 위한 방법을 제시한다. 얼굴을 구성하는 각각의 요소들의 특징을 추출하고, 추출된 특징을 바탕으로 각 구성요소에 해당하는 데이터베이스를 검색하여 특징을 잘 표현할 수 있는 그림을 선택한다. 최종적으로 선택된 그림들은 원 이미지의 비율에 맞도록 재구성하여 얼굴 캐릭터를 생성한다.
-
최근 인간과 컴퓨터간의 원활한 상호작용의 필요성이 커짐에 따라 인간의 행동을 분석하는 연구가 많이 수행되고 있다. 기존의 시스템은 인간과 컴퓨터의 상호작용을 위해 3차원 센서 등의 별도의 장치를 필요로 한다. 그러나, 이러한 시스템은 원활한 상호작용이라는 관점에서 볼 때 자연스럽지 못하게 되고, 또한 시스템의 제약이 많기 때문에 다양한 시스템으로의 응용이 어려워지게 된다. 본 논문에서는 보다 자연스러운 인간과 컴퓨터의 상호작용을 위해서 센서가 아닌 카메라를 이용하여 대상을 입력받고, 이를 분석함으로써 대상이어떠한 상태이고, 어떤 동작을 취하고 있는지를 파악하여, 보다 자연스러운 인간과 컴퓨터간의 인터페이스를 구현하고자 한다.
-
본 논문은 얼굴의 특징점 추적을 위하여 얼굴 회전 변환과의 크기 변환을 고려한 BMA(Block matching alogorithm)을 이용한 방법을 제안한다. 우선 얼굴의 크기 변화를 구하기 위하여 얼굴 영역을 분리하여 그 면적을 구한다. 이 면적을 이전 프레임에서 구한 얼굴 영역의 면적과 비교하여 크기 비례를 계산한다. 다음으로 각 특징점을 중심으로 하는 8방위 영역의 화소들로 집합을 설정한다. 집합을 설정할 때에는 얼굴의 크기 변화를 고려하여 영역 내 화소들을 포함하는 양을 수정한다. 그리고 새로운 영상에서 화소 집합간의 거리가 가장 작은 화소를 새로운 특징점으로 지정한다. 이 때, 회전 변화를 고려하여 화소 집합의 순서를 순차적으로 바꿔 집합 간 거리를 산출한다. 제안하는 방법은 회전과 크기 변환에 강인한 특성을 보일 뿐 아니라, 단순한 움직임 예측 방법인 BMA보다도 쉽고 빠르게 계산된다.
-
하드웨어 성능 및 소프트웨어 기술에 힘입어 컴퓨터 애니메이션 기술은 발전을 거듭하고 있으며, 영화와 게임산업으로부터 군사훈련에 이르기까지 다양한 응용분야에서 이용되고 있다.[1][2] 개발된 3D 애니메이션 엔진은 구조화된 클래스들로 되어있기 때문에 클래스의 가감이 용이하다. 또한 모션 데이터 로더와 캐릭터 로더가 포함되어 있고, 스킬(skill)간의 전이와 섞음이 가능하다. 그러므로 애니메이션 엔진을 이용하여 캡쳐된 모션데이터를 게임에 적용하기 쉬울 뿐만 아니라 다양한 가상환경에서 이용되리라 기대된다.
-
In this paper. a key frame extraction algorithm for browsing and searching the summary of a video is proposed. Toward this end, important frames representing a shot are selected according to the correlations among frames. by using the Fourier descriptor which is useful for the shot boundary detection. To quantitatively evaluate the importance of selected frames. a new measure based on correlation coefficients of frames is proposed. If there are several frames with a same importance. another criteria is introduced to break the tie. by computing the partial moment of subframes including each candidate key frame so that the distortion rate is minimized Since a key frame extraction algorithm can be evaluated subjectively. the performance of the proposed algorithm has been verified by a statistical test. Experiments show that more than 20% improvement has been obtained by the proposed algorithm compared to existing methods.
-
In this paper, we first propose new texture features, BVLC (block variation of local correlation coefficients) moments, for content-based image retrieval (CBIR) and then present an image retrieval method based on the fusion of BDIP and BVLC moments. BDIP uses the local probabilities in image blocks to extract valley and edges well. BVLC uses the variations of local correlation coefficients in images blocks to measure texture smoothness well. In order not to be affected with the movement, rotation, and size of an object, the first and second moments of BDIP and BVLC are used for CBIR. Corel DB and Vistex DB are used to evaluate the performance of the proposed retrieval method. Experimental results show that the presented retrieval method yields average 12% better performance than the method using only BDIP or BVLC moments and average 13% better performance than the method using wavelet moments.
-
The application of one-dimensional projection to each image enables to obtain shape or spatial information of image. This paper proposes a method that uses relative distances between peaks and their maximum value in the projection vector. In order to verify retrieval performance, the experimental results between the histogram intersection method, the projection only method. and the proposed one are compared and analyzed.
-
인터넷이 빠르게 보급됨에 따라 많은 멀티미디어 컨텐츠를 접할 수 있게 되었다. 이에 따라 사용자들이 쉽게 멀티미디어 컨텐츠에 접근하게 하기 위해 여러 가지 방법으로 이를 재구성하여 데이터베이스를 만드는 연구가 활발하게 진행되고 있다. 이러한 추세에 발맞추어 MEPG-7 표준이 진행 중에 있고, 사용자들이 대용량의 멀티미디어 컨텐츠에 대한 접근을 용이하게 하기 위해 멀티미디어 요약과 같은 기법들이 표준화되고 있다. 본 논문에서는 MPEG-7에 제안된 충실도 (fidelity) 기술법(description scheme)을 이용하여 뉴스를 효과적으로 요약할 수 있는 방법에 대해 제안한다.
-
비디오 데이터의 효율적인 저장, 관리를 위해서는 장면진환 검출을 통한 비디오 분할 기술에 대한 연구가 필요하다. 본 논문에서는 MPEG 압축 비디오 상의 B(Bidirectional) 프레임의 특성을 복호화 과정을 거치지 않고 직접 추출하여 I(Intra), P(Predictive), B(Bidirectional) 프레임에 제안받지 않고 장면전환을 검출해 내는 방법을 제안한다. 장면전환 검출을 위해 복호화 하지 않고 필요한 데이터만을 추출해 내어 B 프레임의 특징만을 이용해 검출하므로 빠르면서도 정화한 장면전환을 검출한다. 또한 카메라 움직임이나 빛의 변화 같은 잡음에 강건한 방법을 제안한다.
-
워터마크(watermarks)는 원데이터에 크게 손상을 주지 않으면서도 필요한 정보를 숨겨서 삽입하여야 하며, 압축이나 포맷변환 또는 의도적인 공격에 대하여 강인하게 검출되어야 한다. 본 논문에서는 템플릿(template)을 이용하여 압축이나 필터링 등의 일반적인 영상처리 뿐만 아니라, 회전(rotation), 확대 및 축소(scale), 평행이동(translation) 등과 같은 기하학적 변환(geometric attack)에 대해서도 강인한 워터마크 기법을 제안한다. 본 알고리듬은 템플릿을 웨이블릿(wavelet) 공간의 모든 대역에 삽입하여 강인한 템플릿을 구성한다. 템플릿을 이용한 강인한 워터마크 기법은 영상 압축 및 기하학적 변환에 대하여 우수한 성능을 보였다.
-
비디오 워터마킹 기술은 비인지성, 안전성 및 강인성의 일반적인 요구조건 이외에 실시간 처리의 요구 조건들이 부가된다. 또한 공격에 있어서 프레임 정보를 이용한 워터마크 제거와 같은 공격이 가능하기 때문에 정지 영상과 비교하여 설계 시 많은 고려가 요구된다. 본 논문에서는 이진의 삽입 정보가 삽입된 비디오 데이터로부터 양극성 랜덤 계열을 이용하여 워터마크를 추출하는 경우에 비디오 프레임 간의 움직임 예측에 의해 구성된 프레임을 이용하여 추출 성능을 향상시키기 위한 추출 방법을 제안하였다. 제안 방식의 실험 결과로부터 움직임 예측을 이용하지 않은 결과와 비교하여 워터마크 추출 성능이 향상되었음을 확인하였다.
-
오늘날, 디지털 워터마크에 대하여 기하학적 변환에 대한 강인성이 요구되고 있다. 본 논문에서는 회전, 이동 및 크기변화에 강인한 워터마킹 방법을 제안한다. 영상의 푸리에 변환 계수를 이용하여 이동에 대한 강인한 속성을 가지도록 하며, 입력 마스크의 상호 관계가 회전, 크기 변화에 강인하도록 워터마크 마스크를 생성한 후 영상에 삽입한다. 삽입된 워터마크의 검출은 영상의 주파수 영역의 radial projection 에 대한 워터마크 신호의 상관도를 이용하여 검출한다. 실험을 통하여 제안된 방법이 여러 가지 기하학적 변환에 강인함을 보여준다.
-
본 논문은 DCT, FFT 및 Wavelet 등과 같은 주파수 영역에 의한 Watermarking 기법에서 정확한 Watermark를 검출하기 위하여 제안한 알고리즘이다. 본 논문에서 사용한 알고리즘은 기존의 왜곡된 영상에서 원 영상의 주파수 변환 값을 제거하여 왜곡된 상태의 영상 값에서 삽입된 Watermark를 검출하는 알고리즘에서 벗어나 왜곡된 값을 완전히 제거한 상태에서 영상의 Watermark를 검출함으로써 보다 완벽한 Watermark를 검출 할 수 있는 향상된 알고리즘을 제안하였다.
-
본 논문에서는 MPEG 비트스트림 기반의 동영상 저작권 보호를 위한 간단하면서도 효율적인 실시간 워터마킹 알고리즘을 제안한다. 제안된 알고리즘에서는 MPEG 부호화된 동영상에 대해 DCT 계수 영역으로 부분 복호화한 후 양자화 기법을 사용하여 DC 계수에 비가시성을 가지도록 워터마크를 삽입한다. 실험결과 제안된 알고리즘은 기존의 비트스트림 기반 워터마킹 기법보다 계산 복잡도 및 강인성 면에서 향상된 성능을 보여주고 있다.
-
In this paper, we propose a robust and fragile watermarking technique for tamper proofing of still images. Robust watermarks are embedded by quantization with a robust quantization step-size, and it is imperceptible value for human visual system. Fragile watermarks are embedded by thresholding and quantization with EW(Embedded Zerotree Wavelet) algorithm. The proposed method enables us to distinguish malicious change from non-malicious change. Futhermore this technique enables us to find tampering regions and degrees.
-
반향(Echo)을 이용한 워터마킹은 오디오 신호에 인위적인 반향을 첨가함으로써 정보를 삽입한다. 다른 오디오 워터마킹 방법과 마찬가지로 반향 오디오 워터마킹은 시간축 공격에 대해 강인하지 못한 단점을 가지고 있다. 특히, 오디오 신호의 피치를 보존하면서 재생 시간을 변형시키는 시간 스케일 변형 (Time Scale Modification)에 대해서는 별도의 방어를 위한 알고리듬이 없을 경우 전혀 복호화가 이뤄지지 않는다. 본 논문에서는 반향 오디오 워터마킹의 성능 향상을 위해 시간 스케일 변형 공격에 대응하여, 변형된 정도를 검출하고 보상하여 복호화가 가능하도록 하는 새로운 알고리듬을 제안한다.
-
In this paper, we present a robust watermarking technique based on a DCT-domain watermarking approach and an order statistic(OS) filter. The proposed technique inserts one watermark into each of four coefficients within a 2
${\times}$ 2 block which is scanned on DCT coefficients in the zig-zag ordering from the medium frequency range. The detection algorithm uses an adaptive trimmed mean operator as a local estimator of the embedded watermark to obtain the desired robustness in the presence of additive Gaussian noise and JPEG compression attacks. The performance is analyzed through statistical analysis and numerical experiments. It is shown that the robustness properties against additive noise and JPEG compression attacks are more enhanced than the previous techniques. -
본 논문에서는 인간시각시스템(HVS)과 블록 DCT를 이용한 효과적인 워터마킹 방법을 제안한다. 워터마크는 시각적으로 인식 가능한 패턴과 비밀키에 의해 생성되고, 인간시각특성에 따라 영상의 중간 주파수 대역을 선택적으로 변조함으로서 삽입된다. 워터마크의 추출에는 원 영상이 필요하며, 추출된 워터마크와 원래의 워터마크와의 상관관계를 통하여 유사성을 판별한다. 제안한 방법의 실험결과, 영상에 삽입된 워터마크는 노이즈, 필터링, JPEG 손실압축등에 강인함을 보여준다.
-
영상에 워터마크를 삽입하는 것을 통신채널의 입장에서 해석한다면 워터마크는 신호로, 영상은 잡음으로 모델링이 가능하다. 따라서 이러한 잡음 속에서 신호에 대한 에러를 최소화하는 것이 워터마크의 추출을 최대화하는 것이라 할 수 있다. 통상적으로 Error Correction Code는 에러가 많은 통신채널에서 많이 이용되기 때문에 워터마킹 방법에서도 효과를 기대할 수 있다. 본 논문에서는 DCT 기반의 구간화 워터마킹 방법에 Turbo code를 이용하여 강인성 면에서의 향상된 성능을 실험 결과로 보이며, Turbo code의 해밍거리를 이용하여 워터마킹의 보다 효율적인 검출 방법을 제안한다.
-
본 논문에서는 연집 오류(burst error)에 우수한 정정 능력을 보이는 고속 RS(Reed-Solomon) 복호기를 제안한다. 제안된 RS 복호기는 RS(n, k, t); (37 < n ≤ 255, 21 < k ≤ 239, t = 8)의 사양을 지원하며 수정 유클리드 알고리즘(modified Euclid´s algorithm)을 이용한 시스톨릭 어레이(systolic array) 방식의 병렬처리 구조로 설계되었다. 고속 RS 복호기의 효율적인 VSLI 설계를 위하여 새로운 방식의 수정 유클리드 알고리즘 연간 회로를 제안한다. 제안된 수정 유클리드 알고리즘 회로는 2t + 1의 연산 지연 시간을 갖으며 기존 구조의 연산 지연 시간인 3t + 37에 비하여 t = 8 인 경우 약 72%의 연산 지연이 감소하였다. 제안된 구조를 VHDL을 이용하여 설계하였으며 SAMSUNG 0.5㎛(KG80) 라이브러리를 이용하여 논리 합성과 타이밍 검증을 수행하였다. 합성된 RS 복호기의 총 게이트 수는 약 77,000 개이며 최대 80MHz의 동작 속도를 나타내었다.
-
TCM(Trellis Coded Modulation) has soft decision scheme so that BM(Branch Metric) calculates the ED(Euclidean Distance) between the received signal and each code words in signal space. For computing the ED, square and square root computations increase the hardware complexity. Some simplified method is known for convolutional codes with QPSK(Quadrature Phase Shift Keying), PSK(Phase Shift Keying) modulation. But it is not acceptable for QAM (Quadrature Amplitude Modulation)-TCM scheme. In this paper, we suggest that two modified BM computation methods, which is applicable for QAM-TCM. By comparative study, we also assessed two proposed method in the case of hardware complexity and BER (Bit Error Rate) performance.
-
G.UTE ADSL 모뎀에 적합한 주파수 영역 프로세서의 구조를 제안하였다. 주파수 영역의 연산과정에 대한 알고리듬 수준의 최적화를 수행하였고, 하드웨어 자원할당에 따른 설계의 효율성도 분석하였다. 제안된 프로세서는 한 개의 실수 곱셈기와 두 개의 실수 덧셈기를 병렬로 연결한 구조를 가지며, 기존의 연구결과에 비해 작은 하드웨어 크기를 차지한다. 설계된 시스템은 삼성 0.35㎛ 표준셀 라이브러리를 사용하여 합성하였으며, G.LITE ADSL 모뎀에 적합하게 적은 하드웨어 자원으로 필요한 연산을 효율적으로 수행한다.
-
본 논문에서는 2 채널 MAIN 프로필 MPEG-2 AAC 복호화 시스템의 구조를 제안하고 구현하였다. 복호화 알고리듬의 구조적인 모듈화에 근거하여, 시스템 설계 과정에서 전체 시스템을 3 개의 하드웨어 모듈로 분할하였다. 전체 시스템은 허프만 복호화기, 예측기, 20 비트 고정소수점 DSP 코어로 이루어져 있다. 허프만 복호화기는 주어진 작업을 1 클럭 사이클 내에 수행할 수 있는 고속의 하드와이어드 모듈이고, 예측기는 높은 해상도를 가지고 다른 모듈들과 병렬처리가 가능한 구조를 가진 모듈이다. 구현된 시스템은 16.9 MIPS 로 2 채널의 MPEG-2 AAC 비트열을 고음질로 복호화할 수 있다.
-
본 논문에서는 OFDM 시스템용 복조기의 구현에 가장 핵심적인 소자인 2K/4K/8K-point FFT 프로세서를 제안하였다. 구현된 프로세서는 30MHz 시스템 클럭에 서 8,192개의 복소 입력 샘플을 273㎲에 2,048개의 복소 입력 샘플을 68.26㎲에 수행함으로써 OFDM방송에서 요구하는 심볼 fp이트의 데이터를 처리할 수 있다. 기본 구조는 1차원 DFT를 작은 크기의 2차원 DFT로 변환할 수 있는 쿨리-투키 알고리듬을 적용하였으며 다차원 DFT 변환에 적합한 전치 메모리와 셔플 메모리를 사용하였다. 복소 곱셈기는 기존의 방법보다 더 효율적인 메모리 구조를 갖는 CORDIC 프로세서를 사용하였으며 제안하는 트위들팩터 발생 방법은 트위들팩터를 저장하기 위한 ROM의 크기를 효과적으로 줄일 수 있다.
-
홍채인식 시스템에서 입력된 영상으로부터 정합(matching)에 사용될 홍채 영역을 추출해 내는 과정은 필수적인 과정으로 빠른 처리 속도와 정확성을 요구한다. 기존의 원형검출기나 허프(Hough) 변환을 이용한 방법 등은 홍채의 바깥쪽과 안쪽 경계를 비교적 정확하게 검출해내는 장점이 있으나 탐색영역이 커서 수행시 간이 매우 많이 걸리는 단점이 있다. 따라서 본 논문에서는 이진화와 형태학적 연산(morphology)을 이용하는 새로운 탐색 영역 단축 방법을 제안한다. 제안한 방법은 기존의 홍채영역 검출 방법에 적용할 경우 수행 시간을 효율적으로 단축시킬 수 있다. 검출된 영역에 대해서 주성분 분석법(principal component analysis, PCA)을 이용해 매칭을 수행한 결과 약 95%의 인식율을 나타내었다.
-
미국의 National Library of Medicine에서 제공하는 Visible human 컬러영상을 이용하여, 신체 장기의 3차원 모델링 및 가시화 하기 위한 영역 분할 방법 연구가 활발히 진행되고 있다. 특히 다른 신체 장기 분할에 비해 뼈분할은 주위의 영역들과 모호한 경계를 지니고 있어 컬러영상만을 가지고 구분해 내기가 쉽지 않다. 이러한 문제점을 해결하기 위해 본 논문에서는 Visible human CT영상을 가지고 뼈 영역을 분할하고 분할 된 뼈 영역의 경계를 추출하여 그 경계를 컬러영상의 최적화된 위치로 변환해 최종적인 뼈 영역 분할을 시도한다. 제안된 방법은 Visible human 단면영상의 머리부분에 적용하여 좋은 결과를 얻음을 실험을 통해 효율성을 검증하였다.
-
영상 분할은 임상에서의 진단과 분석 및 3차원 가시화하는데 있어 선행되어야 할 필수적인 과정이다. 본 논문에서는 심혈관계 영상의 분할을 위한 Wave-front SRG방법을 제안한다. 제안된 방법은 2차원 슬라이스 영상에서 사용자에 의한 씨앗점(seed front)을 입력으로 받아 그 이웃한 슬라이스들에 wave-front를 만들어 영역 성장법에 의해 3차원 volume을 확장시킨다. 이때 다음으로 성장할 wave-front voxel의 mean gradient 값을 사용하여 밝기값의 변화가 심한 심혈관계 영상을 분할하였으며, Wave-front voxel의 size를 계산하여 혈관분할 시 발생할 수 있는 작은 채널에서의 새나감을 방지하였다. 제안된 방법을 컴퓨터 단층촬영으로 얻은 심혈 관계 영상의 분할에 적용한 결과, 밝기값의 변화가 심한 심혈관계 영상을 성공적으로 분할했으며, 작의 채널의 새나감이 없이 분할을 수행하였다.
-
본 논문에서는 가상의 블루스크린(Virtual Blue Screens, VBS)을 이용한 반자동 영상분할 기법을 제안한다. 가상 블루스크린은 동영상에서 배경영역을 특정한 값으로 채워 만든 참조영상으로 정의한다. 반자동 영상 분할 기법은 크게 화면내 영상분할과 화면간 영상분할의 두 단계로 이루어진다. 화면내 영상분할은 VBS와 원영상의 형태학적 분할 기법을 사용하고, 화면간 영상 분할은 두개의 연속하는 화면에서 변화검출(Change Detection)로 이루어진다 [1]. 본 논문에서는 효과적인 변화검출을 위하여 제안된 VBS를 사용한다. VBS를 이용한 영상분할에서는 우선, 이전화면에서 만들어진 VBS를 참조하여 다음화면에서 움직임 영역을 예측한다. 이렇게 예측된 영상과 원영상에 대해 형태학적 분할 기법(Morphological Segmentation Technique)을 이용해서 각각에 대한 레이블 마스크(Label Mask)를 얻는다 [2]. 두개의 레이블 마스크 사이에는 서로 공통된 영역들이 존재하게 되는데, 이런 공통된 영역을 추출함으로써 움직임 객체를 검출한다. 현재화면에서 검출된 움직임 객체는 다음화면을 위한 가상의 블루 스크린을 만드는데 사용한다.
-
In this paper, we present a robust region segmentation method based on the watershed transformation of a pseudo-distance map (PDM). A usual approach for the segmentation of a gray-scale image with the watershed algorithm is to apply it to a gradient magnitude image or the Euclidean distance map (EDM) of an edge image. However, it is well known that this approach suffers from the oversegmentation of the given image due to noisy gradients or spurious edges caused by a thresholding operation. In this paper we show thor applying the watershed algorithm to the EDM, which is a regularized version of the EDM and is directly computed form the edgestrength function (ESF) of the input image, significantly reduces the oversegmentation, and the final segmentation results obtained by a simple region-merging process are more reliable and less noisy than those of the gradient-or EDM-based methods. We also propose a simple and efficient region-merging criterion considering both boundary strengths and inner intensities of regions to be merged. The robustness of our method is proven by testing it with a variety of synthetic and real images.
-
종래에 사용되어 왔던 1차원 바코드가 정보를 포함하고 있는 데이터베이스에 접근하는 데이터 키 역할을 주로 해온 것에 비해, 2차원 바코드는 다량의 데이터를 포함할 수 있고 고밀도의 데이터 표현이 가능하여, 호스트 컴퓨터의 데이터 베이스에 온라인 연결할 필요없이 확인하고자 하는 사람이나 대상물에 대한 정보를 얻을 수 있다. 본 논문에서는 가장 널리 사용되는 2차원 바코드 체계인 PDF417 을 중심으로 디지털 카메라를 통하여 입력한 영상을 이진화하여 시작 심볼 또는 정지 심볼을 검색함으로써 2차원 바코드 영역을 추출한 다음, 추출된 영역으로부터 바코드의 행과 열의 수, 오류수정 정도 등의 헤더정보를 검출하고 이를 바탕으로 코드워드를 추출하는 알고리즘을 제안한다. 얻어진 코드워드는 데이터를 효율적으로 저장하기위해 정보가 숫자인지, ASCII코드인지 혹은 바이트 정보인지에 따라 다른 방식으로 인코딩 되어 있는데, 그에 따른 디코딩 알고리즘을 제안한다.
-
MPEG-2 압축 방법을 이용한 비트열은 가변장 부호를 이용하기 때문에 에러에 매우 민감하다. 하나의 비트에러가 발생하더라도, 다음 동기화 부호를 찾을 때까지 매크로블록 또는 슬라이스 단위의 정보 손실을 초래하기 때문에 복원 영상의 화질 열화가 심각하다. 따라서 에러 영상의 복원을 위한 에러 은닉 기술은 복호기 쪽에 매우 중요하다. 기존에 발표된 방법들은 에러에 의한 손실이 매크로블록 단위로 발생했다는 가정 하에 손상된 매크로블록주위의 상, 하, 좌, 우 네 방향의 데이터를 이용하였다. 하지만 대부분의 심각한 에러는 슬라이스 단위로 발생하기 때문에 좌, 우의 데이터는 사용할 수 없다. 본 논문에서는 이러한 슬라이스 단위의 에러를 은닉하기에 적합한 알고리즘을 제안한다. 상, 하, 오른쪽 상단, 왼쪽 상단, 오른쪽 하단, 왼쪽 하단의 6영역의 데이터를 이용하여 두 가지 대표적인 에러 은닉 방법인 boundary matching 방식과 주변 움직임 벡터 정보를 이용한 움직임 벡터 추정 방식에 적용하였다. 실험 곁과 기존의 방법에 비해 향상된 복원 화질을 얻을 수 있었다.
-
본 논문에서는 동영상의 계층적 부호화의 효율을 높이기 위한 방안에 대해 연구하였다. 단일 계층부호화에 비해 다 계층부호화는 계산량이 많아진다. 따라서 계층적 부호화의 장점을 살리고 단점을 보완하는 방안을 제시하였다. 우선 인코더에서 고급계층의 복잡도를 줄이기 위하여 고급계층의 참조 형태를 P-VOP (Prediction-Video Object Plane)만으로 정한다. 고급계층의 참조 영역으로 사용되는 업샘플링된 VOP의 횟수를 줄여서 업샘플링에 따른 계산량을 줄인다. 그리고 고급계층의 비트율을 조절하여 Traffic shaping 효과도 얻을 수 있다. 이러한 방법들을 통해 단일 계층 부호화에 비해 다 계층부호화의 장점을 살리고 단점을 보완하는 코덱을 제안한다.
-
이 논문에서는 미국과 유럽에서 디지털 CATV 전송 방식으로 각각 채택하고 있는 Opencable 시스템과 DVB-C 시스템의 전송성능을 비교하였다. 채널 환경의 신호손상요소는 랜덤잡음과 CTB (Composite Tripple Beats) 잡음을 고려하였다. 전송성능을 비교하기 위하여 각 전송시스템에 대한 모의실험장치를 S/W적으로 구현하여, 각 잡음 값에 따른 BER(Bit Error Rate) 값을 구하였다. 동일한 조건에서 모의실험을 실시한 결과, 64-QAM 모드에서는 Opencable 방식이 우수하고, 256-QAM 모드에서는 두 가지 전송방식의 성능이 비슷하다는 결과를 얻었다.
-
We analyze mathematically a VSB (vestigial side-band) transceiver system for the Advanced Television Systems Committee (ATSC) digital television standard and extract a near-baseband equivalent VSB channel model. This model shows the multi-path fading effect of the quadrature component on the in-phase component. Also, we obtain a simplified model of the VSB transceiver system, which is represented by convolution of the transmission signal (before modulation) and the VSB channel. This simplified model is efficiently used for simulation of VSB systems to improve its performances, especially in an equalization part. Applying the DTV channel specifications tested by the Advanced Television Test Conter (ATTC) to the channel model, we obtain an equivalent VSB channel and show the equalization result by using the conventional derision-feedback equalize (DFE).
-
현재 인터넷 스트리밍 기술과 그 시장은 날로 발전하고 있으며 사용자들의 멀티미디어 데이터에 대한 요구 사항인 시간적 신뢰성과 데이터의 질이 점점 다양해지고 있으며 그 요구사항을 보장 해 주기를 요구를 하고 있다. 인터넷 스트리밍 서비스는 영상과 유사한 트래픽을 가지며 이러한 트래픽 소스를 지금의 시간에 가변적인 인터넷 망에서 전송하기 때문에 손실과 지연, 지터등이 가변적으로 발생하는 문제를 가지고 있다. 그 이유는 현재의 인터넷 트래픽에게 최선 서비스(best-effort service)만을 제공하기 때문이며 비디오 데이터는 가변적이며 매우 높은 트래픽의 특징을 가지고 있기 때문이다. 이를 극복하기 위해 네트 워크 계층에서는 종합서비스(Intserv : Integrated Service), 차별서비스(Diffserv : Different Service)등특정한 트래픽의 스트림에게는 일정한 대역폭을 보장하는 개념으로 자원 예약 프로토콜이 연구되어 지고 있으며 비디오 계층에서는 비디오의 보다 효율적인 전송을 위하여 하나의 영상정보를 다중의 Layer로 구성하여 부호화하는 계층부호화에 대하여 MPEG(moving Picture Expert Group)에서 많은 연구가 진행되어왔다. 이러한 두 계층의 노력을 감안하여 특정 비디오 스트림에 대하여 예약 프로토롤을 사용하여 보다 효율적인 전송 시스템을 제안하며 그 성능을 객관적인 평가기준인 PSNR을 사용하여 평가하고 지연, 지터, 손실의 분포 빈도등을 사용자의 요구 사항을 만족시키는 서비스 방안에 대하여 연구하였다.
-
본 논문에서는 DTV 수상기에서 전송 받은 영상을 원하는 크기로 디스플레이 하기 위해 필요한 포맷 변환에 관한 알고리즘을 제시한다. 포맷 변환을 할 때에 영상을 보간하면 영상의 품질이 떨어지는 것을 볼 수 있는데 특히 에지 부분이 눈에 민감한 특성을 생각한다면 에지 부분에서의 무뎌짐은 상당한 문제점이 된다. 이를 해결하기 위해 고역 통과 필터링을 해주어 영상의 선명도를 올려줄 수 있는데 영상 전체에 고역 통과 필터링을 해주게 되면 영상의 에지뿐만 아니라 잡음 신호까지도 같이 증폭되는 문제점이 나타난다. 따라서 이를 해결하기 위해 에지 부분만을 적응적으로 고역 통과 필터에 통과시켜 잡음 성분은 줄이면서 에지 부분의 선명도는 올려주는 알고리즘을 제시하였다. 이를 검증하기 위해 다양한 영상에 대하여 컴퓨터 모의 실험을 하였고, 결과를 기존의 방법들과 비교하여 알고리즘의 우수성을 확인하였다.
-
최근 몇 년간 멀티미디어의 응용이 활발해지면서 H.261, H263을 이용한 영상회의 MPEG-1, MPEG-2등을 이용한 디지털 저장 미디어와 방송이 주요 관심분야로 발전해왔다. 이러한 기술을 바탕으로 이제는 무선망을 이용한 3세대 이동 통신이 새로운 이슈로 등장하고 있다. 그러나 무선 환경에서는 채널 상에서 데이터를 전송할 때 에러가 많이 발생하기 때문에 에러에 강인한 방법이 반드시 필요하게 된다. 본 논문에서는 특히 향후 많은 응용분야에 쓰일 MPEG-4 데이터를 무선망으로 전송함에 있어 MPEG-4 표준에서 규정하는 에러 내성 방법과 여기에 채널 코딩 기법을 도입하여 오류에 강인한 특성을 지니도록 하는 방법을 제안한다. 실험결과는 단순히 기존의 에러 내성 기법을 활용할 때 보다 에러에 대한 강인성과 에러 검출에 있어 향상된 성능을 보여준다.
-
DTV 방송 신호를 수신하거나 송신하는 장비의 경우 대부분 한두 가지 인터페이스 방식을 이용하여 서로 통신을 하고 있다. 따라서 서로 다른 인터페이스 포맷을 사용하여 스트림을 전송하는 경우 기존의 장비를 사용하지 못하는 경우가 많이 있다. 본 논문에서는 이런 장비들 사이에서 주고받는 스트림의 포맷을 자유로이 연결 가능하도록 해주는 인터페이스를 설계 및 구현하였다. 본 논문에서 구현한 인터페이스는 스트림 자체 내용은 변경하지 않고, 송·수신하기 위한 인터페이스 규격에 스트림을 적용하여 자유로이 송·수신할 수 있도록 하였다. 구현한 인터페이스 규격은 SMPTE 310M, ASI(Asynchronous Serial Inerface), SPI (Synchronous Parallel Interface)와 셋탑박스에서 사용하는 TS(Transport Stream)의 네 가지로 서로간에 송·수신 가능하도록 매트릭스 형태를 취하고 있다. 주요 블록은 YHDL 코딩을 이용하여 설계를 하였으며, FPGA(EPF10K10T144)를 사용하였다.
-
CDMA2000 1x 기반의 무선 인터넷 서비스가 가능해짐에 따라 무선 멀티 미디어 서비스에 대한 수요가 점점 늘어나고 있다. 화상 전화나 VOD 서비스와 같은 실시간 멀티 미디어 서비스에 사용되는 UDP는 현재의 유선과 무선이 혼합된 망에서는 패킷 전송 주기와 패킷의 크기에 따라 매우 다른 성능을 보여준다. 무선 구간에서 전송 효율을 높이기 위해서는 대역폭과 패킷손실률 그리고 채널의 타임슬롯 시간을 고려해 야 한다. 본 논문에서는 CDMA2000 1x 망에서 망 측정을 통하여 실시간 멀티미디어 전송에 적합한 QoS 인자를 추출하여 이를 개선 향상을 위해서 하고 실시간 멀티 미디어 서비스를 위한 대안을 제시하였다.
-
본 논문에서는 영상 시퀀스 상에서 물체의 가려짐을 고려하여 상대적인 깊이 순서에 의해 정렬되는 계층을 분리하기 위한 새로운 움직임 분할 방법을 제안한다. 블록을 기반으로 한 움직임 추정 및 클러스터링 과정을 통하여 각 계층에 대한 블록영역을 구하고, 이 블록영역에 대하여 윤곽선 추출을 이용하여 각 계층에 대한 정확한 객체를 분리할 수 있다. 이러한 움직임 분할방법을 통한 동영상의 계층적인 표현은 영상에서 원하지 않는 물체, 전경, 배경의 제거나 기존의 영상을 이용한 새로운 영상의 합성에 이용될 수 있으며, 분할을 통해 얻어진 객체는 영상 압축, 영상 합성 등을 위한 데이터베이스에 저장되어 응용될 수 있다.
-
본 논문에서는 MPEG가 비디오 스트림의 형상 정보를 클러스터링 하여 VO(Visual Object)의 동작을 요약하는 새로운 방법을 제안한다. 제안하는 방법은 MPEG-4 비트 스트림의 디코딩 없이 형상 정보를 근사화 한다. 그리고 사용자가 입력한 질의 VOP(Video Object Plane)와 VO의 각 VOP와의 NMHD(Normalized Mean Hausdorff Distance)를 구한 후 클러스터링을 수행하여 키 영역을 분리해낸다. 클러스터링에 의해 시간적으로 분리된 영역의 지속성을 고려하여 Rank를 매김으로써 사용자가 원하는 수의 키 VOP를 선택할 수 있게 한다. 제안하는 방법은 클러스터링을 사용함으로써 키 VOP를 선정하였으며, Rank와 질의 VOP를 사용하여 사용자와의 상호작용이 가능하다.
-
본 논문은 두 대의 카메라로 제안하는 물체의 색상, 움직임, 형태상의 특성을 이용하여 3차원 공간상의 움직임을 실시간으로 추출하는 것을 목적으로 한다. 본 논문에서 제안하는 물체는 구조상 물체 자체가 캘리브레이션 물체의 역할을 포함하여 캘리브레이션이 되지 않은 상황에서도 정확하게 물체의 3차원 정보를 추출할 수 있으므로 3차원 입력 디바이스로 이용할 수 있다. 3차원 움직임을 추출하기 위해 먼저 3차원 공간상의 물체와 좌우 영상의 상관관계를 구하고 좌우 즉 영상에서 원이 위치할 탐색영역은 MAWUPC 알고리즘을 이용하여 예측한다. 탐색영역 안에서 PCA를 사용하여 원의 정확한 위치를 찾으며 좌우 영상에서 얻은 원의 위치와 스테레오 카메라의 기하학적 구조를 종합하여 3차원 움직임을 추출한다. 추출한 3차원 움직임은 가상환경에서 가상 물체의 움직임을 제어하는데 응용할 수 있다.
-
본 논문에서는 변이-움직임 벡터의 상관관계를 통한 동시 추정(joint disparity and motion estimation)을 이용하여 방대한 계산량과 데이터량을 요구하는 스테레오 영상 데이터의 효율적인 부호화를 위한 알고리즘을 제안한다. 스테레오 시퀀스에 대해서 두 변이 벡터(disparity vector)와 하나의 움직임 벡터(motion vector)의 상관관계를 이용하면 나머지 움직임 벡터는 직접적인 추정 과정 없이 얻을 수 있다. 하지만, 이렇게 얻어진 움직임 벡터는 직접 추정에 비해 정확도가 현저히 떨어져 이 벡터를 그대로 사용하여 영상을 복원하게 될 경우 심각한 오차의 누적이 발생한다. 따라서 본 논문에서는 효율적인 동시 추정을 위해 추정단에서 벡터 평활화(vector regularization)과정을 수행하고 불확실 벡터 영역 추출을 통한 선택적인 보정 과정을 수행한다. 또한, 불확실 벡터 영역의 벡터만을 가변장 부호화(variable length coding)한다. 실험결과, 직접 추정 과정을 거치지 않고 도 만족할 만한 화질의 영상을 얻을 수 있었으며, 부호화량도 상당히 감소시킬 수 있었다.
-
일반적인 동영상 압축 부호화 방법에서 시간적 중복 정보를 줄이기 위해 움직임 예측과 움직임 보상 방법을 이용한다. 웨이블릿 변환을 이용한 동영상 압축 부호화 기법 중에는 기존의 공간 영역에서의 움직임을 예측하는 대신에 웨이블릿 변환 영역에서 움직임을 예측하기도 한다. 이러한 방법은 움직임 예측 시간을 줄이는 장점이 있지만, 웨이블릿 변환에서 추림(Desimation)하는 과정에서 천이-변동 문제 (Shift-Variant Problem)를 일으켜 좋지 않은 성능을 나타낸다. 본 논문에서는 웨이블릿 영역에서의 다중 해상도 움직임 예측에서 천이-변동 문제를 해결하기 위한 새로운 움직임 예측과 움직임 보상 방법을 제안한다. 제안된 방법은, 기존의 공간 영역에서의 블록 정합 방법과 비교하여, 더 높은 화질을 나타낼 뿐 아니라, 주관적 화질에도 개선된 결과를 보인다.
-
본 논문에서는 객체의 움직임에 의한 모양 변화를 표현하기 위하여 MPEG-7 에 제안된 모양 시퀀스 기술자(Shape Sequence Descriptor)에 대하여 설명하고, 모양 시퀀스 기술자 추출에 필요한 Shape Variation Map 생성을 위한 두 가지 방법을 비교하였다. 기존의 방법은 물체의 평균 적인 모양에 가중치를 두어 생성되며, 새로운 방법은 물체의 움직임에 의해 변화되는 부분에 더 가중치를 두는 방법으로 생성된다. 또한 최종적으로 사용되는 특징 값으로 Zernike moment를 이용하는 방법과 ART(Angular Radial Transform)을 이용하는 방법을 비교하여 모양 시퀀스 검색을 위한 가장 효율적인 방법을 제안하였다.
-
본 논문에서는 광학센서와 적외선 센서를 사용하는 Multi-sensor 시스템에서 영상 정보를 통한 물체의 추적 및 인식에 필요한 영상을 분리하는데 필요한 전처리와 object 기반의 추적 방법을 제안하였다. 일반적인 추적 알고리즘의 목표는 consistency를 유지하는데 있다. 그러나 인식에 필요한 영상을 분리하기 위해서는 물체의 범위를 정확히 판단 할 수 있는 능력이 중요하다. 이를 위해 CCD와 IR영상에 동시에 적용 가능한 전처리 기법과 object 기반의 two-step 추적 알고리즘을 통해 consistency외에도, 물체의 범위를 estimation하여 인식에 필요한 범위를 분리해 낸다. 본 논문에서는 ITS 의 ETCS application을 위해 이종 센서인 CCD와 IR의 야간 차량 영상정보를 이용하여 알고리즘을 test 하였다.
-
본 논문에서는 보다 효율적이고 정확한 움직임 벡터를 추정하기 위하여 계층적 평활화 방법(hierachical regularization technique)을 이용한 움직임 추정 알고리듬을 제안한다. 계층적 평활화 기법을 이용하여 움직임 벡터들의 신뢰도를 증가시켰고, 주위 벡터와의 평활화를 통해 움직임 벡터들의 비트량을 감소시켰다. 또한 적은 후보 벡터를 이용하여 움직임 벡터를 예측하는 고속 움직임 추정 알고리듬을 적용하여 평활화 과정의 추가로 인해 생기는 많은 연산량을 감소시켰다.
-
본 논문에서는 영상 합성을 위해 실시간으로 움직임 물체를 추출하고 움직임 물체의 홀이나 외곽선의 손실을 최소화하고 복원하는 알고리즘을 제안한다. 움직임은 기준영상과 현재 입력된 영상의 차이를 계산함으로써 검출 된다. 따라서 여기서 적당한 기준 영상과 검출 문턱치 방법의 선택이 필요하게 된다. 몇 가지 문턱치 선택 방법들이 연구되었나, 본 논문에서는 회귀적인 문턱치들을 이용한다. 그레이 영상을 통해 구해진 영역에서 칼라 값의 비교를 통해 손실된 영역을 복구하고 최종 실루엣 영상을 얻는다. 얻어진 움직임 물체의 실루엣 영상은 영상 합성에 이용한다.
-
본 논문에서는 움직임 보상을 이용한 Motion-Adaptive De-interlacing Method를 제안 한다. 정확한 움직임 추정을 위해서 Pre-filter로서 EBMF(Edge Based Median Filter)를 사용하며 새로운 Block Matching Method를 제안한다. Temporal Filter로서 Motion Missing Error를 제거하기 위해 입력 영상의 움직임 영역에 따라 각각 다른 임계 값을 적용하는 AMPDF(Adaptive Minimum Pixel Difference Filter)를 적용하였으며 MMD(Maximum Motion Detection)와 SAD(Sum of Difference)를 이용하여 빠른 움직임 영역에서 화질을 향상시켰다. 최종적으로 잘못된 움직임 보상에 기인하는 화질의 열화를 방지하기 위한 Motion Correction Filter를 제안한다.
-
본 논문에서는 실내에서 액티브 카메라를 사용하여 다중 인물의 얼굴의 위치를 검출하고. 추적할 수 있으며 조명과 배경 등의 영향에 강인한 추적 알고리즘을 제시하고자 한다. 알고리즘은 얼굴영역 검출, 추적의 2단계로 구성되며, 빠르고 효율적인 얼굴영역 검출은 추적 알고리즘의 성능향상으로 이어지므로, 이를 위해 독특한 색상영역 분포를 갖는 피부 색상 특징을 이용하였다. 표본영상에서 추출된 피부색상 픽셀들을 바탕으로 YCbCr 색상계를 사용하여 얼굴 색상모델을 구축한 후, Gaussian 함수를 사용하여 입력 영상의 픽셀과 얼굴색상모델과의 유사도를 결정하였다. 최종 얼굴 영역은 추출된 영역에 대한 얼굴의 타원특징, 해부학적 특징을 이용하여 결정된다. 추적은 추출된 얼굴영역과 temporal Gaussian 필터를 적용한 움직임 추정을 통한 움직임 검출의 조합으로 이루어진다. 또한, 예측버퍼의 사용으로 탐색영역의 축소로 인한 계산량 감소와 처리 속도의 증가시켰으며, pan/tilt가 가능한 카메라를 사용하여 상호 피드백이 가능하도록 하였다. 제시된 알고리즘은 PC 상에서 시뮬레이션되었으며, 좋은 결과를 얻을 수 있었다.
-
본 논문에서는 경계영역을 잘 보존할 수 있는 움직임 추정기법을 제안하였다. 고정크기 블록으로 움직임 추정시 생길 수 있는 경계영역에서의 왜곡은 인간의 시각에 민감하게 작용할 수 있다. 제안한 움직임 추정기법은 고정크기 블록기반으로서 기본적으로 MAD(Mean Absolute Difference)가 최소가 되도록 하는 동시에 영상의 경계값과 복잡도를 이용하여 경계부분에서 일어나는 시각적인 왜곡을 줄일 수 있도록 하였다. 제안한 움직임 추정기법은 기존의 경계영역 보존 기법에 비해 직관적 성능 및 주관적 차질이 향상됨을 모의 실험결과로부터 확인하였다.
-
본 논문에서는 비디오 영상에서 장면 전환을 검출하는 알고리듬을 제안한다. 장면 전환 검출은 비디오 프레임 사이의 유사도를 측정하여 이루어 진다. 유사도는 비디오 영상의 특성을 나타내는 지표를 추출하고 이를 비교함으로써 얻어진다. 비디오 영상의 특성 지표는 비디오 영상 전체에서 추출하는 것이 일반적이나 제안하는 알고리듬에서는 비디오 영상에서 강한 에지 부분을 포함하는 여러개의 블록에서만 추출된다. 이렇게 함으로써 배경보다 더 중요한 정보를 가진 에지 주변의 칼라 변화에 집중하는 효과를 얻게된다. 실험 결과는 강한 에지 블록에서 얻은 지표가 점진적 장면 전환(dissolve, wipe) 검출에 효과적임을 보여준다. 제안하는 알고리듬은 또한 Cut탐지에도 비교적 좋은 성능을 보인다. 그리고 Fade-in/out을 간단하면서 효과적으로 탐지할 수 있는 방법을 제시한다.
-
A motion vector sensitivity function for abrupt scene change detection is presented. Proposed function detects a scene change by a static uni-value, not using threshold comparion method in real time and compressed domain. All abrupt scene change was detected.
-
영상 압축 분야에서는 데이터 압축이 필수적인데, 이때 가장 많은 데이터 중복성을 가지고 있는 시간적 중복성은 이전 프레임의 데이터를 이용하여 움직임 추정과 움직임 보상을 수행하고 추정된 움직임 벡터에 의해서 보상된 영상과 원 영상과의 차 신호를 부호화하여 데이터를 압축한다. 움직임 추정과 움직임 보상기법은 비디오 영상압축에서 중요한 역할을 하지만 많은 계산량으로 인하여 실시간 응용이나 고해상도 응용에 많은 어려움을 가지고 있다. 이러한 문제점을 해결하기 위하여 여러 가지 고속정합 알고리즘들과 하드웨어 기법들이 개발되었다. 특히 다이아몬드 탐색 기법은 계산량도 줄이고 안정된 복원 영상 화질을 유지하고 있다. 본 논문에서는 기존의 다이아몬드 탐색 기법의 문제점을 개선한 수정된 다이아몬드 탐색 기법을 제안하고 성능을 평가한다. 실험에 의하여 제안된 기법은 기존의 다이아몬드 탐색 기법과 비교하여 화질 면에서나 속도 면에서 모두 좋은 결과를 가져왔다.
-
본 논문에서는 항공 영상에서 직선 성분을 강건하게 추출하기 위한 새로운 영상 필터링 기법을 제안한다. 제안하는 기법은 지상 구조물의 추출에 유용한 직선 특징을 이루는 에지와 비직선 특징을 이루는 에지의 대비도를 증가시키기 위하여 비선형, 비등방 확산 기법 [2]을 영상에 적응적으로 적용한다. 이를 위하여 확산 매개변수를 제안하는 새로운 직선성 척도로 설정하고 영상의 각 점에서의 직선성 값에 따라 적응적으로 확산을 시킴으로써 확산 과정에서 직선 특징을 잘 보존하고 비직선 특징을 효과적으로 제거한다. 본 논문에서는 직선성 척도로서 에지 체인 위의 점들의 방향성 엔트로피를 제안하고 다양한 영상에 대한 실험을 통해서 엔트로피 척도가 영상에서의 직선 특징을 추출하는데 효율적임을 보인다.
-
We propose an algorithm for extracting the boundary of an object. In order to take full advantage of global shape, our approach uses global shape parameters derived from Point Distribution Model (PDM). Unlike PDM, the proposed method models global shape using curvature as well as edge. The objective function of applying the shape model is formulated using Bayesian rule. We can extract the boundaries of an object by evaluating iteratively the solution maximizing the objective function. Experimental results show that the proposed method can reduce computation cost than the PDM and it is robust to noise, pose variation, and some occlusion.
-
최근 영상 검색(retrieval)과 분류(classification)에서 질감 특징(texture feature)을 이용한 연구들이 활발하게 진행되고 있다. 본 논문에서는 효율적인 질감 특징 추출을 위해 명암도 상호발생 행렬법(gray level co-occurrence matrix)과 웨이블릿 변환(wavelet transform)을 이용하여 질감의 특징을 추출한 후 특징의 중요도에 따라서 가중치를 부여하는 방법을 제안한다. 이렇게 추출된 가중치 대표 벡터들을 기반으로 베이시안 분류기(Bayesian classifier)를 통해 임의의 질감을 인식하였다.
-
목표물 인식(Target Recognition)에 사용되는 대표적인 특징 정보에는 밝기 (Intensity) 정보와 윤곽선(Boundary) 등의 모양(Shape) 정보가 있다. 그러나, 일반적으로 영상에서 바로 추출한 밝기 정보나 윤곽선 정보는 환경 변화에 의한 많은 오차 요인들을 포함하고 있기 때문에, 이들 특징 정보를 개별적으로 인식에 사용하는 것은 높은 인식 성능을 기대하기 어렵다. 따라서, 밝기 정보와 모양 정보를 인식에 함께 사용하는 기법이 요구된다. 본 논문에서는 밝기 정보와 윤곽선 기반의 모양 정보를 합성하여 동시에 인식에 사용하는 3단계 기법을 제안한다. 제안하는 기법에서 밝기 정보 추출에 는 PCA (Principal Component Analysis)기법을 사용하고 , 윤곽선 정보 추출에는 PDM(Point Distribution Model) 에 기반한 영역 분할(Segmentation) 기법과 Algebraic Curve Fitting기법을 사용하였다 추출된 밝기 정보와 윤곽선 정보는 FLD(Fisher Linear Discriminant) 기법을 통해 결합(integration)되어 인식에 사용 된다. 제안한 기법을 적외선 자동차 영상을 인식하는 실험에 적용한 결과, 기존기법에 비해 인식 성능이 개선됨을 확인할 수 있었다.
-
The automatic construction of large, high-resolution image mosaics is an active area of reasearch in the fields of photogrammetry, computer vision, image processing, and computer graphics. In this study, we describe a automatic mosaicing method that makes a panorama from images by placing camera in a emitted-grid. In the images captured by cameras, there must be a matched area and the area is in the particular area of the image. Initial transformation matrix, there(ore, is calculated from points searched in the partial area. It is possible to find best transformation matrix by Levenberg-Marquardt method. Finally, each images are multiplied by blending function and stitched by the transformation matrix to complete panoramic image.
-
개별적인 인식기를 하나의 단일 인식 시스템으로 구성하여 음성과 문자를 인식할 수 있는 공용인식시스템의 성능향상을 위해 온라인 필기에서 전역적인 정보를 추출할 수 있는 비트맵 파라미터 추출 방법을 제안하였다. 제안된 방식에서는 고속의 파라미터 추출을 위해 보간법을 이용한 재샘플링 과정 대신에 새로운 시간열을 구성하는 방식을 이용한다. 제안한 비트맵 파라미터를 본 연구실에서 개발한 음성/문자 공용인식 시스템에 적용하기 위하여 67개의 자소를 5상태 10천이 CHMM(Continuous Hidden Markov Model)모델로 구성한 다음 인식알고리즘으로서는 상태단위로 지속 시간 정보를 제어하는 OnePassDP법을 이용하였다. 실험결과, 제안한 방법을 이용한 경우, 자소인식률은 61.3%에서 85.3%로 24%의 인식률 향상을 가져왔으며, 글자인식률은 64.3%에서 82.2%로 17.9%의 인식률 향상을 가져와 제안한 방법의 유효성을 확인할 수 있었다.
-
본 논문에서는 문서 위의 문자를 Off-Line방식으로 컴퓨터에 저장할 수 있도록 기하학적 패턴 벡터를 이용하여 한·영문자 및 글꼴을 인식하는 알고리즘을 제안하였다. 일반적으로 문서에서는 여러 가지 글꼴에 따라 글자의 형태가 다르므로 대표적인 한·영 세 가지 글꼴을 기하학적 패턴(Geometrical Pattern Vector)을 이용하여 크기와 이동에 인식하도록 하였다. 이진 입력 한영혼용 영상에서 잡음을 제거하고 수평·수직 투영 기법을 이용하여 한 문자를 분할하여 문자의 폭에 따라 기하학적 패턴을 추출한다. 추출한 패턴은 각 합계를 계산하여 기준 패턴 합계와 비교한 후 기준 패턴 문자와 글꼴을 인식하게 된다. 마지막으로 제안한 알고리즘의 성능을 평가하기 위해 크기, 이동 변형이 있는 대표적인 한·영 글꼴(신명조, 궁서, 고딕)체와 영어 Time New Roman체를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 원형 패턴 알고리즘보다 문자인식률과 글꼴 그리고 영어의 대·소문자를 구별하는 우수함을 보였다.
-
지문영상의 특이점(Singularities) 중의 하나인 Core Point는 대부분의 지문인증 시스템에서 기준점(Reference Point)으로 사용되고 있다. 또한 Core Point의 검출은 전체 지문인증 시스템의 가장 기본적인 단계로서 전체 시스템의 성능에 많은 영향을 준다. 본 논문에서는 지문 영상의 방향 패턴(Orientation Pattern)과 이의 리레이블링(Re-labeling)을 이용한 Core Point 검출 방법을 제안하고, 기존의 Poincare Index를 이용하는 방법 및 Sine Map을 이응한 방법과 비교, 분석하였다.
-
본 논문에서는, 지문인식에 있어서 특징 추출알고리즘과 추출된 특징을 가지고, matching하는 알고리즘을 제안하였다. 지문인식에 필요한 특징추출 알고리즘들은 Gabor-filter라는 알고리즘에 기반을 두었으며, minutiae 와는 달리 특징추출에 있어서 전처리과정(smoothing, binarization, thining, restoration) 을 필요로 하지않는다. 또한, 지문의 matching에 있어서의 알고리즘은 fingercode들 간의 유사성에 기반을 두었다. 이를 통한 실 험결과로써, 인식의 정확성은 95.7(%), FAR(2.9%), FRR(1.4%)을 보여주었다.
-
본 논문에서는 지문인식 시스템에 있어서 중간 단계인 Reference Point를 검출하는 방법을 제안하려고 한다. Reference Point는 지문 인식 방법들인 Minutiae 매칭 방법[1]과 Gabor filter를 사용한 Filterbank 방법[2]을 적용함에 있어서 feature를 추출할 때 사용되는 기준이 되는 Point이다. 그래서 동일인에 대해서는 항상 불변하고 정확한 위치를 찾아내는 정도가 지문 인식 시스템의 인식률에 크게 영향을 미치게 된다. 본 논문에서 제안하는 방법은 Gray Image에서 직접 Statistical한 방법을 사용하여 지문의 방향 분포를 구하고 이러한 방향 분포도로부터 얻어진 정보를 바탕으로 각 방향간의 거리를 측정하여 모든 방향 성분을 동일하게 유지하는 Reference Region을 찾게 된다. 이렇게 추출된 Reference Region내에서 SED(Statistical Equi-Distance)를 최대로 하는 좌표값을 Reference Point로 결정하게 된다.
-
본 논문에서는 센서 융합과 배경 추정 기법을 이용하여 연속된 영상에서 물체 영역을 검출하는 기법을 제안하였다. IR/CCD각각의 카메라로부터 얻은 입력 영상을 정렬하고 융합하는 과정을 거친 후, 각 화소 단위의 배경 모델을 추정하고 시간이 지남에 따라 이를 갱신함으로써 물체 영역을 효과적으로 검출하는 기법을 제시하고 있다. 실험은 차량을 대상으로 하였고, 카메라가 움직이는 상황과 비교적 복잡한 환경에서도 좋은 결과를 얻을 수 있었다.
-
자동차 번호판 인식 시스템은 크게 세 부분으로 나뉘어 질 수 있는데 그 첫 부분이 Camera를 통해서 획득된 영상에서 번호판 영역을 추출하는 것이다. 본 논문에서는 자가용과 영업용 번호판의 배경이 모두 다른 부분과 차이를 가지고 있다는 점을 이용하여 번호판 영역 추출을 위하여 기존의 방법과 달리 Color 정보를 이용하였다. Edge 검출이나 Gray level의 변화값을 이용하지 않고 Color 정보를 이용함으로써 번호판이 구부러진 영상이나 Noise를 통해서 훼손된 영상, Contrast가 낮은 영상에도 영역 추출에 강한 성능을 나타내었다. Camera를 통해서 획득된 RGB 영상을 YCbCr Format으로 바꾸고 그 중 Cb와 Cr 정보를 이용하여 번호판 영역을 검출하고 인증과정을 거쳐서 추출된 영상이 실제로 번호판 영상인지를 확인하는 단계를 거쳤다. 실험을 통하여 주간, 야간 및 훼손되거나 Noise가 많이 발생한 영상에서도 강한 성능을 나타냄을 볼 수 있었다.
-
본 논문에서는 그룹화 블록스네이크와 영상분할을 이용하여 다차선을 검출하고 컬러 정보를 기반으로 차량 후면에 위치하는 미등과 브레이크등을 인식, 저속 주행환경에서의 다차선 및 전방차량을 인식하는 알고리즘을 제안하였다. 제안한 알고리즘에서는 기울기 값과 명암도 값으로 기초 블록을 얻은 뒤, 차선의 가능성이 큰 블록을 탐색하여 영상분할을 시행한다. 영상 분할에서 잡음 블록들을 제거하여 차선일 가능성이 가장 높은 블록들만을 검출하고, 그룹화 블록스네이크를 이용하여 차선을 검출하도록 하였다. 또한 전방 차량인식을 위해 미등과 브레이크등의 컬러 특징을 이용하여 후보 영역을 분할한 후, 미등과 브레이크등의 패턴의 기하학적 특징과 위치적 특징을 이용하여 한 쌍의 미등 혹은 브레이크등을 탐지하도록 하였다. 탐지된 양쪽 등의 위치정보를 이용하여 전방차량의 위치를 측정 할 수 있다.
-
In this paper, a new license plate recognition method using the morphological size distribution functions and color images is proposed. The proposed method consists of two steps. The first step is license plate extraction process using the plate color and step edge information in the license plate. The second step is the extraction of character feature vectors using the morphological size distribution functions and character recognition process using the MLP(multilayer perceptron). By the use of morphological size distributions functions, the error that may occur during the character region extraction process is lessened and the recognition performances are improved by the decrease of feature vector dimension.
-
본 논문에서는 하이브리드 패턴벡터를 이용하여 자동차의 고유 마크와 차량 번호를 실시간으로 인식하는 알고리즘을 제안하였다. 제안한 알고리즘에서는 차량 입력 영상에서 차량의 마크와 번호판의 수평 및 수직 명암값 빈도수 변화를 이용해 마크와 번호판 영역을 추출한다. 또한, 추출된 알고리즘으로부터 수평 수직 패턴을 적용해 자동차의 마크를 인식하고 하이브리드 패턴벡터를 이용하여 번호판의 문자 및 숫자를 인식하도록 하였다. 제안한 자동차 마크 및 번호판 추출 과정에서는 마크와 번호판 영역의 문자와 배경이 뚜렷하게 구별되는 상대적인 크기의 특성과 수평 및 수직 빈도수와 패턴 벡터를 사용하여 마크 및 번호판 영역을 추출, 인식하도록하였다. 제안한 방법들을 적용한 결과, 차량 번호판의 크기에 관계없이 잡음에 영향을 받지 않고 차량의 종류와 번호를 실시간으로 처리할 수 있으며 차량번호판 추출 및 인식뿐 아니라 차량의 마크 추출 가능성을 제시하였다.
-
MPEG-4 Parametric Coding 중 저 비트율로 음성신호를 부호화하는 HVXC(Harmonic Vector excitation Ending)의 복호화 모듈인 LSP 합성필터와 무성음 합성부, 유성음 합성부를 VHDL을 이용하여 구현하였다. MPEG-4 HVXC의 복호화 과정은 코드북을 이용하여 LSP 계수, VXC signal, 그리고 Spectral Envelop이 복호화 되어 각각 LSP 역필터, 무성음과 유성음 합성단을 통과하여 LPC계수와 유,무성음 여기신호로 변환된 후 LPC 합성필터링 과정을 거쳐 최종적으로 음성신호를 출력시킨다. LSP inverse filter에서 사용되는 cosine함수값을 위하여 Table based Approximation을 이용하여 적은 양의 Table 값을 사용하여 정확하고 고속의 cosine 연산을 수행하였다. VXC 복호화 과정에서는 신호의 중복성을 제거하는 Hidden Address in LSH 방법을 사용하여 코드북의 크기를 줄였다. 유성음 합성단에서는 IFFT 모듈을 이용하여 연산속도를 증가 시켰다. 최종적으로 위와 같이 구현된 시스템을 Simulation을 통해 Software 검증을 하였다.
-
MPEC Audio Layer-III(MP3)알고리듬은 복호화기에 비해 부호화기가 월등히 많은 연산량을 가지고 있는 비대칭 구조를 가지고 있다. MP3 부호화기의 대부분의 연산량은 복잡한 초월함수 연산이 포함되는 심리음향모델과 반복 루프 과정을 수행하는 비선형 양자화와 비트 할당과정 이 차지한다. 본 논문에서는 MP3 부호화기의 실시간 구현을 위한 알고리듬 레벨의 최적화를 수행하였다. MP3 부호화기의 연산량을 줄이기 위해 심리음향모델을 간략화하고 반복 루프의 회수를 최소화할 수 있는 방법을 제안하였다. 프레임당 한 그래뉼의 심리음향모델 정보를 계산하여 한 프레임 내에서의 심리음향모델 정보를 추정함으로써 연산량을 45% 이상 감소시켰다. 또한 외부 반복 루프의 반복 회수를 줄이기 위하여 외부 반복 루프의 반복에 따른 스케일 팩터(Scale Factor) 및 양자화 스탭의 증가 패턴을 관찰하고 최적화된 스캐일 팩터 증가 방법을 제안하였다. 제안된 고속화 방법은 주관적 음질 평가를 통해 성능을 검증하였다.
-
본 논문에서는 32비트 MCU RISC 프로세서를 사용하여 MPEC 오디오 복호화기를 소프트웨어의 구현하였다. 구현된 MPEC 오디오 복호화기는 MPEC-2 Layer-III (MP3)와 MPEC-2 AAC 로 구성된다. 프로그래밍 가능한 소프트웨어로 구현하여 향후 성능 개선이나 새로운 기능을 추가할 수 있는 유연성을 극대화하였다. 복호화기 구현은 구현 시간과 비용을 고려하여 직접 어셈블리를 코딩하는 대신 최적화된 C 코드를 사용하여 컴파일하는 방법을 선택하였다. 이때 발생할 수 있는 성능 저하 요소들을 줄이기 위해 추가의 최적화 과정을 수행하여 성능을 개선하는 방법을 제시하였다. 구현된 복호화기의 출력 음질은 ISO 13818-4 compliance test 결과 Full compliance 를 만족하였다. 또한 연산량 최적화 결과 MP3 와 AAC 테스트 비트열에 대해 모두 35 MHz 이하의 동작 주파수로 동작이 가능함을 확인하였다.
-
본 논문에서는 허프만 코딩의 기본 원리인 이진트리로부터 생성된 효율적인 일차원 검색테이블 구성과, 프로세싱 효율을 증가시키기 위한 수치연산 기법의 도입을 통하여 도출된 효율적인 허프만 디코딩 방법을 제시한다. 제안된 방법에서는 허프만 코드화 된 비트스트림으로부터 읽어 들인 비트 데이터를 직접 이진트리를 검색하기 위한 주소연산에 적용함으로써, 기존의 이진트리 검색을 위하여 수행되던 비교 및 분기문의 제거를 가능토록 하였다. 본 논문에서 제안하는 허프만 디코딩 기법은 기존의 비교 및 분기구분에 의하여 수행되던 허프만 디코딩 기법대비 30%이상의 검색속도 증가 및 이진트리 방식의 검색을 수행하기 위하여 필요로 하는 검색테이블에서 존재하던 데이터 및 노드간의 연결주소를 저장하기 위하여 사용되던 메모리 공간을 효율적으로 제거할 수 있는 일차원 검색테이블을 구성함으최써, 기존 방법대비 1/3의 메모리 공간만을 사용하도록 하였다. 제안된 허프만 디코딩 기법의 성능평가를 위하여 MPEG-2 AAC의 허프만 디코더에 적용한 결과 기존의 순차검색방법에 의한 디코딩 기법대비 198%의 성능향상 결과를 확인할 수 있었다.
-
본 논문에서는 MPEG-2 AAC 디코더의 DSP구현에 관한 연구결과로서 IS0/1EC 13818-7 표준에 의거 구현된 MPEC-2 AAC 디코더의 각 세부 기능블럭들의 구성 및 동작원리에 대하여 요약 기술하고. DSP연산에 최적화된 연산구조의 연구를 바탕으로 16bit 고정소수점 연산구조를 가지는 DSP상에서 구현된 MPEG-2 AAC 디로더의 시스템의 하드웨어 및 소프트웨어 구성에 관하여 간략한 기술하였다. 구성된 디코더의 성능평가를 통하여 MPEC-2 AAC 비트스트림을 디코딩하기 위하여 필요로 하는 연산량 및 소요 메모리의 양을 측정하고, 디코더 성능의 중요 척도인 음질평가를 수행하였다. 수행방법으로서 conformance test에 의거하여 PSNR을 측정함으로써 객관적인 성능 지표의 제시와 함께, 주관적인 음질 평가도 병행하여 수행하였다.
-
본 논문에서는 기존의 Caussian Mixture Model을 이용한 실시간문맥독립화자인식시스템의 성능을 향상시키기 위하여 화자검증시스템에서 좋은 결과를 나타내는 유사도정규화 ( Likelihood Normalization )방법을 화자식별시스템에 적용하여 시스템을 구현하였으며, 인식실험한 결과에 대해 보고한다. 시스템은 화자모델생성단과 화자식별단으로 구성하였으며, 화자모델생성단에서는, 화자발성의 음향학적 특징을 잘 표현할 수 있는 GMM(Gaussian Mixture Model)을 이용하여 화자모델을 작성하였으며. GMM의 파라미터를 최적화하기 위하여 MLE(Maximum Likelihood Estimation)방법을 사용하였다. 화자식별단에서는 학습된 데이터와 테스트용 데이터로부터 ML(Maximum Likelihood)을 이용하여 프레임단위로 유사도를 계산하였다. 계산된 유사도는 유사도 정규화 과정을 거쳐 스코어( SC)로 표현하였으며, 가장 높은 스코어를 가지는 화자를 인식화자로 결정한다. 화자인식에서 발성의 종류로는 문맥독립 문장을 사용하였다. 인식실험을 위해서는 ETRI445 DB와 KLE452 DB를 사용하였으며. 특징파라미터로서는 켑스트럼계수 및 회귀계수값만을 사용하였다. 인식실험에서는 등록화자의 수를 달리하여 일반적인 화자식별방법과 프레임단위유사도정규화방법으로 각각 인식실험을 하였다. 인식실험결과, 프레임단위유사도정규화방법이 인식화자수가 많아지는 경우에 일반적인 방법보다 향상된 인식률을 얻을수 있었다.
-
실제 화자 인증기를 설계함에 있어서 발생하는 가장큰 문제는, 적은 Enrollment data로 화자 모델이 만들어 지므로 화자 인증기의 성능이 시간이 지남에 따라 굉장히 줄어들게 되는 것과, 미리 훈련된 데이터 만으로 Threshold를 설정함에 따라 차후 실제 사용 시에 발생하는 변이를 고려하지 못하여 역시 성능 저하의 문제를 발생시킨다는 것이다. 위의 문제를 해결하기 위해 이 논문은 화자 모델을 구성하는데 있어 MAP 방법을 적용하고, threshold를 Resetting하는 방법을 적용했다. 본 논문에서 제안한 방법으로 HTER값이 23%정도 줄어듦을 보여준다.
-
최근 음싱인식이 인간과 기계 사이의 자연스러운 통신을 위한 가장 중요한 수단으로 인식되어 이와 관련된 연구가 구준히 이루어져 왔으며, 일부 응용 분야에서는 성공적으로 적용되고 있다. 하지만, 좀 더 다양한 응용분야에 적용하기 위해서는 실제 환경에 존재하는 여러가지 주변잡음에 강인한 특성을 가지는 인식 시스템이 요구된다. 본 연구에서는 음성인식 시스템을 휴대전화에 적용하기 위해 도메인 적응 기법, LDA (Linear Discriminant Analysis) 기법 등을 도입하여 시스템 DB의 크기를 줄이고 잡음에 대한 강인성을 높이고자 하였으며, HMM (Hidden Markov Model)에 기반한 음싱인식 시스템을 사용하여 각 기법의 적용에 따른 인식성능을 평가하였다.
-
본 연구에서는 화자에 따라 서로 다른 성도의 길이에 의해 발생하는 음성인식 시스템의 성능 저하를 줄이기 위하여, VTN(Vocal Tract Normalization)을 음성인식 시스템에 적용하고, 주소 인식 실험을 통하여 인식 성능을 평가하였다. 또, VTN을 CMN과 동시에 적용하여 인식 실험을 하였다. 실험에서는 화자간 성도길이의 차이를 반영하기 위하여 13개의 Warping 계수에 대해 필터 뱅크를 이용한 선형 Warping 방법을 적용하였다. 실험결과, Baseline 인식 시스템에 비하여 VTN을 적용하면, WER(Word Error Rate)이 1.24% 감소하였고, CMN과 VTN을 동시에 적용한 실험에서는 Baseline 인식 시스템과 비교하여 WER이 0.33% 감소 하였지만 VTN을 적용한 실험결과와 비교하면 오히려 0.91% 증가하였다.
-
본 논문에서는 마이크 입력레벨 조절기의 구현과 이를 이용한 인식률의 향상을 다룬다. 마이크를 통한 음성 입력이 너무 작거나 너무 크면 인식률에 직접 영향을 미치므로 인식에 적합한 입력레벨로 조절할 필요가 있다. 자동 입력레벨 조절기의 구현을 위해 고려할 사항을 연구했으며, 이를 통해 PC환경의 입력레벨 조절기를 구현했다. 수집된 음성 데이터베이스는 켑스트럼 평균차감법(CMS)을 이용하여 채널왜곡을 보상했으며, 구현된 조절기를 이용하여 실험한 결과, 이용하지 않은 경우에 비해 약 50%의 오인식율을 줄일 수 있었다.
-
본 논문은 한국어 음성에 대한 한국어 단어의 음소단위 분할을 목적으로 하였다. 대상 단어는 원광대학교 phonetic balanced 452단어 데이터 베이스를 사용하였고 분할 단위는 음성 전문가에 의해 구성된 44개의 음소셋을 사용하였다. 음소를 분할하기 위해 음성을 각각 프레임으로 나눈 후 각 프레임간의 스펙트럼 성분의 유사도를 측정한 후 측정한 유사도를 기준으로 음소의 분할점을 찾았다. 두 프레임 간의 유사도를 결정하기 위해 두 벡터 상호간의 유사성을 결정하는 방법중의 하나인 Lukasiewicz implication을 사용하였다. 본 실험에서는 기존의 프레임간 스펙트럼 성분의 유사도 측정을 이용한 하나의 어절의 유/무성음 분할 방법을 본 실험의 목적인 한국어 단어의 음소 분할 실험에 맞도록 수정하였다. 성능평가를 위해 음성 전문가에 의해 손으로 분할된 데이터와 본 실험을 통해 얻은 데이터와의 비교를 하여 평가를 하였다. 실험결과 전문가가 직접 손으로 분할한 데이터와 비교하여 32ms이내로 분할된 비율이 최고 84.76%를 나타내었다.
-
마이크로폰을 배열을 이용한 음성개선 기법 중에서 저주파 영역에서의 높은 상관성과 고주파 영역에서의 spatial aliasing을 동시에 고려하기 위하여 대수적인 선형 마이크로폰 배열을 사용하고 웨이브렛 도메인에서의 Wiener 필터에 기반한 postfiltering을 수행하는 방법이 제안된 바 있는데[l], 본 논문에서는 이 방법의 문제점을 분석하고 해결방안을 제시하였다. 제안한 알고리즘을 사용하여 시뮬레이션한 결과, 마이크에 입력되는 음성신호의 SNR이 0dB일 때와 l0dB일 때, 기존의 알고리즘에 비해 약 1.7dB와 2.5dB의 성능개선이 있었으며, 청취실험을 통해서도 음질의 향상을 확인할 수 있었다.
-
본 논문에서는 DRCT 기지국에서 사용하기 위한 4채널 음성 코덱과 반향제거기를 TMS320VC5402 DSP 칩을 이용하여 실시간 구현하였다. 코드 최적화를 통하여 4채널 G.726 ADPCM 코덱과 반향제거기를 76MIPS의 연산량 이내로 실시간 동작 가능하도록 구현하였다. 본 논문에서 구현한 ADPCM 코덱은 ITU-T G.726 Appendix II에서 정의된 모든 테스트 샘플로 검증하였다. 반향제거기는 모의실험 결과 반향신호를 약 20dB 정도 감쇠시켰으며, 실시간 시스템 통화시험을 통해 전체시스템의 안정적인 동작을 확인하였다.
-
신호 대 잡음비가 매우 낮은 수중 음원을 탐지하기 위해서는 많은 센서를 갖는 견인 배열 시스템을 운용하여야 한다. 그러나 이러한 경우 수백 미터에 이르는 배열을 견인함이 끌고 다닐 때 파도와 같은 해수면의 움직임과 견인선의 기동 형태에 따라 원하는 배열 형태를 항상 유지할 수 없다. 그러므로 본 논문에서는 실제 수 중 환경에서 견인되는 배열의 왜곡된 형태를 시간적으로 뿐만 아니라 공간적으로 통합된 센서의 움직임 근거로 한 상관 형태를 잘 표현한 ""Paidoussis"" 방정식을적용하여 이 방정식의 간단화된 형태인 수차 모형(Water pulley)배열을 협대역 목표물 탐지에 이용하였다. [1][2][8] 수차 모형 구조의 배열을 이용하여 사상 기법을 적용하면 수차 모형의 왜곡 특성으로 인해 센서간 간격이 비균일성을 가지는 가상의 선형 배열이 형성되어 진다. 본 논문에서는 사상 기법에 의해 생성된 가상의 선형 배열을 토대로 합성 어패처 방식의 일종인 FFTSA(Fast Fourier Transform Synthetic Aperture) 기법을 이용하여 센서 배열의 입사각 추정 성능에 중대한 영향을 부여하는 코히어런스 주기에 따른 추정 성능의 변화 및 견인함의 이동 경로 변화에 따른 변동 경로 주기에 따른 성능 변화를 분석하였다.
-
본 논문은 음성 및 음악을 위한 새로운 4kbps 다중 모드 하모닉 변환 여기 부호화 방법을 제안한다. 제안된 부호화방법은 음성/음악 분류기에 의해 분류된 신호를 각각 하모닉-잡음 여기모델과 MLT 여기모델로 부호화한다. 하모닉-잡음 여기모델에서는 전이구간과 유/무성음 혼합신호의 모델링오차 개선을 위해 MP(Matching Pursuit)방법과 혼합된 잡음스펙트럴을 표현하기 위한 캡스트럽 LPC 잡음 모델, 빠른 정현파 합성법을 제안한다. 음악에서는 비트할당 효율을 높이기위한 LP 적응 피크 분석을 적용한 MLT(Modulated Lapped Transform) 부호화 방법을 제안한다. 제안된 방법을 적용한 4kbps 음성부호화 방법은 전이구간에서의 향상된 모델링 구조를 보여주었으며, 주관적음질 평가 8kbps QCELP 보다 MOS 0.2 정도 향상된 결과를 얻었다.
-
본 논문에서는 plasma display panel에서 제한된 개수의 subfield를 사용하여 gradation을 표현함으로써 발생하는 dynamic false contour 등의 화질 열화를 개선할 수 있는 방법에 관하여 고찰한다. 먼저, 화질의 최종판단자인 인간 시각시스템의 특성과 subfield의 밝기 변화 특성 등을 고려하여 제한된 개수의 subfield로 최적의 화질을 얻을 수 있는 subfield pattern을 제시한다. 또한, 비교적 적은 양의 계조값 변화에서도 견실한 특성을 보일 수 있는 방법을 제시하였다.
-
In this paper, we present a novel method to solve the inevitable RGB beam mismatch problem in projection TV receivers. Conventional methods solve the mismatch problem by directly controlling the cathode ray tube (CRT) using the convergence yoke (CY). Unlike conventional methods, the proposed method is based on digital video processing using image warping techniques. Firstly RGB beam projection paths are mathematically modeled. Then based on the modeling, the input video signal to CRT is prewarped so that RGB beams are landed at the same point on the screen. Since the proposed method is based on a digital video processing instead of using CY, it can outperform the conventional method in terms of quality and cost. The experimental results with a real 60´projection TV demonstrate that the proposed method indeed produces converged images on the projection TV screen.
-
본 논문에서는 검출기의 반응 특성을 선형화 모델링 하여 정규화 할 수 있는 방법을 제안한다. 디지털 의료영상 시스템에서 X-선을 검출하는 검출기의 반응 특성이 모든 검출기마다 다르기 때문에 이 특성을 쉽고 빠르게 정규화 하는 방법이 필요하다. 본 논문에서는 균일한 피사체에 X-선 조사량의 비율을 다르게 하여 두 번 찍은 영상으로 검출기의 반응 특성을 정규화 한다. 실험 결과 일정한 두께의 납 평판에 조사량을 달리하여 촬영한 두 개의 결과 영상을 가지고 검출기의 반응 특성을 보정하면 매우 안정된 결과 영상을 얻을 수 있다.
-
영상에 포함된 잡음은 시각적인 문제를 일으킬 뿐만 아니라, MPEG이나 H.263과 같은 영상 압축 시스템의 부호화 효율을 떨어뜨린다. 따라서 영상 압축 시스템의 입력으로 이러한 잡음이 포함된 신호가 들어갈 때, 잡음 제거 필터를 사용하여 잡음을 제거한 후 영상 압축을 하는 것이 시각적인 면에서나 압축 효율적인 면에서 매우 효과적이다. 본 논문에서는 이웃한 4개의 화소값을 참조하여 잡음의 존재 여부를 판단하고, 판단 결과를 이용하여 선택적으로 잡음을 제거하는 적응형 십자형 중간값(median) 필터를 제안한다. 제안된 방법을 이용하면 전체 영상에 걸쳐 필터를 이용하는 방법에 비해 계산량이 크게 줄고, 영상의 필터 처리후에 나타나는 뭉개짐(blurring) 현상을 줄일 수 있다. 또한 잡음이 처리된 영상을 시간방향으로 Look-up Table에 따른 IIR필터를 통과시킴으로써 시간상으로 존재하는 잡음을 제거하여 동영상의 주관적 화질을 향상시킬 수 있다.
-
Through matched filtering synthetic aperture radar (SAR) produces high-resolution imagery from data collected by a relative small antenna. While the impulse response obtained by the matched filter approach produces the best achievable signal-to-noise ratio, large sidelobes must be reduced to obtain higher-resolution SAR images. So, many enhancement methods of SAR imagery have been proposed. As a deconvolution method, the phase-extension inverse filtering is based on the characteristics of the matched filtering used in SAR imaging. It improves spatial resolution as well as effectively suppresses the sidelobes with low computational complexity. In the phase-extension inverse filtering, the impulse response is obtained from simulation with a point target. But in a real SAR environment, for example ERS-1, the impulse response is distorted by many non-ideal factors. So, in the phase-extension inverse filtering for a real SAR processing, the magnitudes of the frequency transfer function have to be compensated to produce more desirable results. In this paper, an estimation method to obtain a more accurate impulse response from a real SAR image is studied. And a compensation scheme to produce better performance of the phase-extension inverse filtering is also introduced.
-
본 논문은 불완전한 휘도/색신호 분리로 인해 복조된 NTSC 칼라 TV신호의 휘도와 색차신호의 경계(edge)에서 나타나는 dot 패턴을 제거하는 2차원 필터에 대한 것이다. 제안된 필터는 휘도와 색차신호의 천이영역 검출신호와 dot 패턴 검출신호에 따라 직렬(cascade)로 연결된 수평-수직방향 저역통과필터의 차단주파수를 조절함으로써 dot 패턴을 감소시킨다. 제안 방식의 성능을 검증하기 위하여 현재 가장 많이 사용되는 NTSC 디코더 칩인 BT835과 SAA7113H을 이용하여 복조된 휘도와 색차신호에 적용한 결과 영상신호가 변화를 갖는 경계 영역에서 발생한 dot 패턴과 불완전한 복조로 인해 발생하는 평탄영역에서의 dot 패턴이 제거되었음을 확인할 수 있었다.
-
본 논문에서는 시공간 3차원 잡음 제거기의 ASIC 설계 및 구현결과를 소개한다. 구현된 잡음 제거기는 휘도와 색차신호에 대한 잡음제거 필터들로 구성된다. 휘도에 적용한 필터는 A-MEAN 필터와 A-LMMSE 필터를 결합한 형태의 필터를 시공간적으로 연결한 필터로써, 특히 시간방향으로 IIR 필터 형태를 갖도록 설계하여 평탄한 영상영역에서 보다 강한 잡음 제거 효과를 갖도록 하였다. 한편, 색차신호에 대해서는 5탭 길이를 갖는 1차원 A-MEAN 필터를 적용하였다. C-언어를 이용한 시뮬레이션을 통해 설계된 잡음 제거기의 성능을 평가하였고, VHDL과 C-언어에 의한 시뮬레이션 결과를 비교하여 VHDL-코드의 검증을 수행했다. 구현과정은 시뮬레이션과 논리합성 등 전반부 설계를 Synopsys 툴을 이용하여 수행했고, 레이아웃 등 후반부 설계를 Cadence 툴과 Apollo 툴을 이용하여 수행했다.
-
잡음에 의해 훼손된 영상 신호를 복원할 때 쓰이는 Wiener filter는 국부영역의 잡음 분산과 신호 분산을 가지고 적응적으로 필터의 파라미터를 조절한다. 그러나 기존의 Wiener filter는 고정된 필터 마스크를 사용함으로써, 평탄 영역의 잡음을 크게 제거하면, 에지 부분의 잡음이 살고, 에지 부분의 잡음을 제거하면, 평탄영역의 잡음이 사는 특성이 있다. 본 논문은 Kirsh mask로 에지와 그 방향성을 판별한 후, 에지 부분의 잡음을 제거하면서 평탄 영역의 잡음도 동시에 제거하기 위해 가변적인 필터 마스크를 사용했으며, 잡음에 의해 훼손된 방향성 정보를 살러 주기위해 필터 마tm크와 훼손된 영상 이미지에 방향성 정보를 추가했다. 제안된 방법으로 실험한 결과 주관적 비교에서 에피 부분이 잡음을 제거하고 방향성을 살렸으며, PSNR을 이용한 객관적 비교에서도 기존알고리즘보다 개선된 성능을 보였다.
-
이 논문에서는 미디언 필터의 선형 조합을 통해 임의의 주파수 특성을 갖는 필터 구조와 그 설계 방법을 제안한다. Linear-phase FIR 저대역통과 필터의 홀수번째 필터 계수의 부호를 바꾸면 FIR 고대역 통과 필터를 얻을 수 있는데, 이것은 필터 계수의 부호가 모두 양수인 두 개의 부분 필터의 차와 같은 모양을 가진다. 이 과정을 일반화하여 비선형 필터에 적용하면 LCWM(linear combination of median filter)필터는 가중 미디언 부필터(sub-filter)의 선형 조합으로 구성된다. 이는 선형 대수학에서 어떤 공간상의 임의의 벡터가 그 공간의 기저 (basls) 벡터들의 선형 조합으로 표현된다는 사실과 유사하다. 따라서 부필터의 필터 계수를 기저 벡터로이용하여 얻어지는 기저 행렬과 필터의 주파수 특성을 조절하는 계수 벡터를 구함으로써 LCWM 필터를 설계할 수 있다. 제안된 필터 설계 방법을 이용하면 특정 주파수 특성을 가지는 FIR 필터와 유사한 특성을 갖는 비선형 필터 구조를 만들 수 있다. LCWM 필터는 고대역 통과, 저대역 통과, BP(band-pass), BS(band-stop)의 임의의 주파수 특성을 가지는 필터로 설계될 수 있음이 실험을 통해 확인되었다.
-
본 논문에서는 비월주사 방식의 영상을 순차주사 방식의 영상으로 변환하기 위한 deinterlacing 기법에 관하여 고찰한다. 먼저, 공간 영역 상에서 수행되는 기존의 deinterlacing 기법 중에서 우수한 성능을 보이는 것으로 알려진 ELA방법의 단점을 보완하기 위하여 적응적 ELA 알고리즘을 제안하였다. 기존의 ELA방법은 수평 edge를 검출할 수 없어 수평 edge 성분을 포함하는 화소 값은 원치 않는 값으로 보간 되는 결과를 가져왔다. 이를 개선시키기 위해 수평 edge를 효과적으로 검출하는 방법을 제안하고, 수평 에지 부분을 적절히 보간할 수 있는 적응적인 필터를 제안한다. 그 결과 수평 edge 부분에서의 개선으로 기존의 ELA 방법보다 더 나은 성능을 얻었다.
-
본 논문에서는 광대역 WLL신호환경에서 동작하는 스마트 안테나 시스템의 역방향 채널에서의 시스템 성능 분석을 제시하였다. 이 논문에 보여지는 모든 결과는 현재 상용화 된 단말기로부터 수신한 실제 데이터로부터 얻어졌다. 웨이트 벡터로부터 계산되어진 빔패턴과 BER(Bit Error Rate)은 실내와 실외 환경 실험에서 관찰되었다. 실험의 결과로, 제안되어진 스마트 안테나 시스템은 실외와 실내 신호 환경 모두에서 향상된 성능을 제공한다는 결론을 얻었다.
-
The performance of a coherent rake receiver of DS-CDMA systems is significantly affected by the accuracy of channel estimation. The performance of the channel estimator can be improved by employing a channel estimation filter (CEF) whose impulse response is adjusted according to the channel condition. In this paper, we consider the design of an adaptive channel estimator for DS-CDMA systems with a pilot channel. The proposed channel estimator estimates the channel condition, which can be performed without haying exact a priori information on the operating condition. The estimated channel condition adjusts the impulse response of the CEF. Numerical results show that the use of the proposed channel estimator can provide BER performance quite robust to a wide range of channel condition.
-
본 논문에서는 다중 대역통과 표본화 이론에 기반하여 1.9GHz IS-95신호와 2.2GHz IMT-2000 신호를 하나의 ADC(analog to digital converter)를 사용하여 동시에 표본화하고 디지털 처리를 수행하는 방법을 제안하고 실험을 통하여 검증하였다. 일반적인 방법으로는 본 논문에서 고려하는 두 신호를 동시에 표본화하기 위해서는 표본화 주파수가 최소한 1GHz 이상의 고속의 ADC를 사용해야 한다. 그러나 현재 ADC의 기술은 광대역의 신호를 직접 더지털화하기에는 아직 미흡하다. 반면에 대역통과 표본화 이론은 기존의 상용 ADC와 기콘의 RF 시스템을 이용하여 다른 대역에 위치한 두 신호를 통합처리 할 수 있는 기반을 제공하고 있다. 본 논문에서는 이러한 대역통과 표본화 이론에 기반을 두고 상용 ADC를 사용하여 표본화 시스템을 구현하여 IS-95신호와 IMT-2000 신호를 표본화하고 이를 컴퓨터에서 디지털 필터를 이용하여 두 신호를 분리하는 실험을 통하여 다중 대역통과 표본화의 적용 가능성을 검증하였다.
-
본 논문에서는 스마트 안테나를 적용하여 서로 다른 대역폭(1.25MHz, 5Mhz)과 서로 다른 환경(rural, urban)에서 W-CDMA 시스템의 성능을 분석하였다. 먼저 스마트 안테나 시스템의 성능을 분석하기 위해서 시·공간 상관특성을 갖는 채널이 필요하다. 이를 위해 시간 정보를 고려하기 위해 시변 선형 필터로 모델링하였고, 공간 정보를 고려하기 위하여 배열 응답 벡터를 삽입하였다. 이 때 공간적으로는 일정량의 각도 퍼짐을 갖는 부-다중경로 성분으로 구성된 한 개의 반사파가 한 방향으로부터만 수신된다고 가정하였다. 또한 한 칩 내에 들어오는 다중 경로 성분을 분리하여 가장 큰 신호 성분만을 찾아내어 원하는 사용자의 신호로 사용하는 방법으로 모의 실험을 실행하였다. 모의실험 결과, 협대역 CDMA를 사용하는 스마트 안테나 시스템보다 광대역 CDMA를 사용하는 스마트 안테나 시스템이 더 나은 성능을 보임을 확인할 수 있었다. 또한 스마트 안테나는 2D-RAKE receiver를 사용했을 때 urban area에서 보다 더 효과적임을 확인할 수 있었다.
-
In the W-CDMA system, cell search is one of the imporant functions of the mobile station searching for a cell and achieving spreading code and time synchronization to its downlink scrembling code. For the methods of cell search to optimize codes, three stages are considered: 1) slot synchronization, 2) frame synchronization, and 3) scrambling code identification. Channels for cell search are Primary Synchronization Channel (P-SCH), Secondary Synchronization Channel(S-SCH), and Common Pilot Channel (CPICH). In this paper, cell search is analyzed based on simulation. Rake receiver provides improvement of Performance as an increase of bandwidth because there are more available multipaths. In this paper, the performance of W-CDMA system employing RAKE receiver is evaluated by computer simulation over the types of ITU_R wideband channel model and spreading rate. The result shows that the performance of CDMA adapting RAKE receiver is improved by the increase of multipath components in equal level of the received power.
-
본 논문에서는 비선형 왜곡이 있는 환경에서 QAM 신호의 수신 성능을 개선시키기 위한 비선형 왜곡 제거 알고리즘을 제안한다. 비선형 왜곡의 효과를 줄이기 위하여 MMSE-DFE 수신기의 역방향 필터에 비선형 탭을 포함시키고 등화기 출력에서 추가적인 처리를 통해 남아 있는 잔여 비선형 왜곡을 제거한다. 비선형 왜곡이 있는 환경에서 MMSE-DFE 수신기와 제안된 수신기의 성능을 분석하고 전산 모의 실험을 통해 검증한다. MMSE-DFE 수신기와 비교한 제안된 수신기의 SNR 이득은 QAM 신호의 신호점 수가 커지고 비선형 왜곡이 커질수록 증가한다.
-
본 논문에서는 고출력 증폭기와 송신 펄스 성형 필터로서 Raised Cosine filter (RCF)를 사용하는 OFDM 시스템에서 비선형 왜곡 보상을 위한 고정점 반복 사전왜곡기를 제안하고 이의 성능을 검증하였다. 제안된 사전왜곡기는 RCF 전단에 위치하나 이의 Zero-Intersymbol Interference 성질을 이용하여 단지 고출력 증폭기에 의한 기억성이 없는 비선형 왜곡만을 보상하는 효율적인 구조이다. 또한 성능 검증을 위해 필터 전단에 위치하는 사전왜곡기와 증폭기 전단에 위치하여 증폭기의 비선형 왜곡만을 보상하는 사전왜곡기를 비교하여, 필터에서 ISI를 제거한 경우에는 사전왜곡기의 위치에 관계없이 비선형 왜곡을 효과적으로 보상할 수 있다는 점을 모의실험을 통해 확인하였다.
-
This paper proposes LUT based predistorter using interpolater to reduce nonlinear distortion which was generated by HPA. We minimized performance degradation from the reduced LUT size with linear interpolation. We updated LUT using LMS algorithm using input data as reference data. As a result, it is shown that when the size of the LUT is 8, linear interpolation is the most outstanding performance in the view of performance and H/W complexity.
-
An adaptive sub-optimal method using a preset threshold for combining partial transmit sequence (PTS) of an orthogonal frequency division multiplexing (OFDM) signal is presented. The results show that adaptive sub-optimal method reduces the 0.1% PAP by 3.4dB, while iterative flipping method reduces it by 3dB and PTS reduce it by 4.1dB. The complexity of adaptive sub-optimal method is 2.4% of that of PTS method for M=8.
-
본 논문에서는 3GPP에 규격으로 채택된 전송 다이버 시티 기법들 중에 이상적인 상황에서 가장 우수한 성능을 갖는 폐쇄루프 전송 다이버시티 (CLTD : Closed Loop Transmit Diverstiy) 기법과 선형 사전필터의 조합을 통해 MISO 시스템에서 보다 우수한 성능의 전송 다이버시티 기법을 제안하고 이에 대한 성능을 분석하였다. 또한 사전필터의 최적의 필터 계수 값을 사용하여 다이버시티이득을 최대화하였고 이에 대한 성능을 분석한 결과 CLTD 기법보다 월등히 우수한 성능을 확인하였다.
-
In this paper, an efficient approach to classification of transient and harmonic disturbances in power systems is proposed. First, the Stop-and-Go CA CFAR Detector is utilized to detect a disturbance from the power signals which are mixed with other disturbances and noise. Then, (i) Wigner Distribution, SVD(Singular Value Decomposition) and Fisher´s Criterion (ii) DWT and Fisher´s Criterion, are applied to extract an efficient feature vector. For the classification procedure, a combined neural network classifier is proposed to classify each corresponding disturbance class. Finally, the 10 class data simulated by Matlab power system blockset are used to demonstrate the performance of the proposed classification system.
-
센서 array 신호처리에서 DOA(direction of arrival)의 추정에 사용되고 있는 root-MUSIC, TLS-ESPRIT 등과 같은 고해상도 스펙트럼 추정 기법들은 과다한 연산량으로 인하여 실시간 구현이 어렵고, 신호들의 DOA가 근접한 경우에서는 추적 성능이 매우 불안정하게 된다. 이러한 문제점에 대한 대안으로 여러 형태의 부공간 추적 개념을 사용하는 수치기법이 제안되어 왔다 [2], [4], [6]. 본 논문에서는 이들 부공간 추정 기법들을 LS-ESPRIT 기법에 접목하여 그 성능을 비교하고, 개선 방안을 제시하였다.
-
본 연구에서는 MPEG 시스템의 동기화 방식에 대해 조사하고, 이를 바탕으로 특정 어플리케이션 개발에 적용 할 오디오/비디오 동기화 시스템을 구현하고자 한다. 먼저 비디오 신호와 오디오 신호를 각각 MPEG-1 시스템의 비디오 압축 방식과 G.722 팡대역 음성 부호화 방식을 이용하여 부호화하고, 부호화된 두 미디어간의 동기화를 위해 시간 정보를 삽입하여 최종적으로 하나의 비트스트림으로 다중화 하고, 다중화된 비트스트림으로부터 오디오/비디오 신호를 각각 분리하여 재생할 수 있음을 보였다.
-
OFDM(orthogonal frequency division multiplexing) 시스템은 유효심볼의 뒷부분 일부를 복사하여 유효심볼 이전에 미리 전송하는 보호구간을 이용하여 다중경로에 의한 왜곡을 줄일 수 있다. 그러나, 유효심볼의 시작점을 정확히 판단하더라도 열악한 다중경로 또는 프리-고스트(pre-ghost) 채널의 영향으로 인해 심볼간 간섭(inter-symbol interference)이 발생한다. 본 논문에서는 다중경로 환경하의 기존 시스템에서 발생하던 심볼간 간섭을 제거할 수 있는 프레임 선택 알고리듬을 제안한다. 프레임 선택 알고리듬은 FFT 입력으로 유효심볼의 뒤 알부 대신 보호구간의 일부를 사용한다. FFT 입력으로 사용된 보호구간내 교체구간은 다중경로 환경에 따라 달라져야 하는데, 교체구간 판단을 위한 네 가지 알고리듬도 소개한다. 제안한 알고리듬을 DVB-T(digital video broadcasting-terrestrial) 시스템에 적용한 모의실험을 통하여 3 dB 이상의 성능향상을 얻을 수 있다.
-
본 논문에서는 수중 환경에서 분산 소나 시스템의 최적 정보 융합에 관한 알고리즘을 제시하였다. 기존의 방법은 Bayesian 법칙을 이용하여 local 소나와 퓨전 센터의 문턱치를 적절히 조절하여 분산 소나 시스템을 최적화했다. 그러나, 이러한 최적화 과정에서 소나의 개수를 늘려감에 따라 P/sub F/(false alarm probability)가 단조 증가하는 현상이 발생하였고 이러한 단점을 보완하기 위해 P/sub F/를 작은 간에 제한시키고 Bayesian 법칙과 Neyman-Pearson 법칙을 함께 적용하여 분산 소나 시스템을 최적화시킨다. 그러나, 이러한 조건 하에 시스템을 최적화시키는 것은 N-P hard 문제에 의해 계산 부하가 매우 크므로 unate 함수와 SQP(Sequential Quadratic Programming)을 이용하여 계산 부하를 감소시켰다.
-
멀티미디어 검색을 위한 MPEG-7 표준화 작업이 완료되어감에 따라, 멀티미디어 특징 기술자를 활용한 다양한 응용들이 나타나고 있다. 본 논문에서는 미키 마우스, 포켓 몬스터 또는 호돌이와 같은 지적 재산 정보인 동시에 고부가가치 대상인 캐릭터 이미지를 대상으로 하여, 캐릭터 이미지 특징을 분석하고, MPEG-7 에서 정의된 컬러 기술들간의 검색 효율을 비교하여, 캐릭터 이미지에 가장 적합한 기술자를 제안한다. 캐릭터 이미지는 자연 이미지와는 달리, 질감(Texture)이나 모양 (Shape)정보에 비해, 주로 컬러 정보에 의존하며,존재하는 컬러의 수가 3-6 개 범위 내에 주로 존재하고, 컬러의 분포가 고르며, 질감 성분이 많지 않은 특징을 갖고 있다. MPEG-7 에 정의된 Dominant Color, Scalable Color, Color Layout 및 Color Structure 4 종류의 기술자를 캐릭터 이미지 특징에 맞는 기술자를 유형별로 분류된 3,834개의 이미지 셋에 적용하여, 검색 성능 평가 지수인 ANMRR(Average Normalized Modified Retrieval Rank) 를 측정하여 가장 효율적인 기술자를 정의한다.
-
본 논문에서는 H.26L 동영상 압축 표준화 방식에서 블록화 및 링 현상을 동시에 제거하는 계산량이 감소된 일차원 loop filter를 제안한다. 새로운 일차원 정규화 완화 함수가 정의되고 두 개의 인접 방향에서 완화의 정도를 조절하는 정규화 매개변수는 부호화와 복호화 부에서 이용 가능한 코드화 블록 패턴과 양자화 스텝크기로 정의된다. 그러므로, 정규화 매개변수를 정의하고 압축된 동영상으로부터 복원된 영상을 얻기 위한 기타 정보는 필요하지 않다. 실험결과로부터 제안된 알고리즘의 성능은 확인할 수 있었다.
-
본 논문에서는 공간 영역의 제약 정보를 이용한 적응 영상 복원 방식을 제안한다. 공간 영역의 제약 정보로는 국부 정보의 평균, 분산 및 최대 값을 이용하였다. 반복 기법을 이용하여 매 반복 해에서 얻어진 복원 영상으로부터 상기 제약 정보를 설정하게 되고, 위의 제약 정보는 임의의 입력 값에 의해 정의되는 매개 변수와 더불어 복원 영상의 국부 완화 정도를 결정하게 된다. 제안된 방식을 이용하여 복원 영상을 얻기 위해 비적응 복원 방식보다 빠른 수렴 속도를 갖게 됨을 알 수 있었다. 또한, 국부적으로 제어된 완화 정도를 지닌 복원 영상을 얻을 수 있었다.
-
웨이블렛 변환을 이용한 영상 압축의 방법에 있어서 최근 우수한 압축 성능을 보이는 비트 평면 부호화 방법이 많이 발전되어 왔다. 본 논문에서는 블록 기반 제로트리와 사진나무구조를 이용하여 비트 평면을 효율적으로 부호화함으로써 우수한 압축 성능을 보이는 부호기를 제안한다. 블록 기반 제로트리는 주파수 대역에 걸쳐 상관성을 보이며 존재하는 중요하지 않은 계수를 효과적으로 부호화하며, 사진나무구조는 블록 안에 있는 중요한 계수를 찾아내어 부호화한다. 제안하는 부호기의 성능은 기존의 우수한 비트 평면 부호기에 필적하는 성능을 보이며, 특히 낮은 피라미드 레벨과 저비트율에서의 성능이 더 우수함을 보인다.
-
In this paper, a robust watermarking technique is presented by using a block-based statistics in DCT domain. First, the proposed technique calculates JND threshold value using the global statistics in DCT domain. Then watermark insertion is carried out by inserting one watermark into coefficients which are above the threshold value J within a 2
${\times}$ 2 block. Finally, watermark is estimated by averaging the extracted watermarks from the coefficients which are above the threshold in a window. In experiments it is shown that the proposed techniques can enhance perceptual invisibility and robustness against additive noise and JPEG compression attacks by using the characteristics of JND. -
본 논문에서는 영상을 특성에 따라 국부 영역으로 분류하고 변위 공간(disparity space)상에서의 특징을 분석하여 각각의 영역에 적합한 윈도우의 크기를 정하는 새로운 스테레오 정합 기법을 제안한다. 일반적으로 텍스쳐(texture)가 적은 영역이나 텍스쳐가 반복되는 영역, 그리고 깊이의 불연속선상에서는 고정된 크기의 윈도우를 사용하는 영역 기반 스테레오 기법은 잘 동작하지 않는다. 본 논문에서는 이러한 영역들의 변위 공간상에서의 정합 값 분포를 분석하여 스테레오 정합에 이용한다. 실험은 변위의 참값이 알려진 영상에 대해서 수행되었으며 기존의 방법에 비해 짧은 수행 시간 및 정확한 정합 결과를 보여 준다.
-
본 논문에서는 스테레오 정합을 위한 특징으로 웨이 블릿의 이동성(shiftability)을 이용한 윈도우 웨이블릿 기반 스테레오 정합방법을 제안하였다. 전 영상에 대한 웨이블릿 분해는 웨이블릿의 이동성 유지가 이루어지지 않아서 정합 정확도가 떨어진다. 그래서 웨이블릿의 이동성을 신뢰성 있는 정합정보로 만들기 위해 윈도우로 전체 파형의 일부를 표본화하고 웨이블릿 분해를 수행하여 기준신호와 이동된 신호의 부대역 정보 사이의 상관도(cross-correlation)를 정합정보로 이용하였다. 대역별 상관도는 얻어진 4개의 부대역의 대역별 가중치가 고려되어 계산된다. 제안한 방법은 주파수 대역별 계층적인 정합과 양방향 정합과정을 통해 영상의 경계부분, 동일한 형태의 반복, 잡음(white noise)등이 포함된 영상에서의 오정합을 줄일 수 있었으며 특징정보가 부족한 부분에서의 정합도 개선할 수 있었다.
-
We propose an efficient algorithm for an interactive content-based image retrieval using relevance feedback. In the proposed algorithm, a new query feature vector first is yielded from the average feature vector of the relevant images that is fed back from the result images of the previous retrieval. Each component weight of a feature vector is computed from an inverse of standard deviation for each component of the relevant images. The updated feature vector of the query and the component weights are used in the iterative retrieval process. In addition, the irrelevant images are excluded from object images in the next iteration to obtain additional performance improvement. In order to evaluate the retrieval performance of the proposed method, we experiment for three image databases, that is, Corel, Vistex, and Ultra databases. We have chosen wavelet moments, BDIP and BVLC, and MFS as features representing the visual content of an image. The experimental results show that the proposed method yields large precision improvement.
-
디지털 워터마킹이란 디지털 데이터에 인간이 감지 할 수 없도륵 특정정보를 삽입하는 기술이다. 본 논문에서는 웨이블릿 3레벨을 이용하여 각 부대역에 디지털 영상 내부에 시각적으로 인식 가능한 심벌(마크, 심벌, 인장 또는 사인)을 삽입한다. 다중 문턱값을 이용하여 시각적으로 중요한 웨이블릿 계수를 선택하여 각 부대역별 웨이블릿 계수에 가중치를 달리 결정하여 삽입하고 PN코드를 이용한 디지털 워터마킹을 제안하였다. 제안한 워터마킹 방법은 실험을 통해 워터마크의 비가시성, 다양한 공격에 대하여 우수한 강인성을 확인하였다.
-
본 논문에서는 컬러 장치들간에 색을 일치시키기 위하여 휘도 대비와 채도 향상을 고려한 원형 색역 사상(circular shape-based gamut mapping)방법을 제안하였다. 서로 다른 장치들간에 색역을 일치시키기 위해 장치 독립적이고 균등 색 공간인 CIELAB값으로 변환하여 색역 사상을 수행하였다. 인간 시각에 상대적으로 민감한 특성을 가지는 휘도 성분을 JND(just noticeable difference)에 기반해 분할하고, 이를 기점으로 색역을 원의 형태로 나눈다. 이렇게 나뉜 색역은 사상의 방향성을 결정하는 기본 단위로 사용되어, 이들 영역을 기점으로 영역 대 영역별 사상 방법을 사용하였다. 제안한 색역 사상 방법을 모니터와 프린터간에 적용한 결과 보다 선명하고 휘도 대비가 높은 영상을 얻을 수 있었다.
-
본 논문에서는 EZW(embedded zerotree wavelet)를 사용하여 영상을 압축하는 과정에서 워터마크를 삽입하는 새로운 방법을 제안하였다. 비트열에 워터마크를 삽입하는 기존의 방법은 DCT를 기반의 MPEG과 JPEG 비트열에 워터마크를 삽입하였다. 하지만 DCT 기반의 압축 방법은 낮은 비트율로 압축할 몌에 블록화현상이 생기고 비트율을 제어하기 어려운 문제점이 있다. 이러한 문제점을 극복하기 위해 웨이블릿을 이용한 압축 방법이 사용되었고, 대표적인 방법으로 EZW가 많이 쓰인다. 본 논문에서는 EZW의 주부호화 과정(dominant pass)에서 발생하는 4가지의 심벌을 이용하여 부호화된 이진의 워터마크 영상을 삽입하는 방법을 제안하였다. 웨이블릿 분해된 계수 상에서 마지막 레벨에 위치한ZTR(Zerotree root) 심벌에 워터마크를 삽입함으로 원 영상에 손상을 주지 않고, 워터마크를 간단히 추출할 수 있었다. 또 낮은 비트율에서도 워터마크의 손상이 적었고, 많은 양의 워터마크 영상을 삽입할 수 있었다.
-
본 논문은 MPEG 비디오에서 나타나는 여러 예측 형태의 움직임 벡터를 프레임 타입에 관계없이 단일 예측방향만을 갖도록 새롭게 추정하여 비디오 영상물의 분석에 직접적으로 활용하는 방안에 대해 제시하고 있다. 또한 재 추정된 각 프레임에서의 움직임 벡터를 이용한 비디오 시퀀스 내에서의 객체 추출 및 추적 기법 등에 대해서도 함께 제안하였다. 제안된 알고리즘은 영상에 대한 복원과정을 거치지 않고, 압축 비디오 영역으로부터 쉽게 추출될 수 있는 매크로 블록 영역 상에서 수행되었으며, 실험 결과는 제안된 방법의 높은 성능을 잘 나타내어 주고 있다.
-
대용량 hard disk를 내장하고 있는 DTV용 PVR(Personal video recorder)에서는 단순히 수신되는 방송 stream을 녹화하고 재생하는 기능 뿐만 아니라 다른 여러 가지의 부가적인 기능들을 지원하는 것이 필요하다. 그 중의 하나가 기존의 아날로그 VCR의 사용자들에게 친숙한 fast-forward play, reverse play, pause 등과 같은 trick mode play기능을 지원하는 것이다. 그러나 MPEG video는 화면간의 상관관계를 이용하여 압축하는 방식을 채택하고 있으므로 재생하고자 하는 frame이 intra frame이 아닌 한 독립적으로 재생할 수가 없어서 trick mode play 기능을 구현하기가 용이하지 않다. 특히 reverse trick mode의 경우에는 original stream에서의 마지막 frame이 먼저 display되어야 하는데 이를 위해 하나의 GOP가 모두 decoding되어야 하므로 더욱 그 구현이 어렵다. 본 논문에서는 reverse trick mode를 구현하기 위한 여러 알고리즘을 소개하고 이에 대한 system 복잡도, 메모리 사용량 성능 등을 분석하고자 한다.
-
이동 통신 채널과 같이 에러 발생율이 높은 환경에서 부호화된 비디오 스트림 전송시 발생된 에러는 비디오 화질에 큰 영향을 준다. 본 논문에서 현재 널리 사용되고 있는 H.263의 복호화기에서 전송도중 에러가 발생했을 경우 추가적인 데이터 스트림의 삽입 없이 효율적으로 에러를 은닉할 수 있는 기법에 관하여 제안하였다. 특히 인터프레임 영상에서 손상되거나 손실된 움직임벡터에 대해 시간영역에서 관계가 깊은 이전 프레임에서 손실블록(매크로블록)과 같은 위치에 있는 블록의 움직임벡터와 현재 프레임에서 손실블록과 인접한 블록들의 움직임벡터 정보를 이용하여 손실 블록의 후보 움직임벡터를 구하게된다. 이러한 후보 움직임 벡터를 이용하여 통일한 움직임 벡터를 갖는 영역을 찾아 손실 블록이 어떤 움직임 영역에 속하는 지를 판단하여 손실된 블록을 복원하는 방법을 제안한다.
-
MPEG-2는 영상회의에서 HDTV까지 광범위하게 활용되는 국제 동영상 부호화 표준이다. MPEG-2 표준에 맞게 압축된 신호는 유선 통신망이나 공중파를 통하여 전송이 되는데, 특히 공중파 전송과정에 채널의 상태에 따라 전송 오류가 발생된다. 이로 인해 수신단에서 복호할 때, 영상의 화질 열화, 오류 전파둥 영상의 출력에 영향을 미치는 것들이 존재하게 된다. 특히 전송 자료 중에서 헤더 정보는 영상의 출력에 중요한 정보를 가지고 있어 오류 발생 시에는 영상의 출력에 심각한 영향을 주는 것이 대부분인데, 아직까지 헤더에서의 오류 검출(detection) 및 정정(correction)에는 많은 연구가 이루어지지 않았다. 그러므로, 본 논문에서는 MPEG-2 비디오 비트스트림의 헤더부분에 전송 오류가 발생할 경우 오류를 검출하고 정정하는 방법을 제안하고자 한다.
-
본 논문은 영상압축 표준의 하나로 표준화가 진행중 인 H.26L에 효율적인 저전력 움직임 추정 구조를 제안한다. 제안하는 방식은 움직임 추정에 사용하는 이전 프레임에서의 움직임 벡터 발생 빈도와 경향을 이용하여 계산량과 수행시간을 줄인다. 그리고 가변 블럭 정합을 고려하여 먼저 최소 블럭 크기 단위로 블럭 SAD를 계산한 후 다른 모드 블럭 SAD 를 계산으로 생성한다. 제안하는 방식은 기존의 저전력 블럭 정합 방식과 비교하여 최대 31% 전력 소모 감소가 이루어지며 완전 전역 탐색 블럭 정합 방식에 비해 평균 75-90%의 계산량이 감소된다.
-
여러 장의 입력 영상으로부터 3차원 형상 정보를 복원하는 기법은 크게 스테레오(stereo) 기법과 각선 기반 방법으로 나누어져 있다. 특히 복셀 기반 방법은 스테레오 기법에서의 대응점 문제를 극복하고 가리어짐 현상이나 컬러의 변화가 적은 영역에서의 현상 복원 능력이 우수한 것으로 알려져 있지만 광학적 외피(photo hull) 이라는 근본적인 복원 한계성을 가진다. Photo hull은 바라보는 카메라의 위치에 크게 의존하는 성질을 보인다. 조건에 맞는 최적의 카메라 위치를 결정하는 것을 시점 계획(view planning)이라 고 하고 거리 영상(range images)로부터 형상을 복원하는 기법에 활발히 연구되어져 왔다. 본 논문에서는 복셀 기반 방법에서의 단점인 photo hull을 줄이기 위해 최적의 시점을 선택하는 시점 계획(view planning)에 대한 알고리듬을 제안하고 photo hull의 효과를 최소로 하여 형상이 복원되는 것을 실험을 통해 검증한다.
-
인터넷과 같은 네트워크의 특성은 QoS(Quality Of Service)가 보장되지 않으며, 다양한 대역폭 변화 율, 전송중의 높은 패킷 손실율, 그리고 스트리밍 시스템에서 스트리밍 서버 및 클라이언트의 부호 화/복호화에 따른 복잡도등 다양한 문제점 및 많은 스트리밍 클라이언트에게 효과적으로 데이터를 전송하기 위한 멀티캐스팅 기법이 필수적으로 요구된다. 따라서, 계속 증가하는 멀티미디어 데이터의 스트리밍 지원을 위해 이러한 네트워크 특성과 비디오 부호화 기술을 접목시켜 보다 안정적인 데이터 전송 및 화질 유지를 가능하도록 하기 위한 요구 조건 및 스트리밍을 위한 영상 부호화 기술에 대해 살펴보고자 한다.
-
인터넷 문화 활성화에 따라, 새로이 제작된 멀티 미디어 컨텐츠의 부가가치가 높아지고 있으며, 저작물에 대한 도용 또한 문제시 되고 있다. 멀티미디어 매체 중에서 이미지는 큰 비중을 차지하고 있으며, 인터넷 상에서 도용된 이미지는 원본으로 부터 크기 확대 및 축소, 가로/세로비 변화, 문자 강제 색인 등의 형태로 변형되어 나타난다. 본 논문은 이와 같이 웹상에서 변형 도용된 이미지를 검색하기 위하여, MPEG-7 컬러 기술자인 Color Layout 기술자를 이용하여 모든 변형된 이미지를 검색하는 방법을 제안한다. 제안된 방법은 단순 변형 및 2 가지 이상이 혼합된 복합 변형된 도용 이미지들에 대해서도 검색이 가능하다. 정량적 평가를 위해 인위적으로 조작된 351 개의 이미지를 대상으로 MPEG-7 검색 성능 평가 지수인 ANM-RR (Average Normalized Modified Retrieval Rank)를 이용하여 효용성을 보였다.
-
최근 정지영상, 동영상, 음성 등의 멀티미디어 컨텐트가 디지털화 되고 네트워크가 발달함에 따라 영상을 포함한 멀티미디어 데이터의 접근이 용이해 졌다. 이러한 데이터의 불법적 사용과 인위적인 조작으로부터 소유권과 저작권을 효율적으로 보호하기 위한 워터마킹 기술이 많이 연구되고 있다. 일반적으로 정지 영상 및 음성에 대한 워터마킹 기술은 많이 연구가 되었지만 이러한 방법을 동영상에 그대로 적용하기에는 실시간 처리에 적용하기가 힘들다는 큰 문제점이 있다. 따라서 본 논문에서는 비디오 신호에서의 빠른 처리과정과 실시간으로 워터마크를 삽입하고, 원 영상 없이 워터마크를 추출 할 수 있는 새로운 방법(Blind Watermarking)을 제안하고자 한다. 제안한 방법은 대역확산을 근거로 하여 워터마크 은닉 과정에서 치환(Permutation) 과정과 LSB 부호화 방법을 이용하여 비디오 시퀀스의 모든 I-프레임에 은닉한다. 복원과정은 모든 I-프레임에서 LSB 복호화와 역 치환 과정을 거쳐 본래의 저작권 정보를 추출한다. 제안한 방법을 여러 가지 동영상 비디오에 적용해 본 결과 기존의 워터마킹 방법보다 효율적이고 시각적 손상이 없었으며 빠른 실시간 처리가 가능함을 볼 수 있었다.
-
일반적으로 블록기반의 동영상 압축방식은 블록킹효과를 필연적으로 수반한다. 특히 저비트율의 동영상에서는 블록킹 효과가 다른 어떤 영상의 왜곡보다 많이 발생한다. 본 논문에서는 이러한 블록킹효과를 효율적으로 인간 시각체계에 적합하게 실시간으로 제거하는 후처리 알고리즘을 제안한다. 우선 복원된 영상에서 인간의 시각체계와 동영상의 특성에 따라 3가지의 모드로 분리하여 QP(quantization Parameter)에 따라 임계치를 변화함으로써 각 모드의 필터링 범위를 가변시켰다. 이후에 각 모드에 알맞은 일차원 및 적응형 필터링을 적용한다. 적용된 모드별 필터링은 과도한 블러링 현상을 방지하고 영상내의 실제 에지성분읓 보호하면서 효과적으로 블록킹효과를 제거한다. 본 논문에서 제안하는 알고리즘을 실험 영상에 적용하였을 경우에 주관적 화질 및 객관적 화질인 PSNR로 0.5dB 정도 향상되었다.
-
본 논문에서는 동영상 데이터의 효율적인 압축과 전송을 위하여 이산 웨이블렛 변환(Discrete Wavelet Transform)과 H.263 부호화[1] 방법을 이용한 영상 부호화 방법을 제안하였다. 이 방법은 웨이블렛 변환을 이용하여 영상을 여러 개의 주파수 영역별로 나누고 각각의 주파수특성에 따라 다른 부호화 방식을 취하게 된다. 제안된 방법은 정보량이 가장 많고 원본의 영상에 가장 가깝게 보존되는 저주파 영역은 H.263 부호화 방식을 사용하고, 나머지 고주파 영역은 산술부호화 방식을 사용함으로서 각각의 주파수 특성을 적절하게 고려한 압축을 하여 그 효율을 증대시키게 된다. 또한 웨이블렛 변환에 따른 저주파 영역의 크기는 실제 영상 크기의 4분의 1이 되는데, 이러한 사실은 H.263 부호화에서 움직임정보의 검출 단위인 매크로블럭(macro-block)의 개수를 줄여 웨이블렛 알고리즘 사용에 드는 추가적인 부호화 시간을 보상하게 한다. 저주파 영역의 H.263 부호화 방식으로 인한 양자화 오류로 나타나는 역 웨이블렛 변환에서의 화질열화를 최소화하기 위해 2단계 웨이블렛 변환을 사용했는데 실험결과 1단계 웨이블렛 변환을 사용한 영상에 비하여 화질이 개선됨을 알 수 있다.
-
본 논문에서는 2단계 참조를 통하여 원본 워터마크에 보다 근접한 워터마크를 추정해내는 워터마킹 방법을 제안한다. 이 방법은 워터마크 추출시 원본 영상을 필요로 하지 않으며 워터마크는 이진 신호가 된다. 여기서 참조 워터마크는 워터마크의 왜곡 정도를 알려주는데 이것을 가지고 좀 더 정확한 워터마크를 추정 해낼 수 있게 된다. 본 논문에서는 또한 추출된 워터마크와 원본 워터마크를 비교할 때 좀 더 정확한 비교를 위해서 국부 상관성을 이용한 방법을 제안한다. 실험 결과 공격의 특성에 구애받지 않고 일정한 성능을 보여줌을 확인 할 수 있었다.
-
위성영상은 그 특성상 다중대역과 방대한 양의 영상 데이터로 이루어져 있으며, 방대한 양의 데이터에서 필요한 영상정보를 검색하기 위해서는 위성영상 검색에 적용 가능한 다중대역의 화소벡터, 질감 및 이들의 공간분포를 효과적으로 얻어낼 수 있는 속성을 추출하여 활용하는 것이 필요하다. 따라서 본 논문에서는 위성영상 검색에 유용하게 사용할 수 있는 속성으로 다중대역의 화소벡터 값과 질감 정보를 동시에 추출하면서 UV(Color Coherent Vector)의 개념을 적용하여 이들의 공간분포에 관한 정보를 포함한 새로운 속성을 정의하였고, SPOT 위성영상을 이용하여 국부적인 질의 영상의 속성벡터와 광범위한 지역의 위성영상에서 부분영상들의 속성벡터와의 유사성 비교를 통하여 원하는 부분영상을 검색하는 방법으로 그 성능을 평가하였다. 제안된 검색방식은 칼라와 질감 그리고 이들의 공간적인 분포 등을 개별적으로 추출하여 조합하는 과정이 필요 없으며, 특히 위성영상이나 특정 도메인에 종속되지 않기 때문에 다양한 내용기반 영상정보 검색에 효과적으로 이용될 수 있을 것으로 사료된다.
-
동영상은 각 프레임 사이에 시간적으로나 공간적으로 많은 양의 정보가 중복되어 있다. 이러한 중복 정보를 줄이는 표현 방법들 중에 하나로, 동영상을 커다란 하나의 영상으로 정합하여 중복 정보를 줄이는 모자이크 기법이 있다. 두 개 이상의 영상을 정합하기 위해서는 영상간의 카메라 파라미터가 필요한데, 본 논문에서는 Mellin 변환을 사용하여 카메라 파라미터를 구하였다. 이때 3차원 공간모델은 직교 투사법을 사용하였으며, 영상의 움직임 모델로는 4개의 파라미터(평행이동, 확대/축소, 회전)를 사용한 어파인 움직임 모델을 사용하였다. 이렇게 구현된 파노라마 영상은 동영상에서 움직이는 물체를 검출하거나 추적하고, 동영상을 편집하는데 응용될 수 있다. 또한 본 연구의 최종 목적인 3D 영상의 배경을 구현하는 데 좀 더 사실적인 영상을 제공할 수 있다.
-
An improved zerotree-structure based wavelet coding algorithm is proposed. When the descendants of a significant coefficient are all zerotree, its four-childs are coded respectively in conventional EZW. But in the proposed algorithm, a new symbol is assigned for the significant coefficient. Entropy for both methods are analyzed and new coding scheme is proposed. The experimental results show that the Proposed algorithm has a better performance than the original EZW algorithm.
-
The paper presents an algorithm for estimating the variance of additive zero mean Gaussian noise in an image. The algorithm uses the wavelet transform which is a good tool for energy compaction. The algorithm consists of three steps. At first, high frequency components, wavelet coefficients in HH band, are generated from a noisy image by the wavelet transform. In a second step, high frequency components which are out of the noise range ate eliminated. Finally, if the image has many components eliminated in the previous step, then its noise estimated value is reduced. Experimental results show that the wavelet filter has better performance than the other high pass filters such as a Laplacian filter, residual from a median filter, residual from a mean filter, and a difference operator. In various images, the algorithm reduces 50% of estimated error on an average.
-
일반적으로 디지털 컬러 영상의 워터마킹 구현방법은 기존의 워터마킹 방법을 RGB 컬러 성분에 대해 각각 적용하였기 때문에 컬러 영상의 특성을 충분히 고려하지 못했다. 그러나 인간의 시각 체계(HVS : Human Visual System)의 특성을 이용하면 컬러 영상에 더욱 효과적으로 워터마크를 삽입할 수 있다. 본 논문에서는 다해상도 이산 웨이브렛 변환 영역에서의 인간의 시각 체계의 특성을 이용한 컬러 영상 워터마킹 방법을 제안하였다.
-
In this paper. Ive propose a postprocessing technique based on the theory of projection on convex sets(POCS) to reduce the blocking artifacts in HDTV decoded images. In BDCT of HDTV. the image is divided into a grid of non-overlapped 8
${\times}$ 8 blocks. and then each block is coded separately. A block which is located one pixel apart from the grid of BDCT will include the boundary of the original 8${\times}$ 8 block. If the blocking artifact is Introduced alone the block boundary. this block will have different frequency characteristic from that of the original block. Thus, a comparison of frequency characteristics of these two overlapping blocks can detect the undesired high-frequency components mainly caused by the blocking artifact. By eliminating these undesired high-frequency components adaptively, robust smoothing projection operator can be obtained. Simulation results with real image sequences indicate that the proposed method performs better than conventional algorithms. -
본 논문은 오디오 데이터의 인덱싱과 검색을 위해 DWT를 이용한 방법을 제안하였다. 오디오 데이터는 그 자신이 가지고 있는 다양한 특성 때문에 좋은 검색 효율을 위한 인덱스를 구성하기가 쉽지 않다. 신호 및 영상처리에서 각광받고 있는 DWT를 이용한 인덱스는 웨이블렛 변환이 가지고 있는 여러 특징들로 인해 데이터를 블록으로 나누지 않은 상태에서의 인덱싱과 검색을 가능케 한다. 즉 웨이블렛의 마지막 단계의 고주파 부분과 저주과 부문에서 고주파 부분은 String Watching 기법으로 블록을 결정하고, 저주파 부분은 결정된 블록에 대해서 세부적인 비교를 한다. 실험은 적절한 비교 계수를 결정하기 위한 실험과, 질의 길이의 변화에 따른 검색율의 변화를 보여준다. 마지막 결론에서는 본 논문에서 제안한 방법을 이용한 발전방향과 응용에 대해서 서술한다.
-
본 논문에서는 터보 TCM(Turbo Trellis Coded Modulation)에서 복호기 입력 전에 수신데이터를 이용하여 SNR을 추정하고, SNR에 따라 요구하는 성능을 만족하는 반복 복호수를 적응적으로 복호기 앞단에서 미리 설정하는 반복복호 제어기법을 제안한다. 성능분석결과 최대 반복 복호를 수행했을 때와 비교하여 성능 감소 없이 평균 반복 복호수를 줄일 수 있었다. 따라서 제안구조는 터보 TCM의 복호화 과정에서 문제점 중 하나인 복호 계산량과 지연을 성능 저하 없이 효율적으로 감소시킬 수 있다.
-
Waish-Hadamard Transform은 압축, 필터링, 코드 디자인 등 다양한 이미지처리 분야에 응용되어왔다. 이러한 Hadamard Transform을 기본으로 확장한 Jacket Transform은 행렬의 원소에 가중치를 부여함으로써 Weighted Hadamard Matrix라고 한다. Jacket Matrix의 cocyclic한 특성은 암호화, 정보이론, TCM 등 더욱 다양한 응용분야를 가질 수 있고, Space Time Code에서 대역효율, 전력면에서도 효율적인 특성을 나타낸다 [6],[7]. 본 논문에서는 Distributed Arithmetic(DA) 구조를 이용하여 Fast Jacket Transform(FJT)을 구현한다. Distributed Arithmetic은 ROM과 어큐뮬레이터를 이용하고, Jacket Watrix의 행렬을 분할하고 간략화하여 구현함으로써 하드웨어의 복잡도를 줄이고 기존의 시스톨릭한 구조보다 면적의 이득을 얻을 수 있다. 이 방법은 수학적으로 간단할 뿐 만 아니라 행렬의 곱의 형태를 단지 덧셈과 뺄셈의 형태로 나타냄으로써 하드웨어로 쉽게 구현할 수 있다. 이 구조는 입력데이타의 워드길이가 n일 때, O(2n)의 계산 복잡도를 가지므로 기존의 시스톨릭한 구조와 비교하여 더 적은 면적을 필요로 하고 FPGA로의 구현에도 적절하다.
-
열악한 전송 환경에서 고품질, 고신뢰성 통신을 지속적으로 하기 위해서 오류 정정 부호는 필수 적이다. 최근에 반복 복호를 통해 샤논의 채널 용량 한계에 근접하는 터보 부호와 LDPC부호가 가장 관심을 불러일으키고 있다. 반복 복호법은 성능 면에서는 우수해 지나 이에 따른 계산량 증가와 지연이 수반된다. 따라서 본 논문에서는 모의 실험을 통한 수신 데이터를 이용, SNR을 추정하여 LDPC 부호의 최대 반복 복호수에 따른 계산량과 지연을 효과적으로 줄일 수 있는 적응적 반복 복호수 설정 방식을 제안한다.
-
This paper is mainly concerned with the state of the practical developments of a constants PWM bridge type resonants DC-DC suitable converter for Nd:YAG Laser with a Microprocessor. (PIC16C54 & 8051) The use of IGBT power supply with feedback control of flashLamp currents imparts a advantages to Nd:YAG Laser for materials processing. these include the alility to tailor the pulseshape and modify pulse parameters on a pulse- by pulse basis. And Correct choice of pulseshape can enhance the repeatability of the process. as higher power IGBT became available, act ive pulseforming power supplies will find greater user in deep hole drilling machine By Using certain control tecniques, utililized in designing Pic16c54 from Microchip technology and Intel 8051, also Mornitoring from Microsoft Visual Basic 5, And it allowed us to designed and fabricate ahigh repel it ion rate and high power(HRHP) pulsed Nd:YAG laser system, As a result of that, the current pulsewidth could be contort led 200s to 350s(step 50s) , and the pulse repetition rate could be adjusted 500pps to 1150pps. In addition, in the case of one laser head consisting of a Nd:YAG laser rod and two flashlamps , the maximum laser output of 240w was produced at the condition of 350s and 1150pps, and that of about 480w was generated at the same condition when two laser heads were arranged in cascade.
-
에밀레종은 771년도에 성덕대왕의 공적을 기리기 위해 34년간 주조(높이 3.663m, 최대지름 2.227m, 무게 18,900kg)하여 만든 세계적인 문화유산이다. 외형도 미려하지만 종소리는 천, 지, 인을 뒤흔드는 신비감을 갖추고 있다. 에밀레 종소리는 끊어질 듯 이어지는 소리, 애끓는 소리, 심금을 울리는 소리 등의 특징을 갖는데 끊어질듯 이어지는 소리는 맥놀이 현상으로 나타난다. 지금까지 맥놀이 현상의 규명에 대한 많은 연구가 있었다. 하지만, 현존하는 국내의 종들과 에밀레종이 갖는 애끓는 소리에 대한 실험을 비교 분석을 통해 에밀레종의 우수성을 밝히기는 이번이 처음이다. 여기에는 우리 선조들이 750년경에 과학적 근거를 토대로 하여 응용이 가능하였음을 알 수 있다. 결론적으로 우리는 1228년 전에 완성한 우리민족의 지혜와 숨결이 스며있는 에밀레 종소리의 세 가지를 규명하고 재현함으로서 문화민족의 자부심으로 새로운 세대를 개척해 나아갈 수 있는 원동력을 얻고자 한다.
-
성능향상에 관한 실험을 하였다. 화자식별 방식은 등록된 음성과 테스트 음성을 비교하여 결정논리에 의하여서 화자를 식별하는 방식이다. 이러한 시스템에서 전처리(preprocessing)를 어떻게 해 주느냐에 따라서 인식률에 큰 영향을 미치게 된다. 본 논문에서는 전처리 과정 중에서 음성구간 검출에 대한 실험을 수행하여 성능을 비교 하였다. 본 논문에서는 시간영역에서 안정구간(stationary region)과 전이구간(transition region)에서 Normalized AMDF를 적용하였을 때 피치점에서 골(valley)의 기울기가 크다는 점을 이용하여 유성을 검출하였다. 그리고 검출된 유성음 구간 앞뒤로 인접 샘플의 자기상관관계함수(Autocorrelation)의 비를 이용하여 무성음을 검출하였다. 결과적으로 처리시간은 비슷하였으나 전체 인식률은 약 2%정도 개선되었다.
-
음성인식 시스템은 인간의 의사소통 수단인 음성을 기계가 인지할 수 있게 하는 것이다. 이러한 음성 인식 알고리즘 개발은 현재 활발히 진행되고 있다. 올바른 음성인식 시스템의 구현을 위해서는 높은 인식률 구현과 적은 처리시간이 요구된다. 또한 인식률 향상을 위해서는 그 구현 알고리즘이 복잡해지고 이에 따라 많은 처리 시간이 요구된다. 본 논문에서는 성문 특성에 따른 Glottal Spectrum에 적응적인 필터계수를 적용하여 인식률 향상을 도모하였다. 제안한 알고리즘을 모의 실험한 결과 전체 인식률이 2% 향상되었다.
-
스펙트럼의 평탄화는 스펙트럼 신호로부터 포만트의 영향이나 천이진폭의 영향을 제거하는 것이다. 따라서 정확한 피치검출과 포만트검출에 적용할 수 있다. 본 논문에서는 새로운 스펙트럼 평탄화 기법을 제안하고 기존의 방법인 LPC법, Cepstrum법과 비교하여 어느 정도의 우수성을 보이는지 평가하였다. 평가 방법은 각각의 평탄화된 신호의 분산을 구하여 평탄화의 정도를 측정하였다. 이때 핑탄화된 신호는 최고점이 영이 되도 록 정규화 시키고 평균이 영인 분산을 계산하였다. 실험 결과는 제안한 방법이 기존의 방법보다 우수함을 보여 준다.
-
LSP 파라미터는 음성코덱(codec)이나 인식기에서 음성 신호를 분석하여 전송형이나 저장형 파라미터로 변환되어, 주로 저전송률 음성부호화기에 사용된다. 그러나 LPC 계수를 LSP로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다는 단점이 있다[1]. 기존의 LSP 변환 방법 중 음성 부호화기에서 주로 사용하는 real root 방법은 근을 구하기 위해 주파수 영역을 순차적으로 검색하기 때문에 계산시간이 많이 소요되는 단점을 갖는다. 본 논문에서 비교 평가한 알고리즘은 첫 번째, 기존의 real root 알고리즘, 두 번째는, LSP 파라미터의 분포 특성을 조사하여 이를 토대로 검객구간의 순서와 검색간격을 달리한 경우, 세 번째는 검색 시 mel scale을 사용한 알고리즘이다. 실험결과, 기존의 real root 방식에 비하여 두 가지 방식 모두가 변환시간의 40% 이상이 감소되는데 반하여 통일한 관을 찾음을 알 수가 있었고, 특히 분포특성을 이용하여 검색순서와 간격조절을 한 경우에 있어서, 기존의 방식보다 40%이상이 감소되었다.
-
음성인식, 합성 및 분석과 같은 음성신호처리 분야에 있어서 기본주파수 즉, 피치를 정확히 검출하는 것은 중요하나 만일 음성신호의 기존주파수를 정확히 검출할 수 있다면 음성인식에 있어서 화자에 따른 영향을 줄일 수 있기 때문에 인식의 정확도를 높일 수 있고, 음성합성 시에 자연성과 개성을 쉽게 변경하거나 유지할 수 있다. 또한 분석시 피치에 동기 시켜 분석하면 성문의 영향이 제거된 정확한 성도 파라미터를 얻을 수 있다. 따라서 제안한 논문에서는 시간영역처리에서 시간영역파형에서 먼저 성도성분이 제거된 성문특성 즉 피치주기 성분을 강조하기 위해 음성신호의 기울기를 이용한 Positive 센터 클리핑를 수행하고 주파수 영역에서는 원신호의 스펙트럼과 센터클립된 신호의 스펙트럼과의 Peak-Fiting을 수행하고 선형 인터폴래이션(스무딩)을 통해 평탄화된 스펙트럼을 얻었다. 결과적으로 유성음 구간과 음성이 변하는 전이구간에서 G-peak가 강조된 더욱 정확한 Pitch를 검출할 수 있었다.
-
본 논문에서는 AMR(Adaptive Multi-Rate)과 MLT (Modulated Lapped Transform) 벡터 양자화 방법을 이용하여 광대역 음성부호화기를 설계하였다. 제안한 음성부호화 알고리즘은 split-band 구조를 가지고 있으며 16kHz로 샘플링 된 신호를 입력받아 QMF 필터에 의해 두 개의 대역으로 나누어, 각각 8kHz 샘플링 신호로 변환시킨 후 저대역(0Hz-3400Hz)의 신호와 고대역(3400Hz -7000Hz)의 신호로 나누어 각각 부호화한다. 나누어진 두 개의 협대역 음성신호는 AMR(Adaptive Multi-Rate)부호화기와 MLT (Modulated Lapped Transform)벡터 양자화 방법을 사용하여 각각 부호화되어 전송된다. 수신단에서는 각 대역을 AMR과 IMLT(Inverse MLT) 벡터 양자화 방법으로 역부호화하여 음성신호를 합성한다. 제안한 음성부호화기는 20.2kbps에서 12.15kbps까지의 다전송률로 동작된다. 설계된 광대역 음성부호화기는 MOS시험 결과로부터 G.722의 56 kbps 음성이 설계된 코더의 20.2 kbps와 비슷한 음질을 갖음을 확인할 수 있었다.
-
본 논문에서는 섬광탄 (flare)과 같은 공중 표적(target)의 대응 능력 (CM; countermeasure) 에 효과적으로 대처할 수 있는 2-color 탐색기의 반대응 (CCM; counter-countermeasure) 알고리듬을 제안하고자 한다. 자외선 (UV) 및 적외선 (IR) 대역을 동시에 이용하는 2-color 탐색기는 표적과 섬광탄의 방사에너지 특성을 적외선 및 자외선 대역에서 비교, 분석하여 대역별 특성을 결정한다. 이러한 특성을 이용하여 두 대역의 입력 신호로부터 효과적으로 표적 신호만을 검출, 추적함을 보인다. 또한 제안된 2-color 방식을 로젯 주사 탐색기(rosette scan seeker)의 반대응 능력으 펄 이용하여 동적 시뮬레이션을 수행한다.
-
본 논문에서는 TMS320C6701 을 이용하여 방대한 양의 데이터를 실시간으로 처리할 수 있는 병렬 DSP 시스템을 설계 및 구현한 것에 대하여 나타내었다. 이 병렬 DSP 시스템은 DSP 칩간의 통신과 보드간의 통신이 가능하며, DSP칩이 마스터가 되어 EMIF(External Memory Interface)포트를 통해 다른 DSP 칩의 지역메모리를 엑세스 할 수 있으며, 또한 외부의 호스트 프로세서가 보드 내의 DSP 칩에 프로그램을 다운로딩 할 수 있도록 설계하였다. DSP 칩에 의해 처리된 신호는 PCI 버스를 통하여 호스트로 전송되며, DSP 칩에서 DSP 칩 또는 지역메모리와의 통신은 지역버스를 통해 직접적으로 이루어진다. 병렬 DSP 시스템을 통하여 고속의 병렬신호처리를 수행 할 수 있다.
-
SDR(Software Defined Radio)은 여러 세대의 이동 통신 시스템 무선방송 및 다양한 통신 시스템이 존재하는 환경에서 소프트웨어 업그레이드로 무선장치 및 서비스를 제공할 수 있는 효율적인 해결 방안으로 대두되고 있다. SDR 이라는 기술은 하드웨어 수정 없이 모듈화 된 소프트웨어의 변경만으로 단일의 송수신 시스템을 통해 다수의 무선 통신 규격을 통합 수용하는 무선 인터페이스 기술이다[1]. 이러한 기술을 실현하기 위해서는 소프트웨어 다운로드 기술이 매우 중요하게 된다. 왜냐하면 시스템에 프로그램을 다운로딩해서 하드웨어가 Reconfiguration 되어 사용자가 원하는 대로 시스템이 셋팅이 될 수 있어야 하기 때문이다. 소프트웨어 다운로드 방법에는 크게 공중파를 이용하는 방법, 컴팩트한 이동식 디바이스로부터 다운로딩 받는 방법, 전화나 케이블 서비스 등을 통해 근거리/원거리 호스트 서버로부터 소프트웨어를 다운로딩 받는 방법, 네트워크를 통해서 소프트웨어를 다운로드 하는 방법 등이 있다[2]. 이 중에서 본 논문에서는 SDR을 위한 임베디드 시스템을 구현 하였고, 리눅스 포팅을 하였으며 스마트 카드를 이용한 소프트웨어 다운로드 방범을 제시함으로써 SDR 의미 구현을 시도해 보았다.
-
본 논문에서는 2차 통계치를 이용하여 패널추징 및 등화 기법을 제안하였다. 기존의 채널 추정 알고리듬은 잡음이 없는 환경에서 LS방법을 이용하기 때문에 잡음이 강한 패널에서는 원하는 성능을 얻을 수 없는 단점이 있다. 수신신호의 상관행렬의 최소 고유값에 대응하는 고유벡터는 채널의 임펄스 응답에 관한 정보를 포함하고 있다. 이러한 고유 벡터를 매시간마다 갱신시키면서 구하는 적응 알고리듬을 제안하고 이를 이용하여 블라인드 채널 추정 및 등화기 파라미터를 추정하였다. 제안한 알고리듬은 잡음에 강인한 특성을 보일 뿐 아니라 기존의 알고리듬들 보다 우수한 채널 추정 및 등화 성능을 모의 실험을 통하여 검증하였다.
-
본 논문에서는 한국어 음성인식 시스템의 성능 향상을 위해 청각 주파수 분해능을 가진 MEL-LPC Cepstrum을 음소단위의 HMM(Hidden Markov Model)을 기반으로 하는 인식 시스템에 적용하여 그 결과를 비교 검토하였다. 선형예측(LP) 분석 후에 후처리로서 주파수를 왜곡시킨 LPC-MEL 분석이 계산량이 적고 효과적이라 일반적으로 많이 사용되고 있으나 주파수 분해능은 많이 개선되지 않는다. 따라서 본 논문에서는 주파수 분해능을 개선하기 위해, 원 음성신호로부터 직접적으로 멜주파수로 왜곡시킨 후 선형 예측 분석을 수행하는 MEL-LPC 분석방법을 이용한 음소기반의 화자 독립 음성인식 시스템을 구성하여 기존의 LPC-MEL 분석방법과 비교실험을 통하여 MEL-LPC 분석방법의 유효성을 검토하였다. 실험에 사용한 음성 데이터베이스는 음소 및 단어 인식실험에서는 ETRI 445단어 DB, 연속 숫자음인식 실험에서는 KLE 4연속 숫자음 DB를 사용하였다. 화자 독립 음소인식 실험의 경우, 묵음을 제외한 47개의 유사 음소에 대하여 4상태 3출력의 Left-to-Right 모델을이용하였다. 단어 및 연속 숫자음 인식 실험의 경우, 유한상태 네트워크에 의한 OPDP법을 이용하였다. 화자 독립 음소, 단어 및 4연속 숫자음 인식 실험결과, 기존의 LPC-MEL Cepstrum을 사용한 경우보다 MEL-LPC Cepstum을 사용한 경우가 더 높은 인식률을 나타내어 한국어 음성인식 시스템에서 MEL-LPC 분석방법의 유효성을 확인할 수 있었다.
-
주파수 추정 알고리즘의 경우 기존에 제안된 방법들 중에서 ML방법은 계산상 너무 복잡하고 구현하기 힘들며, 준-ML 방법들은 이론적인 방법과 비교해 볼 때 다소 단순하긴 하나 역시 구현상의 문제가 따른다. 따라서 본 논문에서는 BWLL환경에 적용할 수 있는 단순하면서도 구현이 용이한 주파수 추정방법을 제안한다. 본 논문에서 제안하는 주파수 추정기는 V&V 위상추정기를 기초로 한다. 성능분석 결과 본 논문에서 제안한 알고리즘을 이용할 경우 최대로 정규화된 심벌율의 0.5%까지 조정이 가능하다. 따라서 아날로그 영역에서의 거친 주파수 조절과정에서 다소 많은 잔류 주파수옵셋이 존재하여도 주파수 복구가 가능하다.
-
This paper introduces a new technique for estimating the speed of a mobile station in a wireless system. The proposed method is based on the feature extraction of the received signal envelope. The undecimated discrete wavelet transform via lifting captures local minimum points of the received signal, which is used for the speed estimation. This technique requires neither knowledge of the average received power of the nonstationary signal nor adaptation of a temporal observation window, in contrast to other speed estimators given in the literature. Simulations show that the proposed speed estimator tracks the variable speed of the mobile station.
-
본 논문에서는 multipath 환경에서 효과적으로 시지연을 추정하기 위한 알고리즘을 제안하였다. 제안된 알고리즘은 전처리 과정으로 웨이블릿 변환을 적용하였으며, 적응 알고리즘으로는 RLS를 계층적인 구조로 나타낸 HRLS(Hierarchical RLS)를 사용하였다. 시지연은 신호 분해과정 이후 각각의 부밴드에서 primary 신호와 reference 신호 사이의 MSE(Mean of Squared Error)를 최소화 시키는 적응 메카니즘을 사용하여 추정하였다. 아울러 모의실험을 통하여 제안된 알고리즘의 성능을 검증하였다.
-
본 눈문에서는 뒤틀림, 응력, 압력[1], 토크, 가속도 등의 물리적인 동적 현상을 측정하여 수집된 데이터를 처리하기 위한 신호처리(Signal Processins) 기능이 결합되어 넓은 용도로 활용할 수 있는 센서 신호 수집 시스템을 구현하였다. 구현된 시스템은 data acquisition board 의 하드웨어와 소프트웨어로 나누어 볼 수 있다. 하드웨어의 구성은 아날로그부, 디지털부, 그리고 시스템 인터페이스 처리부로 되어 있다. 아날로그부에서는 센서신호를 받아서, PGA (Programmable Gain Amplifier)[2]와 Op-Amp를 사용하여 signal conditioning 처리하여 8차 Lowpass Filter 로 보낸다. Filtering 된 신호는 ADC (Analog to Digital Converter) 가 내장되어 있는 PIC(3) microcontroller로 보내져 AD변환과 디지털 신호 처리를 한다. 처리된 신호는 RS232 인터페이스를 통해 호스트 컴퓨터로 보내 사용자가 분석할 수 있도록 한다. 또한 LCD display 실시간으로 확인, 분석할 수 있으며 동시에analog output에서 센서신호의 특징을 분석 할 수 있도록 한다.
-
잡음발생기는 통신시스템을 측정할 때 신호에 영향을 미치는 잡음신호들을 인위적으로 만들어 실제 신호가 전송되는 환경과 유사한 환경을 만드는데 필요한 시스템이다. 본 논문에서는 최근에 제안된 DCT를 이용한 잡음발생회로의 면적을 약 40∼45% 정도 줄이는 방안을 제시한다. 또한, 전력소모를 줄이기 위해 시스템에 사용되는 ADD 블록의 불필요한 동작을 억제하며 면적증가에 영향을 주지 않는 구조를 제안한다.
-
본 논문에서는 MPEG4 스트리밍을 기반으로 하여 다용도로 인터넷에서 영상 및 음성을 전송할 수 있는 시스템(RealCam SUN A/V)를 설계하고 구현하였다. 기존의 인터넷응용 시스템들은 주변 관찰용, 인터넷 방송용, 원격 장비 제어용 등의 독립된 시스템으로 개발 운영되고 있으며, 2개 이상의 용도를 사용하기 위해서는 여러 개의 시스템을 설치하여 사용해야 하는 문제점을 가지고 있었다. 본 연구에서는 이들 용도를 하나로 통합하여 다목적으로 활용할 수 있게 시스템을 설계하고 구현하였으며, 그 결과 56Kbps 에서는 160*120 화면 크기로는 초당 15프레임정도의 영상 전송을 할 수 있었고, 512Kbps에서는 640*480 크기를 초당 30프레임으로 서비스할 수 있었다.
-
많은 멀티미디어와 DSP 응용에서 입력과 출력 데이터 길이가 같은 고정 길이 곱셈기가 요구된다. 고정 길이 곱셈기는 확률적인 추정에 근거한 적절한 보상 바이어스를 더해줌으로써 일반적인 병렬 곱셈기와 비교하여 50%의 면적을 줄일 수 있다. 본 논문에서는 CSD 곱셈기에 적합한 고정길이 곱셈기의 구조를 제시하고 전파 캐리 선택절차를 이용한 부호확장제거방법과 결합함으로서 새로운 곱셈기구현 방안을 제시한다. 이 곱셈기의 응용으로서 SSB/BPSK-DS/CDMA 전송방식에 사용되는 힐버트 트랜스포머를 43탭 FIR 필터로 구현하고 기존의 compensation 벡터 방법과 비교하여 약 34%의 부호확장 오버헤드를 줄일 수 있음을 보인다.
-
TCM offers considerable coding gains without compromising bandwidth or signal power. But TCM decoder is more complex than convolutional Viterbi decoder. Because, the number of branches exponentially increased by the constraint length and input symbol bits. The parallelism of ACS and memory management technique of SPMM is one of the important factor for speed-up and hardware complexity. This paper proposes a multi-processing technique of ACS and also gives a memory management technique of SPMM in TCM decoders.
-
Blind identification and equalization of communication channel is important because it does not need training sequence, nor does it require a priori channel information. So, we can increase the bandwidth efficiency. The linear prediction error method is perhaps the most attractive in practice due to the insensitive to blind channel estimator and equalizer length mismatch as well as for its simple adaptive algorithms. In this paper, we propose method for fractionally spaced blind equalizer with arbitrary delay using one-step forward prediction error filter from second-order statistics of the received signals for SIMO channel. Our algorithm utilizes the forward prediction error as training sequences for data estimation and desired signal for channel estimation.
-
본 논문에서는 고속 데이터 전송을 위한 OFDM (Orthogonal Frequency Division Multiplex) 시스템용 고속 FFT 프로세서를 제안한다. 적은 하드웨어 크기를 만족하기 위해 단일 메모리 구조를 채택하였으며 고속 연산을 위해 Radix-4 알고리즘과 메모리 뱅크 구조를 사용하였다. 또한, 버터 플라이 출력이 입력 데이터의 위치에 저장되는 In-place 메모리 구조를 갖는다. 설계한 프로세서는 VHDL로 모델링하여 삼성 0.5㎛ SOG 공정으로 합성하였으며 메모리를 제외한 전체 게이트 수가 98,326개를 보였다. 동작속도는 42MHz로 256-포인트 연산이 6㎲에 처리 가능한 구조이다.
-
본 논문에서는 고속도로와 유료도로의 톨게이트에 상습 정체지역으로 개선방안이 시급히 요구 되어진다. 이에 대해 차량속도를 향상시키며 평균차량 대기시간을 줄이는 새로운 요금정산 방법인 전자자동요금 징수시스템에 대해 기술하였다. 유로도로를 통과시 차량당 요금정산을 위해 평균대기 시간이 길어짐으로 인해 공해, 유류낭비 뿐만 아니라 과다한 물류비로 인해 국가적으로 손실이 엄청 크다. 이에 대해 기능이 향상되고 보안성이 뛰어난 Off-Line의 상거래 처리가 가능한, 비접촉식 IC 카드를 대상으로 게이트 리더기와 원격정보수집장치로 구성으로 설계 및 제작을 하였다. 기존의 방식보다 차량대기속도 및 평균주행속도가 15%에서 40% 가량 개선됨을 확인할 수가 있었다.
-
레이어 코딩된 비디오의 경우 Base 스트림과 Enhancement 스트림으로 나누어지게 되는데 중요한 정보인 Base 스트림을 보장하고 Enhancement 스트림의 손실을 최소화 하는 방법의 연구가 많이 진행되어 왔다. 인터넷 망은 이러한 비디오 정보를 전송할 때 패킷의 크기와 전송간격, 그리고 프로토콜에 다양하게 영향을 받는다. 본 논문에서는 트래픽의 상당량을 차지하는 비디오를 레이어 코딩을 사용할 경우 생기는 트래픽 특성과 클라이언트의 네트워크변화에 따른 상황을 분석하고 패킷의 전송 방법을 프로토콜별로 효율성을 분석하며 Base 스트림의 Guaranteed 서비스를 보장하기 위해 TCP 스트리밍 방법을 제안한다.
-
본 논문에서는 NTGST (noise·tolerant generalized symmetry transform)와 snake를 이용하여 복잡배경으로부터 여러 물체의 윤곽선을 동시에 검출하는 방법을 제안하였다. 먼저 NTCST의 대칭도 맵(symmetry map)을 이용하여 복잡한 배경에 혼재하는 여러 물체들의 위치를 찾은 다음, 이들 각 물체에 snake의 초기 윤곽들을 자동 설정해 줌으로써 기존 snake 알고리즘의 초기 윤곽 설정의 어려움과 다중 물체 윤곽선 검출의 어려움을 동시에 해결하였다. 이때 NTGST의 대칭도 맵으로부터 설정된 snake의 초기 윤곽은 실제 물체의 윤곽선 가까이에 위치할 뿐만 아니라 물체의 형태를 잘 반영하므로 요철이 있는 물체의 윤곽선도 기존의 방법보다 적은 반복횟수로 정확하게 검출 할 수 있다. 다양한 합성 영상과 실영상에 적용한 결과 복잡배경으로부터도 다중 물체의 윤곽선을 효과적으로 추출함을 확인하였다.
-
본 논문에서는 TI사의 고정 소숫점 연산을 하는 DSP 중 7MS320C62xx를 이용하여 미 국방성의 2.4kbps MELP(Mixed Excitation Linear Predictive) 보코더의 실시간 구현을 목표로 최적화 과정을 수행하였다. 연구에서 사용된 7MS320C62xx의 경우 1,200∼2,400MIPS의 성능을 가지므로 PC강 C컴파일러에서도 최적화 되지 않은 MELP의 복잡도가 일정 레벨에서 실시간이 가능하도록 하였다. 먼저 C레벨에서 최적화 작업을 거친후, 논문에서 사용된 DSP에서 제공하는 컴파일러에서의 최적화 과정을 통해 실시간 동작하도록 하였다. 또한 PC용 C 컴파일러에서 시뮬레이션 한 결과와 DSP 상에서 구현한 복호화기의 출력이 정확히 일치함을 검증하였다.
-
최근에 3 차원 가상 내시경은 환자에게 고통을 주지않고 내부 기관을 볼 수 있는 대체 방법으로 주목을 받고 있다. 인터랙티브(interacticve)한 렌더링 속도로 기관의 내부 표면을 도시하기 위해 표면 렌더링이 사용될 수 있지만, 이는 사실적인 렌더링 화질을 얻기에 부적합하고, 병변의 자세한 구조를 표현하기에 적합하지 않으며, 표면 뒤편의 조직을 도시할 수 없다. 이러한 이유로 볼륨 렌더링이 표면 렌더링의 대안으로 사용될 수 있지만 많은 계산량을 필요로 하므로, 대부분의 볼륨 렌더링 기반의 가상 내시경 시스템들은 부가적인 하드웨어나 큰 용량의 메모리를 사용한다. 본 논문은 가상 내시경을 위해 원근 레이 캐스팅 (perspective ray casting)을 이용한 볼륨 렌더링 기법의 고속화에 그 목적이 있다. 렌더링 속도를 높이기 위해서 서브샘플링(sub-sampling)된 화소들에 대해 레이 캐스팅을 수행하고, 이 과정에서 동시에 깊이 정보를 얻는다. 얻어진 깊이 정도로부터 남아있는 화소들에 대한 깊이 정보를 예측함으로써. 이를 레이 캐스팅의 속도 향상에 이용한다. 제안한 알고리즘을 이용하여 기존의 방법에 비해 기관지 내시경에서 77%, 대장 내시경에서 85%까지 렌더링 시간을 줄일 수 있고, 따라서 인터랙티브 렌더링이 가능하다.
-
본 논문에서는 조명의 변화에 의해 컬러 영상의 컬러 성분이 달라지더라도 영상 내 컬러간의 편차값을 나타내는 공분산 행렬(covariance matrix)의 고유벡터(eigenvector)와 영상 내 화소들의 컬러 성분과의 상관관계는 거의 변화하지 않는 특징을 이용한 조명 변화에 강인한 영상 검색 방법을 제안한다. 제안된 방법은 영상에서 컬러 성분들의 공분산 행렬과 공분산 행렬의 고유치(eigenvalue), 고유벡터를 계산한 후, 가장 큰 고유치에 관계된 고유벡터로 화소를 투영시키고, 투영된 벡터의 크기 성분으로 영상을 재구성한다. 재구성된 영상으로부터 7개의 불변 모멘트(moment)를 계산하고, 공분산의 가장 큰 고유치를 가중치로 부과하여 특징벡터를 추출한다. 7개의 불변 모멘트로부터 구한 특징벡터는 영상 내 물체의 이동, 영상의 회전, 크기 변화뿐만 아니라, 조명의 변화에 의해 컬러가 변화할 경우에도 유사한 영상을 잘 검색한다. 제안된 방법의 성능 확인을 위하여 5가지 조명에서 얻은 영상 데이터베이스를 이용하여 실험하였으며, 실험 결과 히스토그램 인터섹션에 비해 적은 특징량으로 검색이 가능하면서 조명 변화에도 대응할 수 있는 검색 결과를 얻을 수 있었다.
-
In this paper, we address a new time delay estimation method using third-order statistics and subband adaptive filtering to improve the accuracy of target detection for acoustic backscattered signals in a noise interference environment. Each reference and primary signals are decorrelated using the multiresolution analysis framework through a M-band discrete wavelet transform(M-DWT). Then noise effect can be reduced. Here, time delays are estimated iteratively in each subband using two different adaptation mechanisms that minimize the mean squared error (MSE) between the references and primary signal. More specifically, third-order cumulants and projection cross-correlation(PCC) criterion are utilized to achieve an effective SNR improvement for the time delay estimation.
-
본 논문에서는 10Gigabit Ethernet 물리계충 전송 기술로서 IEEE 802.3 Higher Speed Study Group (HSSG)에서 검토했던 방법으로 선로부호화 방법이 있는데 그 중에서 국내 연구진에 의해 제안된 최소 대역폭 선로부호 MB810을 사용하여 10Gigabit Ethernet에서의 clock recovery 가능성에 대해 알아 본다. MB810 code를 사용하면 기존의 통신 시스템에서 필요로하는 대역폭을 반만 사용하여 전송할 수 있기 때문에 대역 효율이 좋아지나 이전의 일반적인 square law 방법으로는 clock recovery가 어렵다. 본 논문에서는 4th power law 방법을 사용했을때의 이론적인 해석과 시뮬레이션 결과를 보인다.
-
In this paper we study a new convergence behavior of the least mean fourth (LMF) algorithm where the error raised to the power of four is minimized for a multiple sinusoidal input and Gaussian measurement noise. Here we newly obtain the convergence equation for the sum of the mean of the squared weight errors, which indicates that the transient behavior can differ depending on the relative sizes of the Gaussian noise and the convergence constant. It should be noted that no similar results can be expected from the previous analysis by Walach and Widrow.
-
다중 반송파를 사용하는 직접 확산 코드 분할 다중 접속 방식에서는 다중 사용자들에 의해서 시스템의 성능에 영향을 미치는 문제인 다중 사용자 간섭이 발생된다. 이 문제를 해결하기 위해서 사용된 기법이 다중 사용자 검출이다. 기존 방안으로 부공간 최소 평균 제곱 에러 다중 사용자 검출기가 존재한다. 이 검출기는 정확한 타이밍과 채널에 대한 정보가 필요하다. 이에 이점을 극복하기 위해서 부공간 MMSE 구조에 적응 구조를 더하여 검출 능력을 향상 시키고자 하였다. 모의 실험 결과 제안된 검출기가 기존 검출기 보다 BER 10/sup -3/ 기준에서 약 0.5[dB]의 신호대 잡음 이득을 얻을 수 있음을 나타내고 있다. 따라서 제안된 검출기가 기존 검출기보다 더 나은 성능을 지니고 있음을 알 수 있다.
-
In this paper, we investigate a new approach pilot-symbol-aided channel estimation for orthogonal frequency division multi-plexing (OFDM) systems. Until now, lots of channel estimation methods are proposed. The pilot symbol assisted modulation (PSAM) has good performance. But, our proposed Algorithm has more good performance than the conventional PSAM system. Our algorithm is that channel estimation performance using the less inserted pilot-symbols systems is almost same to the two times inserted pilot-symbols system. The proposed method is highly robust to fast Rayleigh fading channel. Simulation results are presented to demonstrate the performance of our proposed algorithm.
-
본 논문에서는 웨이블렛 변환 알고리듬을 이용 한 음향반향 제거 기법을 제안하였다. 일반적으로 LMS 알고리듬은 간단하지만 그 수렴특성이 고유치 분포율과 탭 수에 의해 결정되는 단점이 있고 MDF (multidelay filter)를 이용한 적응 알고리듬은 블록단위로 수행되는 LMS를 수렴속도 측면에서 보완해주지만 긴 차수일때는 FFT에 비례하여 연산량이 늘어나는 단점이 있다. 본 논문은 웨이블렛의 직교성을 이용한 변환 적응 알고리듬을 음향반향 제거기에 도입하여 그 성능을 비교·평가하였다. 모의실험을 통해 시간영역 LMS, MDF 알고리듬과 비교하여 제안한 알고리듬의 수렴성능이 우수함을 보였다.
-
고정 계수를 갖는 곱셈기의 구현 시 면적과 전력소모를 줄이기 위해서 곱셈계수를 CSD(Canonic Signed Digit) 형태로 표현 할 수 있다. CSD 계수의 1 또는 -1의 위치에 따라 부분곱들을 시프트 하여 더할 때 모든 부분곱들의 부호확장이 필요하며 이로 인해 하드웨어의 오버헤드가 증가하게 된다. 본 논문에서는 부호확장 부분에서의 캐리 전파를 적절히 조절함으로써 부호확장으로 인한 오버헤드를 조절 할 수 있다는 사실을 이용하여 새로운 부호확장 오버혜드 감소방법을 제시한다. 제안한 방법과 기존의 방법을 다양한 시뮬레이션을 통해서 비교하고 기존의 방법에 비해 약 30%의 부호확장 오버헤드를 줄일 수 있음을 보인다.
-
본 논문에서는 하드디스크를 내장한 디지털 위성방송 수신기의 설계 및 구현에 대해 기술한다. 디지털 방송 기술의 발달로 인해 방대한 양의 디지털 멀티미디어 데이터의 전송과 접근이 가능해졌다. 이러한 방송 데이터를 실시간으로 저장하기 위한 하드디스크 인터페이스와 방송의 저장과 재생 등 기존 아날로그 비디오 레코더가 가지는 기능 외에 하드디스크의 특성을 이용한 랜덤 액세스 기능 등 디지털 비디오 레코더(DVR)의 기능이 포함된 하드디스크 내장 위성방송 수신기를 개발하였다. 이 수신기는 PC에서 사용되는 파일 시스템보다 멀티미디어 데이터에 적합하도록 디스크 클러스터의 크기와 한정된 메모리를 고려하여 설계된 파일 시스템을 이용해 저장된 멀티미디어 데이터를 효과적으로 관리하는 부분을 포함한다. 이러한 시스템을 이용함으로써 방송의 효과적인 시청과 멀티미디어 데이터의 효율적인 관리가 가능해진다.
-
본 논문에서는 ITU-T G.723.1, G.729 부호화기와 MLT(Modulated Lapped Transform) 방법을 이용한 광대역 음성 부호화방법을 제안한다. 제안된 광대역 음성부호화 방법은 16 kHz로 샘플링된 입력신호를 QMF(Quadrature Mirror Filter)사용하여 저대역과 고대역으로 나누며, 각 대역은 8 kHz의 샘플링을 갖는 협대역 음성 신호로 변환된다. 고대역은 MLT변환 후 벡터 양자화하며 또한 MLT를 사용한 ATC(Adaptive Transform Coding)방법을 적용하여 표현하며 저대역은 G.723.1과 G.729 부호화기를 사용한다. 설계된 광대역 음성부호화기의 성능을 평가하기 위하여 MOS (Mean Opinion score)실험을 수행하였다. MOS 실험을 통해 16 kbps G.729-MLT VQ방식이 G.722 56kbps 와 비슷한 음질을 나타내었다.
-
We have developed a PVR (Personal Video Recorder) chip that is capable of simultaneous playback and recording of HD quality MPEG-2 streams for digital TV. it provides viewers with some advanced features as well as pause, instant replay, skip forward and fast forward/rewind found in conventional PVRs for analog TV. This paper describes the enhanced and innovative features that art implemented on our PVR.
-
This paper implements H.263 codec using SIMD(single instruction multiple data) method in real time based on PC. This system uses INS algorithm previously proposed by the authors as motion estimation module. SIMD method is used in DCT, IDCT, quantization, motion estimation, and display module. The developed algorithms are implemented using TMN5. Using the above algorithm, H.263 Codec can communicate more than 15 frames/sec in CIF resolution on a Pentium-IV 1.7GHz computer.
-
본 논문에서는 SDR (Software Defined Radio)시스템을 위한 디지털 IF (Intermediate Frequency)수신기를 구현하였다[1][2]. 구현된 수신기의 하드웨어 구조는 AD변환부, PDC(Programmable Down Converter)부, DSP (Digital Signal Processing)부분으로 이루어졌다. AD변환부는 Analog Devices사의 AD6644를 이용하여 아날로그 신호를14bit의 디지털 신호로 변환된다. PDC부분은 Intersil사의 HSP 50214B를 이용하여 14bit 샘플 된 IF(Intermediate Frequency)입력을 혼합기와 NCO(Numerically Controlled Oscillator)에 의해 기저대역으로 다운 시키는 역할을 한다. PDC는 CIC (Cascaded Integrator Comb)필터, Halfband 필터 그리고 프로그램할 수 있는 FIR필터로 구성되어 있다. 그리고 PDC부분을 제어하고 PDC부분에서 처리할 수 없는 캐리어, 심볼 트래킹을 위해 Texas Instrument사의 16비트의 고정소수점 DSP인 TMS320C5416과 Altera사의 FPGA를 사용하였다. 그러므로 중간주파수 대역과 기저대역 간의 신호변환을 디지털 신호처리를 수행함으로써 일반적인 아날로그 처리방식보다 고도의 유연성과 고성능 동작이 가능하고 시간과 환경 변화에 우수한 동작 특성을 제공한다.
-
본 논문에서는 비동기 CDMA 시스템에서 다중접속에 의한 간섭을 제거하는 역상관기 중에서 반복 연산을 사용하여 계산량을 개선한 second-order stationary 기반의 반복적 역상관기와 수렴특성에 대하여 이론적으로 분석하고 모의실험을 통하여 성능을 검증하였다. 먼저 반복적 역상관기에서 수렴특성을 결정하는 수렴 인자를 유도하고 가장 빠른 수렴 특성을 보장하는 최적의 수렴상수를 상관행렬의 최대 및 최소 고유값으로 나타낼 수 있음을 증명하였다. 또한 최적의 수렴 상수와 반복회수에 따른 BER이 기존의 역상관기와 비슷한 성능을 가짐을 보였다.
-
Turbo codes of long block sizes have been known to show very good performance in an AWGN channel and the turbo code has been strongly recommended as error correction code for IMT-2000 in 3GPP(3rd Generation Partnership Project). Recently, turbo codes of short block sizes suitable for real time communication systems have attracted a lot of attention. Thus, in this paper we consider the turbo code of 1/3 code rate and short frame size of 192 bits in ITU-R channel model. We analyzed the performance of W-CDMA systems of 10MHz bandwidths employing RAKE receiver with not only MRC diversity but also turbo code.
-
The wideband DS-CDMA (W-CDMA) system is one of the candidates for the next generation mobile communication system known as IMT-2000. The important concept of W-CDMA is the introduction of intercell asynchronous operation. In this paper, we design and analyze the system level simulator for the International Mobile Tele communication - 2000 (IMT-2000) 3-rd generation partnership project (3GPP) system. We confirm how the simulator works by BER over different Eb/NO. This study will be expected to use as reference data in the development of asynchronous IMT-2000. In this paper, we analyze a physical layer of W-CDMA system and design a transmitter and receiver by using ADS (Advanced Design System). Also, we simulated a link level performance in Rayleigh fading channel environment. This study will be useful in the analysis and design of W-CDMA system.
-
본 논문에서는 적응 필터의 계수 갱신에서 가변 블록을 사용하는 방법을 제안하였다. 데이터 블록의 길이는 MSE 학습곡선의 시정수에 비례하도록 하였다. 이 방법에서는 적응 필터가 정상상태로 접근함에 따라 스텝사이즈를 조정하여 필터계수 갱신의 횟수를 줄일 수 있다. 제안한 방법의 유용성을 입증하기 위한 컴퓨터모의 실험을 통해 기존의 최적 스텝사이즈 수열을 이용한 알고리듬과 가변 스텝사이즈 알고리듬과 성능을 비교하였다. 그리고 MSE 의 초기값을 최소화하는 최적 초기 스텝사이즈를 유도하였다. 유도된 최적 스텝사이즈를 가변 스텝사이즈 알고리듬에 적용, 그 성능을 평가 하였다.
-
Multi-Carrier Spread Spectrum communications has shown the ability of transform domain excision using the wavelet transformation to improve system performance when transmitting signals in the presence of additive white Gaussian noise and interference. In such work, the transforms were implemented using FIR filters and IIR filter. Some well-known classes of sequences, such as Pseudo noise, Walsh, Cold sequences are evaluated with respect to the basic criteria. The main objective is to implement the wavelet transform using IIR filters. This filters are well known to have sharper transition regions leading to better performance. Numerical simulation of multi-carrier spread spectrum communication systems have shown that IIR filters are better in removing the sinusoidal jammer and subsequently yield better BER performance.
-
In connection with the monitoring of the insulation degradation of large power apparatus in order to predict their expected service failures, a statistical treatment, such as phase resolved partial discharge analysis (PRPDA), has been established for the on-line monitoring system during the past decades. However, this method has shown some inconveniences to identify the nature of the PD source in power apparatus. In this regard, a novel approach based on the chaotic analysis (CAPD) is proposed describing the fundamental ideas, outcomes and different viewpoints from the conventional PRPDA. As a model for the possible defects causing sudden failures in service, three types of specimen are prepared. And partial discharge signals, originated from those samples, are measured and analyzed by means of CAPD. Throughout this work, it seems that the correlation between the consecutive PD pulses, depending on the nature of PD, could be clarified by CAPD. Thereffre, it could be considered that the nature of PD source can be identified more distinctively when the CAPD is combined with PRPDA.
-
본 논문은 이동물체 영역을 신뢰성 있게 분리하는데 기초가 되는 seed를 정확하게 선정하고, 선정된 seed를 중심으로 영역을 확장함으로써 이동물체 영역을 분리하기 위한 방법을 제안한다. 고정된 카메라로부터 입력되는 연속된 영상열로부터 초기의 이동물체가 존재하지 않는 영상을 참고영상으로 하여 입력영상과의 차영상을 구하고 차영상의 히스토그램에서 배경잡음 모델링을 통해 배경잡음을 제거한다. 그리고 배경잡음이 제거된 차영상에서 Local Maxima 들을 이용해 후보 seed를 선정한 후, 이드의 특징값들을 분석하여 이동물체의 seed와 배경의 seed 를 결정하고 이 두 개의 seed를 기반으로 watershed 알고리즘을 적용하여 영역을 확장함으로써 이동물체 영역을 추출한다. 제안된 방법을 실제 상황에서 얻은 다양한 영상열에 적용한 결과, 기존의 영역분리 알고리즘보다 주위 잡음의 영향을 적게 받으며 효과적으로 이동물체를 분리할 수 있음을 확인할 수 있었다.
-
본 논문은 DCT를 기반으로 하여 비디오 내에서 자막을 I-frame들로부터 추출하였다. 본 논문에서 제안하는 자막 검출 및 추출 방법은 자막이 주위 배경 화면과 그 대비 값이 크다는 점과 화면상에 일정한 시간동안 유지된다는 점을 이용하였다. 먼저 비디오 내에서 I-frame들의 DCT 값들로부터 주위 배경화면과 비교하여 그 대비 값이 큰 영역들을 표시하였다. 이로부터 자막의 시간적 특성과 공간적 특성을 이용하여 자막을 포함하는 프레임을 검출하여, 그 내에 있는 자막 영역을 추출하였다.