• 제목/요약/키워드: multi-frame detection

검색결과 65건 처리시간 0.026초

IMT-2000 비동기식 단말기용 ASIC을 위한 적응형 다중 비트율 (AMR) 보코더의 구현 (Implementation of Adaptive Multi Rate (AMR) Vocoder for the Asynchronous IMT-2000 Mobile ASIC)

  • 변경진;최민석;한민수;김경수
    • 한국음향학회지
    • /
    • 제20권1호
    • /
    • pp.56-61
    • /
    • 2001
  • 본 논문은 비동기 방식의 IMT-2000 단말기용 ASIC (주문형 집적회로)에 포함되는 음성부호화기 알고리즘인 AMR(Adaptive Multi Rate) 보코더의 실시간 구현에 관한 것이다. 구현된 AMR 보코더는 12.2kbps에서 4.75kbps까지 8가지의 다중 비트율을 가지고 있으며, 인코더와 디코더 기능 외에 VAD (Voice Activity Detection) 블록과 SCR (Source Controlled Rate operation) 블록 등의 부가기능 및 시스템과의 접속 처리를 위한 프레임 구성 기능도 구현되어 있다. AMR 보코더를 구현하기 위하여 설계된 DSP (디지털 신호처리기)는 TeakLite 코어를 기반으로 하여 메모리 블록, 직렬접속 블록, CPU와의 접속을 위한 레지스터 파일 블록, 인터럽트 제어회로 등으로 구성된 16비트 고정 소수점형 DSP이다. 실시간 구현 방법에서는 메모리의 효율적인 관리를 통하여 계산량을 최적화하여 최대 동작 계산량을 약 24MIPS로 줄였으며, 구현된 AMR 보코더는 3GPP의 표준 시험 벡터를 모두 통과하여 검증을 완료하고, 실시간 보드 시험에서도 안정적으로 동작하는 것이 확인되었다.

  • PDF

컷 전환에 적응적인 혼합형 초고해상도 기법 (Hybrid Super-Resolution Algorithm Robust to Cut-Change)

  • 권순찬;임종명;유지상
    • 한국정보통신학회논문지
    • /
    • 제17권7호
    • /
    • pp.1672-1686
    • /
    • 2013
  • 본 논문에서는 이산 웨이블릿 변환(discrete wavelet transform: DWT)을 이용한 단일영상 기반의 초고해상도 기법(super-resolution)과, 복수영상 기반의 초고해상도 기법을 제시하고 두 기법을 혼합한 새로운 초고해상도 기법 기법을 제안한다. 기존의 단일 영상 기반의 초고해상도 기법의 경우 처리 시간이 빠르다는 장점이 있으나 영상 보간 시 사용할 수 있는 정보량이 제한적이다. 또한 기존 복수영상 기반의 초고해상도 기법은 단일 영상을 사용했을 경우보다 영상의 보간 시 많은 정보를 사용할 수 있으나 영상의 내용에 따라 기법의 적용이 제한적이고, 컷(cut)의 경계 부근에서 기법의 성능이 매우 떨어지는 단점이 있다. 제안된 기법에서는 컷 검출(cut-detection) 기법을 통해 각 장면의 경계부근에서 적응적으로 단일영상 기반의 초고해상도 기법을 사용한다. 또한 움직임 벡터의 정규화 및 블록 단위의 윤곽선(edge) 패턴 분석을 통해 여러 제한조건에 강한 복수 영상 기반의 초고해상도 기법을 제안한다. 실험을 통하여 제안된 기법이 객관적, 주관적으로 기존의 기법보다 우수한 성능을 보이는 것을 확인하였다.

동시구동 및 순차센싱을 이용한 대형 정전용량 터치스크린용 고속 센싱 기법 (A Fast Sensing Method using Concurrent Driving and Sequential Sensing for Large Capacitance Touch Screens)

  • 모하메드 모하메드 가말 아흐메드;김형원;조태원
    • 전자공학회논문지
    • /
    • 제52권4호
    • /
    • pp.62-70
    • /
    • 2015
  • 최근 스마트폰의 발달과 더불어 대형 TV, 의료용 장비 및 전자 칠판에도 터치스크린의 수요가 급증하고 있다. 스크린 사이즈가 증가 할수록 고해상도를 위하여 훨씬 더 많은 채널이 추가 되면서 한 프레임을 스캔하는데 긴 시간이 소요되어 터치감지 지연이 큰 문제가 되고 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 새로운 드라이빙 및 센싱 기법을 제안한다. 이 기법은 differential 드라이빙 방법으로 2 단계로 수행되어진다. 먼저 고속 센싱 프로세스를 통해 터치가 발생된 센싱 라인들을 우선 대략적으로 도출해 낸 후 정확한 터치 위치 스캔을 위해서 터치된 라인에서만 감지가 수행되어 진다. 이 방법을 사용하면 터치 패널의 frame refresh rate를 향상 시킬 수 있다. 제안된 구조는 FPGA와 개발된 AFE board로 구현되었으며, 23인치 상용 터치패널을 사용하여 테스트하였다. 이 기법은 기존 대비 frame scan rate를 8.4배 향상시킨다.

효율적인 하모닉-CELP 구조를 갖는 저 전송률 음성 부호화기 (Efficient Harmonic-CELP Based Low Bit Rate Speech Coder)

  • 최용수;김경민;윤대희
    • 한국음향학회지
    • /
    • 제20권5호
    • /
    • pp.35-47
    • /
    • 2001
  • 본 논문에서는 하모닉 부호화기와 CELP(Code Excited Linear Prediction) 부호화기의 장점을 고려한 효율적인 저 전송률 하모닉-CELP 음성 부호화기를 제안한다. 제안된 하모닉-CELP 부호화기에서는 프레임 단위 유/무성음 판별에 따라 무성음 구간에서는 고속 CELP방식으로 부호화하고 유성음 구간에서는 개선된 하모닉 부호화를 수행한다. 제안된 부호화기는 무성음 부호화를 위한 RP-VSELP(Regular Pulse Vector Sum Excited Linear Prediction), 유성음 부호화를 위한 간단한 정수 피치 검색, 정수 단위 피치에서의 고속 하모닉 추정, 가변 차원 하모닉 벡터 양자화, 주파수 해상도를 반영한 인지 가중치, 고속 하모닉 합성, 대역별 유성음 정도에 따른 자연성 제어, 다중 모드 등을 주요한 특징으로 하며, 이러한 특징들로 인해 기존의 HVXC(Harmonic Vector eXeited Coder) 부호화기에 비해서 매우 낮은 복잡도를 갖는다. 주관적인 음질 평가 결과, 제안된 2.4 kbps 하모닉-CELP 부호화기는 낮은 지연과 적은 계산량으로 양호한 음질을 얻을 수 있음을 확인하였다.

  • PDF

주변 전경 픽셀 전파 알고리즘 기반 실시간 이동 객체 검출 (A Real-time Motion Object Detection based on Neighbor Foreground Pixel Propagation Algorithm)

  • 응웬탄빈;정선태
    • 대한전자공학회논문지SP
    • /
    • 제47권1호
    • /
    • pp.9-16
    • /
    • 2010
  • 이동 객체 검출은 입력 영상에서 배경과 다른 전경 객체를 찾는 것을 말하는 것으로 지능 영상 감시, HCI, 객체 기반 영상 압축 등의 여러 영상 처리 응용 분야에서 필요한 과정이다. 기존의 이동 객체 검출 알고리즘은 상당한 계산량을 요구하여 다채널 영상 감시 응용, 또는 임베디드 시스템에서의 단일 채널의 실시간 응용에 사용하는 데 애로가 많다. 보다 정확한 이동 객체 검출을 위하여 필요한 과정인 전경 마스크 정정은 보통 열림, 닫힘 등의 모폴로지 연산을 통해 수행된다. 모폴로지 연산은 계산량이 적지 않고 게다가 프로세싱 방법이 달라 이동 객체 검출의 다음 단계인 연결 요소 레이블링 루틴과 동시에 처리되기 어렵다. 본 논문에서는 먼저 모폴로지 연산과는 달리 연결 요소 레이블링 루틴에서 사용되는 주변 픽셀 점검 과정을 활용한 전경 마스크 정정 알고리즘인 "주변 전경 픽셀 전파"을 고안하고, 이를 활용하여 전경 마스크 정정과 연결 요소 레이블링이 동시에 수행될 수 있는 이동 객체 검출 방법을 제안한다. 실험을 통해, 제안된 이동 객체 검출 방법이 기존의 모폴로지 연산을 사용한 방법 보다 정확하게 이동 객체를 검출하였으며, 대상 실험 영상 프레임 및 비디오에 대해서는 최소 4배 이상 신속하게 처리됨을 확인하였다.

DNN 학습을 이용한 퍼스널 비디오 시퀀스의 멀티 모달 기반 이벤트 분류 방법 (A Personal Video Event Classification Method based on Multi-Modalities by DNN-Learning)

  • 이유진;낭종호
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1281-1297
    • /
    • 2016
  • 최근 스마트 기기의 보급으로 자유롭게 비디오 컨텐츠를 생성하고 이를 빠르고 편리하게 공유할 수 있는 네트워크 환경이 갖추어지면서, 퍼스널 비디오가 급증하고 있다. 그러나, 퍼스널 비디오는 비디오라는 특성 상 멀티 모달리티로 구성되어 있으면서 데이터가 시간의 흐름에 따라 변화하기 때문에 이벤트 분류를 할 때 이에 대한 고려가 필요하다. 본 논문에서는 비디오 내의 멀티 모달리티들로부터 고수준의 특징을 추출하여 시간 순으로 재배열한 것을 바탕으로 모달리티 사이의 연관관계를 Deep Neural Network(DNN)으로 학습하여 퍼스널 비디오 이벤트를 분류하는 방법을 제안한다. 제안하는 방법은 비디오에 내포된 이미지와 오디오를 시간적으로 동기화하여 추출한 후 GoogLeNet과 Multi-Layer Perceptron(MLP)을 이용하여 각각 고수준 정보를 추출한다. 그리고 이들을 비디오에 표현된 시간순으로 재 배열하여 비디오 한 편당 하나의 특징으로 재 생성하고 이를 바탕으로 학습한 DNN을 이용하여 퍼스널 비디오 이벤트를 분류한다.

Multi-Channel Data Acquisition System Design for Spiral CT Application

  • Yoo, Sun-Won;Kim, In-Su;Kim, Bong-Su;Yun Yi;Kwak, Sung-Woo;Cho, Kyu-Sung;Park, Jung-Byung
    • 한국의학물리학회:학술대회논문집
    • /
    • 한국의학물리학회 2002년도 Proceedings
    • /
    • pp.468-470
    • /
    • 2002
  • We have designed X-ray detection system and multi-channel data acquisition system for Spiral CT application. X-ray detection system consists of scintillator and photodiode. Scintillator converts X-ray into visible light. Photodiode converts visible light into electrical signal. The multi-channel data acquisition system consists of analog, digital, master and backplane board. Analog board detects electrical signal and amplifies signal by 140dB. Digital board consists of MUX(Multiplex) which routes multi-channel analog signal to preamplifier, and ADC(Analog to Digital Converter) which converts analog signal into digital signal. Master board supplies the synchronized clock and transmits the digital data to image reconstructor. Backplane provides electrical power, analog output and clock signal. The system converts the projected X-ray signal over the detector array with large gain, samples the data in each channel sequentially, and the sampled data are transmitted to host computer in a given time frame. To meet the timing limitation, this system is very flexible since it is implemented by FPGA(Field Programmable Gate Array). This system must have a high-speed operation with low noise and high SNR(signal to noise ratio), wide dynamic range to get a high resolution image.

  • PDF

세선화 알고리즘 기반의 에지검출을 이용한 멀티센서 영상의 자동매칭 (Automatic Matching of Multi-Sensor Images Using Edge Detection Based on Thinning Algorithm)

  • 신성웅;김준철;오금희;이영란
    • 한국측량학회지
    • /
    • 제26권4호
    • /
    • pp.407-414
    • /
    • 2008
  • 본 논문은 항공사진과 위성영상의 서로 다른 해상도를 지닌 이종센서 영상들에 대한 효율적인 특이점 자동 매칭 기법에 대한 알고리즘에 관한 연구이다. 본 연구의 자동 매칭 알고리즘은 매칭 정확도 및 속도를 향상시키기 위해 다양한 영상 처리 방법을 적용하였다. 특이점을 추출하기 위하여 전처리 과정, 필터링, 세선화, 특이점 추출 방법을 사용하였으며, 특이점에 대한 키서술자(Key-descriptor)를 비교하여 매칭의 정확도를 향상시켰다. 특히 본 연구에서 제안된 이종센서간의 정확도 높은 자동 영상 매칭을 위해 센서마다 지닌 기하학적 및 방사학적인 영상의 특징을 활용하였다. 아울러 매칭 속도를 높이기 위해 센서 모델을 이용하여 탐색 영역을 최소화 하고 매칭이 잘못된 특이점을 제거할 수 있는 방법을 제시하고 있다.

영상회의를 위한 화자 검출 시스템 (Speaker Detection System for Video Conference)

  • 이병선;고성원;권혁봉
    • 조명전기설비학회논문지
    • /
    • 제17권5호
    • /
    • pp.68-79
    • /
    • 2003
  • 본 논문에서는 여러 사람이 참여하는 영상 회의에서 입술 움직임 정보를 이용하여 화자를 검출하는 시스템을 구현하였다. 구현된 시스템은 얼굴색 정보와 형태 정보를 이용하여 각 사람의 얼굴 및 입술 영역을 검출한 후, 입술 영역에서 이전 프레임과의 변화량을 계산하여 화자를 검출한다. 검출된 화자를 클로즈업하기 위하여 두 대의 CCD카메라를 사용하였으며, RS-232C시리얼 포트를 이용하여 PTZ 카메라를 제어한다. 실험 결과 3인 이상의 입력 동영상에서 얼굴의 기울어짐에 무관하게 화자를 검출할 수 있었으며 최초 기준 영상에서 화자를 클로즈업하는데 약 4∼5초 정도의 시간이 소요되었다. 또한 320${\times}$240 크기의 얼굴 영역 화면과 전체적인 배경 화면을 동시에 제공하므로 영상회의 및 인터넷 방송 등과 같은 영상 전송 시스템에서 보다 효율적인 의사 전달이 가능하게 하였다.

Performance-based and damage assessment of SFRP retrofitted multi-storey timber buildings

  • Vahedian, Abbas;Mahini, Seyed Saeed;Glencross-Grant, Rex
    • Structural Monitoring and Maintenance
    • /
    • 제2권3호
    • /
    • pp.269-282
    • /
    • 2015
  • Civil structures should be designed with the lowest cost and longest lifetime possible and without service failure. The efficient and sustainable use of materials in building design and construction has always been at the forefront for civil engineers and environmentalists. Timber is one of the best contenders for these purposes particularly in terms of aesthetics; fire protection; strength-to-weight ratio; acoustic properties and seismic resistance. In recent years, timber has been used in commercial and taller buildings due to these significant advantages. It should be noted that, since the launch of the modern building standards and codes, a number of different structural systems have been developed to stabilise steel or concrete multistorey buildings, however, structural analysis of high-rise and multi-storey timber frame buildings subjected to lateral loads has not yet been fully understood. Additionally, timber degradation can occur as a result of biological decay of the elements and overloading that can result in structural damage. In such structures, the deficient members and joints require strengthening in order to satisfy new code requirements; determine acceptable level of safety; and avoid brittle failure following earthquake actions. This paper investigates performance assessment and damage assessment of older multi-storey timber buildings. One approach is to retrofit the beams in order to increase the ductility of the frame. Experimental studies indicate that Sprayed Fibre Reinforced Polymer (SFRP) repairing/retrofitting not only updates the integrity of the joint, but also increases its strength; stiffness; and ductility in such a way that the joint remains elastic. Non-linear finite element analysis ('pushover') is carried out to study the behaviour of the structure subjected to simulated gravity and lateral loads. A new global index is re-assessed for damage assessment of the plain and SFRP-retrofitted frames using capacity curves obtained from pushover analysis. This study shows that the proposed method is suitable for structural damage assessment of aged timber buildings. Also SFRP retrofitting can potentially improve the performance and load carrying capacity of the structure.