• 제목/요약/키워드: 입출력 최적화

검색결과 128건 처리시간 0.023초

TMS320C6201을 이용한 MPEG-1 Layer III 오디오 디코더의 실시간 구현 (Real-Time Implementation of MPEG-1 Layer III Audio Decoder Using TMS320C6201)

  • 권홍석;김시호;배건성
    • 한국통신학회논문지
    • /
    • 제25권8B호
    • /
    • pp.1460-1468
    • /
    • 2000
  • 본 논문에서는 고정소수점 DSP인 TMS320C6201을 이용하여 MPEG-1 Layer III 오디오 디코더를 실시간으로 동작하도록 구현하였다 음질의 손실 없이 부동소수점 연산을 고정소수점 연산으로 변환하였으며 적은 메모리를 사용하여 동작하도록 소스프로그램을 최적화하였다 특히 연산의 정확성을 위해서 Descaling 모듈에서 중점적으로 부동소수점 연산을 고정소수점 연산으로 변환하여UT고 연산량과 프로그램 크기를 줄이기 위해서 IMDCT 모듈과 Synthesis Polyphase Filter Bank 모듈에 대해서 최적화 작업을 수행하였다 그 결과 구현된 디코더는 TMS320C6201 DSP가 수행할 수 있는 최대 연산량의 26% 만으로 실시간 동작이 가능하여UT으며 사용된 프로그램 ROM의 크기는 3.13 kWord 데이터 RAM의 크기는 9.94 kWord 이었다 부동소수점 프로그램의 최종 출력 PCM값과 구현된 고정소수점 연산의 최종 출력 PCM값을 비교하여 60 dB 이상의 높은 SNR를 가짐을 확인함으로써 고정소수점 연산의 정확성을 검증하였다. 또한 EVM 보드에서 사운드 입출력과 호스트(PC) 통신을 이용하여 실시간으로 동작함을 확인하였다.

  • PDF

내장형 실시간 시스템의 성능 개선을 위한 리엔지니어링 기법 (Performance Reengineering of Embedded Real-Time Systems)

  • 홍성수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권5_6호
    • /
    • pp.299-306
    • /
    • 2003
  • 본 논문에서는 내장형 실시간 시스템의 성능 개선을 위한 리엔지니어링(performance re-engineering) 기법을 제시한다. 시스템 리엔지니어링은 구현이 완료된 시스템에서 새로운 성능 요구사항을 만족시키기 위한 일련의 작업이라 할 수 있다. 일반적으로 실시간 시스템의 성능은 실시간 처리량(real-time throughput)과 입출력 시간 지연(input-to-output latency) 등으로 기술할 수 있으며 새로운 성능 요구사항은 이와 같은 파라미터를 통해 기술된다. 본 연구의 리엔지니어링 기법은 두 단계로 구성된다. 첫째, 시스템을 프로세스 네트워크의 형태로 파악한 후, 프로세스의 수행시간을 분석하여 병목(bottleneck)이 되는 프로세스를 찾아낸다. 둘째, 병목 프로세스의 수행시간을 개선한 수 있도록 프로세싱 요소의 성능비례계수(performance scaling factor)를 구한다. 성능비례계수는 성능 개선을 비율로 나타낸 것으로서 리엔지니어링 비용을 최소화하도록 그 값을 구한다. 따라서 유도된 성능비례계수에 따라 하드웨어 장치를 업그레이드하면 하드웨어 비용을 최적화할 수 있다. 이러한 방법을 사용하면 소프트웨어를 수정할 필요가 없으며, 리엔지니어링 비용 및 시간을 단축할 수 있다.

저 전력 시스템을 위한 파워다운 구조를 가지는 이중 전하 펌프 PLL 기반 클록 발생기 (A Dual Charge Pump PLL-based Clock Generator with Power Down Schemes for Low Power Systems)

  • 하종찬;황태진;위재경
    • 대한전자공학회논문지SD
    • /
    • 제42권11호
    • /
    • pp.9-16
    • /
    • 2005
  • 이 논문에서는 다중 동작 주파수를 갖는 고성능 저전력 SoC에 사용 가능한 광대역 입출력 주파수를 지원하는 프로그램머블 PLL 기반의 클록킹 회로을 제안하였다. 제안된 클록 시스템은 이중 전하펌프를 이용 locking 시간을 감소시켰고, 광대역 주파영역에서 동작이 가능하도록 하였다. 칩의 저 전력 동작을 위해 동작 대기모드 시에 불필요한 PLL 회로를 지속적으로 동작시키지 않고 relocking 정보를 DAC를 통해 보존하고 불필요한 동작을 억제하였고, 대기모드에서 빠져나온 후 tracking ADC(Analog to Digital Converter)를 이용하여 빠른 relocking이 가능하도록 설계하였다. 또한 프로그램머블하게 출력 주파수를 선택하게 하는 구조를 선택하여 저 전력으로 최적화된 동작 주파수를 지원하기 위한 DFS(Dynamic frequency scaling) 동작이 가능하도록 클록 시스템을 설계하였다. 제안된 PLL 기반의 클록 시스템은 $0.35{\mu}m$ CMOS 공정으로 구현하였으며 2.3V의 공급전압에서 $0.85{\mu}sec\~1.3{\mu}sec$($24\~26$사이클)의 relocking 시간을 가지며, 파워다운 모드 적용 시 PLL의 파워소모는 라킹 모드에 비해 $95\%$이상 절감된다. 또한 제안된 PLL은 프로그래머블 주파수 분주기를 이용하여 다중 IP 시스템에서의 다양한 클록 도메인을 위해 $81MHz\~556MHz$의 넓은 동작 주파수를 갖는다.

Cascode 구조에 Shunt Peaking 기술을 접목시킨 밀리미터파 광대역 Amplifier (Millimeter-wave Broadband Amplifier integrating Shunt Peaking Technology with Cascode Configuration)

  • 권혁자;안단;이문교;이상진;문성운;백태종;박현창;이진구
    • 대한전자공학회논문지TC
    • /
    • 제43권10호
    • /
    • pp.90-97
    • /
    • 2006
  • 본 논문에서는 cascode 구조에 shunt peaking 기술을 접목시킨 밀리미터파 광대역 amplifier를 설계 및 제작하였다. 밀리미터파 광대역 cascode amplifier의 설계 및 제작을 위해서 $0.1{\mu}m\;{\Gamma}-gate$ GaAs PHEMT와 CPW 및 passive library를 개발하였다. 제작된 PHEMT는 최대 전달 컨덕턴스는 346.3 mS/mm, 전류이득 차단 주파수 ($f_T$)는 113 GHz, 그리고 최대공진 주파수($f_{max}$)는 180 GHz의 특성을 갖고 있다. 설계된 cascode amplifier는 회로의 발진을 막기 위해서 저항과 캐패시터를 common-rate 소자의 드레인에 병렬로 연결하였다. 대역폭의 확장 및 gain의 평탄화를 위해 바이어스 단들에 short stub 및 common-source 소자와 common-gate 소자 사이에 보상 전송선로를 삽입하고 최적화하였으며, 입출력 단은 광대역 특성을 갖는 정합회로로 설계하였다. 제작된 cascode amplifier의 측정결과, cascode 구조에 shunt peaking 기술을 접목시킴으로써 대역폭을 확장 및 gain을 평탄화 시킬 수 있다는 것을 확인하였다. 3 dB 대역폭은 34.5 GHz ($19{\sim}53.5GHz$)로 광대역 특성을 얻었으며, 3 dB대역 내에서 평균 6.5 dB의 $S_{21}$ 이득 특성을 나타내었다.

학습과 진화의 Lamarckian 상호 적응에 의한 뉴로-퍼지 제어기의 최적 설계 (An Optimal Design of Neuro-Fuzzy Logic Controller Using Lamarckian Co-adaptation of Learning and Evolution)

  • 김대진;이한별;강대성
    • 전자공학회논문지C
    • /
    • 제35C권12호
    • /
    • pp.85-98
    • /
    • 1998
  • 본 논문은 특정 응용에 적합한 퍼지 제어기의 최적 설계 파라메터 (퍼지 규칙과 소속 함수)를 찾는데 역전파 학습 과정과 유전 알고리즘을 결합한 Lamarckian 상호적응 기법을 이용한 뉴로-퍼지 제어기의 새로운 설계 방법을 제안한다. 설계 파라메타들은 진화에 의한 전역적 탐색을 통해 높은 포함값과 유용한 퍼지 규칙들을 갖는 규칙 베이스와 작은 근사화 오차와 좋은 제어 성능을 갖는 소속 함수들을 얻도록 제어기간 파라메타 조절을 수행하며, 학습에 의한 국부적 탐색을 통해 각 퍼지 제어기가 원하는 제어 결과를 나타내도록 제어기내 파라메타 조절을 수행한다. 제안한 상호적응 설계 방법은 유전 알고리즘의 모든 세대에서 역전파 학습이 이루어지므로 보다 좋은 근사화 능력을 나타나고, 사용한 무게 중심 비퍼지화기가 정확한 비퍼지화값을 계산하므로 보다 좋은 제어 성능을 가지며, 퍼지 규칙 베이스와 소속 함수들의 최적화 탐색 과정이 입출력 공간의 같은 퍼지 분할 상에서 통합된 적응 함수에 의하여 동시에 수행되므로 탐색을 위한 작업 공간이 아주 작아지는 장점이 있다. 시뮬레이션 결과는 Lamarckian 상호 적응에 의해 얻어진 FLC가 퍼지 규칙수, 근사화 능력, 제어 성능등 모든 면에서 다른 방법에 의해 얻어진 FLC보다 가장 우수함을 보여준다.

  • PDF

서비스 지향 아키텍처 기반의 모바일 서비스 모델링 (Mobile Service Modeling Based on Service Oriented Architecture)

  • 장영원;노혜민;유철중
    • 대한전자공학회논문지SD
    • /
    • 제45권2호
    • /
    • pp.140-149
    • /
    • 2008
  • 서비스 기반 아키텍처(Service-Oriented Architecture;SOA) 등장 이후 서비스와 애플리케이션을 상호 연결하는 측면에서 여러 가지 접근 방법들이 개발되고 있다. 모바일과 같은 정보기기는 일반적인 접근법이나 전통적인 접근법과는 달리 메모리와 프로세스 등 단말기 자체의 제약과 스크린 및 입출력 및 사용자 인터페이스의 제약이 많아 여러 가지가 고려되어 설계되어야 한다. 본 연구는 서비스를 기반으로 한 구조에서 많은 제약을 갖는 모바일의 효율성을 높이기 위해 모바일 애플리케이션 요구 사항을 분석하고 명세한 후 설계 방법을 최적화하고, 서비스 유스케이스 테스팅을 위한 확장된 유스케이스 명세를 제공하고, 서비스 명세로부터 서비스간 상호운영 테스트를 한다. 또한 모바일 애플리케이션의 성능을 확장하고, 제약을 최소화 할 수 있는 과정을 제시하며 유스케이스 테스팅을 위한 명세 방법과 서비스 상호간 상호운용성 보장 테스팅을 수행한다. 본 연구는 서비스 지향 아키텍처를 기반으로 모바일 서비스 명세 방법과 애플리케이션 테스팅 방법에 대한 아이디어를 제공한다는데 그 의의가 있다.

ASM기반 (2D)2 하이브리드 전처리 알고리즘을 이용한 얼굴인식 시스템 설계 (Design of ASM-based Face Recognition System Using (2D)2 Hybird Preprocessing Algorithm)

  • 김현기;진용탁;오성권
    • 한국지능시스템학회논문지
    • /
    • 제24권2호
    • /
    • pp.173-178
    • /
    • 2014
  • 본 연구에서는 ASM기반 $(2D)^2$ 하이브리드 전처리 알고리즘을 이용한 얼굴인식 분류기와 그것의 설계방법론을 소개한다. 얼굴인식을 위한 이미지는 외부 환경에 쉽게 영향을 받기 때문에, 전처리 단계로 이러한 문제를 해결하기 위해서 ASM을 사용하였다. 특히 사람 얼굴의 특징 추출을 목적으로 널리 이용되고 있다. ASM을 이용해 얼굴영역을 추출 한 뒤 PCA와 LDA를 이용한 $(2D)^2$ 하이브리드 전처리 알고리즘을 이용하여 차원을 축소한다. 전처리 알고리즘을 통한 얼굴데이터는 제안된 다항식 기반 방사형 기저함수 신경회로망의 입력으로 사용된다. 기존의 신경회로망과는 달리 제안된 지능형 패턴 분류기는 강인한 네트워크 특성을 가지며, 예측능력이 우수할 뿐만 아니라 다차원 입출력에 대한 문제도 해결했다. 분류기의 중요한 필수 설계 파라미터(행의 고유벡터의 수, 열의 고유벡터의 수, 클러스터의 수, 퍼지화 계수)는 ABC알고리즘에 의해 최적화 되어진다. 얼굴인식에 많이 사용되는 Yale과 AT&T를 사용하여 인식률을 평가하였다.

빅 데이터의 MapReduce를 이용한 효율적인 병렬 유전자 알고리즘 기법 (The Efficient Method of Parallel Genetic Algorithm using MapReduce of Big Data)

  • 홍성삼;한명묵
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.385-391
    • /
    • 2013
  • 빅 데이터는 일반적으로 사용되는 데이터 관리 시스템으로 데이터의 처리, 수집, 저장, 탐색, 분석을 할 수 없는 큰 규모의 데이터를 말한다. 빅 데이터 기술인 맵 리듀스(MapReduce)를 이용한 병렬 GA 연구는 Hadoop 분산처리환경을 이용하여, 맵 리듀스에서 GA를 수행함으로써 GA의 병렬처리를 쉽게 구현할 수 있다. 기존의 맵 리듀스를 이용한 GA들은 GA를 맵 리듀스에 적절히 변형하여 적용하였지만 잦은 데이터 입출력에 의한 수행시간 지연으로 우수한 성능을 보이지 못하였다. 본 논문에서는 기존의 맵 리듀스를 이용한 GA의 성능을 개선하기 위해, 맵과 리듀싱과정을 개선하여 맵 리듀스 특징을 이용한 새로운 MRPGA(MapReduce Parallel Genetic Algorithm)기법을 제안하였다. 기존의 PGA의 topology 구성과 migration 및 local search기법을 MRPGA에 적용하여 최적해를 찾을 수 있었다. 제안한 기법은 기존에 맵 리듀스 SGA에 비해 수렴속도가 1.5배 빠르며, sub-generation 반복횟수에 따라 최적해를 빠르게 찾을 수 있었다. 또한, MRPGA를 활용하여 빅 데이터 기술의 처리 및 분석 성능을 향상시킬 수 있다.

$OakDSPCore^{\circledR}$를 이용한 적응형 다중 비트 (AMR) 음성 부호화기의 실시간 구현 (Real-time Implementation of the AMR Speech Coder Using $OakDSPCore^{\circledR}$)

  • 이남일;손창용;이동원;강상원
    • 한국음향학회지
    • /
    • 제20권6호
    • /
    • pp.34-39
    • /
    • 2001
  • 적응형 다중 비트 (AMR: adaptive multi-rate)은 ETSI (European Telecommunications Standards Institute)에서 채택한 광대역 코드분할 다중화(W-CDMA: wideband cadedivision multiple access)용 음성 부호화표준방식으로서 채널 상태의 변화에 따라 가변적인 전송률을 가진다. 본 논문에서는 적응형 다중 비트 음성 부호화 알고리즘을 분석하고 C프로그램 최적화 과정을 거친 후OakDSPCore/sup R/를 기반으로 설계된 C&S Technology사의 CSD17C00A칩을 이용하여 전과정을 어셈블리어로 실시간 구현하였다. 구현된 코덱은 최대의 계산량을 요구하는6.7 kbps 모드일때 인코더부분이 최대 20.6MIPS이며 디코더부분은 약2.7MIPS의 복잡도를 나타낸다. 사용된 메모리는 약 21.33 kwords, 데이터 RAM메모리는 약 4.25 kwords를 가지며 데이터 ROM메모리는 약 15.1kwords 이다. 구현된 코덱은 최대 약 23.29MIPS의 복잡도를 가지고 있으므로 40MIPS의 성능을 가지는 CSD17C00A를 이용한 보드상에서 실시간 동작이 가능함을 확인하였다. 구현된 프로그램은 ETSI에서 제공하는 21개의 테스트 (test) 벡터를 통하여 bit-exact함을 확인하였다. 그리고 마이크와 스피커를 이용한 실시간 음성 입출력이 음질의 왜곡이나 지연없이 실시간으로 동작함을 확인하였다.

  • PDF

스트리밍 서버를 위한 멀티미디어 파일 시스템 최적화 (Optimizing a Multimedia File System for Streaming Severs)

  • 박진연;김두한;원유집;류연승
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제31권5_6호
    • /
    • pp.268-278
    • /
    • 2004
  • 전통적인 텍스트기반의 입출력과 달리, 멀티미디어 자료의 재생은 저장장치에서 일정한 대역폭을 보장을 필요로 한다. 대용량 서버에서 가장 많이 사용되는 유닉스 계열의 파일 시스템은 대역폭 보장이 필요하고, 순차적 접근특성을 가지고 있는 멀티미디어 자료 재생에 많은 개선의 여지를 가지고 있는 것이 사실이다. 본 논문에서는 유닉스 계열 파일 시스템의 단점을 극복하고 동영상 실시간 재생에 적합한 파일 시스템 구조를 연구 개발한 결과를 기술하고자 한다. 본 파일 시스템은 세 가지 설계 목표를 가지고 개발되었다. 첫 번째는 순차적 접근 부하에 대한 효과적 지원이다. 순차적 접근 특성을 효과적으로 지원하기 위해서는 트리기반의 데이타 블록구성이 아닌 연결리스트기반의 데이타 블록 구성방식을 채택한다. 두 번째는 파일 단편화 방지이다. 순차적 읽기에 있어서 과도한 디스크 탐색(Seek) 작업은 디스크의 효율성에 부정적인 영향을 미친다. 이를 효과적으로 극복하기 위하여 파일은 데이타 유닛 그룹(Data Unit Group)이라 불리는 단위의 집합으로 구성되며, 데이타 유닛 그룹은 연결리스트를 이용하여 구성되었다. 세 번째는 논리적 유닛에 기반한 파일 접근방식의 지원이다. 멀티미디어 파일은 비디오 프레임이나 오디오 샘플들의 집합으로 구성되어 있으며, 이들은 각기 다른 크기를 가지고 띤다. 따라서, 이들에 대한 임의접근 (Random Access)를 지원하기 위해서 각 논리적 유닛의 위치를 나타내는 인덱스를 파일 메타구조에 포함하였다. 이 부분은 트리구조를 이용하여 구성한 것이다. 실험을 통해서 파일 시스템의 성능을 리눅스 기반의 EXT2 파일 시스템, SGI 사에서 개발한 XFS 파일 시스템과 비교하였으며, 본 논문에서 제안하는 파일 시스템이 기존 리눅스 기반의 EXT2 그리고 SGI 사의 XFS 파일 시스템 보다 더 우수한 성능을 나타내는 것으로 입증되었다.