• 제목/요약/키워드: 최적화 로직

검색결과 65건 처리시간 0.025초

TMS320C32 DSP를 이용한 실시간 화자종속 음성인식 하드웨어 모듈(VR32) 구현 (Real-Time Implementation of Speaker Dependent Speech Recognition Hardware Module Using the TMS320C32 DSP : VR32)

  • 정익주;정훈
    • 한국음향학회지
    • /
    • 제17권4호
    • /
    • pp.14-22
    • /
    • 1998
  • 본 연구에서는 Texas Instruments 사의 저가형 부동소수점 디지털 신호 처리기 (Digital Singnal Processor, DSP)인 TMS320C32를 이용하여 실시간 화자종속 음성인식 하 드웨어 모듈(VR32)을 개발하였다. 하드웨어 모듈의 구성은 40MHz의 TMS320C32 DSP, 14bit 코덱인 TLC32044(또는 8bit μ-law PCM 코덱), EPROM과 SRAM 등의 메모리와 호 스트 인터페이스를 위한 로직 회로로 이루어졌다. 뿐만 아니라 이 하드웨어 모듈을 PC사에 서 평가해보기 위한 PC 인터페이스용 보드 및 소프트웨어도 개발하였다. 음성인식 알고리 즘의 구성은 에너지와 ZCR을 기반으로 한 끝점검출(Endpoint Detection) 침 10차 가중 LPC 켑스터럼(Weighted LPC Cepstrum) 분석이 실시간으로 이루어지며 이후 Dynamic Time Warping(DTW)를 통하여 최고 유사 단어를 결정하고 다시 검증과정을 거쳐 최종 인식을 수행한다. 끝점검출의 경우 적응 문턱값(Adaptive threshold)을 이용하여 잡음에 강인한 끝 점검출이 가능하며 DTW 알고리즘의 경우 C 및 어셈블리를 이용한 최적화를 통하여 계산 속도를 대폭 개선하였다. 현재 인식률은 일반 사무실 환경에서 통상 단축다이얼 용도로 사 용할 수 있는 30 단어에 대하여 95% 이상으로 매우 높은 편이며, 특히 배경음악이나 자동 차 소음과 같은 잡음환경에서도 잘 동작한다.

  • PDF

FPGA ORB를 고려한 ORB 연동 프로토콜 개발 (Development of Inter-ORB Protocol for FPGA ORB)

  • 정혜경;배명남;이인환;이용석
    • 대한전자공학회논문지TC
    • /
    • 제46권10호
    • /
    • pp.34-42
    • /
    • 2009
  • HAO는 로직 기반의 코바 컴포넌트 개발을 수용하기 위해 FPGA에 탑재되는 ORB엔진이다. 본 논문은 표준 코바와 HAO 간 연동을 제공하기 위한 과정으로, 표준 ORB간 연동 프로토콜인 GIOP의 구체화 방안에 대해 기술한다. 구체적으로, 시스템 보드의 하드웨어 자원을 직접 사용한다는 관점에서 HAO Core가 하드웨어 독립성을 갖도록 하여야 하며, 공유 자원에 대한 빠른 제어 반환을 고려한 최적화 방안을 포함해야 한다.

Tangential Swirl 연소기에 적용된 스월인젝터의 고고도 운전성능 연구 (Study of High Altitude Operation for Air Swirl Injector in Tangential Swirl Combustor)

  • 박희호;류세현;구현철;이성준
    • 한국추진공학회:학술대회논문집
    • /
    • 한국추진공학회 2010년도 제35회 추계학술대회논문집
    • /
    • pp.825-828
    • /
    • 2010
  • 항공용 가스터빈 엔진은 운용 범위가 넓으며 고고도에서 운용되므로 극한 환경조건에서의 운용을 요구하며 높은 신뢰성을 요구한다. 따라서 본 연구에서는 혹독한 환경에서 높은 수준의 신뢰성 있는 연소기 개발을 위한 연소기 리그시험 및 엔진 단위의 운용 안정성 평가를 수행, 최적화하였으며, 엔진개발 단계에서 수립된 시동로직을 반영하여 고고도 운전영영에서의 시동 및 운용 안정성을 검증하였다. 리그 및 엔진시험 결과, air swirler가 장착된 인젝터를 적용할 경우, 20kft Hot day 및 $-40^{\circ}C$에서 정상적인 운용 및 시동이 이루어졌다.

  • PDF

스크래치패드 메모리를 위한 데이터 관리 기법 리뷰 (A Review of Data Management Techniques for Scratchpad Memory)

  • 조두산
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.771-776
    • /
    • 2023
  • 스크래치패드 메모리는 소프트웨어 제어 온칩 메모리로서 기존의 캐시 메모리의 단점을 완화할 수 있게 설계되어 이용되고 있다. 기존의 캐시 메모리는 태그 관련 하드웨어 제어 로직이 있어 캐시 미스를 사용자가 직접 제어할 수 없으며, 사이즈가 크고 에너지 소모량이 상대적으로 많다. 스크래치패드 메모리는 이러한 하드웨어 오버헤드를 제거하였기 때문에 사이즈, 에너지 소모량에서 장점이 있으나 데이터 관리를 소프트웨어가 해야하는 부담이 존재한다. 본 연구에서는 스크래치패드 메모리의 데이터 관리 기법들을 분류하여 살펴보고 그 장점을 극대화할 수 있는 방안에 대하여 논의하였다.

지능제어를 이용한 평면 여자유도 매니퓰레이터와 환경과의 상호작용에 관한 연구 (Study on Interaction of Planar Redundant Manipulator with Environment based on Intelligent Control)

  • 유봉수;김신호;조중선
    • 한국지능시스템학회논문지
    • /
    • 제19권3호
    • /
    • pp.388-397
    • /
    • 2009
  • 로봇 매니퓰레이터를 이용한 대부분의 작업은 환경과의 상호작용을 요구하며, 위치제어, 충돌제어 그리고 힘제어로 구성된다. 위치제어는 환경에 도착하는 방법을 의미하고, 환경에 접촉하는 순간은 충돌제어 문제를 야기하며, 힘제어는 환경과의 충돌후에 원하는 힘궤적을 유지하는 것이다. 이러한 세 가지 제어문제는 순차적으로 발생하므로, 각각의 제어 알고리즘은 독립적으로 개발되어야 한다. 특히 여자유도 매니퓰레이터에서 이러한 세 가지 제어문제는 독립된 중요한 연구 주제이다. 예를 들어, 관절 토크 최소화와 충격힘 최소화는 여자유도 매니퓰레이터의 대표적인 연구주제이다. 본 논문에서는 단일 작업을 통하여 세 가지 제어문제를 구성하였다. 위치제어는 각 관절의 토크와 토크변화 그리고 충돌 시의 충돌힘 최소화를 위하여 개발되었다. 따라서 충돌제어의 초기조건은 이전의 위치제어 알고리즘으로부터 최적화 되고, 그러한 제어 전략은 충돌제어의 결과를 개선시킨다. 유사하게, 힘제어 문제의 초기조건은 이전의 위치제어와 충돌제어로부터 간접적으로 최적화된다. 힘제어 알고리즘은 각 관절 토크와 힘외란 최소화시키는 개념을 사용하였다. 모의실험 결과는 제안된 알고리즘의 타당성을 보여준다.

R-LWE 암호화를 위한 근사 모듈식 다항식 곱셈기 최적화 (Optimization of Approximate Modular Multiplier for R-LWE Cryptosystem)

  • 이재우;김영민
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.736-741
    • /
    • 2022
  • 격자 기반 암호화는 최악의 경우를 기반으로 한 강력한 보안, 비교적 효율적인 구현 및 단순성을 누리기 때문에 포스트 양자 암호화 방식 중 가장 실용적인 방식이다. 오류가 있는 링 학습(R-LWE)은 격자 기반 암호화(LBC)의 공개키암호화(Public Key Encryption: PKE) 방식이며, R-LWE의 가장 중요한 연산은 링의 모듈러 다항식 곱셈이다. 본 논문은 R-LWE 암호 시스템의 중간 보안 수준의 매개 변수 집합을 대상으로 하여 근사 컴퓨팅(Approximate Computing: AC) 기술을 기반으로 한 모듈러 곱셈기를 최적화하는 방법을 제안한다. 먼저 복잡한 로직을 간단하게 구현하는 방법으로 LUT을 사용하여 근사 곱셈 연산 중 일부의 연산 과정을 생략하고, 2의 보수 방법을 활용하여 입력 데이터의 값을 이진수로 변환 시 값이 1인 비트의 개수를 최소화하여 필요한 덧셈기의 개수를 절감하는 총 두 가지 방법을 제안한다. 제안된 LUT 기반의 모듈식 곱셈기는 기존 R-LWE 모듈식 곱셈기 대비 속도와 면적 모두 9%까지 줄어들었고, 2의 보수 방법을 적용한 모듈식 곱셈기는 면적을 40%까지 줄이고 속도는 2% 향상되는 것으로 나타났다. 마지막으로 이 두 방법을 모두 적용한 최적화된 모듈식 곱셈기의 면적은 기존대비 43%까지 감소하고 속도는 10%까지 감소하는 것으로 나타났다.

링크 도선 길이를 고려한 고성능 비동기식 NoC 토폴로지 생성 기법 (Link-wirelength-aware Topology Generation for High Performance Asynchronous NoC Design)

  • 김상헌;이재성;이재훈;한태희
    • 전자공학회논문지
    • /
    • 제53권8호
    • /
    • pp.49-58
    • /
    • 2016
  • 어플리케이션 특성에 따라 링크 대역폭 요구량이 다양하게 분포하는 이종 (heterogeneous) 아키텍처 기반 네트워크-온-칩 (Network-on-Chip, NoC) 설계에 있어 링크 지연 시간이 독립적으로 설정될 수 있는 비동기식 프로토콜을 적용할 경우 동기식 설계에 비해 성능 향상의 기회가 확대될 수 있다. 본 논문에서는 비동기식 NoC에서 각 링크의 대역폭 요구량과 도선 길이에 따른 지연 시간 모델을 제시하고 이를 최적화하는 simulated annealing (SA) 기법을 이용한 플로어플랜 기반 토폴로지 생성 알고리즘을 제안하였다. 생성된 토폴로지와 각 링크의 도선 길이를 기반으로 대응하는 도선 지연시간을 계산하고 로직 합성 단계를 거쳐 생성된 gate-level netlist와 표준지연시간 모델을 이용한 시뮬레이션을 통해 성능을 측정하였다. 링크 도선 길이를 고려하지 않은 일반적인 토폴로지 생성 알고리즘인 TopGen과 비교하여, 제안된 알고리즘이 다양한 어플리케이션 실험에서 평균 13.7% 지연 시간 단축 효과 및 처리량 측면 지표인 실행 시간에서 평균 11.8% 감소 효과가 있음을 확인할 수 있었다.

패턴 탐색 기법을 사용한 Multiplierless 리프팅 기반의 웨이블릿 변환의 설계 (Design of Multiplierless Lifting-based Wavelet Transform using Pattern Search Methods)

  • 손창훈;박성모;김영민
    • 한국멀티미디어학회논문지
    • /
    • 제13권7호
    • /
    • pp.943-949
    • /
    • 2010
  • 본 논문은 하드웨어 곱셈 연산을 최적화하여 리프팅 기반의 9/7 웨이블릿 필터의 개선된 VLSI의 구조를 제안한다. 제안한 구조는 범용 곱셈기를 사용하는 기존의 리프팅 기반의 웨이블릿 필터와 비교하여 화질의 열화 없이 보다 적은 로직과 전력소모를 갖는다. 본 논문은 Pattern search 기반의 Lefevre 알고리즘을 이용하여 하드웨어 구조를 개선한다. 제안한 구조는 범용의 곱셈기를 단순한 shift-add 연산으로 대체하여 하드웨어 구현을 단순하게 하고 계산 속도를 빠르게 한다. 제안한 구조와 기존의 구조를 Verilog HDL을 이용하여 구현하고 비교 실험하였다. 두 구조는 0.18um 디지털 CMOS 공정의 스탠다드 셀을 이용하여 합성된다. 제안한 구조는 200MHz의 합성 타겟 클록 주파수에서 기존의 구조에 비해 면적, 전력소모와 최대 지연시간이 각각 약 51%, 43%와 30%로 감소하였다. 구현 결과를 통해 제안한 구조가 범용의 곱셈기 블록을 사용한 기존의 구조보다 스탠다드 셀을 이용한 ASIC 구현에 보다 적합하다는 것을 보여준다.

변형된 4스텝 써치를 이용한 블럭정합 움직임 추정 및 보상 알고리즘의 VLSI 구조 설계 (VLSI Architecture Designs of the Block-Matching Motion Estimation/Compensation using a Modified 4-Step Search Algorithm)

  • 이동호
    • 전자공학회논문지S
    • /
    • 제35S권9호
    • /
    • pp.86-94
    • /
    • 1998
  • 본 논문에서는 기존 고속 블럭 알고리즘보다 성능이 우수하고 하드웨어 구현에 적합한 새로운 MFSS(Modified Four-Step Search) 알고리즘을 제안한다. 제안하는 알고리즘의 추정 과정은 일정한 규칙을 갖기 때문에 하드웨어 구현에 적합하고, 모의실험을 통해 거의 FS(Full Search) 성능에 근접할 정도로 기존의 고속 움직임 추정 알고리즘보다 성능의 우수함을 확인하였다. 본 논문에서는 이러한 MFSS(Modified Four-Step Search) 움직임 추정 및 보상기 설계에서 중요한 고려 사항은 설계 결과의 하드웨어적인 크기와 출력이 나오기 까지의 필요한 지연 시간인데, 본 논문에서는 9개의 PE(Process Element)만을 이용하여 구현함으로써 전체 로직의 양을 최적화 하였고, 움직임 추정기와 보상기를 결합함으로써 메모리를 공유하고 필요한 지연시간도 줄이는 구조를 제안한다.

  • PDF

LDM 원격 제어를 위한 임베디드 시스템 구성 (Designing a Embedded System for Remote Control of LDM)

  • 문철홍;강상우
    • 대한전자공학회논문지SD
    • /
    • 제42권8호
    • /
    • pp.27-34
    • /
    • 2005
  • 본 논문에서는 LDM(LED Dot Matrix) 원격 제어를 위해 임베디드 시스템의 FPGA H/W 및 S/W를 구현하였다. 개발된 시스템에서는 고성능의 XScale CPU를 사용했고, 통신방식은 이더넷 및 시리얼을 사용했다. CPU와 인터페이스 되는 H/W에서는 LDM 회전부와 LDM을 구동하기 위한 FPGA 로직을 구현하였으며, 원거리에서 LDM 데이터를 전송하기 위한 명령 패킷을 구성하였고, S/W는 임베디드 리눅스에 사용되는 리눅스 디바이스 드라이버와 리눅스 응용프로그램을 작성했다. 이 S/W는 모듈에 의해 동작되기 때문에 리눅스용 파일시스템에 모듈로 적재를 시켜서 원하고자 하는 동작을 실행한다. 또한 운영체제로는 시스템의 최적화를 할 수 있는 임베디드 리눅스를 시스템에 맞게 컴파일 함으로서 불필요한 메모리를 사용하지 않기 때문에 시스템의 가격을 줄일 수 있다. 본 논문에서 구현된 H/W 및 S/W 원리를 이용한다면 다른 임베디드 시스템에도 유용하게 활용할 수 있다.