• 제목/요약/키워드: 연산량

검색결과 1,859건 처리시간 0.028초

블록 통합을 사용한 효율적 터보 디코더 설계 (An efficient method for Turbo Decoder design using Block Combining)

  • 서종현;윤상훈;정정화
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 I
    • /
    • pp.537-540
    • /
    • 2003
  • 본 논문에서는 터보 디코더에 사용되는 MAP 알고리즘의 저전력 구조를 제안한다. 터보 디코더 알고리즘 중 하나인 MAP 알고리즘은 많은 메모리 사이즈와 복잡한 연산량을 가진다. 본 논문에서는 메모리 사이즈를 줄이기 위하여 두 번의 상태 천이(branch metric) 과정을 하나로 통합 계산하는 방식을 제안하였다. 제안된 방식으로 구한 상태 천이 값을 이용해서 FSM(Forward State Metric)값을 구하면 BM(branch metric)값이 다음 상태의 FSM에 포함되어지므로 APP(A Posteriori Probability)를 계산할 때 BM부분이 빠져 LLR(Log Likelihood Ratio)의 연산량을 줄일 수 있다. 실험결과 기존의 MAP 알고리즘과 동일 성능을 가지면서 MAP 알고리즘을 개선한 Pietrobon 알고리즘을 log-MAP 알고리즘에 적용하여 LLR 연산량을 비교했을 때 덧셈 연산을 반으로 줄일 수 있음을 확인하였다.

  • PDF

3-Level NPC 컨버터의 동특성 개선을 위한 모델예측제어의 연산감소 기법 (A Calculation Reduce Method of Model Predictive Control for Improving Dynamic Characteristic of 3-Level NPC Converter)

  • 강경민;홍석진;강진욱;송준호;원충연
    • 전력전자학회:학술대회논문집
    • /
    • 전력전자학회 2017년도 전력전자학술대회
    • /
    • pp.310-311
    • /
    • 2017
  • 양극성 직류배전 시스템의 과도상태 응답특성을 향상시키기 위한 방법으로 최근 많은 관심을 받고 있는 모델예측제어는 실제로 구현함에 있어서 DSP와 같은 마이크로프로세서가 많은 연산량을 부담해야 한다. 하지만 현재 사용되는 마이크로프로세서의 성능은 모델예측제어를 구현하기 위한 연산량을 모두 감당할 수 있을 만큼 뛰어나지 않기 때문에, 본 논문에서는 모델예측제어를 구현하는데 필요한 연산량을 감소시킬 수 있는 기법을 제안하였다. 제안한 기법은 PSIM 시뮬레이션을 통하여 검증되었다.

  • PDF

UAV 및 모바일 기기를 위한 얼굴 표정 인식 네트워크 (Face Expression Recognition Network for UAV and Mobile Device)

  • 최은지;박병준;윤경로
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.348-351
    • /
    • 2021
  • 최근 자동화의 필요성이 증가함에 따라 얼굴 표정 인식 분야(face expression recognition)가 인공지능과 이미지 처리 분야에서 활발히 연구되고 있다. 본 논문에서는 기존 인공신경망에서 요구되었던 고성능 GPU 환경과 높은 연산량을 극복하고자 모델 경량화(Light weighted Model) 기법을 적용하여 드론 및 모바일 기기에서 적용될 수 있는 얼굴 표정 인식 신경망을 제안한다. 제안하는 방법은 미세한 얼굴의 표정 인식을 위한 방법으로, 입력 이미지의 receptive field 를 늘려 특징 맵의 표현력을 높이는 방법을 제안한다. 또한 효과적인 신경망의 경량화를 위하여, 파라미터의 연산량을 줄일 때 발생하는 문제점을 극복하기 위한 방법을 제시한다. 따라서 제안하는 네트워크를 적용하면 많은 연산량과 느린 연산속도로 인해 제한되었던 네트워크 환경을 극복할 수 있을 뿐만 아니라, UAV(Unmanned Aerial Vehicle, 무인항공기) 및 모바일 기기에서 신경망을 이용한 실시간 얼굴 표정 인식을 할 수 있다.

  • PDF

변형된 데이터베이스와 선택적 연산을 이용한 WLAN 실내위치인식 알고리즘 (Indoor localization algorithm based on WLAN using modified database and selective operation)

  • 성주현;박종성;이승희;서동환
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제37권8호
    • /
    • pp.932-938
    • /
    • 2013
  • 최근 WLAN을 이용한 실내 위치인식 방법 중 하나인 Fingerprint 기법은 신호의 반사 및 굴절에 의한 페이딩 현상에 강인하여 많이 연구되고 있다. 그러나 이 방법은 신호의 수집과 데이터베이스와 측정된 신호의 비교 연산의 과정에서 요구되는 시간과 연산량이 많다. 본 논문에서는 연산량을 줄이기 위하여 제안한 변형된 데이터베이스를 기반으로 실시간으로 수집되는 신호의 선택적 연산을 이용한 WLAN 실내 위치인식 알고리즘을 제안한다. 제안한 알고리즘은 신호의 세기에 따른 선형보간과 문턱치를 통하여 데이터베이스의 구성 시간 및 크기를 줄이고, 실시간으로 측정되는 신호의 선택적 연산을 통해 연산량은 감소시키면서 위치정확도를 유지하였다. 실험결과 제안한 알고리즘은 실내 복도 환경에서 기존의 Fingerprint 기법 대비 정확도를 17.8% 향상시켰으며 연산량은 평균 46% 감소되는 것을 확인하였다.

DWT 계수의 트리구조를 이용한 네트워크-적응적 JPEG2000 컨텍스트 추출방법 (A Network-adaptive Context Extraction Method for JPEG2000 Using Tree-Structure of Coefficients from DWT)

  • 최현준;서영호;김동욱
    • 한국통신학회논문지
    • /
    • 제30권9C호
    • /
    • pp.939-948
    • /
    • 2005
  • 본 논문에서는 JPEG2000의 EBCOT에서 과다한 연산량을 요구하는 컨텍스트 추출과정의 연산량을 감소시키는 방법을 제안하였다. 이 방법은 웨이블릿 변환의 특성인 계수들의 트리구조와 그 계수들의 상관도를 이용하여 특정 임계값을 설정하고 그 임계값보다 작은 계수와 그 자손계수들은 컨텍스트 추출과정을 거치지 않게 하는 것이다. 이 임계값이 증가함에 따라 컨텍스트 추출을 위한 연산량과 출력 데이터양이 줄어드나 화질의 열화가 심해지는 연산량과 화질 또는 데이터량간의 상보적 관계가 성립된다. 따라서 이 임계값을 네트워크의 환경 또는 조건에 따라 설정하면 네트워크에 적응적으로 수행할 수 있는 컨텍스트 추출방법이 가능하다. 이 방법을 실험한 결과 수용할 만한 화질의 범위(30dB 이상)의 임계값은 0에서 4사이이었으며, 이 범위에서 연산량은 평균 $3\%$에서 $64\%$를 감소할 수 있고, 출력데이터는 평균 $32\%$에서 $73\%$의 감소율을 보여 수용할 만한 화질의 열화를 대가로 상당한 연산량 감소와 데이터량 감소를 얻을 수 있을 것으로 판단된다. 따라서 제안한 방법은 무선 환경에서 영상/비디오 데이터의 실시간 통신 등에 매우 유용하게 사용될 것으로 기대된다.

고속 MPEG-2-H.264/AVC 변 환부호화를 위한 화면내 MB 예측 모드 결정 기법 (Intra MB Prediction Mode Decision Method for Fast MPEG-2 to H.264/AVC Transcoding)

  • ;유국열
    • 한국통신학회논문지
    • /
    • 제33권12C호
    • /
    • pp.1046-1054
    • /
    • 2008
  • 본 논문에서는 MPEG-2-H.264/AVC 변환 부호기에서 병목현상을 야기하는 H.264/AVC 부분의 화면내 부호기의 연산량을 감축하는 기법을 제안한다. 본 논문에서는 MPEG-2 복호기에서 획득한 DCT 계수와 영상의 방향성, H.264/AVC 화면내 부호기의 $Intral16{\times}16$$Intra4{\times}4$ 모드들 간의 상관관계 및 휘도와 색차 신호간의 경계(edge) 특성의 상관성을 활용하여 모드 선정시에 연산량을 감축하는 기법을 제안한다. 모의 실험을 통해 제안 방식이 기존에 널리 사용되는 결합형 변환 부호기에 비해 최대 약 70%의 연산량을 감축할 수 있음을 보였고, 대표적인 연산량 감축 기법인 [5]의 기법에 비해 최대 40%의 연산량을 감축할 수 있음을 보였다.

LOS환경에서 위상 차이 보상을 이용한 병렬 구조 빔 형성기 (A Parallel Structure Beamformer Using The Compensation for Phase Differences In LOS Environment)

  • 심세준;정성헌;양승철;이충용
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.95-97
    • /
    • 2000
  • 배열 안테나에서 안테나 소자의 개수의 증가는 안테나의 이득을 증가시킬 수 있으므로 열악한 채널 환경에서도 채널이 필요로 하는 링크 마진을 얻을 수 있다. 그러나, 기존 빔 형성기에서 사용되는 배열 안테나 기법은 많은 계산량과 소모 메모리량 때문에 배열 소자의 개수에 제한이 따르게 된다. 이러한 문제를 해결하기 위하여 본 논문에서는 배열 안테나의 구조에 따른 위상차이를 보상하여 적은 계산량과 메모리를 갖는 배열 위상 차이 보상을 이용한 평행 구조 빔 형성기를 제안한다 배열 위상 차이를 보상하는 기법으로 적은 계산량과 메모리로 개수가 많은 긴 배열 안테나에서 얻을 수 있는 분해능과 안테나 이득을 얻을 수 있다. 제안된 기법의 성능을 비교하기 위해 기존의 빔 형성기법으로delay-sum 빔 형성기와 공분산 행렬의 고유치 해석을 통한 고유벡터 기법의 빔 스펙트럼과 연산량을 비교하였다. 제안된 기법으로 빔 형성을 하면, 배열 안테나의 소자의 개수가 늘어나도 기존의 방법보다 최소 30%의 연산량으로 스펙트럼 상 비슷한 성능을 얻을 수 있다.

  • PDF

MPEG-1 Layer III 오디오 디코더의 실시간 DSP 구현 (Real-Time DSP Implementation of MPEG-1 Layer III Audio Decoder)

  • 김시호;권홍석;배건성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(4)
    • /
    • pp.174-177
    • /
    • 2000
  • 본 논문에서는 높은 압축률과 고음질을 제공하는 MPEG-1 Layer Ⅲ 오디오 디코더를 고정소수점 DSP인 TMS320C6201을 이용하여 실시간으로 동작하도록 구현하였다. ISO/IEC에서 제공하는 부동소수점 C 프로그램을 음질의 손실 없이 고정소수점 연산으로 변환하었고 실시간 동작을 위하여 최적화 작업을 수행하였다. 연산의 정확성을 높이기 위해서 Descaling 모듈에 중점을 두어 부동소수점 연산을 고정소수점 연산으로 변환하였고 IMDCT 모듈과 Synthesis Polyphase Filter Bank 모듈에 대해 고속 알고리즘을 적용하여 연산량과 프로그램 크기를 크게 줄일 수 있었다. 구현된 디코더는 TMS320C6201 DSP가 수행할 수 있는 최대 연산량의 26%만으로 실시간 동작이 가능하였고 부동소수점 연산 결과와 고정소수점 연산 결과를 비교하여 60 dB 이상의 높은 SNR을 가짐을 확인하였다. 또한 사운드 입출력과 호스트 통신을 통하여 EVM 보드에서 실시간으로 동작함을 확인하였다.

  • PDF

GLSL 4.3을 사용한 파티클 시스템 구현 (Implementation of Particle System Using GLSL 4.3)

  • 최영환;홍민;최유주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.189-191
    • /
    • 2016
  • 실시간 물리 기반 3D 시뮬레이션에서 연산속도는 매우 중요한 요소이다. 객체의 움직임이나 변형과 같은 현상들은 복잡한 연산을 통해서 계산되기 때문에 일반적으로 시뮬레이션의 정확도와 연산속도는 반비례 관계에 있다. 현재 출시되고 있는 대부분의 게임에서는 물체의 움직임을 정확하게 표현하기보다 연산량을 줄이기 위해 물체의 움직임이나 변형을 비슷하게 표현하는데 중점을 두고 있다. 본 논문에서는 이러한 문제를 해결하기 위하여 OpenGL 4.3의 Compute shader를 사용하여 다이내믹 시뮬레이션의 연산 작업을 GPU 병렬처리로 처리하였다. Compute shader에서 파티클의 움직임을 계산하고 Shader storage buffer object에 저장하고 파티클들의 작업량을 적절한 Workgroup의 크기로 나누어 할당하여 최적의 처리속도를 제공하도록 구현하였다. Compute shader에서 파티클의 움직임을 표현하기 위해서 수치해법 중의 하나인 Euler method를 사용하였으며 실험 결과 파티클의 수가 4,194,304개일 때 CPU 방법에 비해 약 182배 빠른 연산속도 결과를 보였다. 추후 Compute shader를 활용하여 연산량이 많은 분야에 적용 가능할 수 있을 것으로 기대한다.

부화소 움직임 추정을 위한 효과적인 화소 재구성 알고리즘 (Efficiency Pixel Recomposition Algorithm for Fractional Motion Estimation)

  • 신왕호;선우명훈
    • 대한전자공학회논문지SP
    • /
    • 제48권1호
    • /
    • pp.64-70
    • /
    • 2011
  • 본 논문은 H.264/AVC 비디오 코덱의 부화소 움직임 추정 연산을 효율적으로 줄일 수 있는 화소 재구성 알고리즘을 제안한다. 부화소 움직임 추정 연산은 보다 정확한 움직임 벡터를 찾을 수 있어 비디오 코덱에 널리 사용되지만, 추가적인 보간 및 탐색 연산으로 인해 부호화가의 연산량을 증가시키는 문제점이 있다. 본 논문은 화소 재구성 알고리즘을 이용한 부화소 움직임 추정기를 제안 하였다. 일반적인 부화소 움직임 추정기는 보간 시 같은 화소를 중복하여 보간한다. 이러한 중복 보간은 연산량을 증가 시키는 원인이 된다. 화소 재구성 알고리즘은 화소의 중복 보간을 제거하여 부화소 움직임 추정기의 연산량을 감소시킨다. 제안한 알고리즘은 고속 전역 부화소 탐색 알고리즘과 비교하여 보간 시 연산량이 18.1% 감소하였으며, PSNR 감소는 평균 0.067dB로 화질의 열화는 매우 미비했다. 그러므로 제안한 알고리즘은 저전력의 고효율을 요구하는 모바일 응용에 적합하다.