• 제목/요약/키워드: MP 알고리즘

검색결과 121건 처리시간 0.022초

그래프 컬러링과 OpenMP를 이용한 병렬 메쉬 스무딩 알고리즘의 성능 분석 (Performance Analysis of a Parallel Mesh Smoothing Algorithm using Graph Coloring and OpenMP)

  • 신명규;김지범
    • 전자공학회논문지
    • /
    • 제53권6호
    • /
    • pp.80-87
    • /
    • 2016
  • 본 논문에서는 그래프 컬러링과 OpenMP를 사용한 병렬 메쉬 스무딩 알고리즘을 제안하고 공유메모리 기반의 슈퍼컴퓨터를 이용하여 제안하는 병렬 메쉬 스무딩 알고리즘의 성능 분석을 수행하였다. 제안하는 병렬 메쉬 스무딩 알고리즘은 그래프 컬러링 방법을 통해 전체 메쉬를 여러 개의 독립적인 집합 (색깔)으로 나눈 후 각각의 독립적인 집합에 대하여 OpenMP 라이브러리를 사용하여 순차적으로 병렬 메쉬 스무딩을 수행하는 방법이다. 실험을 통하여 여러 가지 그래프 컬러링 방법과 색깔 순서 재배열 방법이 병렬 메쉬 스무딩의 효율성에 미치는 영향에 대해서 알아보았다. 또한, OpenMP의 루프 스케줄링 방법이 병렬 메쉬 스무딩의 효율성에 끼치는 영향에 대해서 알아보았다.

다중 프로세서 시스템에서 문맥교환을 줄이기 위한 변형된 LLF 스케줄링 알고리즘 (A Modified Least-Laxity First Scheduling Algorithm for Reducing Context Switches on Multiprocessor Systems)

  • 오성흔;길아라;양승민
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권2호
    • /
    • pp.68-77
    • /
    • 2003
  • 최소 여유시간 우선(Least-Laxity First, LLF) 스케줄링 알고리즘은 작은 여유시간을 가진 태스크가 높은 우선순위를 갖는 스케줄링 알고리즘으로써 단일 프로세서 시스템에서 최적이고 다중 프로세서 시스템에서 준최적으로 증명되었다. 그러나 이 스케줄링 알고리즘은 여유시간 충돌이 발생하였을 때 태스크 간에 빈번한 문맥교환이 발생하게 되는 문제점이 있어 실용적이지 못하다. 본 논문에서는 과도한 문맥교환을 일으키는 LLF의 문제점을 해결하기 위해 다중 프로세서 시스템을 위한 MLLF/MP(Modified Least-Laxity First on Multiprocessor) 스케줄링 알고리즘을 제안한다. MLLF/MP는 태스크의 여유시간 역전이 발생하더라도 마감시간을 놓치지 않는 범위에서 태스크를 연속적으로 수행시킴으로써 빈번한 문맥교환이 발생하는 것을 방지한다. MLLF/MP 또한 다중 프로세서 시스템에서 준최적임을 증명한다. 모의 실험 결과를 통하여 MLLF/MP는 LLF보다 적은 스케줄링 오버헤드를 가짐을 보인다.

안정된 결혼문제에 대한 최적화 알고리즘 (An Optimal Algorithm for Stable Marriage Problem)

  • 이상운
    • 한국인터넷방송통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.149-154
    • /
    • 2018
  • 안정된 결혼문제에 대해서는 Gale과 Shapley 알고리즘(GSA)이 유일하게 알려져 왔다. 이 알고리즘은 남성이 자신이 가장 선호하는 여성에게 청혼하면 여성이 수락/거절하는 방식(MP)으로 남성 최적-여성 최악의 결과이지만 항상 안정된 매칭 결과를 얻는다. 남성을 여성으로 바꾸어 여성 청혼-남성 수락 방식(WP)을 적용하면 전혀 다른 결과를 얻을 수 있다. 또한 MP나 WP로도 최적의 안정된 매칭 결과를 얻지 못하는 경우도 발생한다. 본 논문에서는 MP와 WP의 이러한 문제점을 해결하기 위해 어떠한 경우라도 최적의 안정된 매칭 결과를 얻는 방법을 제안한다. 제안된 알고리즘은 여성 최악인 MP 결과에 대해 여성을 보상하기 위해 여성이 보다 선호하는 남성들을 대상으로 k명의 여성이 짝을 상호 교환하는 k-opt를 수행하는 방식을 제안하였다. 다양한 사례에 대해 실험을 한 결과 제안된 알고리즘은 MP나 WP로도 얻지 못하는 최적의 안정된 매칭 결과를 얻을 수 있었다.

TMS320C541 DSP를 이용한 MP3 디코더 구현 (Implementation of MP3 decoder with TMS320C541 DSP)

  • 윤병우
    • 융합신호처리학회논문지
    • /
    • 제4권3호
    • /
    • pp.7-14
    • /
    • 2003
  • MPEG-1 오디오 표준은 고음질 디지털 오디오 신호의 압축 알고리즘이다. 이 표준은 인코더와 디코더의 기능을 규정하고 있고, 인코더와 디코더 알고리즘의 복잡도와 성능에 따라 세 가지 다른 계층으로 분류된다. 본 논문에서는 MPEG-1 오디오 계층3(MP3) 디코더를 고정소수점 DSP인 TMS320C541 칩으로 구현하였다 MP3 알고리즘은 인간의 청각구조의 심리음향 특성을 이용하는 알고리즘으로 인간의 귀에 들리지 않는 주파수의 성분은 미리 제거함으로써 데이터의 량을 줄이면서 음질의 손실을 최대한 줄이는 알고리즘이다. 이 알고리즘은 다이나믹 레인지가 매우 크기 때문에 고정 소수점으로 구현하기가 쉽지 않다. 본 연구에서는 가중 참조표를 적용하여 계산량을 줄이고 다이나믹 레인지 문제를 해결함으로써 고정 소수점 DSP칩을 이용하여 실시간 시스템을 구현하였다.

  • PDF

MP 병렬컴퓨터에서 효과적인 과학계산의 수행 (Efficient Scientific Computation on WP Parallel Computer)

  • 김선경
    • 한국산업정보학회논문지
    • /
    • 제8권4호
    • /
    • pp.26-30
    • /
    • 2003
  • 대칭이고 큰 희소 행렬(Large Sparse Matrices)에 대한 가장 작거나 또는 가장 큰 고유치(Eigenvalues)들을 구하기 위해서 Lanczos 방법이 많이 이용된다. MP(Message Passing) 병렬 컴퓨터에서 global communications은 계산 속도를 떨어뜨린다. 본 논문에서는 s-step Lanczos 알고리즘을 소개하였으며 이 s-step 방법은 기존의 Lanczos 알고리즘에 의해 생성된 행렬에 유사한 축소 행렬을 생성하며 s-step Lanczos 알고리즘에서 한번의 반복은 기존의 Lanczos 알고리즘의 s 번 반복에 해당한다. s-step 방법은 global communications을 최소화하였으며 기존의 알고리즘에 비해 뛰어난 병렬 성질을 가진다. 알고리즘들은 Cray T3E에서 수행되었으며 그 결과를 볼 수 있다.

  • PDF

고해상도 단순 이미지의 객체 분류 학습모델 구현을 위한 개선된 CNN 알고리즘 연구 (Study of Improved CNN Algorithm for Object Classification Machine Learning of Simple High Resolution Image)

  • 이협건;김영운
    • 한국정보전자통신기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.41-49
    • /
    • 2023
  • CNN(Convolutional Neural Network) 알고리즘은 인공신경망 구현에 활용되는 대표적인 알고리즘으로 기존 FNN(Fully connected multi layered Neural Network)의 문제점인 연산의 급격한 증가와 낮은 객체 인식률을 개선하였다. 그러나 IT 기기들의 급격한 발달로 최근 출시된 스마트폰 및 태블릿의 카메라에 촬영되는 이미지들의 최대 해상도는 108MP로 약 1억 8백만 화소이다. 특히 CNN 알고리즘은 고해상도의 단순 이미지를 학습 및 처리에 많은 비용과 시간이 요구된다. 이에 본 논문에서는 고해상도 단순 이미지의 객체 분류 학습모델 구현을 위한 개선된 CNN 알고리즘을 제안한다. 제안하는 알고리즘은 고해상도의 이미지들의 학습모델 생성 시간을 감소하기 위해 CNN 알고리즘의 풀링계층의 Max Pooling 알고리즘 연산을 위한 인접 행렬 값을 변경한다. 변경한 행렬 값마다 4MP, 8MP, 12MP의 고해상도 이미지들의 처리할 수 있는 학습 모델들을 구현한다. 성능평가 결과, 제안하는 알고리즘의 학습 모델의 생성 시간은 12MP 기준 약 36.26%의 감소하고, 학습 모델의 객체 분류 정확도와 손실률은 기존 모델 대비 약 1% 이내로 오차 범위 안에 포함되어 크게 문제가 되지 않는다. 향후 본 연구에서 사용된 학습 데이터보다 다양한 이미지 종류 및 실제 사진으로 학습 모델을 구현한 실질적인 검증이 필요하다.

멀티콥터 영상 전송을 위한 압축 센싱 기법 (Compressed Sensing Techniques for Video Transmission of Multi-Copter)

  • 정국현;이선의;이상화;김진영
    • 한국위성정보통신학회논문지
    • /
    • 제9권2호
    • /
    • pp.63-68
    • /
    • 2014
  • 본 논문에서는 멀티콥터의 효율적 영상 전송을 위해 필요한 압축센싱 기법을 제안한다. 제안된 구조는 압축센싱에 기반한 데이터 용량을 줄이는 것에 중점을 둔다. 우선 Spectrum sensing의 기본원리를 설명하고 AMP(Approximate Message Passing)와 CoSaMP(Compressive Sampling Matched Pursuit)을 수학적 분석과 모의실험 결과를 통해서 비교한다. 또한 두 알고리즘을 계산시간과 복잡도 관점에서 평가하고 멀티콥터 동작에 적합한 알고리즘을 제안한다. 본 논문의 실험결과는 AMP 알고리즘이 CoSaMP 알고리즘보다 계산시간이 적고 이미지 에러 확률도 낮다는 것을 보여준다.

무선 센서 네트워크의 에너지 효율성을 고려한 MP-DD 라우팅 알고리즘 (Improved MP-DD Routing Algorithm Considering Energy Efficiency in Wireless Sensor Networks)

  • 장윤식;박남규;오충식;최승권;이창조;조용한
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권7호
    • /
    • pp.97-103
    • /
    • 2009
  • 본 논문의 무선 센서네트워크에서 사용할 수 있는 효율적인 라우팅 방법인 MP-DD (MultiPath-Direct Diffusion) 알고리즘을 제안한다. 기존의 DD(Directed Diffusion)에서는 하나의 경로만을 강화하여 사용하는 것과 달리 제안한 알고리즘은 다중 경로를 강화하면서, 해당 경로에 높여 있는 센서 노드의 남은 에너지 등급을 고려하여 에너지 레벨이 높은 경로에 따라 가중치를 부여하고, 몇 개의 다중경로를 이용하여 사용함으로써 에너지 소모를 감소시키고 동시에 네트워크에 전체적으로 에너지를 골고루 사용하게 할 수 있다. 시뮬레이션 결과에서는 이러한 센서 네트워크를 위한 단순한 라우팅 방법의 가능성을 증명하였다.

ARM 플랫폼 기반의 MP3 오디오 음질 향상 시스템 구현 (An Implementation of an ARM Platform based MP3 Sound Enhancement System)

  • 오상헌;박규식
    • 대한전자공학회논문지SP
    • /
    • 제44권1호
    • /
    • pp.70-75
    • /
    • 2007
  • 44.1kHz 샘플링 레이트의 표준 CD 음질의 오디오 신호를 인터넷 상에서 전송 및 분배하기 위해서는 네트워크 대역폭과 저장 공간의 제한 점을 고려해야 한다. 이러한 제한은 MP3, AAC, OGG 등과 같은 오디오 신호 압축 코덱을 이용하여 해결할 수 있지만, 이러한 코덱들은 공통적으로 고 주파수(High frequency) 대역의 정보가 손실 된다는 문제가 발생한다. 이러한 고주파수 손실은 결국 표준 CD음질을 가지는 오디오 신호보다 제한된 저 주파수 대역만을 재생 할 수 있게 된다. 일반적으로 오디오 신호의 고 주파수 성분은 위치정보 와 명료도, 재생 환경 등에 대한 음의 풍부한 정보를 제공한다. 본 연구에서는 MP3 오디오 코덱으로 디코드(decode) 된 오디오 신호에서 손실된 고 주파수 대역의 정보를 효과적으로 추정 및 복원하는 ARM 플랫폼 기반의 MP3 오디오 음질향상 시스템을 구축하였다. 제안된 시스템과 기존의 대표적인 알고리즘인 Liu의 HFR 과의 비교실험을 통해 제안된 알고리즘이 신호 스펙트럼상에서 고주파 신호 추정 및 복원 능력이 우수함을 볼 수 있고, 알고리즘 연산량도 약 2배 정도 절약할 수 있었다.

CUDA로 구현한 FDTD알고리즘의 OpenMP기술 적용 및 성능 측정 (OpenMP application to implement CUDA for FDTD algorithm and performance measurement)

  • 정복재;오승택;이철훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.3-6
    • /
    • 2013
  • 반도체 공정에서 소자의 제조 비용 감소를 위해 제조 공정 검증을 위한 시뮬레이션을 수행하게 된다. 이 시뮬레이션은 반도체 소자 내부의 물리량 계산을 통해 반도체 소자 내부의 불순물의 거동을 해석하게 된다. 이를 위해 사용되는 알고리즘으로 3차원적 형상을 표현하는 물리적 미분 미분방정식을 계산하게 되는데, 정확한 계산을 위해 유한 차분 시간 영역법(이하 FDTD)과 같은 수치해석 기법을 이용한다. 실제적으로 반도체 공정의 시뮬레이션에서 FDTD연산의 실행 시간은 90% 이상을 소요하게 된다. 이러한 연산에서 더욱 빠른 성능을 확보하기 위해 본 논문에서는 기존의 CUDA(Compute Unified Device Architecture)로 구현된 FDTD알고리즘을 OpenMP를 통한 다중 GPU제어를 이용하여 연산 수행시간을 감소하고, 그 결과물을 통하여 성능 향상도를 측정한다.

  • PDF