• 제목/요약/키워드: multi-thread

검색결과 188건 처리시간 0.025초

타일 및 프레임 수준의 HEVC 병렬 부호화 (Tile-level and Frame-level Parallel Encoding for HEVC)

  • 김연희;석진욱;정순흥;김휘용;최진수
    • 방송공학회논문지
    • /
    • 제20권3호
    • /
    • pp.388-397
    • /
    • 2015
  • 고화질 비디오에 대한 시장의 요구가 높아짐에 따라 고화질 비디오를 기존 보다 낮은 데이터 량으로 압축할 수 있는 새로운 비디오 부호화 표준 기술인 HEVC(High Efficiency Video Coding)가 최근에 개발 완료되었다. 즉 HEVC로 압축한 데이터의 양은 기존 비디오 부호화 표준인 AVC/H.264로 압축한 데이터의 양의 동일 화질 대비 약 50%로 보고되고 있다. 압축 성능이 개선된 새로운 부호화 표준에 대한 시장의 관심은 뜨겁지만 시장에 바로 활용되기 위하여서는 응용 서비스에서 요구하는 수준의 처리속도를 만족시켜야 한다. 다수의 코어가 탑재된 컴퓨터 시스템이 널리 보급된 오늘날의 개발 환경에서 부호화 처리 속도를 개선시키기 위해서 여러 각도의 병렬 부호화 적용이 필수이다. 본 논문에서는 HEVC 부호화기에 화면 분할 병렬화와 프레임 수준의 병렬화를 조합하여 적용할 때 코딩 효율 대비 병렬화로 인한 더 높은 속도 향상 결과를 가져올 수 있는 방법을 제안하였다. 즉 시스템 자원과 병렬로 처리할 프레임에 따라 화면을 적응적으로 분할하게 함으로써 코딩 효율 대비 속도 향상을 개선시킬 수 있었다. 한 화면 안에서는 다수의 타일(Tile) 단위로 병렬처리하고, 참조되지 않는 프레임(Frame)들을 병렬로 부호화하도록 본 논문을 통해 구현하였으며 Full-HD 및 4K UHD 영상을 이용하여 제안하는 방법이 코딩 효율 대비 병렬화로 인한 속도 향상이 개선되었음을 보여주었다.

분말사출성형을 이용한 다수 캐비티 치과용 요오드 용기 금형제작에 관한 연구 (A Study on mold manufacture of multi-cavity dental iodine container using powder injection molding)

  • 최재훈
    • 한국산학기술학회논문지
    • /
    • 제15권1호
    • /
    • pp.21-26
    • /
    • 2014
  • 치과에서 사용되는 구강 치료용 요오드 용기는 개폐 시 용기의 캡에 부착되어 있는 칼날에 의해 치료용 실은 절단이 된다. 금속의 칼날은 요오드 용액과 반응하여 단기간에 부식이 되는 문제로 인해 환자의 위생에도 영향을 준다. 이러한 문제를 해결하기 위해 최근 세라믹 칼날로 대체되어진 제품들도 개발되어 생산되는데, 이때 세라믹 칼날은 수작업과 기계가공을 통해 만들어 진다. 본 연구에서는 세라믹 칼날을 분말사출성형공정으로 대량 생산할 수 있도록 20Cavity의 균일 충전을 위한 유동 시스템을 제안하였다. Moldflow를 이용하여 20cavity 유동성에 대한 시뮬레이션을 진행하였고, 금형제작과 수정을 통해 금형을 완성하였다. 사출성형 후 탈지와 소결공정을 통해 완성하고, 금형에 세라믹 칼날을 인서트 사출하여 캡 제품을 완성하였다. 본 연구를 통해 유효한 절단 성능을 갖는 세라믹칼날 대량생산 가능성을 검증하였다.

멀티 스레딩 기반 병렬 프로그램의 효과적인 디버깅을 위한 추상적 시각화 (Abstract Visualization for Effective Debugging of Parallel Programs Based on Multi-threading)

  • 김영주
    • 한국정보통신학회논문지
    • /
    • 제20권3호
    • /
    • pp.549-557
    • /
    • 2016
  • 효과적인 시각화는 일반적으로 대용량의 디버깅 정보와 프로그램의 추상적 수행모델을 표현하는 것이 중요하다. 본 논문에서는 스레드들간의 논리적 병행성 관계를 나타내는 부분순서 수행그래프를 이용하여 내포병렬성과 임계구역을 가진 OpenMP 병렬 프로그램의 수행양상과 경합정보의 효과적 디버깅을 위해서 효과적으로 제공하는 추상적 시각화 도구를 제안한다. 본 도구는 수행중 추적선택 기법으로 시각화 정보를 위한 공간적 복잡성을 줄이고, 추적된 시각화 정보에 프로그램의 내포병렬성과 임계구역 동기화를 위한 그래프 추상화를 제공하여 시각적 복잡성을 해결한다. 그래프 추상화를 통한 스레드들간의 부분순서 관계와 경합탐지 정보는 프로그램의 제어흐름과 경합의 위치를 구조적으로 파악할 수 있게 하므로 프로그램 수행의 이해와 경합 탐지 및 수정에 효과적이다.

LLRP를 지원하는 R1000/R2000 겸용 RFID 리더 (Design and Implementation of a R1000/R2000 based RFID Reader Which Supports the Low Level Reader Protocol)

  • 배성우;유원상;곽호길;정명섭;박준석;성영락;오하령
    • 한국통신학회논문지
    • /
    • 제35권2B호
    • /
    • pp.279-286
    • /
    • 2010
  • RFID 리더 프로토콜은 RFID 리더와 미들웨어, 애플리케이션 등의 상위 호스트 사이의 인터페이스이다. 현재의 리더 프로토콜은 리더 제조업체별로 상이하여 이기종의 리더들을 사용하는 환경에서는 리더들 간의 호환성 문제가 있다. 본 논문에서는 이와 같은 문제를 해결하기 위해 EPCglobal의 LLRP(Low Level Reader Protocol)을 지원하는 리더를 설계하고 구현하였다. 또한, 다양한 응용분야에 적용하기 위해 리더를 두 개의 모듈로 나누어 설계하였고, 다양한 인터페이스를 지원하도록 설계하였다. LLRP는 임베디드 리눅스 환경에서 멀티 쓰레드를 이용해 구현하였으며, LLRP의 대부분의 기능을 지원하고 다양한 요구에 맞출 수 있도록 유연한 하드웨어와 소프트웨어 구조로 설계하였다.

Simple Spectral Calibration Method and Its Application Using an Index Array for Swept Source Optical Coherence Tomography

  • Jung, Un-Sang;Cho, Nam-Hyun;Kim, Su-Hwan;Jeong, Hyo-Sang;Kim, Jee-Hyun;Ahn, Yeh-Chan
    • Journal of the Optical Society of Korea
    • /
    • 제15권4호
    • /
    • pp.386-393
    • /
    • 2011
  • In this study, we report an effective k-domain linearization method with a pre-calibrated indexed look-up table. The method minimizes k-domain nonlinear characteristics of a swept source optical coherence tomography (SS-OCT) system by using two arrays, a sample position shift index and an intensity compensation array. Two arrays are generated from an interference pattern acquired by connecting a Fabry-Perot interferometer (FPI) and an optical spectrum analyzer (OSA) to the system. At real time imaging, the sample position is modified by location movement and intensity compensation with two arrays for linearity of wavenumber. As a result of evaluating point spread functions (PSFs), the signal to noise ratio (SNR) is increased by 9.7 dB. When applied to infrared (IR) sensing card imaging, the SNR is increased by 1.29 dB and the contrast noise ratio (CNR) value is increased by 1.44. The time required for the linearization and intensity compensation is 30 ms for a multi thread method using a central processing unit (CPU) compared to 0.8 ms for compute unified device architecture (CUDA) processing using a graphics processing unit (GPU). We verified that our linearization method is appropriate for applying real time imaging of SS-OCT.

NTGST 병렬화를 이용한 고해상도 BLU 검사의 고속화 (NTGST-Based Parallel Computer Vision Inspection for High Resolution BLU)

  • 김복만;서경석;최흥문
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.19-24
    • /
    • 2004
  • 본 논문에서는 LCD (liquid crystal display) 생산라인에서 컴퓨터 비전에 의한 BLU (back light unit)의 고해상도 정밀검사를 원활하게 하기 위해 SIMD (single instruction stream and multiple data stream)형 병렬 구조의 다중 프로세서를 이용하여 계산 집약적인 NTGST (noise-tolerant generalized symmetry transform) 검사 알고리즘을 병렬구현 하였다. 먼저 알고리즘 자체의 속도향상을 위해 C 코드의 최적화를 거친 후, 순차형 프로그램을 N개의 데이터를 동시에 처리하는 SIMD형 언어로 변환하고, 검사영상 데이터를 SIMD형 다중프로세서에서 P개의 각 쓰레드에 분할 할당함으로써 O(NP)의 속도향상이 가능하도록 하였다. Dual Pentium Ⅲ 프로세서를 사용하여 실험한 결과, 제안한 병렬시스템은 기존보다 Sp=8 배 이상 고속 처리가 가능하여, 다양한 크기의 BLU에 대한 고해상도 정밀검사장비에도 신축적으로 확장적용 가능함을 확인하였다.

쿠다를 사용하여 GPU 리소스를 분배하는 지능형 얼굴 인식 및 트래킹 시스템 (Intelligent Face Recognition and Tracking System to Distribute GPU Resources using CUDA)

  • 김재형;이승호
    • 전기전자학회논문지
    • /
    • 제22권2호
    • /
    • pp.281-288
    • /
    • 2018
  • 본 논문에서는 쿠다(CUDA)를 사용하여 GPU 리소스를 분배하는 지능형 얼굴 인식 및 트래킹 시스템을 제안한다. 제안한 시스템은 GPU 리소스를 최적의 상태로 분배하는 GPU 할당 알고리즘, 딥러닝을 이용한 얼굴 영역 검출, 딥러닝을 이용한 얼굴 인식, 실시간 얼굴 트래킹, PTZ 카메라 제어 등의 5단계로 구성되어진다. 멀티 GPU 리소스를 최적의 상태로 분배하는 GPU 할당 알고리즘은 고정적으로 스레드에 GPU를 할당하는 방식과 달리 GPU의 활성화 정도에 따라 유동적으로 GPU 리소스를 분배한다. 따라서 안정적이고 효율적인 멀티 GPU 사용을 가능하게 하는 특징이 있다. 제안된 시스템에 대한 성능을 평가하기 위하여 리소스 분배를 하지 않은 시스템과 제안한 시스템을 비교한 결과, 리소스를 분배하지 않은 시스템은 불안정한 동작을 보이는 반면에 제안한 시스템에서는 안정적으로 구동됨으로서 효율적인 리소스 사용을 보였다. 따라서 제안된 시스템의 효용성이 입증되었다.

상호연관성 분석을 이용한 웹서버 보안관리 시스템 (Web-Server Security Management system using the correlation analysis)

  • 김성락
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.157-165
    • /
    • 2004
  • 본 논문에서는 현재 증가하고 있는 웹 서비스 공격을 정확하고 빠르게 탐지할 수 있고, 잘못된 공격탐지를 줄여줄 수 있는 웹서버 보안관리시스템을 제안한다. 이 시스템은 여러 단위보안모듈들의 결과를 실시간으로 수집하고 상호연관성 분석과정을 통해 탐지의 정확성을 향상시킨다. 단위보안모듈은 네트웍기반 침입탐지시스템 모듈, 파일무결성 검사 모듈, 시스템로그분석 모듈 그리고 웹로그분석 모듈로 구성되며, 그리고 각각의 단위보안모듈들의 결과에 연관성을 부여하여 실시간으로 분석하는 상호연관성 분석 모듈이 있다. 제안한 시스템은 공격탐지의 정확성 뿐 아니라 단위보안모듈의 추가 그리고 상호연관성 분석의 범위확장이 용이한 프레임워크를 제공한다. 그리고 제안한 시스템의 단위보안모듈 중 침입탐지시스템 모듈은 다중 쓰레드 기반으로 Snort를 재구성하여 보다 빠른 공격 탐지 시간을 갖는다. 처리량이 많은 단위보안모듈의 처리시간을 단축함으로서 웹서버 보안관리시스템 처리 성능을 향상시킬 수 있다.

  • PDF

인터넷에서 동시 파일 전송을 효과적으로 지원하는 NFTP의 설계 및 구현 (Next-Generation File Transfer Protocol Which support concurrent file transmissions effectively in Internet)

  • 최재남
    • 한국통신학회논문지
    • /
    • 제27권1C호
    • /
    • pp.90-95
    • /
    • 2002
  • 현재 인터넷 FTP(File Transfer Protocol)는 그 범용성과 안정성에도 불구하고 구조적인 문제로 인하여, 동시 다중 파일 송수신이 불가능하여 파일을 전송하려면 현재 진행중인 전송이 종료될 때까지 대기해야 하는 불편함이 있었다. 그리고 n(n>1)개의 파일을 동시에 송수신 하려면 사용자 측 PC와 서비스 제공자 호스트(HOST)에 n개의 클라이언트와 서버를 각각 띄워야 한다. 따라서, 메모리 및 네트워크 자원의 낭비와 허용 할 수 없는 시스템 부하를 초래하는 위험성까지 내포하고 있다. 앞서 기술한 이와 같은 문제를 해결하기 위하여 본 논문에서는 시스템부하를 최소화하고 효과적으로 동시에 다중 파일 송수신이 가능하도록 멀티쓰레드를 기반으로 한 NFTP(Next-Generation FTP)구조를 설계하였고, NFTP 프로토콜을 구현하였다. 본 논문에서 설계한 NFTP를 구현하여 실제 서비스에 적용한 결과, 이용자의 파일 전송 종료 대기 시간을 대폭 줄일 수 있었을 뿐만 아니라 시스템 부하도 적게 주어서 안정적으로 서비스를 제공할 수 있었다.

Minix3 마이크로커널 기반 디스크 캐쉬 관리자의 설계 및 구현 (Disk Cache Manager based on Minix3 Microkernel : Design and Implementation)

  • 최욱진;강용호;김선종;권혁숭;김주만
    • 디지털융복합연구
    • /
    • 제11권11호
    • /
    • pp.421-427
    • /
    • 2013
  • 마이크로커널 기반의 기능성 서버인 디스크 캐쉬 관리자(DCM)은 공유 디스크의 입출력 성능을 향상하는 목적으로 설계 및 구현되었다. DCM은 Misix3 마이크로커널의 멀티 쓰레드 모드로 동작하는 시스템 엑터간의 포트를 통하여 다른 서버들과 메시지 교환으로 정합한다. 본 논문에서 제안된 DCM은 병렬 입출력이 가능하도록 공유 디스크를 논리적으로 Seven 디스크와 Sodd 디스크로 나누어 사용한다. 본 논문에서 제안하는 DCM은 특정 디스크의 사용 빈도에 따라 캐쉬 사이즈를 증감함으로써 이용율이 높은 디스크의 캐시 사이즈 확대하여 캐시 적중률을 높여주므로서 효과적인 성능을 향상할 수 있게 한다. 경험적 결과를 통해서, 본 논문에서 제안한 DCM은 높은 이용율을 갖는 공유 디스크에서 아주 효과적임을 보였다.