• 제목/요약/키워드: GPU program

검색결과 53건 처리시간 0.024초

하이트필드 맵을 이용한 회화적 질감 표현 (Surface Detailed Painterly Rendering Using Heightfield Map)

  • 류승택
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제12권4호
    • /
    • pp.1-5
    • /
    • 2006
  • 본 논문에서는 하이트필드 맵을 이용한 회화적 질감 표현 방법을 제시한다. 회화적 렌더링된 결과물의 하이트필드 맵을 이용하면 회화작품의 질감을 표현할 수 있다. 이를 위해 하이트필드 맵을 바탕으로 노말 매핑과 디스플레이스먼트 매핑 방법을 이용하여 회화적 렌더링을 구현하였다. 제시된 방법은 GPU 프로그래밍을 이용하여 물체의 세부적인 표면을 실시간으로 회화적 렌더링할 수 있어 3차원 가시화나 게임엔진에 응용할 수 있다.

  • PDF

대규모 점군 및 폴리곤 모델의 GLSL 기반 실시간 렌더링 알고리즘 (A Real-Time Rendering Algorithm of Large-Scale Point Clouds or Polygon Meshes Using GLSL)

  • 박상근
    • 한국CDE학회논문집
    • /
    • 제19권3호
    • /
    • pp.294-304
    • /
    • 2014
  • This paper presents a real-time rendering algorithm of large-scale geometric data using GLSL (OpenGL shading language). It details the VAO (vertex array object) and VBO(vertex buffer object) to be used for up-loading the large-scale point clouds and polygon meshes to a graphic video memory, and describes the shader program composed by a vertex shader and a fragment shader, which manipulates those large-scale data to be rendered by GPU. In addition, we explain the global rendering procedure that creates and runs the shader program with the VAO and VBO. Finally, a rendering performance will be measured with application examples, from which it will be demonstrated that the proposed algorithm enables a real-time rendering of large amount of geometric data, almost impossible to carry out by previous techniques.

GPGPU의 멀티 쓰레드를 활용한 고성능 병렬 LU 분해 프로그램의 구현 (Implementation of high performance parallel LU factorization program for multi-threads on GPGPUs)

  • 신봉희;김영태
    • 인터넷정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.131-137
    • /
    • 2011
  • GPGPU는 원래 그래픽 계산을 위한 프로세서인 GPU를 일반 계산에 활용하여 저전력으로 고성능의 효율을 보이는 신개념의 계산 장치이다. 본 논문에서는 GPGPU에서 계산을 하기 위한 병렬 LU 분해법의 알고리즘을 제안하였다. Nvidia GPGPU에서 프로그램을 실행하기 위한 CUDA 계산 환경에서는 계산하고자 하는 데이터 도메인을 블록으로 나누고 각 블록을 쓰레드들이 동시에 계산을 하는데, 이 때 블록들의 계산 순서는 무작위로 진행이 되기 때문에 블록간의 데이터 의존성을 가지는 LU 분해 프로그램에서는 결과가 정확하지 않게 된다. 본 논문에서는 병렬 LU 분해법에서 블록간의 계산 순서를 인위적으로 정하는 구현 방식을 제안하며 아울러 LU 분해법의 부분 피벗팅을 계산하기 위한 병렬 reduction 알고리즘도 제안한다. 또한 구현된 병렬프로그램의 성능 분석을 통하여 GPGPU의 멀티 쓰레드 기반으로 고성능으로 계산할 수 있는 병렬프로그램의 효율성을 보인다.

실시간 렌더링을 위한 MPEG-I RVS 가속화 기법 (MPEG-I RVS Software Speed-up for Real-time Application)

  • 안희준;이명진
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.655-664
    • /
    • 2020
  • 자유시점 영상합성기술은 MPEG-I(Immersive) 표준에서 중요한 기술 중 하나이다. 현재 MPEG-I에서 개발하여 사용하는 RVS (Reference View Synthesizer) 프로그램은 다수의 시점의 컬러영상과 깊이영상을 바탕으로 임의시점의 영상을 생성하는 DIBR (Depth Information-Based Rendering) 프로그램이다. RVS는 기존의 DIBR이 갖는 깊이정보 전달의 문제를 컴퓨터 그래픽스의 메쉬 표면 방식으로 접근하여 이전 화소방식에 비하여 2.5dB 이상의 성능향상을 보이며 OpenGL을 사용하면 CPU에서 동작하는 코드보다 10배 이상의 속도를 보인다. 그러나 여전히 2개의 2k 해상도 입력 영상에서 0.75fps 정도의 비실시간 처리속도를 보인다. 본 논문에서는 현 RVS의 내부 구현을 분석하고 이를 바탕으로 1) OpenGL 버퍼와 텍스쳐 객체의 재사용 2) 파일 입출력과 OpenGL 실행의 병렬화 3) GPU 셰이더 프로그램과 버퍼 데이터 전송의 병렬화를 적용하였다. 그 결과 두 개의 2k 해상도 입력 영상의 처리속도를 34배 이상 가속하여 22-28fps의 실시간 성능을 확보하였다.

CUDA를 이용한 Convolutional Neural Network의 효율적인 구현 (Efficient Implementation of Convolutional Neural Network Using CUDA)

  • 기철민;조태훈
    • 한국정보통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1143-1148
    • /
    • 2017
  • 현재 인공지능과 딥 러닝이 사회적인 이슈로 떠오르고 있는 추세이며, 다양한 분야에 이 기술들을 응용하고 있다. 인공지능 분야의 여러 알고리즘들 중에서 각광받는 방법 중 하나는 Convolutional Neural Network이다. Convolutional Neural Network를 적은 양의 데이터에서 이용하거나, Layer의 구조가 복잡하지 않은 경우에는 학습시간이 길지 않아 속도에 크게 신경 쓰지 않아도 되지만, 학습 데이터의 크기가 크고, Layer의 구조가 복잡할수록 학습시간이 상당히 오래 걸린다. 이로 인해 GPU를 이용하여 병렬처리를 하는 방법을 많이 사용하는데, 본 논문에서는 CUDA를 이용한 Convolutional Neural Network를 구현하였으며, 비교에 사용한 Framework/Program들 보다 학습속도가 빨라지고 큰 데이터를 학습 시키는데 더욱 효율적으로 진행하도록 한다.

Detecting A Crypto-mining Malware By Deep Learning Analysis

  • Aljehani, Shahad;Alsuwat, Hatim
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.172-180
    • /
    • 2022
  • Crypto-mining malware (known as crypto-jacking) is a novel cyber-attack that exploits the victim's computing resources such as CPU and GPU to generate illegal cryptocurrency. The attacker get benefit from crypto-jacking by using someone else's mining hardware and their electricity power. This research focused on the possibility of detecting the potential crypto-mining malware in an environment by analyzing both static and dynamic approaches of deep learning. The Program Executable (PE) files were utilized with deep learning methods which are Long Short-Term Memory (LSTM). The finding revealed that LTSM outperformed both SVM and RF in static and dynamic approaches with percentage of 98% and 96%, respectively. Future studies will focus on detecting the malware using larger dataset to have more accurate and realistic results.

컨투어 트리를 이용한 삼차원 볼륨 영상의 대화형 시각화 기법 개발 (Development of Interactive 3D Volume Visualization Techniques Using Contour Trees)

  • 손봉수
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권11호
    • /
    • pp.67-76
    • /
    • 2011
  • 본 논문은 삼차원 볼륨 영상으로부터 컨투어 트리를 이용하여 볼륨 영상의 구조를 보여주고 등위면과 그 요소들을 대화형으로 선택하고 시각화하여 영상의 깊은 이해를 돕는 새로운 기법과 프로그램의 개발에 관하여 기술한다. 이 기법의 특징은 컨투어 트리를 사용자가 이해하기 쉽게 2차원 평면상에 배치하는 새로운 알고리즘과, GPU의 병렬구조를 활용하여 등위면 요소를 효율적으로 추출할 수 있도록 하는 알고리즘을 제시한 데 있다. 이러한 알고리즘의 구현을 통해 본 연구진이 개발한 프로그램은 컨투어 트리를 이용하여 등위면 요소를 추출하는 대화형 사용자 인터페이스와 기존의 등위면 및 볼륨 렌더링이 융합된 시각화를 가능하게 해주는 특징이 있다. 본 논문에서 제안하는 기법의 우수성을 검증하기 위하여, 제안된 알고리즘을 삼차원 생의학 영상에 적용하여 그 성능을 측정해 보았다. 그 결과 제안된 컨투어 트리 배치 기법에 기반한 사용자 인터페이스를 이용하여 주어진 영상의 관심 영역인 폴리펩타이드 체인과 뇌실 그리고 대퇴골을 나타내는 등위면 요소를 각각 대화형으로 선택하고 이를 기존 방법에 비교하여 3배~4배이상 빠른 속도로 계산할 수 있었다.

Genetic Divergence Analysis among Micromutant Lines in Finger Millet(Eleusine coracana G.)

  • Muduli, Kumuda Chandra;Misra, Rama Chandra
    • Journal of Crop Science and Biotechnology
    • /
    • 제11권1호
    • /
    • pp.63-68
    • /
    • 2008
  • The induced genetic divergence was estimated in 44 mutant lines of finger millet variety GPU 26, developed by single and combination treatments with gamma rays, EMS and NG using three multivariate analyses. The mutant lines were grouped into eight genetically diverse clusters by multivariate D2 and canonical analyses and 11 clusters by dendrogram grouping through Gower's similarity coefficient. The clustering pattern in these three methods was almost similar. Twelve mutant lines in D2 and 13 in the dendrogram grouping method were grouped in the parental cluster(Cluster I) indicating that they did not possess enough divergence from the parent to be classified as micromutant lines. However a large proportion of mutant lines showed divergence from the parent variety and also among themselves. No definite relationship of mutagenic origin and clustering of mutant lines were observed. The mutant lines developed from the same mutagenic treatments often grouped into different clusters indicating that each mutagenic treatment was effective in inducing diverse types of changes in the nine traits studied. The hybridization program between the divergent mutant lines GE 2-2 or GE 3-4 with GG 3-1 is expected to give promising and desirable segregants in subsequent generations. Traits such as days to 50% flowering and days to maturity had major contributions to the induced genetic divergence.

  • PDF

트랜스포머를 이용한 향상된 댓글 생성에 관한 연구 (A Study on Improved Comments Generation Using Transformer)

  • 성소윤;최재용;김경철
    • 한국게임학회 논문지
    • /
    • 제19권5호
    • /
    • pp.103-114
    • /
    • 2019
  • 온라인 커뮤니티 안에서 다른 사용자들의 글에 반응할 수 있는 딥러닝 연구를 2017년부터 진행해 왔으나, 한국어의 조사와 같은 특성으로 인한 단어처리의 어려움과 RNN 모델의 특성으로 인한 GPU 사용률 저조 문제로 인해 적은 양의 데이터로 학습을 제한해야 했다. 하지만 최근 자연어 처리 분야의 급격한 발전으로 이전보다 뛰어난 모델들이 등장함에 따라 본 연구에서는 이러한 발전된 모델을 적용해 더 나은 학습 결과를 생성해 내는 것을 목표로 한다. 이를 위해 셀프-어텐션 개념이 적용된 트랜스포머모델을 도입했고 여기에 한국어 형태소 분석기 MeCab을 적용해 단어처리의 어려움을 완화했다.

Maskinator: 효율적인 마스크 착용 여부 판단 프로그램 (Maskinator : An Efficient Mask Detection Program)

  • 예상우;박준호;김호숙
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.195-198
    • /
    • 2021
  • COVID-19 전염병은 우리의 일상 생활에 빠르게, 그리고 엄청난 영향을 미쳤다. 현재는 마스크를 착용하는 것이 새로운 평범함이 되었고, 이에 따라 많은 서비스 제공업체들은 고객들에게 그들의 서비스를 이용하기 위해 마스크를 착용하도록 요구하고 있다. 공공 버스도 이에 포함된다. 여러 뉴스 기사에 따르면 마스크를 써 달라는 버스 기사의 부탁에 버스 기사를 폭행한 사건이 여러 번 발생하였다. 이에 기계가 마스크를 쓰지 않은 사람을 가려내고 마스크를 쓰라고 한다면 버스 기사에게 향하는 비이성적 분노가 줄어들 것이라고 생각하였다. 따라서, 본 논문에서는 Keras와 같은 기본적인 기계 학습 패키지를 사용하여 빠르고 정확하게 마스크의 착용여부를 확인할 수 있는 방식을 제안한다. 제안된 방식은 고성능 컴퓨터 및 그래픽카드의 필요없이 CPU에서만 작동하는 마스크 착용 판별프로그렘으로, 추가적으로 알림을 보낼 수 있는 웹사이트와 음성 경고 시스템도 함께 구현하였다. 이 방법은 테스트 데이터셋에서 99.5% 이상의 정확도를 달성했고, GPU가 아닌 CPU에서 6fps 정도의 속도를 지원하여 실생활에 사용될 수 있다.

  • PDF