• 제목/요약/키워드: D2GAN

검색결과 53건 처리시간 0.027초

Study on 2D Sprite *3.Generation Using the Impersonator Network

  • Yongjun Choi;Beomjoo Seo;Shinjin Kang;Jongin Choi
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권7호
    • /
    • pp.1794-1806
    • /
    • 2023
  • This study presents a method for capturing photographs of users as input and converting them into 2D character animation sprites using a generative adversarial network-based artificial intelligence network. Traditionally, 2D character animations have been created by manually creating an entire sequence of sprite images, which incurs high development costs. To address this issue, this study proposes a technique that combines motion videos and sample 2D images. In the 2D sprite generation process that uses the proposed technique, a sequence of images is extracted from real-life images captured by the user, and these are combined with character images from within the game. Our research aims to leverage cutting-edge deep learning-based image manipulation techniques, such as the GAN-based motion transfer network (impersonator) and background noise removal (U2 -Net), to generate a sequence of animation sprites from a single image. The proposed technique enables the creation of diverse animations and motions just one image. By utilizing these advancements, we focus on enhancing productivity in the game and animation industry through improved efficiency and streamlined production processes. By employing state-of-the-art techniques, our research enables the generation of 2D sprite images with various motions, offering significant potential for boosting productivity and creativity in the industry.

A research on the possibility of restoring cultural assets of artificial intelligence through the application of artificial neural networks to roof tile(Wadang)

  • Kim, JunO;Lee, Byong-Kwon
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.19-26
    • /
    • 2021
  • 역사적 지역에서 발굴되는 문화재는 시대적 배경을 바탕으로 고유의 특징을 가지고 있으며, 역사와 전파 지역의 흐름에 따라 그 문양과 특징이 조금씩 변화하는 것을 볼 수 있다. 어떤 지역에서 발굴된 문화재는 그 당시의 문화를 대표하며 온전한 모습을 유지하는 것도 있지만, 대부분이 파손/손실되거나 일부분으로 나누어져 그 구성을 연구하고 파손된 부분을 복구하기 위해 많은 전문가가 동원된다. 이 연구의 목적은 이러한 복원연구에 인공지능 신경망을 통해 과거의 문양과 패턴들을 학습시키고, 출토된 문화재에서 손실된 부분을 복원시키는 데 있으며, 문화재를 복원하기 위해 기본적인 생성적 적대 신경망인 GAN(Generative Adversarial Network)[1]을 사용한다. 연구에서는 GAN을 기반으로 출토된 문화재 일부를 기반으로 하여 손상/손실된 나머지 부분을 복구한 연구 과정으로, 학습에 기반이 되는 온전한 문화재의 이미지로 훈련을 하고, 일부를 마음대로 손상해 복구할 수 있도록 했다. 연구는 문화재 복구에 있어, 시대적 특징을 어느 정도 복구하는지, 색상과 재질을 복구하는지에 중점을 두고 있다. 마지막으로는 실제 출토된 비슷한 문화재를 기반으로 훈련된 신경망을 사용하여 문양을 복구함으로써 인공신경망의 적용 범위를 연구한다.

딥러닝에 의한 라이다 반사강도로부터 엄밀정사영상 생성 (True Orthoimage Generation from LiDAR Intensity Using Deep Learning)

  • 신영하;형성웅;이동천
    • 한국측량학회지
    • /
    • 제38권4호
    • /
    • pp.363-373
    • /
    • 2020
  • 정사영상 생성을 위한 많은 연구들이 진행되어 왔다. 기존의 방법은 정사영상을 제작할 경우, 폐색지역을 탐지하고 복원하기 위해 항공영상의 외부표정요소와 정밀 3D 객체 모델링 데이터가 필요하며, 일련의 복잡한 과정을 자동화하는 것은 어렵다. 본 논문에서는 기존의 방법에서 탈피하여 딥러닝(DL)을 이용하여 엄밀정사영상을 제작하는 새로운 방법을 제안하였다. 딥러닝은 여러 분야에서 더욱 급속하게 활용되고 있으며, 최근 생성적 적대 신경망(GAN)은 영상처리 및 컴퓨터비전 분야에서 많은 관심의 대상이다. GAN을 구성하는 생성망은 실제 영상과 유사한 결과가 생성되도록 학습을 수행하고, 판별망은 생성망의 결과가 실제 영상으로 판단될 때까지 반복적으로 수행한다. 본 논문에서 독일 사진측량, 원격탐사 및 공간정보학회(DGPF)가 구축하고 국제 사진측량 및 원격탐사학회(ISPRS)가 제공하는 데이터 셋 중에서 라이다 반사강도 데이터와 적외선 정사영상을 GAN기반의 Pix2Pix 모델 학습에 사용하여 엄밀정사영상을 생성하는 두 가지 방법을 제안하였다. 첫 번째 방법은 라이다 반사강도영상을 입력하고 고해상도의 정사영상을 목적영상으로 사용하여 학습하는 방식이고, 두 번째 방법에서도 입력영상은 첫 번째 방법과 같이 라이다 반사강도영상이지만 목적영상은 라이다 점군집 데이터에 칼라를 지정한 저해상도의 영상을 이용하여 재귀적으로 학습하여 점진적으로 화질을 개선하는 방법이다. 두 가지 방법으로 생성된 정사영상을 FID(Fréchet Inception Distance)를 이용하여 정량적 수치로 비교하면 큰 차이는 없었지만, 입력영상과 목적영상의 품질이 유사할수록, 학습 수행 시 epoch를 증가시키면 우수한 결과를 얻을 수 있었다. 본 논문은 딥러닝으로 엄밀정사영상 생성 가능성을 확인하기 위한 초기단계의 실험적 연구로서 향후 보완 및 개선할 사항을 파악할 수 있었다.

Generative Adversarial Network를 이용한 카툰 원화의 라인 드로잉 추출 (Extraction of Line Drawing From Cartoon Painting Using Generative Adversarial Network)

  • 유경호;양희덕
    • 스마트미디어저널
    • /
    • 제10권2호
    • /
    • pp.30-37
    • /
    • 2021
  • 최근 웹툰이나 애니메이션을 3D 콘텐츠로 제작하는 사례가 증가하고 있다. 3D 콘텐츠 제작에서 모델링은 반드시 필요하지만 시간이 오래 걸리는 작업이다. 드로잉 기반 모델링을 사용하여 2D 카툰 원화에서 3D 모델을 생성하기 위해서는 라인 드로잉이 필요하다. 하지만 2D 카툰원화는 3D 모델의 기하학적 특성이 표현되지 않고 카툰원화의 제작 기법이 다양하여 일관성 있게 라인 드로잉 추출이 힘들다. 본 연구에서는 generative adversarial network (GAN) 모델을 사용하여 2D 카툰 원화에서 3D 모델의 기하학적 특성을 나타내는 라인 드로잉을 추출하는 방법을 제안하고 이를 실험한다.

Synthesis of T2-weighted images from proton density images using a generative adversarial network in a temporomandibular joint magnetic resonance imaging protocol

  • Chena, Lee;Eun-Gyu, Ha;Yoon Joo, Choi;Kug Jin, Jeon;Sang-Sun, Han
    • Imaging Science in Dentistry
    • /
    • 제52권4호
    • /
    • pp.393-398
    • /
    • 2022
  • Purpose: This study proposed a generative adversarial network (GAN) model for T2-weighted image (WI) synthesis from proton density (PD)-WI in a temporomandibular joint(TMJ) magnetic resonance imaging (MRI) protocol. Materials and Methods: From January to November 2019, MRI scans for TMJ were reviewed and 308 imaging sets were collected. For training, 277 pairs of PD- and T2-WI sagittal TMJ images were used. Transfer learning of the pix2pix GAN model was utilized to generate T2-WI from PD-WI. Model performance was evaluated with the structural similarity index map (SSIM) and peak signal-to-noise ratio (PSNR) indices for 31 predicted T2-WI (pT2). The disc position was clinically diagnosed as anterior disc displacement with or without reduction, and joint effusion as present or absent. The true T2-WI-based diagnosis was regarded as the gold standard, to which pT2-based diagnoses were compared using Cohen's ĸ coefficient. Results: The mean SSIM and PSNR values were 0.4781(±0.0522) and 21.30(±1.51) dB, respectively. The pT2 protocol showed almost perfect agreement(ĸ=0.81) with the gold standard for disc position. The number of discordant cases was higher for normal disc position (17%) than for anterior displacement with reduction (2%) or without reduction (10%). The effusion diagnosis also showed almost perfect agreement(ĸ=0.88), with higher concordance for the presence (85%) than for the absence (77%) of effusion. Conclusion: The application of pT2 images for a TMJ MRI protocol useful for diagnosis, although the image quality of pT2 was not fully satisfactory. Further research is expected to enhance pT2 quality.

궁궐(宮闕) 정전(正殿)에서 기둥과 공포의 구조적(構造的) 비례특성(比例特性)에 관한 연구(硏究) (A study on the Characteristics of Structural Proportion of Pillar and 'Kong-po' in 'Main Hall of Royal Palace(正殿)' of the Royal Palace)

  • 박언곤;최효식
    • 건축역사연구
    • /
    • 제14권1호
    • /
    • pp.71-87
    • /
    • 2005
  • 4 royal palaces are currently remained from capital city (Seoul) of 'Cho-Sun(朝鮮)' period. In these palaces, 'Main hall of Royal Palace(正殿)' is the center of the Royal Palaces. The 'Main hall of Royal Palace' of the Royal Palace was the best building of that time. Therefore there were many studies about the 'Main hall of Royal Palace'. But these studies were individual studies of these 'Main hall of Royal Palace'. Therefore, this study is to analyze and compare 4 'Main hall of Royal Palace' of the Royal palaces. It is to study the proportion regarding the Diameter of the pillar, the Height, the pillar and pillar Interval's Distance, and the arrangement of 'Kong-Po(bracket sets)'. With these studies, it is to prove that the 'Main hall of Royal Palace' is the building which high construction technique of this time is expressed. Result of this study is as followings; First, the proportion of pillar height(H) to its diameter(D) average from H=8.0 to 8.5D. Only the Myeong-Jeong-Jeon omitted the 'Go-Ju(高柱)' in the 'Toi-Kan (退間)' to place Ea-Jwa(御座). Second, Second, the proportion of diameter of the pillar of 'Eoi-Bu-Pyeong-Ju(外部平柱)' and 'Nae-Jin-Go-Ju(內陣高柱)' average D1(Diameter of 'Eoi-Bu-Pyeong-Ju') =0.91D2 (Diameter of 'Nae-Jin-Go-Ju'). In regards to the height, the single floor 'Main hall of Royal Palace' and double floor 'Main hall of Royal Palace' seems to be different. The height proportion of the double floor 'Main hall of royal palace' is H1(Height of 'Eoi-Bu-Pyeong-Ju')=0.34H2(Height of 'Nae-Jin-Go-Ju') and single floor 'Main hall of Royal Palace' has a proportion of H1=0.62H2. Third, in Geun-Jeong-Jeon, with the proportion of height and diameter of the pillar, interval's distance between pillars and diameter, the pillar interval distance and height, of 'Ea-kan(御間)' from the 'Toi-Kan' is different from 'Main hall of Royal Palace'. This is because the structure of 'Toi-Kan' of Geun-Jeong-Jeon is not stable. In order to reinforce this, 'Gui-Go-Ju(隅高柱)' of the Geun-Jeong-Jeon jut out $4{\sim}7%$ more compared to In-Jeong-Jeon. Fourth, when comparing double floor 'Main hall of royal palace' of Geun-Jeong-Jeon and In-Jeong-Jeon, based on distance of 'Eoi-Bu-Pyeong-Ju' and 'Nae-Jin-Go-Ju' of lower level, the 'Sang-Bu-Pyeong-Ju(上部平柱)' of Geun-Jeong-Jeon jut out $4{\sim}7%$ more compared to the In-Jeong-Jeon and also It becomes thicker. Fifth, the arrangement of 'Kong-Po' on the front row of 'Gan(間)' had to do with the change of side 'Gan'. Even though the Geun-Jeong-Jeon and the In-Jeong-Jeon were double floors, the arrangement of the 'Kong-Po' is different because the number of side bay is different.

  • PDF

이미지를 사용한 가상의상착용 알고리즘들의 성능 분석 (Performance Evaluation of VTON (Virtual-Try-On) Algorithms using a Pair of Cloth and Human Image)

  • 따이 트안 투안;미나르 마드올 라흐만;안희준
    • 한국산업정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.25-34
    • /
    • 2019
  • 가상착용기술(VTON: Virtual try-on)은 의상의 온라인 유통을 활성화를 위하여 중요한 기술이다. 그러나 3차원 그래픽스기반 방식은 의상과 인체의 3차원 정보의 확보가 필요하여 범용화에 어려움이 있고, 이러한 제약을 해소하기 위해 개발되는 이미지 기반 방식들의 연구들은 그 기술적 한계가 불명확하다. 구체적으로 VITON (Virtual image try-on) 과 CP-VTON (Content preserving VTON)등은 가능성 위주의 매우 단편적인 결과만을 제시하고 있다. 본 논문은 이미지기반 기술의 상용화의 한계를 파악하기 위해, 세 가지 대표적 방식(SCMM 기반의 비-딥러닝 방식, 딥러닝기반 VITON 과 CP-VTON에 대하여 인물의 자세 및 체형, 의상의 가려짐 정도, 의상의 특성 등에 따라 분석을 하였다. 객관적인 평가를 위하여 변형단계와 합성단계의 성능을 각각 IoU와 SSIM로 평가하였고, 상대적인 비교 분석을 하였다. 그 결과, CP-VTON이 가장 좋은 성능을 보이지만, 자세와 의상의 복잡도에 따라 성능의 한계가 크게 차이가 남을 보였다. 그 주 원인은 2차 기하변형의 한계와 GAN을 통한 합성 기술의 한계로 파악되었다.

Analysis of the Inhibition Layer of Galvanized Dual-Phase Steels

  • Wang, K.K.;Wang, H.-P.;Chang, L.;Gan, D.;Chen, T.-R.;Chen, H.-B.
    • Corrosion Science and Technology
    • /
    • 제11권1호
    • /
    • pp.9-14
    • /
    • 2012
  • The formation of the Fe-Al inhibition layer in hot-dip galvanizing is a confusing issue for a long time. This study presents a characterization result on the inhibition layer formed on C-Mn-Cr and C-Mn-Si dual-phase steels after a short time galvanizing. The samples were annealed at $800^{\circ}C$ for 60 s in $N_{2}$-10% $H_{2}$ atmosphere with a dew point of $-30^{\circ}C$, and were then galvanized in a bath containing 0.2 %Al. X-ray photoelectron spectroscopy (XPS) and transmission electron microscopy (TEM) was employed for characterization. The TEM electron diffraction shows that only $Fe_{2}Al_{5}$ intermetallic phase was formed. No orientation relationship between the $Fe_{2}Al_{5}$ phase and the steel substrate could be identified. Two peaks of Al 2p photoelectrons, one from metallic aluminum and the other from $Al^{3+}$ ions, were detected in the inhibition layer, indicating that the layer is in fact a mixture of $Fe_{2}Al_{5}$ and $Al_{2}O_{3}$. TEM/EDS analysis verifies the existence of $Al_{2}O_{3}$ in the boundaries of $Fe_{2}Al_{5}$ grains. The nucleation of $Fe_{2}Al_{5}$ and the reduction of the surface oxide probably proceeded concurrently on galvanizing, and the residual oxides prohibited the heteroepitaxial growth of $Fe_{2}Al_{5}$.

파형 부호와 방식에 의한 정보압축과 퍼포먼스에 관한 연구 (The study on the information compression by coding method and its performance)

  • 안동순
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1985년도 학술발표회 논문집
    • /
    • pp.68-71
    • /
    • 1985
  • In this paper, Sentence-Sip E Il Ka Gi Seo U1 E Gan Da was spoken by 4 men and 3 see sound is used for the experiment. A/D conversion time is 30 sec. Data are obtained using the microcomputer and compressed by ADPCM Rate of compression is 1/8. Data compressed by ADPCM are synthesized and compared to the original sound. Rate of speech identification is analysed using the sound pressure, white noise. Coding of ADPCM is done for 5bit. As the result of fixing starting voltage by 2.6V. It is acertained that variable value increases in initial speech signal and then process is made by minimum value "3". From the result of processing, synthesized sound is almost eaual to original sound. Minimum values cause distorition, Dummy Head System is used in this experiment.xperiment.

  • PDF

Signal-to-Noise Ratio Formulas of a Scalar Gaussian Quantizer Mismatched to a Laplacian Source

  • 이재건;나상신
    • 한국통신학회논문지
    • /
    • 제36권6C호
    • /
    • pp.384-390
    • /
    • 2011
  • The paper derives formulas for the mean-squared error distortion and resulting signal-to-noise (SNR) ratio of a fixed-rate scalar quantizer designed optimally in the minimum mean-squared error sense for a Gaussian density with the standard deviation ${\sigma}_q$ when it is mismatched to a Laplacian density with the standard deviation ${\sigma}_q$. The SNR formulas, based on the key parameter and Bennett's integral, are found accurate for a wide range of $p\({\equiv}\frac{\sigma_p}{\sigma_q}\){\geqq}0.25$. Also an upper bound to the SNR is derived, which becomes tighter with increasing rate R and indicates that the SNR behaves asymptotically as $\frac{20\sqrt{3{\ln}2}}{{\rho}{\ln}10}\;{\sqrt{R}}$ dB.