• Title/Summary/Keyword: 이미지 분할

Search Result 607, Processing Time 0.036 seconds

Multi-attribute Face Editing using Facial Masks (얼굴 마스크 정보를 활용한 다중 속성 얼굴 편집)

  • Ambardi, Laudwika;Park, In Kyu;Hong, Sungeun
    • Journal of Broadcast Engineering
    • /
    • v.27 no.5
    • /
    • pp.619-628
    • /
    • 2022
  • Although face recognition and face generation have been growing in popularity, the privacy issues of using facial images in the wild have been a concurrent topic. In this paper, we propose a face editing network that can reduce privacy issues by generating face images with various properties from a small number of real face images and facial mask information. Unlike the existing methods of learning face attributes using a lot of real face images, the proposed method generates new facial images using a facial segmentation mask and texture images from five parts as styles. The images are then trained with our network to learn the styles and locations of each reference image. Once the proposed framework is trained, we can generate various face images using only a small number of real face images and segmentation information. In our extensive experiments, we show that the proposed method can not only generate new faces, but also localize facial attribute editing, despite using very few real face images.

Study on an Image Reconstruction Algorithm for 3D Cartilage OCT Images (A Preliminary Study) (3차원 연골 광간섭 단층촬영 이미지들에 대한 영상 재구성 알고리듬 연구)

  • Ho, Dong-Su;Kim, Ee-Hwa;Kim, Yong-Min;Kim, Beop-Min
    • Progress in Medical Physics
    • /
    • v.20 no.2
    • /
    • pp.62-71
    • /
    • 2009
  • Recently, optical coherence tomography (OCT) has demonstrated considerable promise for the noninvasive assessment of biological tissues. However, OCT images difficult to analyze due to speckle noise. In this paper, we tested various image processing techniques for speckle removal of human and rabbit cartilage OCT images. Also, we distinguished the images which get with methods of image segmentation for OCT images, and found the most suitable method for segmenting an image. And, we selected image segmentation suitable for OCT before image reconstruction. OCT was a weak point to system design and image processing. It was a limit owing to measure small a distance and depth size. So, good edge matching algorithms are important for image reconstruction. This paper presents such an algorithm, the chamfer matching algorithm. It is made of background for 3D image reconstruction. The purpose of this paper is to describe good image processing techniques for speckle removal, image segmentation, and the 3D reconstruction of cartilage OCT images.

  • PDF

A Study on the Processing Method for Improving Accuracy of Deep Learning Image Segmentation (딥러닝 영상 분할의 정확도 향상을 위한 처리방법 연구)

  • Choi, Donggyu;Kim, Minyoung;Jang, Jongwook
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.05a
    • /
    • pp.169-171
    • /
    • 2021
  • Image processing through cameras such as self-driving, CCTV, mobile phone security, and parking facilities is being used to solve many real-life problems. Simple classification is solved through image processing, but it is difficult to find images or in-image features of complexly mixed objects. To solve this feature point, we utilize deep learning techniques in classification, detection, and segmentation of image data so that we can think and judge closely. Of course, the results are better than just image processing, but we confirm that the results judged by the method of image segmentation using deep learning have deviations from the real object. In this paper, we study how to perform accuracy improvement through simple image processing just before outputting the output of deep learning image segmentation to increase the precision of image segmentation.

  • PDF

An ECG Document Imaging System based on Neural Network and Graphic Techniques (신경망과 그래픽 기법을 이용한 심전도 결과지 이미징 시스템)

  • Kim Jin-Sang;Choi Sang-Yeol;Bae In-Ho;Kim Yun-Nyeon
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2006.05a
    • /
    • pp.269-272
    • /
    • 2006
  • 병원의 각종 측정 장비에서 출력되는 결과지나 의사들이 작성한 기록지를 스캔하여 이미지형태로 저장하는 이미징 시스템 개발이 크게 요구되고 있다. 본 논문에서는 신경망과 그래픽 기법을 사용하여 대학병원 심전도실에서 사용되는 여섯 종류의 심전도 출력지를 이미지 형태로 저장하고 검색하는 이미징 시스템의 설계와 구현에 대해 논하였다. 구현된 시스템은 여섯 종류의 심전도 출력지를 분류하고, 분류된 각 출력지에 인쇄된 중요한 측정 데이터를 인식하여 데이터베이스에 저장한다. 심전도 출력지의 분류는 각 샘플 서식들의 평균 히스토그램을 구한 다음 새로운 출력지가 들어올 때 평균 히스토그램과의 거리가 가장 가까운 출력지로 분류하는 nearest-neighbor 방법을 사용하였다. 출력지에 인쇄된 데이터의 인식을 위해 먼저 XML로 작성한 출력지별 추출 정보를 기반으로 스캔한 이미지의 영역 분할 작업을 수행한다. 분할된 영역들은 신경망을 이용해 문자 인식을 하고, 인식된 문자들이 데이터베이스의 해당 속성값으로 저장된다. 스캔한 출력지는 의사들이 주석을 붙이거나 조건 검색을 위해 이미지 형태로 저장된다.

  • PDF

Comparative Evaluation of 18F-FDG Brain PET/CT AI Images Obtained Using Generative Adversarial Network (생성적 적대 신경망(Generative Adversarial Network)을 이용하여 획득한 18F-FDG Brain PET/CT 인공지능 영상의 비교평가)

  • Kim, Jong-Wan;Kim, Jung-Yul;Lim, Han-sang;Kim, Jae-sam
    • The Korean Journal of Nuclear Medicine Technology
    • /
    • v.24 no.1
    • /
    • pp.15-19
    • /
    • 2020
  • Purpose Generative Adversarial Network(GAN) is one of deep learning technologies. This is a way to create a real fake image after learning the real image. In this study, after acquiring artificial intelligence images through GAN, We were compared and evaluated with real scan time images. We want to see if these technologies are potentially useful. Materials and Methods 30 patients who underwent 18F-FDG Brain PET/CT scanning at Severance Hospital, were acquired in 15-minute List mode and reconstructed into 1,2,3,4,5 and 15minute images, respectively. 25 out of 30 patients were used as learning images for learning of GAN and 5 patients used as verification images for confirming the learning model. The program was implemented using the Python and Tensorflow frameworks. After learning using the Pix2Pix model of GAN technology, this learning model generated artificial intelligence images. The artificial intelligence image generated in this way were evaluated as Mean Square Error(MSE), Peak Signal to Noise Ratio(PSNR), and Structural Similarity Index(SSIM) with real scan time image. Results The trained model was evaluated with the verification image. As a result, The 15-minute image created by the 5-minute image rather than 1-minute after the start of the scan showed a smaller MSE, and the PSNR and SSIM increased. Conclusion Through this study, it was confirmed that AI imaging technology is applicable. In the future, if these artificial intelligence imaging technologies are applied to nuclear medicine imaging, it will be possible to acquire images even with a short scan time, which can be expected to reduce artifacts caused by patient movement and increase the efficiency of the scanning room.

Image Segmentation by Cascaded Superpixel Merging with Privileged Information (단계적 슈퍼픽셀 병합을 통한 이미지 분할 방법에서 특권정보의 활용 방안)

  • Park, Yongjin
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.23 no.9
    • /
    • pp.1049-1059
    • /
    • 2019
  • We propose a learning-based image segmentation algorithm. Starting from super-pixels, our method learns the probability of merging two regions based on the ground truth made by humans. The learned information is used in determining whether the two regions should be merged or not in a segmentation stage. Unlike exiting learning-based algorithms, we use both local and object information. The local information represents features computed from super-pixels and the object information represent high level information available only in the learning process. The object information is considered as privileged information, and we can use a framework that utilize the privileged information such as SVM+. In experiments on the Berkeley Segmentation Dataset and Benchmark (BSDS 500) and PASCAL Visual Object Classes Challenge (VOC 2012) data set, out model exhibited the best performance with a relatively small training data set and also showed competitive results with a sufficiently large training data set.

Small feature creation on the parameterized surface by using subdivision and texture mapping (곡면 분할 및 텍스쳐 매핑을 사용한 삼각 메쉬의 미세형상 생성)

  • Kim Hyunsoo;Choi Hankyun;Lee Kwan H.
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11a
    • /
    • pp.730-732
    • /
    • 2005
  • 본 논문에서는 곡면 분할 및 텍스쳐 매핑 기법을 적용하여 자유 형상의 삼각 메쉬 위에 텍스쳐 이미지를 이용한 이세 형상 정보를 표현하는 기법에 대한 연구를 하였다. 텍스쳐 이미지 상의 특징 형상을 3차원 메쉬에 표현하기 위해 먼저 삼각 메쉬를 파라미터화(pararneterization)하여 꼭지점의 텍스쳐 좌표를 획득한 후, 이미지의 픽셀 값과 꼭지점의 법선 벡터를 사용하여 메쉬의 형상을 변화시킨다.

  • PDF

A Study Video using Image and Voice Search (음성과 이미지를 이용한 동영상 검색에 관한 연구)

  • Sin, In-Gyeong;Park, Sung-Hyun;Ahn, Hyo-Chang;Rhee, Sang-Burm
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.568-571
    • /
    • 2012
  • 정보화 사회의 정보 기반 구조로서, 고속 정보망의 구축, 개인용 컴퓨터의 급속한 보급, 멀티미디어 기술의 발전 등으로 인하여 정보 서비스의 새로운 장이 열리고 있다. 동영상 데이터는 텍스트만이 아니라 영상정보, 음성정보등 각종 의미있는 다양한 멀티미디어 정보를 포함하고 있다. 본 논문에서는 동영상에서 음성과 영상을 분리하여 음성을 이용하여 음성열을 분할 및 복원하여 음성을 텍스트로 변환하여 텍스트색인파일을 만들고 영상은 이미지를 분할 및 히스토그램을 사용하여 이미지 샷을 검출하여 두 색인파일을 이용하여 인덱싱을 하여 동영상 검색에 활용한다.

Deep Learning-based Image Data Processing for Golf Course Simulation (골프 코스 시뮬레이션을 위한 딥 러닝 기반 이미지 데이터 처리 기법)

  • Seunghyun Kim;Wonje Choi;Honguk Woo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.545-548
    • /
    • 2023
  • 본 논문에서는 골프 코스 시뮬레이션을 위해 수집된 데이터의 정제 및 처리에 요구되는 딥 러닝 모델과 모델 적용 과정에 대해서 논의한다. 최근 스크린 골프 시장의 확대와 골프 시뮬레이터 기술의 발전으로, 위성 이미지, 항공 촬영 이미지, 공간 정보 시스템 (GIS) 등 다양한 데이터 소스로부터 골프 코스에 대한 정보를 수집에 대한 요구가 증가하였다. 이번 연구에서는 이러한 데이터 소스로부터 생성된 원시 데이터를 최적의 시뮬레이션 입력으로 변환하기 위한 컴퓨터 비전 기법과 딥 러닝 모델 구조에 대해서 검토한다. 특히, 데이터에서 골프 코스 시뮬레이션에 요구되는 메타 데이터를 도출하기 위해 코스 분할(Segmentation)과 코스 오브젝트 분류(Classification) 모델을 적용하는 과정을 다룬다. 이를 통해, 본 연구는 골프 코스 시뮬레이터의 개발 과정에서 중요한 기술 요소를 제공하며, 이는 시뮬레이션의 정확도와 골프 코스의 다양성을 증진시키는데에 기여한다.

  • PDF

Generating 2D LEGO Instruction Manual Using Deep Learning Model (딥러닝 모델을 이용한 2D 레고 조립 설명서 생성)

  • Jongseok Ahn;Seunghyeon Lee;Cheolhee Kim;Donghee Kang
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.481-484
    • /
    • 2024
  • 본 논문에서는 레고(LEGO®) 조립 설명서를 생성하기 위해 딥러닝을 이용한 조립 및 설명서 생성 시스템을 제안한다. 이 시스템은 사용자가 제공한 단일 이미지를 기반으로 레고 조립 설명서를 자동 생성한다. 해당 시스템은 딥러닝 기반 이미지 분할 기술을 활용하여 물체를 배경으로부터 분리하고 이를 통해 조립 설명서를 생성하는 과정을 포함하며, 조립을 위한 알고리즘을 새로 설계하였다. 이 시스템은 기존 레고 제품의 한계를 극복하고, 사용자에게 주어진 부품으로 다양한 모델을 자유롭게 조립할 수 있게 한다. 또한, 복잡한 레고 조립 과정을 간소화하고, 조립의 장벽을 낮추는 데 도움을 준다.

  • PDF