Search | Korea Science

Image captioning and video captioning using Transformer (Transformer를 사용한 이미지 캡셔닝 및 비디오 캡셔닝)

Gi-Duk Kim;Geun-Hoo Lee
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2023.01a
- /
- pp.303-305
- /
- 2023
본 논문에서는 트랜스포머를 사용한 이미지 캡셔닝 방법과 비디오 캡셔닝 방법을 제안한다. 트랜스포머의 입력으로 사전 학습된 이미지 클래스 분류모델을 거쳐 추출된 특징을 트랜스포머의 입력으로 넣고 인코더-디코더를 통해 이미지와 비디오의 캡션을 출력한다. 이미지 캡셔닝의 경우 한글 데이터 세트를 학습하여 한글 캡션을 출력하도록 학습하였으며 비디오 캡셔닝의 경우 MSVD 데이터 세트를 학습하여 학습 후 출력 캡션의 성능을 다른 비디오 캡셔닝 모델의 성능과 비교하였다. 비디오 캡셔닝에서 성능향상을 위해 트랜스포머의 디코더를 변형한 GPT-2를 사용하였을 때 BLEU-1 점수가 트랜스포머의 경우 0.62, GPT-2의 경우 0.80으로 성능이 향상됨을 확인하였다
PDF

Comparison Study of the Performance of CNN Models for malicious code image classification (악성코드 이미지 분류를 위한 CNN 모델 성능 비교)

Kang, Chae-Hee;Oh, Eun-Bi;Lee, Seung-Eon;Lee, Hyun-Kyung;Kim, Sung-Wook
- Proceedings of the Korea Information Processing Society Conference
- /
- 2022.05a
- /
- pp.432-435
- /
- 2022
최근 IT 산업의 지속적인 발전으로 사용자들을 위협하는 악성코드, 피싱, 랜섬웨어와 같은 사이버 공격 또한 계속해서 발전하고 더 지능화되고 있으며 변종 악성코드도 기하급수적으로 늘어나고 있다. 지금까지의 시그니처 패턴 기반의 탐지법으로는 이러한 방대한 양의 알려지지 않은 악성코드를 탐지할 수 없다. 따라서 CNN(Convolutional Neural Network)을 활용하여 악성코드를 탐지하는 기법들이 제안되고 있다. 이에 본 논문에서는 CNN 모델 중 낮은 인식 오류율을 지닌 모델을 선정하여 정확도(Accuracy)와 F1-score 평가 지표를 통해 비교하고자 한다. 두 가지의 악성코드 이미지화 방법을 사용하였으며, 2015 년 이후 ILSVRC 에서 우승을 차지한 모델들과, 추가로 2019 년에 발표된 EfficientNet 을 사용하여 악성코드 이미지를 분류하였다. 그 결과 2 바이트를 한 쌍의 좌표로 변환하여 생성한 256 * 256 크기의 악성코드 이미지를 ResNet-152 모델을 이용해 분류하는 것이 우수한 성능을 보임을 실험적으로 확인하였다.
https://doi.org/10.3745/PKIPS.y2022m05a.432 인용 PDF

Corrected 3D Reconstruction Based on Continuous Image Sets (연속 다중 이미지 기반 3D 생성 모델 보정 기술 개발)

Kim, TaeYeon;Jo, Dongsik
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2022.10a
- /
- pp.374-375
- /
- 2022
Recently, Metaverse service has been widely used to naturally communicate with a remote location, freeing from time and spatial constraints. In order to produce such contents, it is necessary to restore and synthesize a 3D model based on real space data. In this paper, a 3D-generated reconstruction model is produced based on continuous images using multiple cameras and a technique to correct the reconstructed 3D model is presented. For this. offline multi-camera setup was performed, errors were analyzed on the 3D model created through images obtained from various angles, and correction was performed using a matching technique between image frames. It is expected that 3D reconstructed data can be utilized in various service fields such as culture, tourism, and medical care.
PDF

Ordinal Depth Based Deductive Weakly Supervised Learning for Monocular 3D Human Pose Estimation (단안 이미지로부터 3D 사람 자세 추정을 위한 순서 깊이 기반 연역적 약지도 학습 기법)

Youngchan Lee;Gyubin Lee;Wonsang You
- Proceedings of the Korea Information Processing Society Conference
- /
- 2024.05a
- /
- pp.826-829
- /
- 2024
3D 사람 자세 추정 기술은 다양한 응용 분야에서의 높은 활용성으로 인해 대량의 학습 데이터가 수집되어 딥러닝 모델 연구가 진행되어 온 반면, 동물 자세 추정의 경우 3D 동물 데이터의 부족으로 인해 관련 연구는 극히 미진하다. 본 연구는 동물 자세 추정을 위한 예비연구로서, 3D 학습 데이터가 없는 상황에서 단일 이미지로부터 3D 사람 자세를 추정하는 딥러닝 기법을 제안한다. 이를 위하여 사전 훈련된 다중 시점 학습모델을 사용하여 2D 자세 데이터로부터 가상의 다중 시점 데이터를 생성하여 훈련하는 연역적 학습 기반 교사-학생 모델을 구성하였다. 또한, 키포인트 깊이 정보 대신 2D 이미지로부터 레이블링 된 순서 깊이 정보에 기반한 손실함수를 적용하였다. 제안된 모델이 동물데이터에서 적용 가능한지 평가하기 위해 실험은 사람 데이터를 사용하여 이루어졌다. 실험 결과는 제안된 방법이 기존 단안 이미지 기반 모델보다 3D 자세 추정의 성능을 개선함을 보여준다.
PDF

Automatic Mask Generation for 3D Makeup Simulation (3차원 메이크업 시뮬레이션을 위한 자동화된 마스크 생성)

Kim, Hyeon-Joong;Kim, Jeong-Sik;Choi, Soo-Mi
- 한국HCI학회:학술대회논문집
- /
- 2008.02a
- /
- pp.397-402
- /
- 2008
본 논문에서는 햅틱 인터랙션 기반의 3차원 가상 얼굴 메이크업 시뮬레이션에서 메이크업 대상에 대한 정교한 페인팅을 적용하기 위한 자동화된 마스크 생성 방법을 개발한다. 본 연구에서는 메이크업 시뮬레이션 이전의 전처리 과정에서 마스크를 생성한다. 우선, 3차원 스캐너 장치로부터 사용자의 얼굴 텍스쳐 이미지와 3차원 기하 표면 모델을 획득한다. 획득된 얼굴 텍스쳐 이미지로부터 AdaBoost 알고리즘, Canny 경계선 검출 방법과 색 모델 변환 방법 등의 영상처리 알고리즘들을 적용하여 마스크 대상이 되는 주요 특정 영역(눈, 입술)들을 결정하고 얼굴 이미지로부터 2차원 마스크 영역을 결정한다. 이렇게 생성된 마스크 영역 이미지는 3차원 표면 기하 모델에 투영되어 최종적인 3차원 특징 영역의 마스크를 레이블링하는데 사용된다. 이러한 전처리 과정을 통하여 결정된 마스크는 햅틱 장치와 스테레오 디스플레이기반의 가상 인터페이스를 통해서 자연스러운 메이크업 시뮬레이션을 수행하는데 사용된다. 본 연구에서 개발한 방법은 사용자에게 전처리 과정에서의 어떠한 개입 없이 자동적으로 메이크업 대상이 되는 마스크 영역을 결정하여 정교하고 손쉬운 메이크업 페인팅 인터페이스를 제공한다.
PDF

Surface Defect Detection System for Steel Products using Convolutional Autoencoder and Image Calculation Methods (합성곱 오토인코더 모델과 이미지 연산 기법을 활용한 가공품 표면 불량 검출 시스템)

Kim, Sukchoo;Kwon, Jung Jang
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2021.01a
- /
- pp.69-70
- /
- 2021
본 논문은 PPM으로 관리되고 있는 자동차 부품 제조 공정에서 검사자의 육안검사 방법을 대체하기 위해 머신비전 및 CNN 기반 불량 검출 시스템으로 제안되었던 방식들의 단점을 개선하기 위하여 기존 머신 비전 기술에 합성곱 오토인코더 모델을 적용하여 단점을 해결하였다. 본 논문에서 제시한 오토인코더를 이용하는 방법은 정상 생산품의 이미지만으로 학습을 진행하고, 학습된 모델은 불량 부위가 포함된 이미지를 입력받아 정상 이미지로 출력한다. 이 방법을 사용하여 불량의 부위와 크기를 알 수 있었으며 불량 여부의 판단은 임계치에 의한 불량 부위의 화소 수 계산으로 판단하였다.
PDF

Automated Image Classification Model Using Web Crawling (웹 크롤링을 사용한 자동화된 이미지 분류 모델)

Lee, Ju-Hyeok;Kim, Mi-Hui
- Proceedings of the Korea Information Processing Society Conference
- /
- 2021.11a
- /
- pp.719-722
- /
- 2021
최근 딥러닝은 이미지 인식, 음성 인식 등 여러 분야에서 고려되고 있는 기술이다. 그러나 딥러닝 기술을 이용하기 위해서는 대형데이터 세트가 필요하나 이를 구축하기 힘들고 많은 시간이 필요하다는 문제점이 있다. 이에, 본 논문에서는 웹 크롤링을 통해 사용자가 원하는 카테고리의 이미지 데이터 세트를 수집하고 수집한 데이터들을 전처리 과정을 통해 딥러닝 모델에 입력할 수 있는 데이터 세트의 구축을 자동화하며, 전이학습을 통해서 적은 훈련 시간과 높은 정확도를 얻을 수 있는 이미지 분류모델을 제안한다.
https://doi.org/10.3745/PKIPS.y2021m11a.719 인용 PDF

TrapMI: Protecting Training Data to Evade Model Inversion Attack on Split Learning (TrapMI: 분할 학습에서 모델 전도 공격을 회피할 수 있는 훈련 데이터 보호 방법)

Hyun-Sik Na;Dae-Seon Choi
- Proceedings of the Korea Information Processing Society Conference
- /
- 2023.05a
- /
- pp.234-236
- /
- 2023
Edge AI 환경에서의 DNNs 학습 방법 중 하나인 분할 학습은 모델 전도 공격으로 인해 입력 데이터의 프라이버시가 노출될 수 있다. 본 논문에서는 분할 학습 환경에서의 모델 전도 공격에 대한 기존 방어 기술들의 한계점을 회피할 수 있는 TrapMI 기술을 제안하고, 이를 통해 입력 이미지를 원 본 데이터 세트의 도메인에서 특정 타겟 이미지 도메인으로 이동시킴으로써 이미지 복원의 가능성을 최소화시킨다. 추가적으로, 테스트 과정에서 타겟 이미지의 정보를 알 수 없는 제약을 회피하기 위해 AutoGenerator를 구축한 후 실험을 통해 원본 데이터 보호 성능을 검증한다.
https://doi.org/10.3745/PKIPS.y2023m05a.234 인용 PDF

음함수 곡면 모델링 기술

김은석;윤재홍;허기택
- Korea Information Processing Society Review
- /
- v.11 no.1
- /
- pp.77-83
- /
- 2004
컴퓨터 그래픽스는 컴퓨터를 이용하여 다양한 이미지를 생성하는 응용 학문이다. 컴퓨터를 이용하여 이미지를 생성하기 위해서는 나타내고자 하는 물체를 표현하는 모델링과 표현된 모델을 이미지로 나타내기 위한 렌더링이 필요하며, 일반적으로 모델링 방법에 따라 렌더링 기법도 좌우된다.
PDF

Preference Tendency to Western Images through Advertising Pictures (광고를 통해 본 여대생의 서구 이미지 선호경향)

Lim Jin-Young;Na Young-Joo
- Science of Emotion and Sensibility
- /
- v.7 no.4
- /
- pp.1-6
- /
- 2004
The purpose of this study was to investigate the female college students' preferences to the images of both western and eastern pictures, and positive/negative perception on to the model's nationality in the apparel advertizing pictures of fashion magazines. 100 students participated in the survey, and 20 stimulus pictures were shown to them. The results were as follows: The female college students preferred the western images than the eastern images in the pictures of bedroom, palace and beer, while they preferred the eastern images in the pictures of snack and famous drawings of a beauty. But they showed more positive attitude to all the western models' advertizement pictures than the eastern models' ones, in casual wear, formal wear, watches and inner-wear divisions except in men's formal wear division. This meant that the perception of female students on western images was positive and it seems stimulating the consumers preferences of brand images.
PDF

Search Result 1,883, Processing Time 0.03 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)