• 제목/요약/키워드: Feature learning

검색결과 1,897건 처리시간 0.027초

Self-Attention을 적용한 문장 임베딩으로부터 이미지 생성 연구 (A Study on Image Generation from Sentence Embedding Applying Self-Attention)

  • 유경호;노주현;홍택은;김형주;김판구
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.63-69
    • /
    • 2021
  • 사람이 어떤 문장을 보고 그 문장에 대해 이해하는 것은 문장 안에서 주요한 단어를 이미지로 연상시켜 그 문장에 대해 이해한다. 이러한 연상과정을 컴퓨터가 할 수 있도록 하는 것을 text-to-image라고 한다. 기존 딥 러닝 기반 text-to-image 모델은 Convolutional Neural Network(CNN)-Long Short Term Memory(LSTM), bi-directional LSTM을 사용하여 텍스트의 특징을 추출하고, GAN에 입력으로 하여 이미지를 생성한다. 기존 text-to-image 모델은 텍스트 특징 추출에서 기본적인 임베딩을 사용하였으며, 여러 모듈을 사용하여 이미지를 생성하므로 학습 시간이 오래 걸린다. 따라서 본 연구에서는 자연어 처리분야에서 성능 향상을 보인 어텐션 메커니즘(Attention Mechanism)을 문장 임베딩에 사용하여 특징을 추출하고, 추출된 특징을 GAN에 입력하여 이미지를 생성하는 방법을 제안한다. 실험 결과 기존 연구에서 사용되는 모델보다 inception score가 높았으며 육안으로 판단하였을 때 입력된 문장에서 특징을 잘 표현하는 이미지를 생성하였다. 또한, 긴 문장이 입력되었을 때에도 문장을 잘 표현하는 이미지를 생성하였다.

ELMo 임베딩 기반 문장 중요도를 고려한 중심 문장 추출 방법 (Method of Extracting the Topic Sentence Considering Sentence Importance based on ELMo Embedding)

  • 김은희;임명진;신주현
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.39-46
    • /
    • 2021
  • 본 연구는 뉴스 기사에서 기사문을 구성하는 문장별 중요도를 고려하여 요약문을 추출하는 방법에 관한 것으로 문장 중요도에 영향을 주는 특성으로 중심 문장(Topic Sentence)일 확률, 기사 제목 및 다른 문장과의 유사도, 문장 위치에 따른 가중치를 추출하여 문장 중요도를 계산하는 방법을 제안한다. 이때, 중심 문장(Topic Sentence)은 일반 문장과는 구별되는 특징을 가질 것이라는 가설을 세우고, 딥러닝 기반 분류 모델을 학습시켜 입력 문장에 대한 중심 문장 확률값을 구한다. 또한 사전학습된 ELMo 언어 모델을 활용하여 문맥 정보를 반영한 문장 벡터값을 기준으로 문장간 유사도를 계산하여 문장 특성으로 추출한다. LSTM 및 BERT 모델의 중심 문장 분류성능은 정확도 93%, 재현율 96.22%, 정밀도 89.5%로 높은 분석 결과가 나왔으며, 이렇게 추출된 문장 특성을 결합하여 문장별 중요도를 계산한 결과, 기존 TextRank 알고리즘과 비교하여 중심 문장 추출 성능이 10% 정도 개선된 것을 확인할 수 있었다.

다중소스 데이터 융합 기반의 가스 누출 예측을 위한 선형 보간 및 머신러닝 기법 (Linear interpolation and Machine Learning Methods for Gas Leakage Prediction Base on Multi-source Data Integration)

  • 홍고르출;조겨리;김미혜
    • 한국융합학회논문지
    • /
    • 제13권3호
    • /
    • pp.33-41
    • /
    • 2022
  • 본 논문에서는 다중 요인을 고려한 천연 가스 누출 정도 예측을 위해 관련 요인을 포함하는 기상청 자료와 천연가스 누출 자료를 통합하고, 요인 분석을 기반으로 중요 특성을 선택하는 머신러닝 기법을 제안한다. 제안된 기법은 3단계 절차로 구성되어 있다. 먼저, 통합 데이터 셋에 대해 선형 보간법을 수행하여 결측 데이터를 보완하는 전처리를 수행한다. 머신러닝 모델 학습 최적화를 위해 OrdinalEncoder(OE) 기반 정규화와 함께 요인 분석을 사용하여 필수 특징을 선택하며, 데이터 셋은 k-평균 클러스터링으로 레이블을 지정한다. 최종적으로 K-최근접 이웃, DT(Decision Tree), RF(Random Forest), NB(Naive Bayes)의 네 가지 알고리즘을 사용하여 가스 누출 수준을 예측한다. 제안된 방법은 정확도, AUC, 평균 표준 오차(MSE)로 평가되었으며, 테스트 결과 OE-F 전처리를 수행한 경우 기존 기법에 비해 성공적으로 개선되었음을 보였다. 또한 OE-F 기반 KNN(OE-F-KNN)은 95.20%의 정확도, 96.13%의 AUC, 0.031의 MSE로 비교 알고리즘 중 최고 성능을 보였다.

A technique for predicting the cutting points of fish for the target weight using AI machine vision

  • Jang, Yong-hun;Lee, Myung-sub
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.27-36
    • /
    • 2022
  • 본 논문에서는 이러한 어류 가공 현장의 문제점을 개선하기 위해서 AI 머신 비전을 이용한 어류의 목표 중량 절단 예측기법을 제안한다. 제안하는 방법은 먼저 입력된 물고기의 평면도와 정면도를 촬영하여 이미지기반의 전처리를 수행한다. 그런 다음 RANSAC(RANdom SAMmple Consensus)를 사용하여 어류의 윤곽선을 추출한 다음 3D 모델링을 사용하여 물고기의 3D 외부 정보를 추출한다. 이어서 추출된 3차원 특징 정보와 측정된 중량 정보를 머신러닝하여 목표 중량에 대한 절단 지점을 예측하기 위한 신경망 모델을 생성한다. 마지막으로 제안기법을 통해 예측된 절단 지점으로 직접 절단한 뒤 그 중량을 측정하였다. 그리고 측정된 무게를 목표 무게와 비교하여 MAE(Mean Absolute Error) 와 MRE(Mean Relative Error)와 같은 평가 방법을 사용해 성능을 평가하였다. 그 결과, 목표 중량과 비교해 3% 이내의 평균 오차율을 달성하였다. 제안된 기법은 향후 자동화 시스템과 연계되어 수산업 발전에 크게 기여할 것으로 전망한다.

컨볼루션 오토인코더를 이용한 마스크 착용 얼굴 이미지 생성 (Generation of Masked Face Image Using Deep Convolutional Autoencoder)

  • 이승호
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1136-1141
    • /
    • 2022
  • 코로나19 팬데믹으로 인해 마스크 착용이 일상화되면서 마스크 착용 얼굴을 식별하는 얼굴인식 연구에 대한 중요도가 높아지고 있다. 안정된 얼굴인식 성능을 위해서는 인식 대상에 대한 풍부한 학습용 이미지 확보가 필요하지만 인물 별로 마스크 착용 얼굴 이미지를 다량 확보하는 것은 쉽지 않다. 본 논문에서는 마스크 미착용 얼굴 이미지에 가상의 마스크 패턴을 합성하는 새로운 방법을 제안한다. 제안 방법은 동일 인물에 대해 마스크 미착용 얼굴 이미지와 마스크 착용 얼굴 이미지를 쌍으로 컨볼루션 오토인코더에 입력하여 얼굴과 마스크의 기하학적 관계를 학습한다. 학습이 완료된 컨볼루션 오토인코더는 학습에 사용되지 않은 새로운 마스크 미착용 얼굴 이미지에 가상의 마스크 패턴을 자연스러운 형태로 합성해준다. 제안 방법은 고속으로 대량의 마스크 착용 얼굴 이미지를 생성할 수 있으며, 얼굴 특징점 추출에 기반하는 마스크 합성 방법에 비해 실용적이다.

Boundary-Aware Dual Attention Guided Liver Segment Segmentation Model

  • Jia, Xibin;Qian, Chen;Yang, Zhenghan;Xu, Hui;Han, Xianjun;Ren, Hao;Wu, Xinru;Ma, Boyang;Yang, Dawei;Min, Hong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권1호
    • /
    • pp.16-37
    • /
    • 2022
  • Accurate liver segment segmentation based on radiological images is indispensable for the preoperative analysis of liver tumor resection surgery. However, most of the existing segmentation methods are not feasible to be used directly for this task due to the challenge of exact edge prediction with some tiny and slender vessels as its clinical segmentation criterion. To address this problem, we propose a novel deep learning based segmentation model, called Boundary-Aware Dual Attention Liver Segment Segmentation Model (BADA). This model can improve the segmentation accuracy of liver segments with enhancing the edges including the vessels serving as segment boundaries. In our model, the dual gated attention is proposed, which composes of a spatial attention module and a semantic attention module. The spatial attention module enhances the weights of key edge regions by concerning about the salient intensity changes, while the semantic attention amplifies the contribution of filters that can extract more discriminative feature information by weighting the significant convolution channels. Simultaneously, we build a dataset of liver segments including 59 clinic cases with dynamically contrast enhanced MRI(Magnetic Resonance Imaging) of portal vein stage, which annotated by several professional radiologists. Comparing with several state-of-the-art methods and baseline segmentation methods, we achieve the best results on this clinic liver segment segmentation dataset, where Mean Dice, Mean Sensitivity and Mean Positive Predicted Value reach 89.01%, 87.71% and 90.67%, respectively.

동일 이미지 판별을 위해 Faster D2-Net을 이용한 이미지 기반의 애플리케이션 테스트 방법 (Image-Based Application Testing Method Using Faster D2-Net for Identification of the Same Image)

  • 전혜원;조민석;한성수;정창성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권2호
    • /
    • pp.87-92
    • /
    • 2022
  • 이미지 기반 애플리케이션 테스트는 이미지 구조 비교를 통한 애플리케이션 테스트 방법을 제안한다. 이 연구는 다양한 디바이스 운영체제의 종류나 GUI에 의존 없이 다양한 기기에서 테스트가 가능하다. 기존 연구는 운영체제 변경, 화면상의 애니메이션 실행 그리고 해상도 변경의 경우 정답 이미지와 달라지기 때문에 기존의 경우 각각 변형마다 테스터를 생성해야 했다. 하지만 이 방법은 운영체제 변경, 해상도 크기의 변경, 화면상의 애니메이션 실행과 같은 변화가 발생해도 동일한 기준으로 판별하기 때문에 하나의 테스터로 테스트할 수 있다. 두 이미지의 객체들의 기본 구조를 비교하고 이미지에 차이가 존재하는 영역을 추출해서 Faster D2-Net의 특징점으로 이미지 유사성을 비교한다. Faster D2-Net 개발로 D2-Net보다 연산의 수와 공간적 손실을 줄여 애플리케이션 이미지에서 특징점을 추출하기 적합하고 수행 시간 단축이 가능했다.

리눅스 기반 프로그래밍 언어의 온라인 학습 시스템 구성에 관한 연구 (A study on the On-line Teaching system for Linux-based Programming Language)

  • 전호익;이현창
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권1호
    • /
    • pp.67-73
    • /
    • 2021
  • 본 논문에서는 리눅스 기반 프로그래밍 언어를 온라인으로 실습할 수 있는 시스템의 구성 방법을 제시하였다. 제시한 시스템은 리눅스 운영체제의 가장 큰 특징인 웹-서버 기능을 활용하며, 방화벽이나 기타 보안적 제약을 받지 않으면서 telnet과 FTP 기능을 모사하여 실제 리눅스 콘솔과 유사한 실습이 가능하다. 이를 위해 웹 상에서 프로그래밍 도구가 가져야 할 기능적 요소들을 분석하고 이를 구현하기 위한 알고리즘을 정립하였으며, 특히 사용자의 실수에 의한 오류 메시지 등이 실재 telnet 화면과 동일한 형태로 나타날 수 있는 방법을 구현하였다. 구현된 학습 시스템을 학생들을 대상으로 수업에 활용한 결과 온라인으로 리눅스 프로그래밍 언어의 실습이 가능함은 물론 교수자가 학습자들의 모든 사항들을 직접 점검하고 지도할 수 있어 학습자의 만족도가 오프라인 수업 때와 유사한 결과를 확인하였다.

초등돌봄교실 공간구성특징에 관한 분석연구 - 초등 돌봄교실 길라잡이를 중심으로 - (An Analytical Study on Space Configuration in After-School Care Class for Elementary School - Focused on Guidelines of Emementary School Care Classes -)

  • 김소라
    • 교육시설 논문지
    • /
    • 제28권6호
    • /
    • pp.3-13
    • /
    • 2021
  • Introduced in 2004 as an 'After-School Academy' policy, the 'After-School Care Class' has become a universal program for elementary schools over time. While the concept of public education service has expanded and changed in various ways including educational welfare, the physical environment of the care classroom has undergone fixed changes within the uniform classroom structure of a standardized school space. The purpose of this study is to identify spatial characteristics of care classroom through chasing and analysing changes in the care class space configuration from 2004 to the present. The findings are as follows. The plan of the early care classroom wasn't much different from the existing common classroom, and it was only in 2007 that the kitchen and floor heating appeared for the first time.From the 2015 standard plan, prominent differentiation of the space between learning activities and resting area was shown, but the spatial characteristics are nothing more than a division that utilizes ready-made furniture. A distinctive feature of the 2018 Seoul care classes are diversity. In the case of the care exclusive classrooms, the division between the support space and the main activity space became more clear using furniture integrated open walls and various floor levels. In the case of a shift classrooms that is used together with common classrooms, it is characterized by flexibility that allows dramatically different classroom configurations for each time period by using a convertible furnishing space.

Lightweight Single Image Super-Resolution Convolution Neural Network in Portable Device

  • Wang, Jin;Wu, Yiming;He, Shiming;Sharma, Pradip Kumar;Yu, Xiaofeng;Alfarraj, Osama;Tolba, Amr
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권11호
    • /
    • pp.4065-4083
    • /
    • 2021
  • Super-resolution can improve the clarity of low-resolution (LR) images, which can increase the accuracy of high-level compute vision tasks. Portable devices have low computing power and storage performance. Large-scale neural network super-resolution methods are not suitable for portable devices. In order to save the computational cost and the number of parameters, Lightweight image processing method can improve the processing speed of portable devices. Therefore, we propose the Enhanced Information Multiple Distillation Network (EIMDN) to adapt lower delay and cost. The EIMDN takes feedback mechanism as the framework and obtains low level features through high level features. Further, we replace the feature extraction convolution operation in Information Multiple Distillation Block (IMDB), with Ghost module, and propose the Enhanced Information Multiple Distillation Block (EIMDB) to reduce the amount of calculation and the number of parameters. Finally, coordinate attention (CA) is used at the end of IMDB and EIMDB to enhance the important information extraction from Spaces and channels. Experimental results show that our proposed can achieve convergence faster with fewer parameters and computation, compared with other lightweight super-resolution methods. Under the condition of higher peak signal-to-noise ratio (PSNR) and higher structural similarity (SSIM), the performance of network reconstruction image texture and target contour is significantly improved.