• 제목/요약/키워드: 합성 알고리즘

검색결과 1,052건 처리시간 0.021초

360 VR 기반 파노라마 영상 구성을 위한 칼라 및 밝기 보상 알고리즘 (Color and Illumination Compensation Algorithm for 360 VR Panorama Image)

  • 남다윤;한종기
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.3-24
    • /
    • 2019
  • 360 VR 기반 파노라마 영상을 제작하는 과정에서 인접한 장면을 촬영한 영상들일 지라도 촬영 각도 및 조명의 위치에 따라 영상들 간에 밝기 변화가 크고 색상값에서도 큰 차이가 발생한다. 이런 영상들을 스티칭하여 360 VR 영상을 만들면, 제작된 파노라마 영상의 품질이 저하되기 때문에 밝기 보상 기법을 전처리 과정으로 사용해야 한다. 기존의 밝기 보상 기법들은 밝기 차이가 적은 경우 또는 적은 장수의 영상들을 스티칭하는 경우에 적용되도록 설계되었기 때문에, 360 VR 서비스용 스티칭 기법에서처럼 스티칭되는 영상의 개수가 많고, 영상들 간의 밝기 차이가 클 경우에는 성능 저하가 발생하는 것으로 알려졌다. 본 논문에서는 기존의 밝기 보상 기법이 급격한 밝기 차이가 발생하는 360 VR 서비스에서도 효과적으로 이용될 수 있도록 추가의 '색상 보정' 및 '밝기 보정' 단계를 전처리 과정으로 사용함으로써, 복잡도 증가는 최소화하면서 360 VR 영상 합성의 성능을 향상시키는 것을 목표로 한다. 본 논문에서는 다양한 환경에서 촬영된 실험 영상들을 이용해서, 제안하는 기술이 기존 기술들의 성능을 향상시킬 수 있음을 보이고 있다.

Implementation of Speech Recognition and Flight Controller Based on Deep Learning for Control to Primary Control Surface of Aircraft

  • Hur, Hwa-La;Kim, Tae-Sun;Park, Myeong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권9호
    • /
    • pp.57-64
    • /
    • 2021
  • 본 논문에서는 음성 명령을 인식하여 비행기의 1차 조종면을 제어할 수 있는 장치를 제안한다. 음성 명령어는 19개의 명령어로 구성되며 총 2,500개의 데이터셋을 근간으로 학습 모델을 구성한다. 학습 모델은 TensorFlow 기반의 Keras 모델의 Sequential 라이브러리를 이용하여 CNN 모델로 구성되며, 학습에 사용되는 음성 파일은 MFCC 알고리즘을 이용하여 특징을 추출한다. 특징을 인식하기 위한 2단계의 Convolution layer 와 분류를 위한 Fully Connected layer는 2개의 dense 층으로 구성하였다. 검증 데이터셋의 정확도는 98.4%이며 테스트 데이터셋의 성능평가에서는 97.6%의 정확도를 보였다. 또한, 라즈베리 파이 기반의 제어장치를 설계 및 구현하여 동작이 정상적으로 이루어짐을 확인하였다. 향후, 음성인식 자동 비행 및 항공정비 분야의 가상 훈련환경으로 활용될 수 있을 것이다.

능동위상배열안테나의 적응형 패턴 널 형성에 관한 연구 (A Study on Adaptive Pattern Null Synthesis for Active Phased Array Antenna)

  • 정진우;박성일
    • 한국전자통신학회논문지
    • /
    • 제16권3호
    • /
    • pp.407-416
    • /
    • 2021
  • 능동위상배열안테나는 적절한 급전신호 가중치 선택에 따라 대국을 향해 주 빔을 조향할 수 있을 뿐만 아니라 간섭원 방향으로 패턴 널을 형성할 수 있다. 주 빔의 조향을 위한 급전신호 가중치는 방사소자의 위치를 기반으로 쉽게 산출할 수 있다. 그리고 패턴 널 형성을 위한 급전신호 가중치 또한 적절한 요구 방사패턴 설정과 WLSM(Weighted Least Squares Method)을 이용하면 산출할 수 있다. 그러나 일반적인 무선 통신망 환경에서 간섭원의 위치는 미인지 상황에 있다. 따라서 적응형 패턴 널 형성 기법이 필요하다. 본 논문에서는 요구 방사특성 설정에 따른 패턴 널 형성이 가능함을 확인하고, 이를 기반으로 관측 영역 기준 이진탐색 알고리즘을 이용하여 간섭원 적응형 패턴 널 형성 기법에 관하여 연구하였다. 제시된 기법을 기반으로 모의실험을 수행한 결과, 효율적으로 간섭 적응형 패턴 널 형성이 가능함을 확인하였다.

잡음과 스펙트럼 이동에 강인한 CNN 기반 라만 분광 알고리즘 (CNN based Raman Spectroscopy Algorithm That is Robust to Noise and Spectral Shift)

  • 박재현;유형근;이창식;장동의;박동조;남현우;박병황
    • 한국군사과학기술학회지
    • /
    • 제24권3호
    • /
    • pp.264-271
    • /
    • 2021
  • Raman spectroscopy is an equipment that is widely used for classifying chemicals in chemical defense operations. However, the classification performance of Raman spectrum may deteriorate due to dark current noise, background noise, spectral shift by vibration of equipment, spectral shift by pressure change, etc. In this paper, we compare the classification accuracy of various machine learning algorithms including k-nearest neighbor, decision tree, linear discriminant analysis, linear support vector machine, nonlinear support vector machine, and convolutional neural network under noisy and spectral shifted conditions. Experimental results show that convolutional neural network maintains a high classification accuracy of over 95 % despite noise and spectral shift. This implies that convolutional neural network can be an ideal classification algorithm in a real combat situation where there is a lot of noise and spectral shift.

하드웨어 공유와 캐리 보존 덧셈을 이용한 MDS 해쉬 프로세서의 설계 (Design of MD5 Hash Processor with Hardware Sharing and Carry Save Addition Scheme)

  • 최병윤;박영수
    • 정보보호학회논문지
    • /
    • 제13권4호
    • /
    • pp.139-149
    • /
    • 2003
  • 본 논문에서는 하드웨어 공유와 캐리 보존 덧셈 연산을 이용하여 MD5 알고리즘을 구현하는 면적 효율적인 해쉬 프로세서를 하드웨어로 설계하였다. 면적을 최소화하기 위해, MD5의 1 단계 동작을 2개의 부분 단계로 세분화하고, 각각의 부분 단계 동작을 동일 하드웨어로 구현하는 방식으로 하드웨어 공유를 극대화하였다. 그리고 MD5의 부분 단계를 구성하는 3개의 직렬 캐리 전달 덧셈 동작을 2개의 캐리 보존 덧셈과 1개의 캐리 전달 덧셈으로 변환하여 동작 주파수를 증가시켰다. MD5 해쉬 프로세서는 0.25$\mu\textrm{m}$ CMOS 표준 셀 라이브러리로 합성한 결과 약 13,000개의 게이트 수로 구성되며, 타이밍 분석 결과 설계된 MD5 해쉬 프로세서는 120 MHz의 동작 주파수에서 512 비트 입력 메시지에 대해 465 Mbps의 성능을 갖는다.

Neural Structured Learning 기반 그래프 합성을 활용한 BIM 부재 자동분류 모델 성능 향상 방안에 관한 연구 (Modeling Element Relations as Structured Graphs Via Neural Structured Learning to Improve BIM Element Classification)

  • 유영수;이고은;구본상;이관훈
    • 대한토목학회논문집
    • /
    • 제41권3호
    • /
    • pp.277-288
    • /
    • 2021
  • IFC 정보의 시멘틱 무결성 확보를 위해 BIM 부재와 IFC 엔티티 간 매핑 검증이 필요하다. 이와 관련된 기존 연구들은 기하정보 기반으로 학습시킨 기계학습 알고리즘을 활용하여 BIM 부재 인식 및 분류를 통해 매핑 검증을 실시하였으나, 유사한 기하특성을 가진 부재를 구분하지 못한다는 한계점이 존재하였다. 이에 본 연구는 BIM 모델의 주요 부재를 인공신경망 기반으로 자동 분류하되, 부재 간 관계정보를 삽입하여 분류성능을 향상시키는 것을 목적으로 하였다. 이를 위해 기존 특성 외에 구조화된 신호를 함께 학습하는 NSL 프레임워크를 활용하여 8개의 BIM 부재를 분류하는 모델을 구축하였으며, 그 결과 기하정보 기반 인공신경망 모델과 대비하여 부재 간 관계정보를 삽입한 NSL 모델의 분류정확도가 현저히 상승한 것을 확인하였다.

객체 감지 데이터 셋 기반 인체 자세 인식시스템 연구 (Research on Human Posture Recognition System Based on The Object Detection Dataset)

  • 유암;리라이춘;루징쉬엔;쉬멍;정양권
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.111-118
    • /
    • 2022
  • 컴퓨터 비전 연구에서 2차원 인체 자세는 매우 광범위한 연구 방향으로 특히 자세 추적과 행동 인식에서 유의미한 분야다. 인체 자세 표적 획득은 이미지에서 인체 목표를 정확히 찾는 방법을 연구하는 것이 핵심이며 인체 자세 인식은 인공지능(AI)에 적용하는 한편 일상생활에 활용되고 있어서 매우 중요한 연구의의가 있다. 인체 자세 인식 효과의 우수성의 기준은 인식 과정의 성공률과 정확도에 의해 결정된다. 본 연구의 인체 자세 인식에서는 딥러닝 전용 데이터셋인 MS COCO를 기반하여 인체를 17개의 키 포인트로 구분하였다. 다음으로 주요 특징에 대한 세분화 마스크(segmentation mask) 방법을 사용하여 인식률을 개선하였다. 최종적으로 신경망 모델을 설계하고 간단한 단계별 학습부터 효율적인 학습에 이르기까지 많은 수의 표본을 학습시키는 알고리즘을 제안하여 정확도를 향상할 수 있었다.

CNN 잡음감쇠기에서 필터 수의 최적화 (Optimization of the Number of Filter in CNN Noise Attenuator)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.625-632
    • /
    • 2021
  • 본 논문은 잡음감쇠기에서 CNN(Convolutional Neural Network) 계층의 필터 수가 성능에 미치는 영향을 연구하였다 이 시스템은 적응필터 대신 신경망 예측필터를 이용하며 심층학습방법으로 잡음을 감쇠한다. 64-뉴런, 16-커널 CNN 필터와 오차 역전파 알고리즘을 이용하여 잡음이 포함된 음성신호로부터 음성을 추정한다. 본 연구에서 필터 수에 대한 잡음감쇠기의 성능을 검증하기 위하여 Keras 라이브러리를 사용한 프로그램을 작성하고 시뮬레이션을 실시하였다. 시뮬레이션 결과, 본 시스템은 필터 수가 16일 때 MSE(Mean Squared Error) 및 MAE(Mean Absolute Error) 값이 가장 작은 것으로 나타났으며 필터가 4개 일 때 성능이 가장 낮은 것을 볼 수 있다. 그리고 필터가 8개 이상이 되면 필터 수에 따라 MSE 및 MAE 값이 크게 차이나지 않는 것을 보여주었다. 이러한 결과로부터 음성신호의 주요 특징을 표현하기 위해서는 약 8개 이상의 필터를 사용해야 한다는 것을 알 수 있다.

딥러닝 기반 미얀마 문자의 특징 추출 및 인식 (Feature Extraction and Recognition of Myanmar Characters Based on Deep Learning)

  • 옴마킨;이성근
    • 한국전자통신학회논문지
    • /
    • 제17권5호
    • /
    • pp.977-984
    • /
    • 2022
  • 최근 동남아시아의 경제발전에 따라 정보기기의 활용이 광범위하게 확산되고 있으며, 지능적 문자인식을 이용한 응용서비스에 대한 수요가 증가하고 있다. 본 논문은 동남아시아 국가 중 하나인 미얀마 문자에 대한 딥러닝 기반 특징 추출 및 인식에 대해 논한다. 특징 추출에는 미얀마 알파벳(33자)과 숫자(10자리)를 사용한다. 본 논문은 9개의 특징을 추출하고 3개 이상의 새로운 특징을 제안한다. 각 문자와 숫자의 특징을 추출하여 성공적인 결과로 표현하였다. 인식 부분에서는 합성곱 신경망을 사용하여 문자 구분에 대한 실행을 평가한다. 제안한 알고리즘은 캡처된 이미지 데이터 세트에 구현되고, 이에 대한 성능을 평가한다. 입력 데이터 세트에 대한 모델의 정밀도는 96%이며 실시간 입력 이미지를 사용한다.

Applying a Novel Neuroscience Mining (NSM) Method to fNIRS Dataset for Predicting the Business Problem Solving Creativity: Emphasis on Combining CNN, BiLSTM, and Attention Network

  • Kim, Kyu Sung;Kim, Min Gyeong;Lee, Kun Chang
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.1-7
    • /
    • 2022
  • 인공지능 기술이 발달하면서 뉴로사이언스 마이닝(NSM: NeuroScience Mining)과 AI를 접목하려는 시도가 증가하고 있다. 나아가 NSM은 뉴로사이언스와 비즈니스 애널리틱스의 결합으로 인해 연구범위가 확장되고 있다. 본 연구에서는 fNIRS 실험을 통해 확보한 뉴로 데이터를 분석하여 비즈니스 문제 해결 창의성(BPSC: business problem-solving creativity)을 예측하고 이를 통해 NSM의 잠재력을 조사한다. BPSC는 비즈니스에서 차별성을 가지게 하는 중요한 요소이지만, 인지적 자원의 하나인 BPSC의 측정 및 예측에는 한계가 존재한다. 본 논문에서는 BPSC 예측 성능을 높이는 방안으로 CNN, BiLSTM 그리고 어텐션 네트워크를 결합한 새로운 NSM 기법을 제안한다. 제안된 NSM 기법을 15만 개 이상의 fNIRS 데이터를 활용하여 유효성을 입증하였다. 연구 결과, 본 논문에서 제안하는 NSM 방법이 벤치마킹한 알고리즘(CNN, BiLSTM)에 비하여 우수한 성능을 가지는 것으로 나타났다.