통합 검색 | Korea Science

준 지도학습과 여러 개의 딥 뉴럴 네트워크를 사용한 멀티 모달 기반 감정 인식 알고리즘 (Multi-modal Emotion Recognition using Semi-supervised Learning and Multiple Neural Networks in the Wild)

김대하;송병철
- 방송공학회논문지
- /
- 제23권3호
- /
- pp.351-360
- /
- 2018
인간 감정 인식은 컴퓨터 비전 및 인공 지능 영역에서 지속적인 관심을 받는 연구 주제이다. 본 논문에서는 wild 환경에서 이미지, 얼굴 특징점 및 음성신호로 구성된 multi-modal 신호를 기반으로 여러 신경망을 통해 인간의 감정을 분류하는 방법을 제안한다. 제안 방법은 다음과 같은 특징을 갖는다. 첫째, multi task learning과 비디오의 시공간 특성을 이용한 준 감독 학습을 사용함으로써 영상 기반 네트워크의 학습 성능을 크게 향상시켰다. 둘째, 얼굴의 1 차원 랜드 마크 정보를 2 차원 영상으로 변환하는 모델을 새로 제안하였고, 이를 바탕으로 한 CNN-LSTM 네트워크를 제안하여 감정 인식을 향상시켰다. 셋째, 특정 감정에 오디오 신호가 매우 효과적이라는 관측을 기반으로 특정 감정에 robust한 오디오 심층 학습 메커니즘을 제안한다. 마지막으로 소위 적응적 감정 융합 (emotion adaptive fusion)을 적용하여 여러 네트워크의 시너지 효과를 극대화한다. 제안 네트워크는 기존의 지도 학습과 반 지도학습 네트워크를 적절히 융합하여 감정 분류 성능을 향상시켰다. EmotiW2017 대회에서 주어진 테스트 셋에 대한 5번째 시도에서, 제안 방법은 57.12 %의 분류 정확도를 달성하였다.
https://doi.org/10.5909/JBE.2018.23.3.351 인용 PDF KSCI KPUBS

NARX 신경망 최적화를 통한 주가 예측 및 영향 요인에 관한 연구 (A Study on the stock price prediction and influence factors through NARX neural network optimization)

전민종;이욱
- 한국산학기술학회논문지
- /
- 제21권8호
- /
- pp.572-578
- /
- 2020
주식 시장은 기업 실적 및 경기 상황뿐만 아니라 정치, 사회, 자연재해 등 예기치 못한 요소들에 영향을 받는다. 이런 요소들을 고려한 정확한 예측을 위해서 다양한 기법들이 사용된다. 최근 인공지능 기술이 화두가 되면서 이를 활용한 주가 예측 시도 또한 이루어지고 있다. 본 논문은 단순히 주식 관련 데이터뿐만 아닌, 거시 경제적 지표 등을 활용한 여러 종류의 데이터를 이용하여 주가에 영향을 미치는 요소에 관한 연구를 제안한다. KOSDAQ을 대상으로 1년 치 종가, 외국인 비율, 금리, 환율 데이터를 다양하게 조합한 후에 딥러닝의 Nonlinear AutoRegressive with eXternal input (NARX) 모델을 활용한다. 이 모델을 통해 1달 치 데이터를 생성하고 각 데이터 조합을 통해 만들어진 예측값을 RMSE를 통해 실제값과 비교, 분석한다. 또한, 은닉층에서 뉴런의 수, 지연 시간을 다양하게 설정하여 RMSE를 비교한다. 분석 결과 뉴런은 10개, 지연 시간은 2로 설정하고, 데이터는 미국, 중국, 유럽, 일본 환율의 조합을 사용할 때 RMSE 0.08을 보이며 가장 낮은 오차를 기록하였다. 본 연구는 환율이 주식에 가장 영향을 많이 미친다는 점과 종가 데이터만 사용했을 때의 RMSE 값인 0.589에서 오차를 낮췄다는 점에 의의가 있다.
https://doi.org/10.5762/KAIS.2020.21.8.572 인용 PDF KSCI

선박용 밸브의 내부 누설 진단을 위한 음향방출신호의 머신러닝 기법 적용 연구 (Diagnosis of Valve Internal Leakage for Ship Piping System using Acoustic Emission Signal-based Machine Learning Approach)

이정형
- 해양환경안전학회지
- /
- 제28권1호
- /
- pp.184-192
- /
- 2022
밸브의 내부 누설 현상은 밸브의 내부 부품의 손상에 의해 발생하며 배관 시스템의 사고와 운전정지를 일으키는 주요 요인이다. 본 연구는 버터플라이형 밸브의 내부 누설에 따라 배관계에서 발생하는 음향방출 신호를 이용하여 배관 가동 중 실시간 누설 진단의 가능성을 검토하였다. 이를 위해 밸브의 작동 모드별로 측정한 시간영역의 AE 원시신호를 취득하였으며 이로부터 구축한 데이터셋은 데이터 기반의 인공지능 알고리즘에 적용하여 밸브의 내부 누설 유무를 진단하는 모델을 생성하였다. 누설 유무진단을 분류의 문제로 정의하여 SVM 기반의 머신러닝과 CNN 기반의 딥러닝 분류 알고리즘을 적용하였다. 데이터의 특징 추출에 기반한 SVM 분류 모델의 경우, 이진분류 모델에서 구축된 모델에 따라 83~90%의 정확도를 나타냈으며, 다중 클래스인 경우 분류 정확도가 66%로 감소하였다. 반면, CNN 기반의 다중 클래스 분류 모델의 경우 99.85%의 분류 정확도를 얻을 수 있었다. 결론적으로 밸브 내부 누설 진단을 위한 SVM 분류모델은 다중 클래스의 정확도 향상을 위해 적절한 특징 추출이 필요하며, CNN 기반의 분류모델은 프로세서의 성능 저하만 없다면 누설진단과 밸브 개도 분류에 효율적인 접근방법임을 확인하였다.
https://doi.org/10.7837/kosomes.2022.28.1.184 인용 PDF KSCI

Pix2Pix의 수용 영역 조절을 통한 전통 고궁 이미지 복원 연구 (A Study on the Restoration of Korean Traditional Palace Image by Adjusting the Receptive Field of Pix2Pix)

황원용;김효관
- 한국정보전자통신기술학회논문지
- /
- 제15권5호
- /
- pp.360-366
- /
- 2022
본 논문은 흑백 사진으로만 남아 있는 한국의 전통 고궁 사진을 적대적 생성 신경망 기법의 하나인 Pix2Pix를 활용하여 컬러 사진으로 복원하기 위한 학습 모델 구조를 제시한다. Pix2Pix는 합성 이미지를 생성기와 합성 여부를 판정하는 판별기의 학습 모델 조합으로 구성된다. 본 논문은 판별기의 수용 영역을 조절하여 인공지능 모델을 학습하고 그 결과를 고궁 사진이 가지는 특성을 고려하여 분석하는 내용을 다룬다. 기존에 흑백 사진 복원에 사용하는 Pix2Pix의 수용 영역은 주로 고정된 크기로 사용하였으나 이미지의 변화가 다양한 고궁 사진을 복원함에 있어서는 고정된 수용 영역을 일률적으로 적용하기에 적합하지 않다. 본 논문에서는 고궁의 특성을 반영할 수 있는 판별기의 수용 영역을 확인하기 위해 기존의 고정된 수용 영역의 크기를 변화시켜 나타나는 결과를 관찰하였다. 실험은 사전에 준비한 고궁 사진을 기반으로 판별기의 수용 영역을 조정하고 모델의 학습을 진행하였다. 판별기의 수용 영역 변화에 따른 모델의 손실을 측정하고 최종 학습한 학습 모델을 복원 대상 흑백 사진에 대입하여 복원 결과를 확인한다.
https://doi.org/10.17661/jkiiect.2022.15.5.360 인용 PDF KSCI HTML

혼성신호 컨볼루션 뉴럴 네트워크 가속기를 위한 저전력 ADC설계 (Low Power ADC Design for Mixed Signal Convolutional Neural Network Accelerator)

이중연;말릭 수메르;사아드 아슬란;김형원
- 한국정보통신학회논문지
- /
- 제25권11호
- /
- pp.1627-1634
- /
- 2021
본 논문은 저전력 뉴럴 네트워크 가속기 SOC를 위한 아날로그 Convolution Filter용 저전력 초소형 ADC 회로 및 칩 설계 기술을 소개한다. 대부분의 딥러닝의 학습과 추론을 할 수 있는 Convolution neural network accelerator는 디지털회로로 구현되고 있다. 이들은 수많은 곱셈기 및 덧셈기를 병렬 구조로 구현하며, 기존의 복잡한 곱셉기와 덧셈기의 디지털 구현 방식은 높은 전력소모와 큰 면적을 요구하는 문제점을 가지고 있다. 이 한계점을 극복하고자 본 연구는 디지털 Convolution filter circuit을 Analog multiplier와 Accumulator, ADC로 구성된 Analog Convolution Filter로 대체한다. 본 논문에서는 최소의 칩면적와 전력소모로 Analog Accumulator의 아날로그 결과 신호를 디지털 Feature 데이터로 변환하는 8-bit SAR ADC를 제안한다. 제안하는 ADC는 Capacitor Array의 모든 Capacitor branch에 Split capacitor를 삽입하여 모든 branch의 Capacitor 크기가 균등하게 Unit capacitor가 되도록 설계하여 칩면적을 최소화 한다. 또한 초소형 unit capacitor의 Voltage-dependent capacitance variation 문제점을 제거하기 Flipped Dual-Capacitor 회로를 제안한다. 제안하는 ADC를 TSMC CMOS 65nm 공정을 이용하여 설계하였으며, 전체 chip size는 1355.7㎛², Power consumption은 2.6㎼, SNDR은 44.19dB, ENOB는 7.04bit의 성능을 달성하였다.
https://doi.org/10.6109/jkiice.2021.25.11.1627 인용 PDF KSCI

x-vector를 이용한 다화자 음성합성 시스템 (A Multi-speaker Speech Synthesis System Using X-vector)

조민수;권철홍
- 문화기술의 융합
- /
- 제7권4호
- /
- pp.675-681
- /
- 2021
최근 인공지능 스피커 시장이 성장하면서 사용자와 자연스러운 대화가 가능한 음성합성 기술에 대한 수요가 증가하고 있다. 따라서 다양한 음색의 목소리를 생성할 수 있는 다화자 음성합성 시스템이 필요하다. 자연스러운 음성을 합성하기 위해서는 대용량의 고품질 음성 DB로 학습하는 것이 요구된다. 그러나 많은 화자가 발화한 고품질의 대용량 음성 DB를 수집하는 것은 녹음 시간과 비용 측면에서 매우 어려운 일이다. 따라서 각 화자별로는 소량의 학습 데이터이지만 매우 많은 화자의 음성 DB를 사용하여 음성합성 시스템을 학습하고, 이로부터 다화자의 음색과 운율 등을 자연스럽게 표현하는 기술이 필요하다. 본 논문에서는 화자인식 기술에서 사용하는 딥러닝 기반 x-vector 기법을 적용하여 화자 인코더를 구성하고, 화자 인코더를 통해 소량의 데이터로 새로운 화자의 음색을 합성하는 기술을 제안한다. 다화자 음성합성 시스템에서 텍스트 입력에서 멜-스펙트로그램을 합성하는 모듈은 Tacotron2로, 합성음을 생성하는 보코더는 로지스틱 혼합 분포가 적용된 WaveNet으로 구성되어 있다. 학습된 화자 임베딩 신경망에서 추출한 x-vector를 Tacotron2에 입력으로 추가하여 원하는 화자의 음색을 표현한다.
https://doi.org/10.17703/JCCT.2021.7.4.675 인용 PDF KSCI

79종의 임플란트 식별을 위한 딥러닝 알고리즘 (Deep learning algorithms for identifying 79 dental implant types)

공현준;유진용;엄상호;이준혁
- 구강회복응용과학지
- /
- 제38권4호
- /
- pp.196-203
- /
- 2022
목적: 본 연구는 79종의 치과 임플란트에 대해 딥러닝을 이용한 식별 모델의 정확도와 임상적 유용성을 평가하는 것을 목적으로 하였다. 연구 재료 및 방법: 2001년부터 2020년까지 30개 치과에서 임플란트 치료를 받은 환자들의 파노라마 방사선 사진에서 총 45396개의 임플란트 고정체 이미지를 수집했다. 수집된 임플란트 이미지는 18개 제조사의 79개 유형이었다. 모델 학습을 위해 EfficientNet 및 Meta Pseudo Labels 알고리즘이 사용되었다. EfficientNet은 EfficientNet-B0 및 EfficientNet-B4가 하위 모델로 사용되었으며, Meta Pseudo Labels는 확장 계수에 따라 두 가지 모델을 적용했다. EfficientNet에 대해 Top 1 정확도를 측정하고 Meta Pseudo Labels에 대해 Top 1 및 Top 5 정확도를 측정하였다. 결과: EfficientNet-B0 및 EfficientNet-B4는 89.4의 Top 1 정확도를 보였다. Meta Pseudo Labels 1은 87.96의 Top 1 정확도를 보였고, 확장 계수가 증가한 Meta Pseudo Labels 2는 88.35를 나타냈다. Top 5 정확도에서 Meta Pseudo Labels 1의 점수는 97.90으로 Meta Pseudo Labels 2의 97.79보다 0.11% 높았다. 결론: 본 연구에서 임플란트 식별에 사용된 4가지 딥러닝 알고리즘은 모두 90%에 가까운 정확도를 보였다. 임플란트 식별을 위한 딥러닝의 임상적 적용 가능성을 높이려면 더 많은 데이터를 수집하고 임플란트에 적합한 미세 조정 알고리즘의 개발이 필요하다.
https://doi.org/10.14368/jdras.2022.38.4.196 인용 PDF KSCI

효율적인 이미지 검색 시스템을 위한 자기 감독 딥해싱 모델의 비교 분석 (Comparative Analysis of Self-supervised Deephashing Models for Efficient Image Retrieval System)

김수인;전영진;이상범;김원겸
- 정보처리학회논문지:소프트웨어 및 데이터공학
- /
- 제12권12호
- /
- pp.519-524
- /
- 2023
해싱 기반 이미지 검색에서는 조작된 이미지의 해시코드가 원본 이미지와 달라 동일한 이미지 검색이 어렵다. 본 논문은 이미지의 질감, 모양, 색상 등 특징 정보로부터 지각적 해시코드를 생성하는 자기 감독 기반 딥해싱 모델을 제안하고 평가한다. 비교 모델은 오토인코더 기반 변분 추론 모델들이며, 인코더는 완전 연결 계층, 합성곱 신경망과 트랜스포머 모듈 등으로 설계된다. 제안된 모델은 기하학적 패턴을 추출하고 이미지 내 위치 관계를 활용하는 SimAM 모듈을 포함하는 변형 추론 모델이다. SimAM은 뉴런과 주변 뉴런의 활성화 값을 이용한 에너지 함수를 통해 객체 또는 로컬 영역이 강조된 잠재 벡터를 학습할 수 있다. 제안 방법은 표현 학습 모델로 고차원 입력 이미지의 저차원 잠재 벡터를 생성할 수 있으며, 잠재 벡터는 구분 가능한 해시코드로 이진화 된다. CIFAR-10, ImageNet, NUS-WIDE 등 공개 데이터셋의 실험 결과로부터 제안 모델은 비교 모델보다 우수하며, 지도학습 기반 딥해싱 모델과 동등한 성능이 분석되었다.
https://doi.org/10.3745/KTSDE.2023.12.12.519 인용 PDF

변이형 오토인코더와 어텐션 메커니즘을 결합한 차트기반 주가 예측 (Chart-based Stock Price Prediction by Combing Variation Autoencoder and Attention Mechanisms)

배상현;최병구
- 경영정보학연구
- /
- 제23권1호
- /
- pp.23-43
- /
- 2021
최근 인공지능 기법을 활용하여 캔들스틱 차트를 분석함으로써 주식가격 예측의 정확성을 높이고자 하는 다양한 연구가 진행되어 왔다. 그러나 이러한 연구들은 주식가격 예측을 위한 학습에 있어 캔들스틱 차트의 시계열적 특성을 고려하지 못한다는 점과 시장 참여자들의 감정 상태를 고려하지 못한다는 점 등이 문제로 지적되고 있다. 본 연구에서는 시장 참여자들의 감정상태를 반영하기 위해 변동성지수(VIX: volatility index) 차트를 캔들스틱 차트와 함께 고려하여 학습시키고 이를 변이형 오토인코더(VAE: variational auto encoder)와 어텐션 메커니즘(attention mechanisms)을 결합한 새로운 방법으로 분석하여 캔들스틱 차트의 시계열적 특성을 고려함으로써 기존 연구의 한계를 극복하고자 한다. 본 연구에서 제안한 방법의 성능 비교를 위해 S&P 500 기업 가운데 50개를 임의로 추출하여 제안한 방법을 통해 이들의 주식가격을 예측하고 이를 합성곱 신경망(CNN: convolutional neural network) 또는 장단기메모리(LSTM: long-short term memory) 등과 같은 기존 방법들과 비교하였다. 비교 결과 기존 방법들에 비해 본 연구에서 제안한 방법이 더 우수한 성능을 보이는 것으로 나타났다. 본 연구는 시장 참여자들의 감정 상태와 캔들스틱 차트의 시계열적 특성을 고려함으로써 주식 가격 예측의 정확성을 높였다는 점에서 그 의의가 있다.
https://doi.org/10.14329/isr.2021.23.1.023 인용 PDF

고객의 투자상품 선호도를 활용한 금융상품 추천시스템 개발 (Financial Products Recommendation System Using Customer Behavior Information)

김효중;김성범;김희웅
- 경영정보학연구
- /
- 제25권1호
- /
- pp.111-128
- /
- 2023
인공지능(AI) 기술이 발전함에 따라 빅데이터 기반의 상품 선호도 추정 개인화 추천시스템에 관심이 증가하고 있는 추세이다. 하지만 개인화 추천이 적합하지 않은 경우 고객의 구매 의사를 감소시키고 심지어 금융상품의 특성상 막대한 재무적 손실로 확대될 수 있는 위험을 가지고 있다. 따라서 고객의 특성과 상품 선호도를 포괄적으로 반영한 추천시스템을 개발하는 것이 비즈니스 성과 창출과 컴플라이언스 이슈 대응에 매우 중요하다. 특히 금융상품의 경우 개인의 투자성향과 리스크 회피도에 따라 고객의 상품 선호도가 구분되므로 축적된 고객 행동 데이터를 활용하여 맞춤형 추천서비스를 제안하는 것이 필요하다. 이러한 고객의 행동 특성과 거래 내역 데이터를 사용하는 것뿐만 아니라, 고객의 인구통계정보, 자산정보, 종목 보유 정보를 포함하여 추천 시스템의 콜드 스타트 문제를 해결하고자 한다. 따라서, 본 연구는 고객의 거래 로그 기록을 바탕으로 고객의 투자성향과 같은 특성 정보와 거래 내역 및 금융상품 정보를 통해 고객별 금융상품 잠재 선호도를 도출하여 딥러닝 기반의 협업 필터링을 제안한 모형이 가장 성능 우수한 것을 확인하였다. 본 연구는 고객의 금융 투자 메커니즘을 기반으로 금융상품 거래 데이터를 통해 미거래 금융상품에 대한 예상 선호를 도출하는 추천 모델을 구축하여, 선호가 높을 것으로 예상되는 상위 상품군을 추천하는 서비스를 개발하는 것에 의의가 있다.
https://doi.org/10.14329/isr.2023.25.1.111 인용 PDF

검색결과 657건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)