• 제목/요약/키워드: 심층망

검색결과 544건 처리시간 0.024초

심층신경망을 이용한 어선의 운동응답 추정 (Motion Response Estimation of Fishing Boats Using Deep Neural Networks)

  • 박태원;박동우;서장훈
    • 해양환경안전학회지
    • /
    • 제29권7호
    • /
    • pp.958-963
    • /
    • 2023
  • 최근에 선박을 안전하게 설계 및 운항하기 위해 인공지능으로 운동성능을 예측하는 연구가 늘고 있다. 하지만 일반적인 선박에 비해 소형 어선에 대한 연구는 부족한 실정이다. 본 논문에서는 소형 어선의 운동성능 계산에 필수적인 운동응답을 심층신경망으로 추정하는 모델을 제안한다. 15척의 소형 어선에 대하여 유체동역학 해석을 수행하였으며 이를 통해 데이터베이스를 구축하였다. 환경 조건과 주요 제원을 입력 데이터로, 단위 파고에 대한 운동응답(Response Amplitude Operator)을 출력 데이터로 설정하였다. 훈련된 심층신경망 모델을 통해 예측된 운동응답은 유체동역학 해석 결과와 유사한 경향을 보이며 고주파 성분을 가진 운동응답 함수를 낮은 오차로 근사하는 결과를 보여준다. 본 연구의 결과를 바탕으로 어선의 선형 특성 고려한 심층신경망 모델로 확장하여 연구 결과의 활용도를 넓히고자 한다.

종단 간 심층 신경망을 이용한 한국어 문장 자동 띄어쓰기 (Automatic Word Spacing of the Korean Sentences by Using End-to-End Deep Neural Network)

  • 이현영;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권11호
    • /
    • pp.441-448
    • /
    • 2019
  • 기존의 자동 띄어쓰기 연구는 n-gram 기반의 통계적인 기법을 이용하거나 형태소 분석기를 이용하여 어절 경계면에 공백을 삽입하는 방법으로 띄어쓰기 오류를 수정한다. 본 논문에서는 심층 신경망을 이용한 종단 간(end-to-end) 한국어 문장 자동 띄어쓰기 시스템을 제안한다. 자동 띄어쓰기 문제를 어절 단위가 아닌 음절 단위 태그 분류 문제로 정의하고 음절 unigram 임베딩과 양방향 LSTM Encoder로 문장 음절간의 양방향 의존 관계 정보를 고정된 길이의 문맥 자질 벡터로 연속적인 벡터 공간에 표현한다. 그리고 새로이 표현한 문맥 자질 벡터를 자동 띄어쓰기 태그(B 또는 I)로 분류한 후 B 태그 앞에 공백을 삽입하는 방법으로 한국어 문장의 자동 띄어쓰기를 수행하였다. 자동 띄어쓰기 태그 분류를 위해 전방향 신경망, 신경망 언어 모델, 그리고 선형 체인 CRF의 세 가지 방법의 분류 망에 따라 세 가지 심층 신경망 모델을 구성하고 종단 간 한국어 자동 띄어쓰기 시스템의 성능을 비교하였다. 세 가지 심층 신경망 모델에서 분류 망으로 선형체인 CRF를 이용한 심층 신경망 모델이 더 우수함을 보였다. 학습 및 테스트 말뭉치로는 최근에 구축된 대용량 한국어 원시 말뭉치로 KCC150을 사용하였다.

스킵 연결 형태 기반의 손 관절 2D 및 3D 검출 기법 (2D and 3D Hand Pose Estimation Based on Skip Connection Form)

  • 구종회;김미경;차의영
    • 한국정보통신학회논문지
    • /
    • 제24권12호
    • /
    • pp.1574-1580
    • /
    • 2020
  • 기존의 신체 인식 방법은 특수한 기기를 사용하거나 이미지로부터 영상처리를 통해 검출하는 방법들이 있다. 특수 기기를 사용할 경우 기기를 사용할 수 있는 환경이 제약되고 기기의 비용이 많이 든다는 단점이 있다. 카메라와 영상처리를 사용할 경우 환경의 제약과 비용이 낮아지는 장점이 있지만, 성능이 떨어진다. 이런 단점을 해결하기 위해 카메라와 합성 곱 심층 신경망을 사용한 신체 인식 방법들이 연구되었다. 합성 곱 심층 신경망의 성능을 올리기 위해 다양한 기법들이 제안되었다. 본 논문에서는 합성 곱 심층 신경망의 성능을 올리기 위한 기법 중 스킵 연결을 다양한 형태로 사용하여 스킵 연결이 손 검출 망에 끼치는 영향을 실험하였다. 실험을 통해 기본 스킵 연결 이외 추가적인 스킵 연결의 존재가 성능에 나은 영향을 끼치고 하향 스킵 연결만 추가된 망이 가장 나은 성능을 보임을 확인하였다.

저해상도 영상 자료를 사용하는 얼굴 표정 인식을 위한 소규모 심층 합성곱 신경망 모델 설계 (A Design of Small Scale Deep CNN Model for Facial Expression Recognition using the Low Resolution Image Datasets)

  • 살리모프 시로지딘;류재흥
    • 한국전자통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.75-80
    • /
    • 2021
  • 인공 지능은 놀라운 혜택을 제공하는 우리 삶의 중요한 부분이 되고 있다. 이와 관련하여 얼굴 표정 인식은 최근 수십 년 동안 컴퓨터 비전 연구자들 사이에서 뜨거운 주제 중 하나였다. 저해상도 이미지의 작은 데이터 세트를 분류하려면 새로운 소규모 심층 합성곱 신경망 모델을 개발해야 한다. 이를 위해 소규모 데이터 세트에 적합한 방법을 제안한다. 이 모델은 기존 심층 합성곱 신경망 모델에 비해 총 학습 가능 가중치 측면에서 메모리의 일부만 사용하지만 FER2013 및 FERPlus 데이터 세트에서 매우 유사한 결과를 보여준다.

가상현실 음향 재구성을 위한 심층신경망 기반 스마트폰의 주파수응답 정규화 방법 (A Method of Frequency Response Normalization of Smart Phones Based on Deep Neural Networks for Virtual Reality Sound Reconstruction)

  • 최재규;윤덕규;최승호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 추계학술대회
    • /
    • pp.19-20
    • /
    • 2017
  • 본 논문은 사용자제작콘텐츠 (User Created Contents, UCC)를 이용한 가상현실 (virtual reality, VR) 음향 재구성을 위한 스마트폰의 주파수응답 정규화에 관한 연구이다. 서로 다른 스마트폰들로 취득한 음향들을 연결할 때, 부자연스러운 음향이 발생하며, 이것은 주로 스마트폰별로 다른 주파수 응답에 기인한다. 이러한 문제를 해결하기 위하여 스마트폰의 주파수응답을 정규화 하는 과정이 필요하며, 본 연구에서는 심층신경망 (deep neural network)을 이용하는 방법을 제안한다. 심층신경망의 입력은 처리하고자 하는 스마트폰 음향의 스펙트럼이고 출력은 이것과 기준 스마트폰 음향의 스펙트럼과의 비율이다. 실험결과, 서로 다른 스마트폰으로 취득한 음향신호가 연결되었을 때, 객관적 및 주관적 평가를 통해 음향의 자연성이 개선됨을 확인 하였다.

  • PDF

인공지능 기반 3차원 공간 복원 최신 기술 동향

  • 임성훈
    • 방송과미디어
    • /
    • 제25권2호
    • /
    • pp.17-26
    • /
    • 2020
  • 최근 스마트폰에서의 증강현실, 미적 효과의 증대(예, 라이브 포커싱) 등의 어플리케이션을 제공하기 위해 모바일 기기에서의 3차원 공간 복원 기술에 대한 관심이 증가하고 있다. 소비자들의 요구에 발 맞춰 최근 스마트폰 제조사는 모든 플래그십 모델에 다중 카메라 및 뎁스 센서(거리 측정 센서)를 탑재하는 추세이다. 본 고에서는 모바일 폰에 탑재되고 있는 대표적인 세 축의 뎁스 추정(공간 복원) 방식에 대해 간단히 살펴보고, 최근 심층학습(Deep learning)의 등장으로 기술 발전의 새로운 국면에 접어 든 다중 시점 매칭(Multi-view stereo) 방법에 대해 소개하고자 한다. 심층 신경망이 재조명 받은 2012년 전까지 주류 연구 방향이었던 전통 기하학 기반의 방법에 대한 소개를 시작으로 심층 신경망기반의 방법론으로의 발전된 형태를 살펴본다. 또한, 신경망기반의 방법론은 크게 3 세대로 나누어 각 세대별 특징에 대해 자세히 살펴보고, 다양한 데이터에 대한 실험 결과를 통해 세대별 공간 복원 결과를 비교 분석한다.

심층 신경망 기반 감정 인식을 위한 스파이크 특성 추출 기술 (Spike Feature Extraction for Emotion Recognition based on Deep Neural Network)

  • 안순호;김재원;한석현;신성현;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 하계학술대회
    • /
    • pp.158-159
    • /
    • 2019
  • 본 논문에서는 심층 신경망을 기반으로 하는 감정 인식을 위해 스파이크 특성을 추출하는 기술을 제안한다. 기존의 심층 신경망을 이용한 감정 인식 기술은 대부분 MFCC를 특성 백터를 사용한다. 그러나 프레임 단위의 연산인 MFCC는 높은 시간 해상도를 확보하기 어려워 시간적 특성의 영향을 받는 감정 인식에 한계가 있다. 이를 해결하기 위해 본 논문에서는 인간의 청각 필터를 모델링한 ERB에 따라 샘플 단위로 주파수의 특성을 나타내는 스파이크그램을 이용한 감정 인식 기술을 제안한다. 제안하는 방법이 감정 인식의 대표적 특성인 MFCC보다 높은 인식률을 제공하는 것을 확인하였다.

  • PDF

엔트로피 모델을 활용한 심층 신경망 기반 오디오 압축 모델 최적화 (DNN-based Audio Compression Model Optimization Utilizing Entropy Model)

  • 임형섭;강홍구;장인선
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.54-57
    • /
    • 2022
  • 본 논문에서는 심층 신경망 기반 점진적 다계층 오디오 코덱의 비트 전송률 효율 향상을 위한 엔트로피 모델 기반 양자화 방식을 제안한다. 최근 심층 신경망을 이용하여 전통적인 신호 처리 이론 기반의 상용 오디오 코덱들을 대체하기 위한 오디오 압축 및 복원 시스템에 관한 연구가 활발하게 이루어지고 있다. 그러나 아직은 기존 상용 코덱의 성능에 도달하지 못하고 있으며 특히 종단 간 오디오 압축 모델의 경우, 적은 정보량으로 높은 품질을 얻기 위해서는 부호화기의 양자화 구조를 개선하는 것이 필수적이다. 본 연구에서는 기존에 제안된 종단 간 오디오 압축 모델 중 하나인 점진적 다계층 오디오 코덱의 벡터 양자화기를 엔트로피 모델 기반 양자화기로 대체하고 전송률-왜곡 트레이드오프 관계를 활용하여 전송률을 다양한 형태로 조절할 수 있음을 보임으로써 엔트로피 모델 기반 양자화기 도입의 타당성을 검증한다.

  • PDF

얼굴사진 기반 감정인식 모델의 특성 분석 (Feature Comparison of Emotion Recognition Models using Face Images)

  • 김민경;양지윤;최유주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.615-617
    • /
    • 2022
  • 본 논문에서는 얼굴사진 기반 감정인식 심층망, 음성사운드를 기반한 감정인식 심층망을 결합한 앙상블 네트워크 구축을 위한 사전연구로서 얼굴사진 기반 감정을 인식하는 기존 딥뉴럴 네트워크 모델들을 입력 데이터 처리 방법에 따라 분류하고, 각 방법의 특성을 분석한다. 또한, 얼굴사진 외관 특성을 기반한 감정인식 네트워크를 여러 구조로 구성하고, 구성된 방법의 성능을 비교하여, 우수 성능을 보이는 네트워크를 선정하여 추후 앙상블 네트워크의 구성 네트워크로 사용하고자 한다.

심층신경망을 이용한 소스 코드 원작자 식별 (Souce Code Identification Using Deep Neural Network)

  • 임지수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권9호
    • /
    • pp.373-378
    • /
    • 2019
  • 현재 프로그래밍 소스들이 온라인에서 공개되어 있기 때문에 무분별한 표절이나 저작권에 대한 문제가 일어나고 있다. 그 중 반복된 저자가 작성한 소스코드는 프로그래밍 특성상 고유의 지문이 있을 수 있다. 본 논문은 구글 코드 잼 프로그램 소스를 심층신경망을 이용한 학습을 통해 각각의 저자를 분별하는 것이다. 이 때 원작자의 소스를 예측 기반 벡터나, 주파수 기반 접근법인 TF-IDF등의 전처리기를 사용하여 입력값들을 벡터화해주고, 심층신경망을 이용한 학습을 통해 각 프로그램 소스 원작자를 식별하고자 한다. 전처리기를 이용하여 언어에 독립적인 학습시스템을 구성하고, 기존의 다른 학습 방법들과 비교하였다. 그 중 TF-IDF와 심층신경망을 사용한 모델은 다른 전처리기나 다른 학습방식을 사용한 것보다 좋은 성능을 보임을 확인하였다.