• 제목/요약/키워드: deep learning framework

검색결과 263건 처리시간 0.017초

증강현실 캐릭터 구현을 위한 AI기반 객체인식 연구 (AI-Based Object Recognition Research for Augmented Reality Character Implementation)

  • 이석환;이정금;심현
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1321-1330
    • /
    • 2023
  • 본 연구는 증강현실에서 적용할 캐릭터 생성에서 단일 이미지를 통해 여러 객체에 대한 3D 자세 추정 문제를 연구한다. 기존 top-down 방식에서는 이미지 내의 모든 객체를 먼저 감지하고, 그 후에 각각의 객체를 독립적으로 재구성한다. 문제는 이렇게 재구성된 객체들 사이의 중첩이나 깊이 순서가 불일치 하는 일관성 없는 결과가 발생할 수 있다. 본 연구의 목적은 이러한 문제점을 해결하고, 장면 내의 모든 객체에 대한 일관된 3D 재구성을 제공하는 단일 네트워크를 개발하는 것이다. SMPL 매개변수체를 기반으로 한 인체 모델을 top-down 프레임워크에 통합이 중요한 선택이 되었으며, 이를 통해 거리 필드 기반의 충돌 손실과 깊이 순서를 고려하는 손실 두 가지를 도입하였다. 첫 번째 손실은 재구성된 사람들 사이의 중첩을 방지하며, 두 번째 손실은 가림막 추론과 주석이 달린 인스턴스 분할을 일관되게 렌더링하기 위해 객체들의 깊이 순서를 조정한다. 이러한 방법은 네트워크에 이미지의 명시적인 3D 주석 없이도 깊이 정보를 제공하게 한다. 실험 결과, 기존의 Interpenetration loss 방법은 MuPoTS-3D가 114, PoseTrack이 654에 비해서 본 연구의 방법론인 Lp 손실로 네트워크를 훈련시킬 때 MuPoTS-3D가 34, PoseTrack이 202로 충돌수가 크게 감소하는 것으로 나타났다. 본 연구 방법은 표준 3D 자세벤치마크에서 기존 방법보다 더 나은 성능을 보여주었고, 제안된 손실들은 자연 이미지에서 더욱 일관된 재구성을 실현하게 하였다.

CNN 기반 스펙트로그램을 이용한 자유발화 음성감정인식 (Spontaneous Speech Emotion Recognition Based On Spectrogram With Convolutional Neural Network)

  • 손귀영;권순일
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.284-290
    • /
    • 2024
  • 음성감정인식(Speech Emotion Recognition, SER)은 사용자의 목소리에서 나타나는 떨림, 어조, 크기 등의 음성 패턴 분석을 통하여 감정 상태를 판단하는 기술이다. 하지만, 기존의 음성 감정인식 연구는 구현된 시나리오를 이용하여 제한된 환경 내에서 숙련된 연기자를 대상으로 기록된 음성인 구현발화를 중심의 연구로 그 결과 또한 높은 성능을 얻을 수 있지만, 이에 반해 자유발화 감정인식은 일상생활에서 통제되지 않는 환경에서 이루어지기 때문에 기존 구현발화보다 현저히 낮은 성능을 보여주고 있다. 본 논문에서는 일상적 자유발화 음성을 활용하여 감정인식을 진행하고, 그 성능을 향상하고자 한다. 성능평가를 위하여 AI Hub에서 제공되는 한국인 자유발화 대화 음성데이터를 사용하였으며, 딥러닝 학습을 위하여 1차원의 음성신호를 시간-주파수가 포함된 2차원의 스펙트로그램(Spectrogram)로 이미지 변환을 진행하였다. 생성된 이미지는 CNN기반 전이학습 신경망 모델인 VGG (Visual Geometry Group) 로 학습하였고, 그 결과 7개 감정(기쁨, 사랑스러움, 화남, 두려움, 슬픔, 중립, 놀람)에 대해서 성인 83.5%, 청소년 73.0%의 감정인식 성능을 확인하였다. 본 연구를 통하여, 기존의 구현발화기반 감정인식 성능과 비교하면, 낮은 성능이지만, 자유발화 감정표현에 대한 정량화할 수 있는 음성적 특징을 규정하기 어려움에도 불구하고, 일상생활에서 이루어진 대화를 기반으로 감정인식을 진행한 점에서 의의를 두고자 한다.

디지털 트랜스포메이션을 위한 인공지능 비즈니스 생태계 연구: 다행위자 네트워크 관점에서 (Understanding the Artificial Intelligence Business Ecosystem for Digital Transformation: A Multi-actor Network Perspective)

  • 황윤민;홍성원
    • 경영정보학연구
    • /
    • 제21권4호
    • /
    • pp.125-141
    • /
    • 2019
  • 알파고로 대변되는 딥러닝 기법의 등장으로 인공지능은 기업 경쟁우위 확보를 위한 디지털 트랜스포메이션의 핵심 주제로 급부상했다. 산업 내 인공지능 기반 디지털 트랜스포메이션 방향을 이해하기 위해서는 현재 진행 중인 인공지능 비즈니스 생태계 참여자들 유형 및 활동에 대한 명확한 이해가 선행되어야 한다. 따라서 본 연구는 다행위자 네트워크(Multi-actor network)관점에서 인공지능 비즈니스 생태계 내부와 외부 참여자들의 활동을 분석하고 플랫폼 전략 유형을 규명하였다. 인공지능 비즈니스 생태계 내부 세 개 계층(인프라스트럭처 & 하드웨어, 소프트웨어 & 애플리케이션, 서비스 & 데이터 계층)에서 사업자들은 네 가지 플랫폼 전략 유형으로(기술수직×비즈수평, 기술수직×비즈수직, 기술수평×비즈수평, 기술수평×비즈수직) 인공지능 비즈니스가 진행되고 있다. 인공지능 비즈니스 생태계 외부에는 다섯 행위자들이(사용자, 투자자, 정부 정책가, 학계 등 컨소시엄, 시민단체) 공존 및 지속가능한 인공지능 비즈니스 생태계를 지원하고 있다. 본 연구는 학술적으로 인공지능 비즈니스 생태계 분석 프레임워크 및 인공지능 플랫폼 전략 모델을 제시하였고, 실무적으로 플랫폼 관점의 인공지능 디지털 트랜스포메이션 전략 방향과 지속가능한 인공지능 비즈니스 생태계 조성을 위한 정부, 학계 등의 역할을 제시했다.