• 제목/요약/키워드: 음성 신호 처리

검색결과 473건 처리시간 0.02초

Identity-CBAM ResNet 기반 얼굴 감정 식별 모듈 (Face Emotion Recognition using ResNet with Identity-CBAM)

  • 오규태;김인기;김범준;곽정환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.559-561
    • /
    • 2022
  • 인공지능 시대에 들어서면서 개인 맞춤형 환경을 제공하기 위하여 사람의 감정을 인식하고 교감하는 기술이 많이 발전되고 있다. 사람의 감정을 인식하는 방법으로는 얼굴, 음성, 신체 동작, 생체 신호 등이 있지만 이 중 가장 직관적이면서도 쉽게 접할 수 있는 것은 표정이다. 따라서, 본 논문에서는 정확도 높은 얼굴 감정 식별을 위해서 Convolution Block Attention Module(CBAM)의 각 Gate와 Residual Block, Skip Connection을 이용한 Identity- CBAM Module을 제안한다. CBAM의 각 Gate와 Residual Block을 이용하여 각각의 표정에 대한 핵심 특징 정보들을 강조하여 Context 한 모델로 변화시켜주는 효과를 가지게 하였으며 Skip-Connection을 이용하여 기울기 소실 및 폭발에 강인하게 해주는 모듈을 제안한다. AI-HUB의 한국인 감정 인식을 위한 복합 영상 데이터 세트를 이용하여 총 6개의 클래스로 구분하였으며, F1-Score, Accuracy 기준으로 Identity-CBAM 모듈을 적용하였을 때 Vanilla ResNet50, ResNet101 대비 F1-Score 0.4~2.7%, Accuracy 0.18~2.03%의 성능 향상을 달성하였다. 또한, Guided Backpropagation과 Guided GradCam을 통해 시각화하였을 때 중요 특징점들을 더 세밀하게 표현하는 것을 확인하였다. 결과적으로 이미지 내 표정 분류 Task에서 Vanilla ResNet50, ResNet101을 사용하는 것보다 Identity-CBAM Module을 함께 사용하는 것이 더 적합함을 입증하였다.

다중비 신호처리에 적용한 선형 주기적 시변 시스템의 입출력 이득 (Input-Output Gains of Linear Periodic Time-Varying Systems with Applications to Multirate Signal Processing)

  • 이상철;박계원
    • 한국정보통신학회논문지
    • /
    • 제4권5호
    • /
    • pp.963-969
    • /
    • 2000
  • 본 논문에서는, 선형 주기적 시변 시스템에 대해서, 두 개의 입출력 이득을 정의한다. 그 하나는 단위 크기의 ι$_2$노름을 갖는 모든 입력에 대한 최악의 $\iota_2$ 노름의 출력의 비로서, G($\iota_2,\iota_2$ 로 표기한다. 또 다른 하나는 단위 크기의 RMS 값을 갖는 모든 입력에 대한 최악의 RMS 값의 출력의 비로서, G(RMS, RMS)로 표기한다. 선형 시불변 시스템에 대해서는 이 두 개의 이득은 등가라는 사실이 잘 알려져 있다. 본 논문에서는 선형 주기적 시변 시스템에 대해서도 이 두 개의 이득이 등가라는 것을 증명한다. 또한, 선형 주기적 시변 시스템에 대한 주파수 응답을 얻는 두 가지 방법 사이의 관계를 유도한다. 이렇게 정의된 입출력 이득은 M-채널 필터 뱅크에 적용한다. 필터 뱅크는 음성 압축 등에 사용되는 대표적인 다중비 신호처리 시스템이다. 이러한 필터뱅크에는 일반적으로 에일리어징 왜곡, 진폭 왜곡 및 위상 왜곡이 존재한다. 본 논문에서는 오차 시스템의 G($\iota_2,\iota_2$ 이득을 최적화 하는 방법에 의해 필터 뱅크를 설계함으로써, 필터 뱅크에서 일반적으로 존재하는 왜곡을 작게할 수 있음을 보인다.

  • PDF

M-채널 서브밴드 QMF 필터뱅크를 이용한 웨이브릿변환기반 적응 음향반향제거기 (An Adaptive AEC Based on the Wavelet Transform Using M-channel Subband QMF Filter Banks)

  • 안주원;권기룡;문광석;김문수
    • 한국멀티미디어학회논문지
    • /
    • 제3권4호
    • /
    • pp.347-355
    • /
    • 2000
  • 본 논문에서는 M-채널 서브밴드 QMF 필터 뱅크를 이용한 웨이브릿 변환기반 적응 음향반향제거기를 제안한다. 제안한 적응 음향반향제거기는 웨이브릿변환 필터뱅크의 적은 계산량, 서브밴드 처리 및 웨이브릿 서브밴드 필터의 직교성에 의해 정상상태 성능을 향상시키고, 실시간 처리가 가능하도록 구현한다. 각 서브밴드에서 적응필터의 계수적응을 위한 알고리듬으로는 실시간 반향제거와 하드웨어 구현시 비용감소를 위하여 계산량이 적고 구현이 간단한 LMS 적응 알고리듬을 사용한다. 제안한 적응 음향반향제거기의 성능평가를 위한 실험으로서 백색 가우시안 잡음 및 주변잡음을 포함한 실제의 음성신호를 입력신호로 반향제거 기에 인가하여 반향성능을 평가하였다. 실험 결과로서 제안한 음향반향제거기는 웨이브릿 완전복원 필터뱅크에 의해 수렴후 점근적 에러가 적고, 적은 계산량을 요구하며 안정한 수렴성능을 나타내었다.

  • PDF

이동통신 시스템에서 MAP기반 터보 부호의 복호에 관한 연구 (A Study on Iterative MAP-Based Decoding of Turbo Code in the Mobile Communication System)

  • 박노진;강철호
    • 융합신호처리학회논문지
    • /
    • 제2권2호
    • /
    • pp.62-67
    • /
    • 2001
  • 최근의 이동통신 시스템에서 오류 정정 부호화 방식으로 사용되는 터보 코드의 성능은 부호기에 내재되어 부호의 자유 거리 결정에 큰 영향을 미치는 인터리버와 복호기에서 수행되는 반복 복호에 의한 것이다. 하지만 우수한 성능을 얻기 위해 수신과정에서 많은 지연시간이 요구되는데 이는 주로 인터리버의 크기에 의존하게 된다. 또한 터보 코드는 페이딩 채널 상에서도 신뢰성 있는 강력한 코딩 기법으로 알려져, 최근 ITU 등에서 IMT-2700과 같은 차세대 이동 통신에서 채널 코드의 표준으로 채택되었다. 따라서 본 논문에서는 복잡도는 2배로 증가하나 성능을 개선시킨 병렬 구조의 4-New 터보 복호기를 제안하고, 차세대 무선 멀티미디어 통신에서 실시간 음성 및 비디오 서비스를 제공 시 복호 지연시간을 단축시키기 위해 가변 복호 방법을 이용하여 AWGN과 페이딩 채널 환경에서의 컴퓨터 모의 실험을 통해 성능 분석을 하였다.

  • PDF

CDMA 채널 환경에서의 MAP 기반 터보 부호에 관한 연구 (A Study on Iterative MAP-Based Turbo Code over CDMA Channels)

  • 박노진;강철호
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.13-16
    • /
    • 2000
  • 최근의 이동통신 시스템에서 오류 정정 부호화 방식으로 사용되는 Turbo Code의 성능은 부호기에 내재되어 부호의 자유 거리 결정에 큰 영향을 미치는 인터리버와 복호기에서 수행되는 반복 복호에 의한 것이다. 하지만 우수한 성능을 얻기 위해 수신과정에서 많은 지연시간이 요구되는데 이는 주로 인터리버의 크기에 의존하게 된다 또한 Turbo Code는 페이딩 채널 상에서도 신뢰성 있는 강력한 코딩 기법으로 알려져, 최근 ITU 둥에서 IMT-2000과 같은 차세대 이동 통신에서 채널 코드의 표준으로 채택되었다. 따라서 본 논문에서는 복잡도는 2배로 증가하나 성능을 개선시킨 터보 복호기를 제안하고, 차세대 무선 멀티미디어 통신에서 실시간 음성 덴 비디오 서비스를 제공시 복호 지연시간을 단축시키기 위해 가변 복호 방법을 이용하여 AWCN과 페이딩 채널 환경에서의 컴퓨터 모의 실험을 통해 성능 분석을 하였다.

  • PDF

산불진화대원용 스마트 헬멧 개발에 관한 연구 (A Study on the Development of Smart Helmet for Forest Firefighting Crews)

  • 하연철;진영우;박재문;도희찬
    • 융합신호처리학회논문지
    • /
    • 제22권2호
    • /
    • pp.57-63
    • /
    • 2021
  • 본 연구의 목적은 산불진화대원들을 안전하게 하고, 현장 정보를 실시간으로 제공하기 위한 스마트 헬멧을 개발하는 것이다. 산불진화대원용 스마트 헬멧은 카메라, 영상/음성통신 모듈, GPS, Bluetooth 및 LTE 모듈 등을 모두 갖추어 산불진화대원의 안전을 도모하고, 스마트 헬멧을 통해 현장 상황을 실시간으로 전송하고, 양방향 통신이 가능하도록 하였다. 제작된 스마트 헬멧을 이용하여 테스트한 결과 관제센터에서 현장 정보를 수신할 수 있었고, 현장 산불진화대원과 소통을 할 수 있었다. 현장 평가와 사용자 평가를 통해 스마트 헬멧의 개선이 필요함을 확인하였다. 개발된 스마트 헬멧은 산림재해 및 산림산업에 다양하게 사용될 수 있을 것이다.

선박 내 스마트 안전모 및 환경 센서 적용에 관한 연구 (A Study on the Application of Smart Safety Helmets and Environmental Sensors in Ships)

  • 김도형;하연철
    • 융합신호처리학회논문지
    • /
    • 제24권2호
    • /
    • pp.82-89
    • /
    • 2023
  • 선박 구조 특성상 격실 구조는 복잡하고 협소하여 작업 과정에서 안전사고가 빈번히 발생하고 있다. 사고의 주된 원인은 구조물 충돌, 낙하물, 독성물질 누출, 화재, 폭발, 질식 등이 존재한다. 사고 발생 시 작업자의 현장 상황을 파악하는 것이 피해를 완화하는 요소 중 하나이다. 이에 안전성을 확보하기 위해 선박 내 CCTV로 현장 상황을 모니터링하고 있으나, 기존의 방식으로는 사고를 예방하기엔 어려움이 있다. 이를 해결하기 위해 안전 기술로 위치 식별, 음성/영상 통신 기능이 탑재되는 스마트 안전모가 개발 중에 있다. 또한, 작업 구역 내 환경 정보 수집 및 저장기능을 포함한 온도, 습도, 진동, 소음, 기울기(자이로 센서), 가스 센서를 사용하여 스마트 안전모를 착용한 작업자에게 위험 상황을 알릴 수 있다. 이를 통해 스마트 안전모 및 환경 센서의 사용으로 선박 내 작업자의 안전성을 강화할 수 있을 것이다.

표면근전도 신호를 활용한 CNN 기반 한국 지화숫자 인식을 위한 아래팔 근육과 전극 위치에 관한 연구 (Study on Forearm Muscles and Electrode Placements for CNN based Korean Finger Number Gesture Recognition using sEMG Signals)

  • 박종준;권춘기
    • 한국산학기술학회논문지
    • /
    • 제19권8호
    • /
    • pp.260-267
    • /
    • 2018
  • 표면근전도(sEMG) 신호의 응용은 초기에는 단순히 근육 활성도의 유무를 판별하여 On/Off 의 스위치 기능으로 많이 사용되어 왔으나, 표면근전도 신호처리와 알고리즘의 발달로 휠체어의 방향 제어는 물론 수화를 인식하는 분야까지 확대되었다. 청각 장애인들의 언어 소통을 위한 중요한 수단인 수화나 지화는 미학습자와는 소통의 어려움이 존재해왔으며, 이러한 어려움을 해결하기 위해 수화나 지화를 인식하는 기술에 대한 연구가 지속적으로 수행되어 왔다. 최근에는, 수화나 지화 시연시에 활성화되는 근육의 신호를 활용하여 수화나 지화를 인식하는 방법이 중국 숫자지화 중심으로 적용되고 있는 추세이다. 하지만, 수화나 지화는 일반 음성언어와 마찬가지로 중국 숫자지화와 한국 숫자지화가 다르므로, 중국 숫자지화 시연시에 관여하는 근육이 한국 숫자지화 시연시에는 관여하지 않을 수가 있어, 인식률이 현저히 떨어질 수 있다. 그러므로 한국 숫자지화 시연시에 활성화되는 근육의 선정은 표면근전도 신호에 기반한 한국 숫자지화 인식률에 매우 중요하다. 하지만, 표면근전도 신호에 기반한 한국 숫자지화 인식에 대한 연구는 문헌에서 드물다. 본 연구에서는 표면근전도 신호를 활용한 한국수화 또는 한국지화의 인식에 관한 초기 연구로서, 한국 숫자지화를 시연시에 관여하는 아래팔근육을 제안하고 실험을 통하여 검증하기 위해 숫자 영(0)부터 다섯(5)의 여섯 가지 한국 숫자지화를 대상으로 인식하는 연구를 수행하였다. 이를 위해, 표면근전도 신호를 활용한 CNN 기반 지화인식 방법에 적용하여 여섯 가지 한국 숫자지화에 대하여 100%의 인식률을 확인함으로써, 여섯 가지 한국 숫자지화 인식을 위해 제안된 아래팔근육과 전극위치의 타당성을 검증하였다.

웨이브렛 변환쌍과 적응-길이 메디안 필터를 이용한 임펄스 노이즈 제거에 관한 연구 (A Study on the Removal of Impulse Noiseusing Wavelet Transform Pair and Adaptive-Length Median filter)

  • 배상범;김남호
    • 한국정보통신학회논문지
    • /
    • 제7권7호
    • /
    • pp.1575-1581
    • /
    • 2003
  • 사회가 고도의 디지털 정보화 시대로 급속히 발전함에 따라 영상 및 음성 데이터의 획득, 전송, 저장을 위한 멀티 미디어 통신 서비스가 상용화 되어가고 있다. 그러나, 여전히 데이터를 디지털화하거나 전송하는 과정에서 여러 가지 원인에 의해 노이즈가 발생하고 있으며, 이러한 노이즈를 제거하기 위한 연구는 지금까지 계속되고 있다. 노이즈를 제거하기 위해 기존에 FFT와 STFT 등이 있었으나, 신호에 대한 시간정보를 알 수 없고 시간-주파수 국부성이 상충관계를 갖는다. 따라서, 이러한 한계를 극복하기 위해 신호처리 분야의 새로운 기법으로 제시된 웨이브렛 변환은 시간-주파수 국부성을 가지므로, 다양한 신호를 해석하는데 용이할 뿐만 아니라, 다중 해상도 해석이 가능하므로 최근 여러 분야에 응용되고 있다. 그리고, 두 개의 웨이브렛 기저가 힐버트 변환쌍을 형성하도록 설계될 때, 웨이브렛 쌍은 데이터 특징 검출에서 기존의 DWT보다 우수한 성능을 갖는다. 따라서, 본 연구에서는 절단된 계수 벡터에 의해 설계된 두 개의 dyadic 웨이브렛 기저와 적응-길이 메디안 필터를 사용하여 임펄스 노이즈를 제거하였다.

CDMA 2000-1X를 기반으로한 차세대 이동망의 진화 (Evolution of Next Generation Mobile Network Based on CDMA2000-1X Network)

  • 손동철;김재원;류충상
    • 한국전자통신학회논문지
    • /
    • 제1권1호
    • /
    • pp.70-80
    • /
    • 2006
  • 통신 서비스 시장의 패러다임이 유선 음성통신에서 무선의 데이터 통신으로 급속히 확산되고 있다. 이러한 통신시장의 변화를 수용하기 위해서는 고속의 전송속도에 근거한 다양한 서비스 제공과 아울러 인터넷 응용에 기반한 다양한 서비스들이 제공되어 기존의 이동통신망의 제한성을 탈피한 고품질의 이동통신망들의 구성이 요구된다. 이러한 고속통신을 수용하기 위해서는 무선 신호처리 기술, 광대역 전송기술, 첨단 이동통신망 구축 기술이 필수적이며, 효율적인 운용 기술에 의한 가입자 서비스의 수용 또한 요구되어 진다. 디지털 이동통신 시스템의 기반 기술로 활용되어 온 CDMA 다중접속 방식은 음성, SMS, 회선 데이터 서비스를 제공하기 위한 IS-95A/B 시스템 과 3세대 이동통신 시스템의 규격으로 평가받고 있는 동기방식 CDMA2000, 비동기방식 WCDMA 기술 등이 개발되고 있다. 본 논문에서는 CDMA2000-1X 이동통신 시스템의 망 구조 및 특징을 분석하고, 각 서비스 제공 방안 분석을 통하여 차세대 이동통신망에서의 효율적인 망 구성방안의 기초자료로 도출하며, 3세대 이동통신망의 차세대 이동통신망으로의 진화 전략과 아울러 망 진화를 위하여 요구되는 핵심기술 등을 분석하였다.

  • PDF