• 제목/요약/키워드: 음성신호

검색결과 1,513건 처리시간 0.034초

커널 백피팅 알고리즘 기반의 가중 β-지수승 최소평균제곱오차 추정방식을 적용한 보컬음 분리 기법 (Vocal separation method using weighted β-order minimum mean square error estimation based on kernel back-fitting)

  • 조혜승;김형국
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.49-54
    • /
    • 2016
  • 본 논문에서는 커널 백피팅 알고리즘에 가중 ${\beta}$-지수승 최소평균제곱오차 추정방식(weighted ${\beta}$-order minimum mean square error: WbE)을 적용한 보컬음 분리 방식에 대해 제안한다. 음성 향상 방식에서, WbE는 진폭 성분 기반 MMSE(Minimum Mean Square Error) 추정방식, 로그 스펙트럼 진폭 기반 MMSE 추정방식 등과 같은 기존의 베이지안(Bayesian) 기반의 추정방식들 보다 객관적 및 주관적 측면에서 모두 보다 높은 성능을 나타내는 방식으로 잘 알려져 있다. 이에 본 논문에서는 기본적인 반복적 커널 백피팅 알고리즘에 WbE를 적용하여 음악 신호에서의 보컬음 분리 성능을 향상시키고자 하였다. 실험결과는 본 논문에서 제안한 방식이 기존의 분리 방식보다 분리 성능이 더 뛰어나다는 것을 보인다.

Embedded Linux 시스템 설계 및 구현에 관한 연구 (A Development and Design of Embedded Linux System)

  • 유임종;고성찬
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.129-132
    • /
    • 2003
  • 본 논문에서는 실시간 운영체제하에 가전제품 및 간단한 통신모듈로 최근 많이 응용되고 있는 StrongArm SA110을 메인 CPU로 하여 정보통신 분야에 적용될 수 있는 VoIP분야 중 RTP를 통한 음성데이터의 통신 Embedded Linux 시스템의 설계 및 구현에 관한 내용을 언급한다. 본 논문에서는 하드웨어 측면으로 임베디드 리눅스 CPU 개발 Toolkit인 타이눅스 박스II를 이용하여 VoIP 시스템을 구성하였으며, VoIP 소프트웨어 처리부분으로는 실시간 전송 프로토콜인 RTP를 이용해 설계 구현하였다. 본 논문의 개발환경은 타겟보드와 개발용 리눅스 PC간 연결 인터페이스를 위한 RS-232C의 직렬 접속, USB 접속, Ethernet LAN 접속 연결로 구성하였다. RS-232C는 직렬 접속으로 개발용 리눅스 PC의 터미널 에뮬레이션을 위한 콘솔로 사용하였다. VoIP 통신을 위한 환경은 ADC/DAC 변환부를 통해 아날로그 신호를 디지털로 변화시키고 PCM 압축하도록 구성되어야 하나 wave 파일로 대체하여 사용하였고, 양측간의 통신을 위한 연결 설정부는 VoIP를 위한 H.323이나 SIP에서 필요한 Gatekeeper나 Network Server를 단말 양측간 소켓통신으로 본 과정을 대체 하였다. 본 논문에서는 VoIP 시스템의 운용 중 일반적 기술에 관한 것을 언급하였고 임베디드 리눅스 개발보드를 이용하여 RTP 프로토콜의 동작하는 메커니즘을 중점적으로 기술하였다.

  • PDF

남녀 성별인식을 위한 음성 특징벡터의 비교 (Comparison of Characteristic Vector of Speech for Gender Recognition of Male and Female)

  • 정병구;최재승
    • 한국정보통신학회논문지
    • /
    • 제16권7호
    • /
    • pp.1370-1376
    • /
    • 2012
  • 본 논문에서는 남성화자 혹은 여성화자인지를 구분하는 성별인식 알고리즘을 제안한다. 본 논문에서는 남성화자와 여성화자의 특징벡터를 분석하며, 이러한 남녀의 특징벡터를 이용하여 신경회로망에 의한 제안한 성별인식에 대한 인식실험을 수행한다. 신경회로망의 입력신호로 사용한 특징벡터로는 10차의 LPC 켑스트럼 계수, 12차의 LPC 켑스트럼 계수, 12차의 FFT 켑스트럼 및 1차의 RMS, 12차의 LPC 켑스트럼 및 8차의 FFT 스펙트럼들이다. 본 실험에서는 특히 12차의 LPC 켑스트럼 및 8차의 저역 FFT 스펙트럼의 특징벡터를 사용하여 20-20-2의 네트워크에 의하여 신경회로망이 학습되었다. 실험결과, 남성화자에 대하여 학습 시에는 평균 99.8%, 여성화자에 대해서는 평균 96.5%의 성별인식률이 구해졌다.

공공서비스 로봇의 의인화에 관한 사용자 선호 (User Preference for the Personification of Public Service Robot)

  • 김반석;김승인
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.361-366
    • /
    • 2020
  • 본 연구는 사람들의 선호를 조사하여 공공서비스 로봇에 의인화가 어떻게 적용돼야 할지 알아보는 연구이다. 공공장소에서 서비스를 제공하는 공공서비스 로봇이 도입되고 있으며 이는 앞으로도 증가할 전망이다. 적절하게 의인화된 로봇은 사용자 경험을 증진하는 효과가 있지만 지나치게 인간과 흡사한 로봇은 불쾌감을 느끼게 한다. 이에 따라 공공서비스 로봇에 요구되는 의인화 적용 기준을 마련하는 것이 필요하다. 이를 위해 설문조사와 심층 인터뷰를 진행하였다. 분석 결과 사람들은 로봇에 언어적 상호작용을 선호하며 음성의 적절한 나이는 20~30대이다. 로봇에 생체 신호는 나타나지 않는 것이 바람직하며 개인에 맞춤화된 서비스에 대한 요구가 있다는 것을 알게 되었다. 본 연구를 통해 사용자 경험을 높이는 공공서비스 로봇 디자인에 기여할 것으로 기대한다.

MIMO 부분간섭 채널에서 멀티미디어 서비스를 위한 무선 네트워크의 성능 (Performance of Wireless Network for Multimedia Services in MIMO Partial Band Channel)

  • 노재성;조성준;김춘길
    • 디지털콘텐츠학회 논문지
    • /
    • 제6권3호
    • /
    • pp.137-142
    • /
    • 2005
  • CDMA 방식은 미래의 모바일 네트워크를 위한 다중접속 방식으로 많은 주목을 받고 있으며 높은 무선 용량과 유연한 데이터 전송에 대한장점을 가지고 있다. 그리고 CDMA방식은 실시간 음성 및 비실시간 데이터 서비스를 제공하는 차세대 멀티미디어 시스템 분야에서 ITU에 제안된 주요 기술이다. 본 논문에서는 무선 채널에서 다중 접속 간섭 및 부분 대역 간섭의 제거와 시스템 채널 용량의 증가를 위해 MIMO-MC/CDMA 시스템의 용량을 평가하였다. 최근에 스펙트럼 효율과 링크의 신뢰도를 증가하기 위하여 다중경로를 이용하는 MIMO 방식이 제안되고 있다. 특히, 본 논문에서는 MIMO-MC/CDMA시스템의 채널 용량을 Eb/No, Mc, p, B에 따라서 평가하였다. 얻어진 결과로부터 채널용량을 개선하기 위해서는 신호의 요소들은 서로 무상관이어야하며 만약 부적당한 공간에 의한 상관과 부분 대역 간섭에 의한 주파수 간섭이 발생하만 MIMO-MC/CDMA 시스템의 채널 용량은 상당히 감소하게 됨을 알 수 있었다.

  • PDF

환경별 사용자 피팅이 가능한 스마트폰 보청기 어플리케이션 개발 (Development of Smart Phone Application with User Fitting for Hearing Impaired in Various Environment)

  • 이강;강상익;박규석;이상민
    • 재활복지공학회논문지
    • /
    • 제9권2호
    • /
    • pp.121-128
    • /
    • 2015
  • 본 논문에서는 보청기 사용자가 본인의 청력손실도를 청력검사를 통해 스스로 측정하여 보청기/이어폰에 피팅이 가능한 어플리케이션을 개발하였다. 개발된 어플리케이션은 청력검사와 피팅을 통한 증폭 기능을 동시에 제공한다는 점에서 청력검사 기능 혹은 증폭 기능만 갖춘 기존의 어플리케이션들과 차이점이 있다. 개발된 어플리케이션의 청력검사는 기본검사와 정밀검사를 제공하며, 두 검사 모두 순음청력검사방법을 사용하여 6개의 주파수에서 청력손실도를 측정한다. 기본검사는 난청인의 청력손실도 경향을 이용하여 검사 과정을 단축시킴으로써 짧은 검사 시간을 제공하며, 정밀검사는 모든 주파수 영역에서 이중 확인을 통해 보다 정확한 결과를 제공한다. 청력검사의 결과로 얻은 주파수별 청력손실도를 기반으로 음성 명료도를 높이기 위해 입력신호는 보청기 피팅 방법 중 하나인 NAL-NL1 방법을 통하여 증폭된다. 또한 환경설정기능을 통하여 저장된 설정 값을 불러와 바로 적용할 수 있는 기능을 제공한다. 이처럼 개발된 어플리케이션은 사용자 스스로 피팅 과정을 진행할 수 있기에 피팅을 위해 주기적으로 병원이나 전문센터를 방문하였던 기존의 불편함을 간편화하여 보청기를 사용하는 난청인의 수를 증가 시킬 것으로 전망된다.

  • PDF

인지 무선 기반 애드 혹 네트워크에서의 클러스터 헤드 선정기법 (Cluster-head Decision Method for Cognitive Radio Based on Wireless Ad-hoc Network)

  • 이경선;김윤현;김진영
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권1호
    • /
    • pp.91-96
    • /
    • 2012
  • Ad-hoc 네트워크는 음영지역, 재난지역, 전쟁 시와 같은 통신 인프라가 구축되기 어려운 상황에서 유용하게 사용 될 수 있다. 그러나 음성 및 데이터 서비스 등과 같은 무선 서비스의 제공을 위해 많은 양의 네트워크 용량이 필요하게 되지만 기존의 제한된 주파수 자원에 따른 주파수 부족 상황 및 주파수 자원정책의 규제에 따라 원활한 주파수 사용이 어려운 상황이다. 이에 따라 높은 주파수 활용을 제공하는 인지 무선 시스템을 ad-hoc 네트워크에 적용하여 보다 다양하고 확장된 네트워크 서비스를 제공할 수 있다. 하지만 인지무선 기반 ad-hoc 네트워크에서 1차 사용자의 센싱 정보를 취합해서 1차 사용자의 존재 유무를 판단하는 클러스터 헤드의 선정에 대한 연구는 아직 미비한 상태이다. 따라서 본 논문에서는 인지 무선 기반 ad-hoc 네트워크 시스템에서 각 ad-hoc 단말기내의 클러스터 헤드 선정 방법과 그에 따른 신호 검출 성능을 보여준다.

지상파 DMB 고도화 망에서의 스케일러블 비디오 부호화 기술 (Method of scalable video application in the advanced T-DMB)

  • 전동산;곽상민;임형수;최해철;김재곤;임종수;홍진우
    • 대한전자공학회논문지TC
    • /
    • 제44권1호
    • /
    • pp.1-9
    • /
    • 2007
  • 디지털 멀티미디어 방송(DMB: Digital Multimedia Broadcasting)은 음성, 영상, 데이터와 같은 다양한 멀티미디어 신호를 디지털 방식으로 변조하여 이동 중에 방송을 청취 할 수 있는 차세대 디지털방송 서비스이다. 하지만 한정된 대역폭으로 인한 비디오 전송율의 한계에 따라 최대 CIF(Common Interleaved Frame)급 화면해상도까지 서비스가 가능하다. 지상파 DMB 전송 고도화 망에서는 계층 변조(Hierarchical Modulation) 전송 기법을 통하여 추가의 전송대역폭을 확보할 수 있으며, 스케일러블 비디오 코딩(Scalable Video Coding) 부호화 방식을 이용하여 고전송효율/고품질의 이동 멀티미디어 방송서비스를 제공할 수 있다. 본 논문에서는 기존의 지상파 DMB가 제공할 수 있는 품질 및 기능을 뛰어넘어, 고품질의 이동 멀티미디어 방송서비스가 가능한 지상파 DMB 전송고도화 망에서의 스케일러블 비디오 적용 방법을 제안한다.

다중 센서 융합 알고리즘을 이용한 사용자의 감정 인식 및 표현 시스템 (Emotion Recognition and Expression System of User using Multi-Modal Sensor Fusion Algorithm)

  • 염홍기;주종태;심귀보
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.20-26
    • /
    • 2008
  • 지능형 로봇이나 컴퓨터가 일상생활 속에서 차지하는 비중이 점점 높아짐에 따라 인간과의 상호교류도 점점 중요시되고 있다. 이렇게 지능형 로봇(컴퓨터) - 인간의 상호 교류하는데 있어서 감정 인식 및 표현은 필수라 할 수 있겠다. 본 논문에서는 음성 신호와 얼굴 영상에서 감정적인 특징들을 추출한 후 이것을 Bayesian Learning과 Principal Component Analysis에 적용하여 5가지 감정(평활, 기쁨, 슬픔, 화남, 놀람)으로 패턴을 분류하였다. 그리고 각각 매개체의 단점을 보완하고 인식률을 높이기 위해서 결정 융합 방법과 특징 융합 방법을 적용하여 감정 인식 실험을 하였다. 결정 융합 방법은 각각 인식 시스템을 통해 얻어진 인식 결과 값을 퍼지 소속 함수에 적용하여 감정 인식 실험을 하였으며, 특징 융합 방법은 SFS(Sequential Forward Selection) 특징 선택 방법을 통해 우수한 특징들을 선택한 후 MLP(Multi Layer Perceptron) 기반 신경망(Neural Networks)에 적용하여 감정 인식 실험을 실행하였다. 그리고 인식된 결과 값을 2D 얼굴 형태에 적용하여 감정을 표현하였다.

촉각 인터페이스를 이용한 시각장애인 보행보조 시스템 (Walking Aid System for Visually Impaired People by Exploiting Touch-based Interface)

  • 이지은;오유수
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.522-525
    • /
    • 2015
  • 본 논문에서는 촉각의 자극으로 장애물 위치를 파악하는 시각 장애인용 경로안내 및 보행보조 시스템을 제안한다. 제안된 시스템은 시각장애인의 보행보조를 위한 촉각기반 장애물 감지 모듈과 장애물 높이 인지 모듈, 그리고 장애물 회피를 위한 경로안내 알고리즘으로 구성된다. 촉각기반 장애물 감지 모듈은 서보 모터의 회전력으로 시각장애인의 엄지를 자극하여 좌 우 전방에 위치한 각각의 장애물을 감지한다. 장애물 높이 인지 모듈은 선형 배치된 초음파 센서들로부터 감지된 데이터를 통합하여, 장애물의 높이를 상 중 하 3단계로 구별한다. 제안된 시스템의 경로안내 알고리즘은 스마트 폰에 내장된 GPS 수신기의 신호로 현재 위치 값을 갱신하여 시각장애인에게 최적화된 맞춤형 경로를 안내한다. 또한, 설계된 경로안내 알고리즘은 시각장애인용 경로안내 앱과 블루투스로 연동하여 시각장애인에게 음성으로 정보를 전달한다. 제안된 시스템은 불확실한 경로를 탐색하여 장애물 배치 상황에 맞도록 회피 경로를 생성함으로써 시각장애인의 보행을 도울 것이다.

  • PDF