• Title/Summary/Keyword: 음성전달

Search Result 485, Processing Time 0.033 seconds

듀얼모드 통신 지원 임베디드 리눅스 기반의 모바일 이야기꾼 설계 및 구현 (Design and Implementation of Embedded Linux-based Mobile Teller which supports CDMA and WiBro networks)

  • 김도형;윤민홍;이경희;이철훈
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.131-138
    • /
    • 2008
  • 본 논문에서는 음성통화를 위해 CDMA 네트워크와 데이터 통신을 위해 와이브로 네트워크를 동시에 사용하는 최초의 임베디드 리눅스 기반 듀얼모드 응용 서비스인 모바일 이야기꾼의 구현에 대해서 기술한다. 현재 와이브로 상용 서비스와 함께 두 개의 이종 네트워크를 지원하는 단말이 출시되었지만, 이들 네트워크를 효과적으로 사용하여 사용자에게 보다 나은 서비스를 제공할 수 있는 응용 서비스의 개발은 미비한 실정이다. 모바일 이야기꾼은 사용자가 듀얼모드 지원 단말에서 텍스트를 입력하면, 와이브로 네트워크를 통해 인터넷 상의 TTS 서버로 전달한다. TTS 서버는 전달된 텍스트를 음성으로 변환하고, 변환된 음성 데이터를 듀얼모드 지원 단말로 다시 전달한다. 듀얼모드 지원 단말은 수신된 음성 데이터를 CDMA 네트워크를 통해 수신자에게 전송하게 된다. 구현된 모바일 이야기꾼은 주위가 시끄러운 환경이나 언어 장애가 있는 사람도 CDMA를 통한 음성 통화를 가능하게 한다.

MIL-STD-220C를 이용한 무전기에서 효율적인 VoIP 통신을 위한 패킷 크기 산출 및 전달 방법 (A method to compute the packet size and the way to transmit for the efficient VoIP using the MIL-STD-188-220C Radio)

  • 한주희
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.161-167
    • /
    • 2008
  • 본 논문에서는 여러 대의 무전기간에 음성 및 데이터 정보를 원활하게 송수신 해 주는 전술 무선 이동 Ad-hoc 프로토콜인 MIL-STD-188-220C를 이용하여 VoIP통신을 하기 위한 패킷 크기 산출 및 전달 방법에 대해 연구하였다. 먼저 예상 데이터 전송시간을 산출한 후 사용자 입장에서의 VoIP 음성 품질과 무전기에서의 데이터 전송품질 요구수준을 동시에 고려하여 음성 패킷 길이 결정 및 패킷 전달 방법을 제시하였다. 전송 속도가 36Kbps인 무전기에서의 VoIP통신의 경우에는 90ms 재전송 패킷과 90ms 샘플링 패킷을 모아 짧은 프레임으로 전송하는 방법이 효율적이고, 36Kbps 이상의 경우에는 샘플링 패킷들을 1초 이상 모아서 전송 후 필요에 따라 재전송을 요청하는 방법을 고려할 수 있었다.

  • PDF

상대전달함수의 역필터링을 이용한 자동차 환경에서의 마이크로폰 어레이 빔형성 기법 (A Microphone Array Beamforming Algorithm with Inverse Filtering of Relative Transfer Functions in Car Environments)

  • 강홍구;황영수;윤대희;한철희
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.30-35
    • /
    • 2006
  • 본 논문에서는 상대전달함수의 역필터링 (inverse-filtering) 전처리를 수행한 후 MVDR (Minimum-Variance Distortionless Response) 빔형성기나 GSC (Generalized Sidelobe Canceller)를 수행하는 방법을 제안하였다. 제안된 방법은 기존의 RTF-MVDR 및 TF-GSC 보다 적은 계산량을 갖으며 최적해 측면에서 동등함을 보였다. 제안된 방법의 성능을 평가하기 위하여 자동차 환경에서 녹음된 음성 데이터베이스와 HTK를 이용하여 음성인식 실험을 수행하였다. 그 결과, 제안된 방법은 기존의 방법과 대등한 성능을 갖거나 적은 성능저하를 보였다.

RFID기반의 다채널 음성 안내 시스템에 관한 연구 (A Study on Multi-Channel Voice Guide System based on RFID)

  • 조용철;이종석;이두용;한운수;이창호
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2008년도 춘계학술대회
    • /
    • pp.361-366
    • /
    • 2008
  • 본 연구는 최근 산업 전반에 걸쳐 도입이 확산되고 있는 RFID(Radio Frequency IDentification)기술과 다채널 음성 전달 서비스 기술을 활용하여, 유비쿼터스 환경에서의 SP(Sales Promotion) 광고를 효과적으로 전달하기 위한 새로운 SP광고용 RFID기반의 다채널 음성 안내시스템을 개발함으로서, 향후 RFID/USN시장을 선점할 수 있는 고부가가치의 신규 미디어 서비스 모델을 제안하고자 한다.

  • PDF

음성 인터페이스 STT(Speech to Text)를 활용한 동영상 스트리밍 자막 강조 시스템 (Subtitle Highlighting System for Video Streaming using Speech Interface STT (Speech to Text))

  • 이강찬;조대수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.567-568
    • /
    • 2021
  • 자막은 자막을 볼 수 있는 모든 사람들의 정보전달, 의사소통을 할 수 있는 유용한 도구로 사용 되고 있지만 자막은 평범한 텍스트로 있어 자막에서 강조된 부분, 감정 등을 전달 할 수 없다는 단점을 가지고 있다. 그러므로 청각 장애인들은 해당 컨텐츠의 감정, 강조 되는 부분을 알 수 없어 대화의 숨은 의미가 다른 방향으로 이해 할 수 있다는 위험성을 가지고 있다. 본 논문에서는 음성을 텍스트로 변환하는 STT(Speech To Text)를 이용하여 동영상 스트리밍 서비스를 실시간으로 음성을 텍스트로 변환과 동시에 강조하는 부분까지 개발하여 청각장애인 입장에서 기존 자막보다 효율적인 시각적 효과를 주는 미디어 접근을 위한 동영상 스트리밍 자막 서비스를 개발하고자 한다.

  • PDF

전력선을 이용한 음향전달 시스템의 구성 및 특성 분석 (Analysis of Sound Transmitting System using Power line Communication Technique)

  • 김호수;이명섭;구경완;한상옥
    • 조명전기설비학회논문지
    • /
    • 제18권3호
    • /
    • pp.128-134
    • /
    • 2004
  • 본 연구에서는 전력선통신 기술을 이용하여 전송주파수에 음성신호를 변조한 후 전력선으로 전송하고 전력선으로부터 수신 및 복조하여 변조된 음성신호를 검출하는 음향전달 시스템을 제작하였다. 제작된 시스템으로부터 변복조 및 주파수 특성을 분석하여, 어학실습 교육을 위한 용도로서의 활용 가능성을 평가하였다. 그 결과 전달된 음향 신호가 최적상태는 아니지만 어학실습 교육용으로 청취하기에 충분한 수준으로 판단되었다.

RSS와 VoiceXML을 이용한 실시간 뉴스 서비스의 구현 (An Implementation of Realtime News Service Using RSS and VoiceXML)

  • 권형준;김동규;홍광석
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2006년도 하계 학술대회 논문집
    • /
    • pp.9-12
    • /
    • 2006
  • 높은 컴퓨터 보급률에 따른 인터넷의 대중화로 인하여 새로운 소식을 원하는 사람들은 기존의 정해진 시각에 전달되는 지면 신문보다 인터넷을 통해 새로운 소식을 접하는 경향이 높아지면서, 국내의 각 언론사들은 RSS(RDF Site Summary)문서를 제공하기 시작하였다. 차세대 웹인 시맨틱 웹의 여러 가지 규격 및 기술 중에서도 그 유용함과 편리성을 인정받아 우리 생활에 가장 먼저 적용되고 있는 RSS는 컨텐츠 배급을 위해 나온 XML형태의 규격 중 하나로서 웹사이트에서 사용자가 원하는 정보의 갱신된 내용을 신속하게 사용자에게 전달하는 자동 정보 수집 기술이다. 본 논문에서는 특정 언론사에서 제공하는 RSS문서에 음성인식 및 합성기술을 기반으로 동작하는 다른 XML형태의 규격인 음성 확장성 생성 언어(VoiceXML)를 접목하여 휴대전화 및 유선전화로 새로운 뉴스를 접할 수 있는 서비스를 제안하고 구현하였다. 실험 결과, 시간과 장소에 구애받지 않고 신뢰성 있는 언론사의 새로운 뉴스를 실시간으로 전달받을 수 있음을 확인하였다.

  • PDF

Bluetooth Low Energy 환경에서 에너지 효율을 위한 Nack 기반 Broadcast 전송 기법 연구 (An Energy-Efficient Broadcast Method based on Nack Mechanism for Bluetooth Low Energy Environment)

  • 정연성;손봉기;이재호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.457-459
    • /
    • 2015
  • Bluetooth Low Energy 기술은 IoT 환경의 개인 영역 통신 시스템의 발달과 함께 저전력 근거리 통신 기술의 대표되는 기술로써 현재까지 에너지 효율을 우선시하여 개발되어 왔다. 하지만 홈 네트워크 환경이나 공공지역에서 서비스되는 음성안내 등의 환경에서 Bluetooth Low Energy 기술이 적용될 경우 Broadcast 형태의 음성 데이터 전달이 요구될 수 있으며, 이 경우 Bluetooth Low Energy를 포함한 대부분의 저전력 근거리 통신 기술에서는 Duty Cycle 등의 에너지 고효율 정책으로 인하여 Broadcast 데이터 수신에 대한 신뢰성이 보장되기 힘들기 때문에, 보편적으로 n-repetition 방식의 데이터 전달 방식을 적용하고 있다. 본 고에서는 이러한 n-repetition 방식의 데이터 전달에 대한 중복 송신에서 발생되는 에너지 소모를 개선시키고자 Nack 기반의 선택적 재전송 형태의 새로운 Broadcast 기법을 제안하며, 실험을 통하여 이에 대한 효율성을 검증하였다.

라즈베리 파이 기반의 음성 감정 분석 시스템을 통한 감성적 이미지 색상 전달 (Emotional Image Color Transfer via Voice Emotion Analytics System Based on Raspberry Pi)

  • 김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제59차 동계학술대회논문집 27권1호
    • /
    • pp.391-393
    • /
    • 2019
  • 본 논문은 일상적인 대화로부터 감성을 추출하고 분석함으로써 상황에 맞는 대화의 내용과 분위기를 이미지의 색상으로 표현할 수 있는 이미지 색상 변환 프레임워크를 소개한다. 본 연구는 라즈베리 파이와 마이크 센서를 기반으로 사용자로부터 목소리를 입력받을 수 있는 모듈을 제작하고, 그 목소리로부터 감성을 분석한다. 분석된 감성을 이용하여 이미지의 색상을 자동으로 변환하는 기술과 통합함으로써 청각장애인 및 미취학 아동들이 화자의 대화를 이미지를 통해 쉽게 인지하여 의사소통 및 감성 전달 환경을 개선하고자 한다.

  • PDF

최적 분류 변환을 이용한 음성 개성 변환 (Voice Personality Transformation Using an Optimum Classification and Transformation)

  • 이기승
    • 한국음향학회지
    • /
    • 제23권5호
    • /
    • pp.400-409
    • /
    • 2004
  • 본 논문에서는 임의의 화자가 발성한 음성을 다른 화자가 발성한 음성처럼 들리도록 변환하는 음성 변환 알고리즘을 제안하였다. 개인이 지니고 있는 음성의 특성을 변환하기 위해 성도 전달 함수의 특성을 변환 변수로 사용하였으며, 기존의 기법과 비교하여 목표 화자의 음성과 주관적, 객관적으로 더욱 유사한 변환음을 얻기 위한 새로운 방법을 제안하였다. 성도 전달 함수의 변환은 전체 특징 벡터 공간을 분류 한 뒤, 각 구획에 대한 선형 변환식을 통해 구현된다. 특징 변수로서 LPC 켑스트럼을 사용하였으며, 벡터 공간의 분류와 선형 변환식의 추정을 동시에 최적화시키는 분류-변환 알고리즘이 새로이 제안되었다. 제안된 음성 변환 기법의 성능을 평가하기 위해 3명의 남성 화자와 1명의 여성 화자로부터 수집된 약 150개의 문장을 사용하여 변환 규칙을 생성하였으며, 이를 동일한 화자가 발성한 다른 150개의 문장에 대해 적용하여 객관적인 성능 평가와 주관적 청취 테스트를 수행하였다.