• 제목/요약/키워드: Digital Voice

검색결과 384건 처리시간 0.04초

음성 인터페이스를 위한 사용자 성격 관련 담화분석 (Conversation Analysis based on User-Personality Traits for Voice User Interface)

  • 김진국;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.341-343
    • /
    • 2011
  • 이번 연구에서는 음성신호로부터 성격을 자동으로 인식하는 성격 인식 사용자 인터페이스에 대한 기술을 소개한다. 사용자의 음성대화 과정에서 말투로부터 성격 인식, 특히 외향과 내향을 구분해 내기 위해 사용되는 행동패턴에 있어서 대화중에 발생하는 생각을 위한 시간의 할애를 기초한다. 이를 바탕으로 질문이 주어진 후 이에 대한 답변을 시작하는데 걸리는 시간, 그리고 대화의 중간에 생각할 시간을 갖기 위해 활용하는 언어 주저형의 빈도수를 고려하여 사용자 성격분류의 실험을 실시하였다. 그 결과 평균적으로 약 65%의 성공률을 보였다.

The Impact of Audiovisual Elements on Learning Outcomes - Focusing on MOOC -

  • Li Meng;Hong, Chang-kee
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제16권3호
    • /
    • pp.98-112
    • /
    • 2024
  • As digital education progresses, MOOC (Massive Open Online Courses) are increasingly utilized by learners, making research on MOOC learning outcomes a necessary endeavor. In this study, we systematically investigated the impact of audiovisual elements on learning outcomes in MOOC, highlighting the nuanced role these components play in enhancing educational effectiveness. Through a comprehensive survey and rigorous analysis involving descriptive statistics, reliability metrics, and regression techniques, we quantified the influence of text, graphics, color, teacher images, sound effects, background music, and teacher's voice on learner attention, cognitive load, and satisfaction. We discovered that background music and text layout significantly improve engagement and reduce cognitive burden, underscoring their pivotal role in the instructional design of MOOC. We findings contribute new insights to the field of digital education, emphasizing the critical importance of integrating audiovisual elements thoughtfully to foster better learning environments and outcomes. Not only advances academic understanding of multimedia learning impacts but also offers practical guidance for educators and course designers seeking to enhance the efficacy of MOOC.

모바일 O2O 커머스 지속이용의도에 영향을 미치는 전화 불안감에 관한 연구 (A Study on the Influence of Telephone Apprehension Affecting Continuous Use Intention of Mobile O2O Commerce)

  • 이경락;김미성;이상준
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권4호
    • /
    • pp.661-671
    • /
    • 2018
  • 젊은 세대의 음성 통화 회피 성향은 메시징을 사용하는 모바일 O2O 서비스의 성장을 촉진한다. 이 연구는 전화불안감을 O2O에 적용하기 위해 전화 불안에 대한 원래의 개념을 채택하고 정교화했다. 서비스 품질의 편재성 및 커뮤니케이션 능력과 불안감에 관련한 선행연구를 검토하였고, 모바일 O2O 서비스 이용자들의 의식을 파악하고자 설문조사를 실시하였다. 결과는 메시지 친밀도가 높은 사용자와 조리성이 부족하다고 느끼는 사용자는 음성 통화를 두려워하는 것으로 나타났다. 불안한 특정 상황을 대체할 수 있는 수단으로 모바일 O2O 서비스를 유용하다고 여기는 것이다. 본 연구는 O2O 모바일 서비스 기술 수용 요인에 있어서 개인의 특성을 고려하였고, 현 시대 상황을 반영한 전화 불안감 특성을 확장한 새로운 시도였다고 할 수 있다. 또한 불안감과 유용성이나 지속이용의도의 선행연구 관계와 다른 결과를 도출한 점에서 의의가 있다.

멀티펄스의 위치보정 방법을 이용한 8kbps PC-MPC에 관한 연구 (A Study on 8kbps PC-MPC by Using Position Compensation Method of Multi-Pulse)

  • 이시우
    • 디지털융복합연구
    • /
    • 제11권5호
    • /
    • pp.285-290
    • /
    • 2013
  • 유성음원과 무성음원을 사용하는 멀티펄스 음성부호화 방식에 있어서, 대표구간의 멀티펄스를 사용하는 경우에 유성음의 합성음성파형에서 일그러짐이 나타난다. 이것은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성신호가 정규화되는 것이 원인으로 작용한다. 이것을 해결하기위하여 본 논문에서는 피치구간마다 멀티펄스의 위치를 보정하는 방법(PC-MPC)을 제시하였으며, 기존의 MPC와 멀티펄스 위치를 보정한 PC-MPC의 $SNR_{seg}$를 평가한 결과, PC-MPC의 남자음성에서 0.4dB, 여자음성에서 0.5dB 개선된 것을 확인할 수 있었다. 결국, MPC에 비해 PC-MPC의 $SNR_{seg}$가 개선되어 음성파형의 일그러짐을 제어할 수 있었으며, 본 방법은 셀룰러폰이나 스마트폰과 같이 Low Bit Rate의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

Low Bit Rate을 고려한 8kbps FBD-MPC 방식에 관한 연구 (A Study on 8kbps FBD-MPC Method Considering Low Bit Rate)

  • 이시우
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.271-276
    • /
    • 2014
  • 유성음원과 무성음원을 사용하는 음성부호화 방식에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 음질저하현상이 나타난다. 본 연구에서는 연속음성에서 무성자음을 포함한 천이구간을 탐색, 추출하고 주파수대역에서 근사합성하는 8kbps의 멀티펄스 음성부호화 방식(FBD-MPC)를 제안하였다. 기존의 8kbps MPC와 FBD-MPC의 SNRseg를 평가한 결과, FBD-MPC의 남자음성에서 0.5dB, 여자음성에서 0.2dB 개선된 것을 확인할 수 있었다. 결국, MPC에 비해 FBD-MPC의 SNRseg가 개선되어 음성파형의 일그러짐을 제어할 수 있었으며, 본 방법은 셀룰러폰이나 스마트폰과 같이 Low Bit Rate의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.

고성능 DSP를 이용한 톤 송수신기의 실시간 구현 (Real-time Implementation of a Tone Sender/Receiver on a High Performance DSP)

  • 최용수;함정표;조성범;강태익;윤정현
    • 한국음향학회지
    • /
    • 제22권4호
    • /
    • pp.276-285
    • /
    • 2003
  • 본 논문에서는 고성능 DSP (Digital Signal Processor)를 사용하여 R2MFC/DTMF (R2 Multi Frequency Combinations/Dual Tone Multiple Frequency) 톤 송수신기를 실시간 구현하여 대용량 VoIP (Voice over Internet Protocol) 게이트웨이 시스템에 적용한다. 수신기는 Goertzel 필터를, 송출기는 고조파 공명 필터를 이용한다. DMA (Direct Memory Access)와 McBSP(Multi Channel Buffered Serial Port)를 사용한 효과적인 PCM 입출력, HPI (Host Port Interface)를 통한 MPU (Main Processing Unit)와의 메시지 통신 등 Texas Instruments TMS320C62x DSP를 이용한 다채널 실시간 구현 기법에 관하여 상세히 기술한다. 실험 결과, 구현된 R2MFC/DTMF 송수신기는 ITU-T(International Telecommunication Union-Telecommunication) 조건을 만족하며, 최적화 된 코드는 250 ㎒ C62x에서 780 채널을 수용할 수 있는 계산량을 보였다.

16 비트 고정 소수점 DSP를 이용한 다채널 G.729A음성 부호화기의 실시간 구현 (Real-time Implementation of a Multi-channel G.729A Speech Coder on a 16 Bit Fixed-point DSP)

  • 안도건;유승균;최용수;이재성;강태익;박성현
    • 한국음향학회지
    • /
    • 제19권4호
    • /
    • pp.45-51
    • /
    • 2000
  • 본 논문에서는 16 비트 고정 소수점 DSP(Digital Signal Processor)를 사용하여 다채널 G.729A 음성 부호화기를 실시간 구현하였으며, 실제로 음성 사서함 서비스(Voice Mailing Service: VMS) 시스템에 응용하였다. DSP는 TI(Texas Instruments)사의 TMS320C549 칩을 사용하였으며, 구현된 G.729A음성 부호화기는 채널 당 부호화기에 14.5 MIPS를, 복호화기에 3.6 MIPS를 소요하였으며, 메모리는 코드 부분에 9.88 K 워드, 데이터 부분에 1.69 K 워드를 필요로 하였다. 결과적으로 개발된 VMS 시스템에는 두 개의 DSP를 사용하여 DSP 당 4 채널씩 총 8 채널을 수용하였다. 실험 결과, 구현된 다채널 부호화기는 ITU-T에서 제공된 테스트 벡터 샘플을 모두 통과하는 일관된 성능을 보였다.

  • PDF

직무불안성성과 EVLN과의 관계에 있어서 조직방해인식의 매개효과에 관한 연구 (The research about mediating effect of perceived organizational obstruction in the relationship with job insecurity and EVLN)

  • 이은령
    • 디지털융복합연구
    • /
    • 제14권2호
    • /
    • pp.99-114
    • /
    • 2016
  • 본 연구의 목적은 직장인의 직무불안정성과 EVLN과의 관계를 확인하고 이 과정에서 조직방해인식의 매개 효과를 규명하는데 있다. 본 연구의 실증분석을 위해 직장인 및 온라인 설문조사 사이트를 통해 350명을 대상으로 설문조사가 실시되었으며, 본 연구의 결과를 요약하면 다음과 같다. 직무불안정성은 조직방해인식에 정(+)의 영향을 미치고, 직무불안정성과 조직구성원의 불만족 반응행동인 EVLN 중에 이직과 발언, 태만간의 관계에서 정(+)의 영향을 미치는 것으로 확인되었고, 충성심에는 유의한 영향을 미치지않는 것으로 나타났다. 또한 조직방해인식이 직무불안정성과 EVLN간에 매개효과를 분석한 결과 이직, 발언, 태만과의 관계에서 부분 매개효과를 보였다. 실무적 시사점은 직무불안정성이 높아진 최근 조직에서 구성원들에게 직무불만족 행동을 더욱 강화하는 매개변인으로서 조직방해인식이 중요하며 이에 대한 관리방안을 모색해야한다는 시사점을 제공한다.

PS-LTE 재난안전통신망에 관한 정책 연구 (A Study on the Public Safety Long Term Evolution Disaster Communication Network)

  • 강희조
    • 디지털콘텐츠학회 논문지
    • /
    • 제16권1호
    • /
    • pp.43-51
    • /
    • 2015
  • 국가재난안전통신망 구축사업 기술방식으로 공공안전 롱텀에볼루션(PS-LTE) 방식이 선정됐다. 이를 통해 2017년부터 경찰, 소방, 군 등 모든 재난안전 책임기관이 음성뿐 아니라 동영상 등 멀티미디어 정보를 활용해 구조활동을 벌일 수 있게 됐다. PS-LTE는 기존 LTE 기술에 그룹통화, 단말기 간 직접통신, 단독 기지국 기능 등이 추가된 방식이다. 지금까지 각 재난안전기관이 사용하던 통신기술은 음성만 전달할 수 있었다. PS-LTE 기술을 이용하면 멀티미디어 전송이 가능해진다. 본 논문에서는 해외 주요국에서 추진 중에 있는 광대역 공공안전통신정책 기술동향을 분석하고, 이를 통해 국내 광대역 공공안전통신 도입 시 고려해야 할 사항을 알아보았다.

프레임 단위의 AELMS를 이용한 잡음 제거 알고리즘 (Noise Reduction Algorithm using Average Estimator Least Mean Square Filter of Frame Basis)

  • 안찬식;최기호
    • 디지털융복합연구
    • /
    • 제11권7호
    • /
    • pp.135-140
    • /
    • 2013
  • 잡음 추정과 검출 알고리즘에서는 LMS Filter를 이용하여 변화하는 잡음 환경에 빠르게 적응할 수 있도록 한다. 하지만 LMS Filter는 잡음 추정을 위한 일정 시간 동안 적응 시간이 필요하며 신호의 변화가 일어날 경우 더 많은 적응 시간이 소요되는 단점을 가지고 있다. 따라서 이를 보완하기 위하여 프레임 단위의 AELMS Filter를 이용한 잡음 제거 방법을 제안한다. 본 논문은 잡음 환경에서 입력되는 신호를 프레임 단위로 분할하고 평균과 분산을 이용한 예측 LMS Filter를 구성하여 잡음을 제거하므로 잡음 환경이 변화하더라도 빠른 적응 시간으로 잡음을 제거한다. 또한 환경 잡음과 음성 신호가 혼합되어 입력될 때 잡음을 제거하여 음성의 고유 특성을 유지하고 음성 정보 손상을 줄이기 위한 방법이다. 프레임 단위의 AELMS Filter를 이용한 잡음 제거 방법으로 잡음 제거 성능을 평가하였다. 실험 결과 변화하는 환경 잡음을 제거하여 얻은 감쇠도가 평균 6.8dB 향상되었다.