• 제목/요약/키워드: voice search

검색결과 90건 처리시간 0.027초

HEEAS: 감정표현 애니메이션 알고리즘과 구현에 관한 연구 (HEEAS: On the Implementation and an Animation Algorithm of an Emotional Expression)

  • 김상길;민용식
    • 한국콘텐츠학회논문지
    • /
    • 제6권3호
    • /
    • pp.125-134
    • /
    • 2006
  • 본 논문은 음성이 인간에게 전달되어 나타나는 여러 가지 감정 표현 중에서 단지 4가지 감정 즉 두려움, 싫증, 놀람 그리고 중성에 대한 감정 표현이 얼굴과 몸동작에 동시에 나타내는 애니메이션 시스템인 HEEAS(Human Emotional Expression Animation System)를 구현하는데 그 주된 목적이 있다. 이를 위해서 본 논문에서는 감정 표현이 풍부한 한국인 20대 청년을 모델로 설정하였다. 또한 입력되어진 음성 신호를 통해서 추출된 감정표현에 대한 데이터를 얼굴코드와 몸동작코드를 부여하고 이를 데이터 베이스화 하여 실제 애니메이션 구현을 하기 위한 처리의 시간을 최소화하였다. 즉, 입력되어진 음성 신호를 이용해서 원하는 결과인 얼굴, 몸동작에 대한 자료를 이진 검색을 이용해서 데이터베이스에서 찾으므로 검색 시간을 최소화하였다. 실제 감정 표현에 대한문제들을 실험을 통해서 얻은 결과가 99.9%의 정확도임을 알 수가 있었다.

  • PDF

VoiceXML기반 EPG 검색 시스템 (A VoiceXML-based EPG Retrieval System)

  • 김한수;황인준
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제10권4호
    • /
    • pp.351-363
    • /
    • 2004
  • 최근 들어 디지털 방송의 본격적인 서비스 개시와 더불어 수많은 채널을 통한 TV 프로그램 방송이 가능하게 되었다. 이로 인해 시청자들은 더 이상 신문이나 TV 가이드와 같은 인쇄매체를 통한 방송 스케줄의 검색이 사실상 어렵게 되었다. 이 같은 문제점을 해결하기 위해 디지털 방송 환경에서는 시청자들에게 전자 프로그램 가이드(EPG: Electronic Program Guide)를 제공한다. 현재 대부분의 EPG 서비스는 디지털 TV 화면이나 각 방송사 웹사이트, 그리고 모바일 단말기에서 EPG 정보를 화면상에서 시각적으로 제공하는 측면에만 초점을 두고 있다. 하지만 이와 같은 EPG 서비스 방식은 검색을 위해 키워드를 직접 입력하기 어려운 운전자나 시각 장애인과 같은 사용자 그룹이 EPG 서비스를 이용할 수 없는 한계점을 지닌다. 따라서 본 논문에서는 모바일 폰을 이용하여 운전자나 시각 장애인과 같은 사용자 그룹도 편리하게 EPG 서비스를 검색할 수 있는 음성 EPG 검색 시스템을 제안하고 프로토타입 시스템의 구현 및 실험을 통해 효율성을 입증하였다.

회선 교환망에서 MFDL 경로를 이용한 Flood Search 알고리즘 (Flood Search Algorithm with MFDL Path in Circuit-Switched Networks)

  • 박영철;이상철;은종관
    • 한국통신학회논문지
    • /
    • 제18권3호
    • /
    • pp.360-371
    • /
    • 1993
  • Flooding 탐색 알고리즘은 고도의 생존성과 신뢰성이 있으므로 전술응용을 위한 효과적 라우팅 메커니즘이라고 알려져 있다. 그러나 망 효율성 측면에서는 큰 결점을 갖고 있다. 본 논문에서는 음성 트래픽에 대하여 최대 4개의 링크와 2개의 우선순위클래스를 갖는 전술 회선교환 격자망을 MFDL 경로기법을 사용하여 호설정시간 증가 및 알고리즘의 프로세서로딩없이 회선교환망의 블로킹 확률에 대한 성능개선 방법을 제안하였다.

  • PDF

대화 패턴 연구를 통한 스마트TV 음성 상호작용 모델의 탐구 (Examination of a Voice Interaction Model for Smart TV through Conversation Patterns)

  • 최진해
    • 한국콘텐츠학회논문지
    • /
    • 제17권2호
    • /
    • pp.96-104
    • /
    • 2017
  • 최근의 스마트 기기들은 사용자의 의도와 사용 맥락을 반영하는 지능형 에이전트의 형태로 발전하고 있으며, 기능을 더 쉽고 편리하게 활용할 수 있는 사용자 경험 설계가 경쟁력의 핵심이 되고 있다. 본 연구는 인간중심의 내추럴 인터랙션이 최적의 스마트TV 경험에 필수적이라는 전제하에 TV에 특화된 음성 인터랙션 방식을 탐구하고자 하였다. 사용자가 자연스러운 행태로 TV를 조작하는 모델을 구축하기 위하여 스마트TV의 주요 기능을 지능형 에이전트에 명령하도록 하였고 대화 패턴을 수집하였다. 수집된 문장은 CfA 모델에 대입하여 기능 실행을 위한 반응 별로 분류하였다. 분류된 5가지 대화 패턴은 스마트TV가 실행하는 기능 특성에 따라 '기능 실행'과 '정보 검색'으로 나눌 수 있었다. 사용자와 TV간의 음성 상호작용에서 모호한 요청의 경우 재확인을 위한 CfC1이 발생하고, 복합 의도나 조건부 요청에 대한 대응이 필요한 경우는 CfC2가 발생한다는 부분도 확인하였다. 본 연구의 결론은 스마트TV에서의 음성 UI 설계에서 Simple Request Type이 가장 효율적 모델이라는 점과 대화형 인터랙션은 가능한 사용자의 모호한 요청을 구체화하기 위한 단계에서만 활용되는 것이 적합하다는 것이다.

정보통신시장 유무선 통합서비스 도입과 기업 대응전략 (Strategies with the Introduction of fixed-mobile Convergence Services on the IT Market)

  • 송영화;류완화;김갑식
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제13권1호
    • /
    • pp.59-75
    • /
    • 2004
  • Fixed-mobile convergence services can be defined as the combination of previously separate fixed and mobile services, and networks and commercial practices. Examples of fixed-mobile convergence services include single voice-mail box, single number and unified messaging across fixed and mobile networks. Recently as more voice is transferred to mobile networks, convergence services between fixed and mobile become more important. In Korea convergence services are only starting to become established, and are likely to become an important part of any operator's offering. In this paper, we search the different levels of fixed-mobile convergence services and the trends and regulations for fixed-mobile convergence services in major countries. And at the same time, we also suggest the corresponding Marketing strategies by operators related to fixed-mobile convergence services.

  • PDF

상태변수 기반의 실시간 음성검출 알고리즘의 최적화 (Optimization of State-Based Real-Time Speech Endpoint Detection Algorithm)

  • 김수환;이영재;김영일;정상배
    • 말소리와 음성과학
    • /
    • 제2권4호
    • /
    • pp.137-143
    • /
    • 2010
  • In this paper, a speech endpoint detection algorithm is proposed. The proposed algorithm is a kind of state transition-based ones for speech detection. To reject short-duration acoustic pulses which can be considered noises, it utilizes duration information of all detected pulses. For the optimization of parameters related with pulse lengths and energy threshold to detect speech intervals, an exhaustive search scheme is adopted while speech recognition rates are used as its performance index. Experimental results show that the proposed algorithm outperforms the baseline state-based endpoint detection algorithm. At 5 dB input SNR for the beamforming input, the word recognition accuracies of its outputs were 78.5% for human voice noises and 81.1% for music noises.

  • PDF

QFD와 TRIZ의 통합에 의한 설계 단계에서의 창의적 문제 해결 방안 (Integration of QFD and TRIZ to Solve the Inventive Problem in the Design Process)

  • 정해성
    • 한국신뢰성학회지:신뢰성응용연구
    • /
    • 제13권3호
    • /
    • pp.153-163
    • /
    • 2013
  • QFD(Quality Function Deployment) is a very important tool to improve market share by reducing the gap between the voice of customer and the product's performance. But QFD is not a problem solving tool, although it is very useful in identifying what has to be solved or improved in order to meet the customer's desires. TRIZ has proved to be a very strong tool to solve the difficult problems that requires inventive thinking. QFD integrated with TRIZ becomes hot research recently. But merely linking between HOQ(House of Quality) in QFD and the contradiction matrix in TRIZ can not provide designers with a concrete method to solve the technical problem in the design process. Practically, the contradiction matrix and 40 inventive principles are not helpful for solving the technical problem. To solve the technical problem using TRIZ, a search for the tool and the object involved in the problem is made, from which the wanted result should be derived. A practical method to integrate QFD and TRIZ is proposed in this paper.

투명한 입력오버레이를 이용한 필기 및 음성 입력 (Handwriting and Voice Input using Transparent Input Overlay)

  • 김대현;김명준;이진호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권4호
    • /
    • pp.245-254
    • /
    • 2008
  • 본 논문은 IBM ViaVoice와 마이크로소프트 필기-인식 시스템(handwriting-recognition system)과 같은 인식 엔진(recognition engines)을 UMPC와 같은 펜-입력 디스플레이에서 작동하는 일반적인 윈도우 어플리케이션과 연동하기 위한 단일화된 멀티모달 입력 프레임워크(unified multi-modal input framework)를 제안한다. 사용자가 펜-입력 디스플레이에 부탁되어있는 버튼을 한 손으로 누르면, 인터넷 검색 윈도우나 워드 프로세서와 같이 현재 포커스를 갖는 윈도우는 전체 데스크탑을 덮을 수 있는 투명한 윈도우로 덮여진다. 이 위에 사용자는 다른 한 손으로, 현재 working context를 놓치지 않으면서, 필기 입력을 자유롭게 수행할 수 있다. 이런 투명 입력 윈도우를 이용하여 필기 및 음성 입력뿐만 아닐라 다이어그램까지 그릴 수 있게 해준다.

Korean National AIS Project

  • Kim, Se-Won;Park, Jin-Soo;Hugh, Ihl
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2000년도 Proceeding of CIN-KIN Joint Symposium 2000 on M.E.T. Under STCW 78/95 and SINO-KOREA MARITIME CONTACT IN MID-CENTURIES
    • /
    • pp.57-81
    • /
    • 2000
  • Universal AIS technology is effective and could enhance navigational safety -The AIS provides and improved method of vessel traffic surveillance -Complement to radar in collision avoidance -Invaluable in Search And Rescue operations -Reduce voice communications -Effective Fleet management

  • PDF

Multi-Modal Controller Usability for Smart TV Control

  • Yu, Jeongil;Kim, Seongmin;Choe, Jaeho;Jung, Eui S.
    • 대한인간공학회지
    • /
    • 제32권6호
    • /
    • pp.517-528
    • /
    • 2013
  • Objective: The objective of this study was to suggest a multi-modal controller type for Smart TV Control. Background: Recently, many issues regarding the Smart TV are arising due to the rising complexity of features in a Smart TV. One of the specific issues involves what type of controller must be utilized in order to perform regulated tasks. This study examines the ongoing trend of the controller. Method: The selected participants had experiences with the Smart TV and were 20 to 30 years of age. A pre-survey determined the first independent variable of five tasks(Live TV, Record, Share, Web, App Store). The second independent variable was the type of controllers(Conventional, Mouse, Voice-Based Remote Controllers). The dependent variables were preference, task completion time, and error rate. The experiment consist a series of three experiments. The first experiment utilized a uni-modal Controller for tasks; the second experiment utilized a dual-modal Controller, while the third experiment utilized a triple-modal Controller. Results: The first experiment revealed that the uni-modal Controller (Conventional, Voice Controller) showed the best results for the Live TV task. The second experiment revealed that the dual-modal Controller(Conventional-Voice, Conventional-Mouse combinations) showed the best results for the Share, Web, App Store tasks. The third experiment revealed that the triple-modal Controller among all the level had not effective compared with dual-modal Controller. Conclusion: In order to control simple tasks in a smart TV, our results showed that a uni-modal Controller was more effective than a dual-modal controller. However, the control of complex tasks was better suited to the dual-modal Controller. User preference for a controller differs according the Smart TV functions. For instance, there was a high user preference for the uni-Controller for simple functions while high user preference appeared for Dual-Controllers when the task was complex. Additionally, in accordance with task characteristics, there was a high user preference for the Voice Controller for channel and volume adjustment. Furthermore, there was a high user preference for the Conventional Controller for menu selection. In situations where the user had to input text, the Voice Controller had the highest preference among users while the Mouse Type, Voice Controller had the highest user preference for performing a search or selecting items on the menu. Application: The results of this study may be utilized in the design of a controller which can effectively carry out the various tasks of the Smart TV.