• 제목/요약/키워드: voice intention

검색결과 57건 처리시간 0.022초

반자율주행 맥락에서 AI 에이전트의 멀티모달 인터랙션이 운전자 경험에 미치는 효과 : 시각적 캐릭터 유무를 중심으로 (The Effect of AI Agent's Multi Modal Interaction on the Driver Experience in the Semi-autonomous Driving Context : With a Focus on the Existence of Visual Character)

  • 서민수;홍승혜;이정명
    • 한국콘텐츠학회논문지
    • /
    • 제18권8호
    • /
    • pp.92-101
    • /
    • 2018
  • 대화형 AI 스피커가 보편화되면서 음성인식은 자율주행 상황에서의 중요한 차량-운전자 인터랙션 방식으로 인식되고 있다. 이 연구의 목적은 반자율주행 상황에서 음성뿐만 아니라 AI 캐릭터의 시각적 피드백을 함께 전달하는 멀티모달 인터랙션이 음성 단일 모드 인터랙션보다 사용자 경험 최적화에 효과적인지를 확인하는 것이다. 실험 참가자에게 주행 중 AI 스피커와 캐릭터를 통해 음악 선곡과 조정을 위한 인터랙션 태스크를 수행하게 하고, 정보 및 시스템 품질, 실재감, 지각된 유용성과 용이성, 그리고 지속 사용 의도를 측정하였다. 평균차이 분석 결과, 대부분의 사용자 경험 요인에서 시각적 캐릭터의 멀티모달 효과는 나타나지 않았으며, 지속사용 의도에서도 효과는 나타나지 않았다. 오히려, 정보품질 요인에서 음성 단일 모드가 멀티모달보다 효과적인 것으로 나타났다. 운전자의 인지적 노력이 필요한 반자율주행 단계에서는 멀티모달 인터랙션이 단일 모드 인터랙션에 비해 사용자 경험 최적화에 효과적이지 않았다.

선물동기에 따른 모바일 메신저 디지털 쿠폰 선물 증여 모형 (Digital Coupon Gift-giving Model through Gift-Giving Motivation)

  • 정종덕;여현진
    • 한국융합학회논문지
    • /
    • 제6권6호
    • /
    • pp.105-110
    • /
    • 2015
  • 스마트폰의 보급으로 인해 인터넷 이용자의 91%가 장소를 불문하고 인터넷을 주된 목적을 채팅과 메신저로 사용하고 있으며 이는 음성/영상통화의 점유율을 앞지르고 있다. 이는 특히 10대에서 30대사이의 젊은 연령층에서 확연히 나타나고 있는 현상으로써, 모바일 메신저를 이용한 쇼핑으로 연결되었다. 본 연구는 이러한 모바일 환경하에서 메신저 사용자가 전통적인 사회적 행위인 선물의 증여를 메신저의 디지털 쿠폰을 사용하여 전달하는 행위의 동기를 찾고, 동기에 따른 구매의도에 기술수용모형의 두 가지 요인인 유용성과 용이성이 어떠한 매개적 영향을 미치는지 알아보았다. 연구결과 모바일 디지털쿠폰을 통해 선물을 증여하는 사용자는 경험적, 의무적, 실용적인 동기 모두 구매의사에 영향을 미치는 것으로 나타났으며, 선물의 유용성 보다는 용이성이 모바일 디지털쿠폰을 통해 선물을 하는 매개변수로써 매개효과를 보이고 있음을 알 수 있었다. 즉, 모바일을 통해 디지털 쿠폰을 선물의 수단으로 사용하는 사람들은 기존의 오프라인 선물과 같은 동기로 접근하나, 기술로 인해 선물이 쉬워짐으로써 더 강한 구매의도를 가지게 되는 것으로 나타났다.

인공지능 에이전트 대화형 인터랙션에서의 감탄사 효과: 자율주행 맥락에서 (The Effect of Interjection in Conversational Interaction with the AI Agent: In the Context of Self-Driving Car)

  • 이수지;서지윤;최준호
    • 문화기술의 융합
    • /
    • 제8권1호
    • /
    • pp.551-563
    • /
    • 2022
  • 이 연구의 목적은 자율 주행 차량의 체화된 에이전트가 '감탄사'를 사용하여 감정 표현을 드러낸 대화 상호작용을 할 경우 사용자 경험에 어떠한 효과를 나타내는지 확인하는 것이다. 감탄사 포함 유무와 대화 유형(과제 중심적 대화 vs. 관계 중심적 대화)의 조건에 따라 실험을 설계하였다. 온라인 실험으로 각 조건별로 4가지 대화 시나리오영상을 시청한 후, 해당 에이전트에 대한 친밀도, 호감도, 신뢰도, 사회적 실재감, 지각된 의인화, 향후 이용 의도를 측정하였다. 분석 결과, 에이전트가 감탄사를 사용할 경우 두 대화 유형 모두에서 사회적 실재감의 주 효과가 나타났다. 에이전트가 감탄사를 사용하지 않을 경우 과제 중심적 대화 유형에서 신뢰와 향후 이용 의도가 높았다. 에이전트가 감탄사를 사용하여 감정적 표현을 더하는 것은 사회적 실재감을 높이는 효과는 발견했지만, 다른 사용자 경험 요인에 대한 영향은 나타나지 않았다.

공공.민간 사회복지사 이직의도 비교 연구 : 영남지역 사회복지사를 중심으로 (A Comparative Study on Turnover Intentions of Social Workers in Public and Private Sectors : the Cases of Social Workers in Youngnam Region)

  • 강영걸
    • 한국지역지리학회지
    • /
    • 제18권1호
    • /
    • pp.86-100
    • /
    • 2012
  • 이 연구의 목적은 영남 지역 공공 민간 사회복지사의 이직의도 차이를 보이스(voice)가설과 형평성(equity)이론으로 설명하는 데 있다. 이 연구를 통해서 파악한 사실은 다음과 같다. 첫째, 공공 민간 사회복지사의 직무만족 급여 이직의도 수준에 차이가 있다. 공공사회복지사는 급여수준은 높지만 직무에는 덜 만족하고, 그럼에도 불구하고 이직의도는 높지 않은데 비해서, 민간사회복지사는 급여수준은 낮은데도 직무에는 만족하고, 그렇지만 이직의도는 높다는 역설적(paradoxical)인 결과를 보여주고 있다. 둘째, 보이스가설이 공공 민간 사회복지사 '직무만족-이직의도' 사이의 역설적 관계를 설명하는 가설이 될 수 있다. 민간사회복지사의 경우 직무만족이 높은데도 불구하고 이직의도가 상대적으로 강한 것은 사실이지만, 보이스 기능을 하는 '임파워먼트' 변수를 방정식에 포함시켜 회귀분석한 결과 공공 민간 부문 사이의 이직의도 차이가 없어졌다. 이러한 결과는 임파워먼트를 통해서 조직 내의 보이스 기능을 강화하면 민간사회복지사의 이직의도가 약해진다는 사실을 보여주는 것이다. 셋째, 형평성이론도 사회복지사 '직무만족-이직의도' 사이의 역설적 관계를 설명하는 이론이 될 수 있다. 민간사회복지사는 공공사회복지사보다 근로조건이 열악하기 때문에 '결과 대 투입' 비율이 공정하지 않다고 느낄 수 있어서, 직무에는 만족하지만 이직의도는 강해지는 역설적인 상황이 발생할 수 있다. 마지막으로, 이론적 실증적 논의 외에도 임파워먼트의 보이스 기능과 급여조정 필요성 등에 대한 제도적 정책적 함의를 논의하였다.

  • PDF

Deep Level Situation Understanding for Casual Communication in Humans-Robots Interaction

  • Tang, Yongkang;Dong, Fangyan;Yoichi, Yamazaki;Shibata, Takanori;Hirota, Kaoru
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • 제15권1호
    • /
    • pp.1-11
    • /
    • 2015
  • A concept of Deep Level Situation Understanding is proposed to realize human-like natural communication (called casual communication) among multi-agent (e.g., humans and robots/machines), where the deep level situation understanding consists of surface level understanding (such as gesture/posture understanding, facial expression understanding, speech/voice understanding), emotion understanding, intention understanding, and atmosphere understanding by applying customized knowledge of each agent and by taking considerations of thoughtfulness. The proposal aims to reduce burden of humans in humans-robots interaction, so as to realize harmonious communication by excluding unnecessary troubles or misunderstandings among agents, and finally helps to create a peaceful, happy, and prosperous humans-robots society. A simulated experiment is carried out to validate the deep level situation understanding system on a scenario where meeting-room reservation is done between a human employee and a secretary-robot. The proposed deep level situation understanding system aims to be applied in service robot systems for smoothing the communication and avoiding misunderstanding among agents.

말소리와 성격 이미지 (Speech sound and personality impression)

  • 이은영;유혜옥
    • 말소리와 음성과학
    • /
    • 제9권4호
    • /
    • pp.59-67
    • /
    • 2017
  • Regardless of their intention, listeners tend to assess speakers' personalities based on the sounds of the speech they hear. Assessment criteria, however, have not been fully investigated to indicate whether there is any relationship between the acoustic cue of produced speech sounds and perceived personality impression. If properly investigated, the potential relationship between these two will provide crucial insights on the aspects of human communications and further on human-computer interaction. Since human communications have distinctive characteristics of simultaneity and complexity, this investigation would be the identification of minimum essential factors among the sounds of speech and perceived personality impression. The purpose of this study, therefore, is to identify significant associations between the speech sounds and perceived personality impression of speaker by the listeners. Twenty eight subjects participated in the experiment and eight acoustic parameters were extracted by using Praat from the recorded sounds of the speech. The subjects also completed the Neo-five Factor Inventory test so that their personality traits could be measured. The results of the experiment show that four major factors(duration average, pitch difference value, pitch average and intensity average) play crucial roles in defining the significant relationship.

내장 문자와 사전 구조 지식을 이용한 HTMLtoVXML 변환 에이전트 개발 (Development of HTMLtoVTML Conversion Agent using Embedded Text and Priori Structural Knowledge)

  • 장영건
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.343-350
    • /
    • 2003
  • 본 연구는 음성 인터넷 서비스를 위하여 기존의 HTML 컨텐츠를 자동으로 VXML 컨텐츠로 변환하여 사용하는 방법에 관한 것이다. 문서 변환은 HTML 문서의 해석과 내용 분리에 앞서 컨텐츠의 선택이 필수적으로 요구되지만, 이미 알고 있고, 관심이 있는 내용의 집단적 선택에 대하여는 아직까지 좋은 해법이 없어 보인다. 본 논문에서는 비구조적 데이터로 구성된 웹 문서로부터 필요한 정보 묶음을 선택하기 위하여 웹 문서에 포함된 문자열, 구조에 대한 사용자의 사전 지식을 상호 반응적으로 사용하는 방법을 제안하며, 이를 구현하여 그 타당성을 입증하였다. 제안하는 방식은 기존의 구조적 방식에 의한 선택보다 사용자의 의도를 정확히 반영하며, 문서 표현의 구현 기법의 변화에 강건한 장점이 있다. 또한 컨텐츠 분리 측면에서는 XML또는 XHTML 문서변환을 중간 과정으로 사용하는 방식에 비하여 시간적으로 빠르며, 변환 과정의 부담이 작다.

목적 지향 대화를 위한 효율적 질의 의도 분석에 관한 연구 (Effective Text Question Analysis for Goal-oriented Dialogue)

  • 김학동;고명현;임헌영;이유림;지민규;김원일
    • 방송공학회논문지
    • /
    • 제24권1호
    • /
    • pp.48-57
    • /
    • 2019
  • 본 연구는 목적 지향 대화 시스템 내에서 단일 한국어 텍스트 형식의 질문으로부터 질의자의 의도를 파악하는 것을 목적으로 한다. 목적 지향 대화 시스템은 텍스트 또는 음성을 통한 사용자의 특수한 요구를 만족시켜주는 대화 시스템을 의미한다. 의도 분석 과정은 답변 생성에 앞서 사용자의 질의 의도를 파악하는 단계로, 목적 지향 대화 시스템 전체의 성능에 큰 영향을 준다. 생활화학제품이라는 특정 분야에 제안 모델을 사용하였고, 해당 분야와 관련된 한국어 텍스트 데이터를 이용하였다. 특정 분야에 독립적이며 범용적인 의도를 의미하는 화행과, 특정 분야에 종속적인 의도를 의미하는 개념열로 나누어 분석한다. 화행과 개념열을 분석하기 위하여 단어 임베딩 모델, 합성곱 신경망을 이용한 분류 방법을 제안한다. 단어 임베딩 모델을 통하여 단어의 의미정보를 추상화하고, 추상화된 단어의 의미정보를 기반으로 합성곱 신경망을 통하여 개념열 및 화행 분류를 수행한다.

양자 간 대화 상황에서의 화자인식을 위한 문장 시퀀싱 방법을 통한 자동 말투 인식 (Automatic Speech Style Recognition Through Sentence Sequencing for Speaker Recognition in Bilateral Dialogue Situations)

  • 강가람;권오병
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.17-32
    • /
    • 2021
  • 화자인식은 자동 음성시스템에서 중요한 기능을 담당하며, 최근 휴대용 기기의 발전 및 음성 기술, 오디오 콘텐츠 분야 등이 계속해서 확장됨에 따라 화자인식 기술의 중요성은 더구나 부각 되고 있다. 이전의 화자인식 연구는 음성 파일을 기반으로 화자가 누구인지 자동으로 판정 및 정확도 향상을 위한 목표를 가지고 진행되었다. 한편 말투는 중요한 사회언어학적 소재로 사용자의 사회적 환경과 밀접하게 관련되어 있다. 추가로 화자의 말투에 사용되는 종결어미는 문장의 유형을 결정하거나 화자의 의도, 심리적 태도 또는 청자에 대한 관계 등의 기능과 정보를 가지고 있다. 이처럼 종결어미의 활용형태는 화자의 특성에 따라 다양한 개연성이 있어 특정 미확인 화자의 종결어미의 종류와 분포는 해당 화자를 인식하는 것에 도움이 될 것으로 보인다. 기존 텍스트 기반의 화자인식에서 말투를 고려한 연구가 적었으며 음성 신호를 기반으로 한 화자인식 기법에 말투 정보를 추가한다면 화자인식의 정확도를 더욱 높일 수 있을 것이다. 따라서 본 연구의 목적은 한국어 화자인식의 정확도를 개선하기 위해 종결어미로 표현되는 말투(speech style) 정보를 활용한 방법을 제안하는 것이다. 이를 위해 특정인의 발화 내용에서 등장하는 종결어미의 종류와 빈도를 활용하여 벡터값을 생성하는 문장 시퀀싱이라는 방법을 제안한다. 본 연구에서 제안한 방법의 우수성을 평가하기 위해 드라마 대본으로 학습 및 성능평가를 수행하였다. 본 연구에서 제안한 방법은 향후 실존하는 한국어 음성인식 서비스의 성능 향상을 위한 수단으로 사용될 수 있으며 지능형 대화 시스템 및 각종 음성 기반 서비스에 활용될 것을 기대한다.

가상현실 웨어러블 기기의 구매 촉진을 위한 태도 자신감과 사용자 저항 태도: 가상현실 헤드기어를 중심으로 (Attitude Confidence and User Resistance for Purchasing Wearable Devices on Virtual Reality: Based on Virtual Reality Headgears)

  • 손봉진;박다슬;최재원
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.165-183
    • /
    • 2016
  • 스마트폰을 넘어 차세대 IT 비즈니스의 주목할 만한 후보군으로 가상현실이 이슈가 되고 있다. 가상현실은 컴퓨터와 VR헤드셋을 통해 구현한 입체적인 가상공간을 제공함으로써 사용자의 시각을 완전히 장악하고, 청각, 촉각 등 오감과의 상호작용 및 음성, 동작인식 등을 통해 가상공간을 마치 현실처럼 느끼게 한다는 점에서 향후 주목할 만한 산업 분야로 떠오르고 있다. 많은 글로벌 대기업들이 가상현실과 관련한 사업에 투자를 하고 있으나 소비자의 관점에서 가상현실 관련 제품군은 아직 쉽게 접하거나 구매하기 어려운 제품군으로 인식된다. 그렇기 때문에 소비자의 태도 변화가 큰 변화가 발생되고 있지 않으며 Acception & Diffusion 모델의 초기단계에 지나지 않아 구매로 연결되지 않는 실정이다. 본 연구는 기존 선행연구의 관점을 바탕으로 가상현실 헤드기어 제품들의 판매 촉진을 위한 사용자 관점에서의 사용자 저항을 매개 변수로 저항을 감소시키고 사용 및 구매의도에 영향을 주는 선행요인들을 도출하고자 하였으며 사용자가 가지고 있는 태도에 대한 자신감에 영향을 주어 행동 의도까지 변화시키는 현상에 대한 분석을 하고자 하였다. 본 연구의 결과는 태도 자신감에 대한 사용 용이성과 사용 혁신성의 영향력을 확인할 수 있었다. 마찬가지로 사용자 혁신저항에 영향력을 주는 변수로는 가격, 심미적 외관, 즐거움, 콘텐츠 및 화질 관련 변수들을 도출하였다. 결과적으로 본 연구는 태도 자신감의 가상현실 혁신 수용에 대한 영향력을 제시하고 가격 이외 변수인 콘텐츠의 양과 저항감의 관계성을 바탕으로 관련 변수들을 제시하였다. 특히 초기 시장인 가상현실 제품의 특성에 따라 브랜드에 대한 선점효과의 필요성과 콘텐츠의 부족함 등이 실무적으로 해결해야 할 과제로서 확인되었다.