• 제목/요약/키워드: Voice Speakers

검색결과 170건 처리시간 0.027초

인공지능 에이전트의 사용 시나리오 분석을 통한 인터랙션 속성 유형화 (Categorization of Interaction Factors through Analysis of AI Agent Using Scenarios)

  • 천수경;연명흠
    • 한국융합학회논문지
    • /
    • 제11권11호
    • /
    • pp.63-74
    • /
    • 2020
  • 인공지능 제품은 스마트폰이나 스피커, 가전제품에 에이전트로 내장되어 '인공지능 비서'로 활용되고 있으며, 현재는 약 인공지능 수준으로 에이전트의 성격, 목소리 등 의인화에 관한 연구가 진행되고 있다. 향후 인공지능 기술 발전으로 지능형 에이전트의 역할과 기능이 확장될 것으로 보이며, 사용자 유형, 사용환경, 에이전트 외관 등 에이전트 관련 다양한 속성에 대한 고려가 필요할 것으로 보인다. 따라서 본 연구에서는 강한 인공지능 에이전트가 나타나는 컨셉 영상 시나리오의 분석을 통해 사용자 관점에서 에이전트의 인터랙션 속성들을 유형화하였다. 연구방법으로 에이전트에 대한 이론적고찰을 토대로 분석을 위한 프레임워크를 구축하였다. 이후 대중화된 영상시청 플랫폼인 유튜브(Youtube)를 활용하여 다수의 영상 시나리오를 수집 및 선별하고 환경, 사용자, 에이전트 관점에 따라 분석하였다. 그 결과 시점, 공간, 형태, 에이전트 행위, 연동기기, 에이전트 인터페이스, 사용상태, 사용자 인터페이스 8개 속성을 유형화하였다. 이는 향후 상용화될 에이전트의 개발 및 예측 시 참고자료로 활용될 것으로 기대된다.

텔레프리젠스 로봇보조학습 사례 연구를 통한 융합기술 (Convergence Technologies by a Long-term Case Study on Telepresence Robot-assisted Learning)

  • 임미숙;한정혜
    • 융합정보논문지
    • /
    • 제9권7호
    • /
    • pp.106-113
    • /
    • 2019
  • 이 논문은 개인 대상으로 장기간의 원격영상 교육을 실시한 사례를 분석함으로써, 효과적인 운영을 위한 융합기술에 대한 제언을 도출하는 것을 목적으로 한다. 로봇보조학습을 포함한 원격영상교육 경험이 있는 교수학습자를 대상으로 텔레프리젠스를 노트북, 스마트폰 로봇, 그리고 음성인식 피드백이 제공되도록 제작한 패드형 로봇으로 실험 설계하여 5개월간 원격수업 방식에 임의할당을 통해 진행하고, 과제 수행도를 측정함과 동시에 심층 인터뷰를 실시하였다. 학습자는 기존 연구와 마찬가지로 텔레프리젠스 로봇보조학습의 과제수행도가 가장 높은 것으로 나타났지만, 학습의 몰입도와 집중을 위하여 음성송출 피드백 외에 원격교수자와의 시선 맞춤이 필요하다고 생각했다. 원격 교수자는 원격교육의 영상입력 추가와 음원추적 자동 제어 기능을 요구했다.

지능형 스피커 중심의 서비스 로봇 시장 분석 (Analysis on Service Robot Market based on Intelligent Speaker)

  • 이성훈;이동우
    • 융합정보논문지
    • /
    • 제9권5호
    • /
    • pp.34-39
    • /
    • 2019
  • 현재 우리 사회에서 자주 언급되고 있는 단어들 중 하나는 스마트 머신이라 할 수 있다. 스마트 머신은 똑똑하거나 혹은 지능적인 기능을 포함한 기계를 의미한다. 이러한 스마트 머신이 최근 우리 가정환경에서 적용되고 있는 사례들이 늘어나고 있다. 바로 스마트 홈의 결과로서 발생하는 현상들이다. 스마트 홈 환경에서 스마트 스피커는 전통적인 음악 재생의 기능에서 벗어나 이제는 스마트 홈의 다양한 구성 요소인 디바이스들을 제어하는 인터페이스 역할이 증대되고 있다. 본 연구에서는 국내, 외 스마트 스피커 시장의 기술 동향 등을 살펴보고, 현 제품들에 대한 문제점을 분석하였으며, 필요한 핵심기술에 대해 기술하였다. 국내 스마트 스피커 시장에서는 SKT와 KT가 관련 산업을 리드하고 있으며, 반면에 국외에서는 대표적인 IT 기업인 아마존, 구글, 애플 등이 관련 제품의 출시 및 기술 개발에 주력하고 있다.

대화형 에이전트의 오류 상황에서 사회적 전략 적용: 사전 양해와 사과를 이용한 사례 연구 (Applying Social Strategies for Breakdown Situations of Conversational Agents: A Case Study using Forewarning and Apology)

  • 이유미;박선정;석현정
    • 감성과학
    • /
    • 제21권1호
    • /
    • pp.59-70
    • /
    • 2018
  • 음성인식 기술의 비약적 발전으로 최근 몇 년 사이 대화형 에이전트는 스마트폰, 인공지능 스피커 등을 통해 널리 보급되었다. 음성인식 기술의 인식의 정확도는 인간의 수준까지 발전하였으나, 여전히 말의 의미나 의도를 파악하는 것과 긴 대화를 이해하는 것 등에는 한계를 보이고 있다. 이에 따라 사용자는 대화형 에이전트를 사용함에 있어 다양한 오류 상황들을 경험하고 있으며 이는 사용자 경험에 부정적인 영향을 미칠 수 있다. 또한, 목소리를 주 인터페이스로 하는 인공지능 스피커의 경우, 대화형 에이전트의 기능 및 한계에 대한 피드백의 부족은 지속적 사용을 저해하는 요소로 꼽히고 있다. 따라서 사용자가 대화형 에이전트의 기능 및 한계를 보다 잘 이해하고 오류 상황에서 부정적인 감정을 완화할 수 있는 방안에 대한 연구에 대한 필요성이 높으나, 아직 관련 연구는 미비한 실정이다. 이에 본 연구에서는 사회적 전략 중 '사전 양해'와 '사과'를 대화형 에이전트에 적용하고 이러한 전략이 사용자가 에이전트에 대해 느끼는 인식에 어떠한 영향을 미치는지 조사하였다. 이를 위해 사전 양해와 사과 여부를 나누어 사용자가 대화형 에이전트와 대화하는 데모 영상을 제작하였고, 실험참가자들에게 영상을 보여준 뒤 느끼는 호감도와 신뢰도를 설문을 통해 평가하도록 하였다. 총 104명의 응답을 분석한 결과, 문헌조사를 토대로 한 우리의 예상과는 상반되는 결과를 얻었다. 사전 양해는 오히려 사용자에게 부정적인 인상을 주었으며, 특히 에이전트에 대한 신뢰도에 부정적인 영향을 주었다. 또한 오류 상황에서의 사과는 사용자가 느끼는 호감도나 신뢰도에는 유의미한 영향을 미치지 않았다. 심층인터뷰를 통해 원인을 파악한 결과, 실험참가자들은 인공지능 스피커를 사람과 같은 인격체보다는 단순한 기계에 가깝다고 인식했기 때문에 인간관계에 작용하는 사회적 전략이 영향력을 발휘하지 못한 것으로 해석된다. 이러한 결과는 사용자가 에이전트를 얼마나 기계, 혹은 사람에 가깝게 인식하는지에 따라 오류 상황에 대한 에이전트의 대처 방식 또한 달라져야 함을 보여준다.

AI Speaker 대중화를 위한 콘텐츠 서비스 선택 요인에 관한 연구 - AHP(계층화 분석)를 중심으로 (A Study on the Selection Factors of Contents Service for the Popularization of AI Speaker based on AHP)

  • 이휘재;김선무;변형균
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.38-48
    • /
    • 2020
  • 국내 AI Speaker 시장은 18년말 국내 보급대수 300만대로 혁신소비자 시장을 넘어 본격적인 조기 수용자 시장으로 성장하고 있지만, 여러 이유로 사용에 만족함을 느끼지 못하는 것이 현실이다. AI Speaker에 대한 많은 선행논문이 나오고 있지만, 지금까지 대다수의 연구는 기기 자체 성능에 대한 수용여부에 치우쳐 있는 경향이 있다, Covid-19시대에 이전 보다 많은 시간을 집안에서 거주를 하게 되고, 이는 많은 OTT사업자들이 AI스피커 사업자와의 협업을 통한 시장 확보를 노력 하는 등의 많은 변화가 이루어지고 있는 오늘의 상황에서, 본 연구는 아직 불만족적인 기술에 대한 요인은 배제하고 AI스피커의 또 하나의 주요 선택 요인이 될 수 있는 콘텐츠 서비스에 대한 우선순위를 파악하고자 하였다. 먼저, 본 연구는 문헌연구를 통해 도출된 AI스피커 선택 요인을 바탕으로, AHP(Analytic Hierarchy Process)를 이용하여 AI스피커 선택 요인 간 우선순위를 파악하였다. AI스피커 선택에 있어서 가장 중요한 상위계층 요인은 Concierge Service, Education Service, Entertainment Service순서였고, 개별 요인 중 우선순위로 선정된 요인은 1순위로 날씨/기온/미세먼지 (11.6%)를 알리는 기능이 주요 요인이었고, 그 다음으로 2순위 육아 컨텐츠(10.8%), 3순위는 음악 서비스(9.8%)로 분석되었다. 상위 우선순위 3개는 상위 계층 1, 2, 3 우선순위에 있는 항목에서 도출되었다. 전체 15개 개별 서비스 중 Concierge Service(날씨/기온/미세먼지, 뉴스, 음성일정 알림)와 Education Service(외국어, 유아, 책읽기)의 하위계층 6개는 상위 8위 안에 들었으며, Entertainment Service의 두 가지 음악서비스와 영화서비스는 3위와 6위에 랭크되었다.

교사 및 성악가의 VHI, V-RQOL, 음향학적 특성 비교 (VHI, V-RQOL, and vocal characteristics of teacher and singer)

  • 홍주혜;황영진
    • 한국산학기술학회논문지
    • /
    • 제13권7호
    • /
    • pp.3048-3056
    • /
    • 2012
  • 본 연구의 목적은 교사 및 성악가에 대한 음성장애지수(VHI), 음성관련 삶의 질 평가(V-RQOL), 음향음성학적 평가에 대한 특성을 연구하였다. 본 연구는 56명(성대결절이 있는 교사 20명 및 성악가, 그리고 정상화자 16명)을 대상으로 하였다. 모든 대상자에게 VHI, V-RQOL를 평가하였고, 음향학적 평가는 CSL 4500(Kay Pantax, USA)으로 측정하였다. 21명의 대상자에게 VHI, VRQOL, CSL을 이용한 음향적 평가에 대한 검사-재검사를 위해 두 번 실시하였다. 본 연구의 자료처리는 SPSS 18.0(SPSS Inc, Chicago, IL)을 사용하였다. 본 실험 결과, VHI 및 V-RQOL 결과, 교사 및 성악가 집단의 신체적, 기능적, 정서적 점수가 정상집단에 비해 유의하게 높았다(p<0.05). 음향학적 특성은 기본주파수 관련 변수, 기본주파수 변이 관련 변수, 음성강도 변이 관련 변수, 잡음 관련 변수, 진전 관련 변수) 범주에서 실험집단이 정상집단에 비해 유의하게 높았다(p<0.05). 결론적으로 교사 및 성악가들은 신체-기능영역에서 자신의 음성문제를 심각하게 인식하는 것 같다.

'세계 7대 자연경관' 선정 캠페인 관련 지역일간지의 뉴스 프레임 연구 (A Study on the News Frames of Regional Daily Newspapers Related to the Selection of the 'New 7 Wonders of Nature')

  • 이서현;고영철
    • 한국언론정보학보
    • /
    • 제63권
    • /
    • pp.26-52
    • /
    • 2013
  • 이 연구는 '대국민 사기극'이라는 꼬리표를 달며 언론의 주목을 받았던 '세계 7대 자연경관' 선정 캠페인을 지역일간지가 어떠한 프레임으로 누구의 목소리를 강조하고 반복하여 보도하였는지에 대한 물음에서 출발하였다. 연구결과, 첫째, 뉴스 프레임은 N7W재단의 공신력 프레임을 제외한 모든 프레임에서 신문사간 차이가 나타나지 않았다. 또한 언론사간 MOU 전후 프레임의 변화를 살펴본 결과, MOU 전에는 N7W재단의 공신력 프레임에서 신문사간 유의미한 차이가 발견되었던 반면, MOU 후에는 모든 프레임에서 의미있는 결과가 발견되지 않았다. 뉴스의 논조는 대부분 긍정적이거나 지지하는 관점을 견지하고 있었고, 부정적이거나 비판적인 보도는 거의 나타나지 않았다. 둘째, 직접인용구는 전체 기사의 68.0%가 사용하고 있는 것으로 나타났다. 직접인용구의 화자는 대부분 7대경관 선정 캠페인을 추진한 공식기관에 편중되어 있었고, 시민사회단체나 일반인은 거의 등장하지 않았다. 반면에 익명취재원의 직접인용구는 다소 높게 나타났으며, 이들은 대부분 7대경관 캠페인을 추진한 공식기관의 관계자였던 것으로 확인되었다. 결과적으로 지역일간지는 지방정부 등 7대경관 캠페인을 추진했던 주체들의 목소리를 강조하고 반복하면서 이들의 관점을 지지하고 옹호했던 것으로 나타났다.

  • PDF

머신러닝 분류기를 사용한 만성콩팥병 자동 진단 및 중증도 예측 연구 (Automatic detection and severity prediction of chronic kidney disease using machine learning classifiers)

  • 문지현;김선희;김명주;류지원;김세중;정민화
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.45-56
    • /
    • 2022
  • 본 논문은 만성콩팥병 환자의 음성을 사용하여 질병을 자동으로 진단하고 중증도를 예측하는 최적의 방법론을 제안한다. 만성콩팥병 환자는 호흡계 근력의 약화와 성대 부종 등으로 인해 음성이 변화하게 된다. 만성콩팥병 환자의 음성을 음성학적으로 분석한 선행 연구는 존재했으나, 환자의 음성을 분류하는 연구는 진행된 바가 없다. 본 논문에서는 모음연장발화, 유성음 문장 발화, 일반 문장 발화의 발화 목록과, 수제 특징 집합, eGeMAPS, CNN 추출 특징의 특징 집합, SVM, XGBoost의 머신러닝 분류기를 사용하여 만성콩팥병 환자의 음성을 분류하였다. 총 3시간 26분 25초 분량의 1,523개 발화가 실험에 사용되었다. 그 결과, 질병을 자동으로 진단하는 데에는 0.93, 중증도를 예측하는 3분류 문제에서는 0.89, 5분류 문제에서는 0.84의 F1-score가 나타났고, 모든 과제에서 일반 문장 발화, 수제 특징 집합, XGBoost의 조합을 사용했을 때 가장 높은 성능이 나타났다. 이는 만성콩팥병 음성 자동 분류에는 화자의 발화 특성을 모두 반영할 수 있는 일반 문장 발화와 거기로부터 추출한 적절한 특징 집합이 효과적임을 시사한다.

선형 판별분석과 공통벡터 추출방법을 이용한 음성인식 (Speech Recognition Using Linear Discriminant Analysis and Common Vector Extraction)

  • 남명우;노승용
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.35-41
    • /
    • 2001
  • 본 논문에서는 선형 판별분석 (LDA: Linear Discriminant Analysis)과 공통벡터 추출방법을 이용한 음성인식방법을 제안하였다. 음성신호는 화자의 성별, 나이, 출생지, 주위 잡음, 정신적 상태, 발성기관의 구조 등과 같은 다양한 정보를 포함하고 있다. 이로 인해 같은 음성신호라 할지라도 서로 다른 화자가 발성하게 되면 서로 다른 특성을 보이게 된다. 음성신호의 이러한 성질은 같은 음성군 (class)에 포함된 공통된 특성벡터를 추출하는 일을 상당히 어렵게 한다. 음성신호에서 공통된 특징 벡터를 추출하는 방법은 KLT (Karhunen-Loeve Transformation)와 같이 선형 대수적인 접근방법이 많이 사용되어지고 있으나, 본 논문에서는 M. Bilginer et al.이 제안한 공통벡터 추출 방법을 사용하였다. M. Bilginer et al.이 제안한 방법은 주어진 훈련 음성신호들에 대하여 최적의 공통 벡터를 추출하여 주면서 공통벡터 추출에 사용된 훈련 데이터에 대해서는 100%의 인식결과를 보여준다. 그러나 공통벡터 추출을 위한 훈련 음성신호의 수를 무한히 늘릴 수 없다는 점과 공통벡터들간의 구별정보 (discriminant information)가 정의되지 않았다는 단점이 있다. 본 논문에서는 단어그룹간 (class) 구별정보를 추출된 공통벡터와 결합해 단어간의 오인식률 (error rate)을 감소시킬 수 있는 방법과 공통벡터 추출방법에 적합한 파라미터 가공 방법을 제안하였다. 공통벡터 추출방법은 음성신호의 시간 축 정규화 방법과 벡터의 차원 크기에 따라 인식시간과 인식률에 영향을 받는다. 따라서 부적절한 시간 축 정렬과 너무 큰 벡터의 차원 수는 인식률 저하 등과 같이 알고리즘의 효율성을 떨어뜨린다. 본 논문에서 제안한 방법을 사용하여 실험한 결과 알고리즘의 효율성이 증가되었으며, 기존방법보다 약 2%정도의 향상된 인식률을 얻을 수 있었다.낮추는 효과를 나타내었다.다. 이상의 결과를 통하여 추출 온도와 용매 농도에 따른 수율의 차이가 있었으며 free radical 소거 활성에서는 종자 에탄을 추출물이 과피 에탄올 추출물 보다 145배 이상의 현저히 높은 활성을 나타내었다.을 나타내었다.'Lian(연)' : repeatability, continuance, plenty and intercommunicate, 2. 'Lian(연)'-'Lian(염)': integrity, 3. 'He (하)'-'He(화)' : peace, harmony and combination, 4. 'He(하)'-'He(하)' : clear river, 5.'He(하)'-'He(하)' ; all work goes well. When the Chinese use lotus patterns in lucky omen patterns, same pronunciation and pitch of Chinese language more prominent than natural properties or the image of Buddhism. I guess that it cause praying individual's peace and happiness more serious than philosophical meaning or symbol that base in Buddhism for ordinary people.ML., -9.00~12.49 and -19.81~19.81%, respectively). Therefore, it is concluded that the two formulations are bioequivalent for both the extent and the rate of absorption after single dose administration.ation.ion.ion.ation.ion.n. fibrosis, collagen bundle) was

  • PDF

한국어-영어 이중언어 화자의 사용 언어, 문맥, 언어 능숙도에 따른 기본 주파수 변화 (Changes in fundamental frequency depending on language, context, and language proficiency for bilinguals)

  • 윤소망;목소라;윤정선;한지윤;임동선
    • 말소리와 음성과학
    • /
    • 제11권1호
    • /
    • pp.9-18
    • /
    • 2019
  • 본 연구에서는 영어-한국어 이중언어 화자의 평균 기본주파수를 분석하여 언어 및 과제에 따른 차이가 있는지 살펴보고, 거주년수 및 언어 능숙도에 따라 언어 간 평균 기본주파수 상이한지 실펴보고자 하였다. 본 연구의 대상자는 영어권 나라에 7년 이상 거주한 한국어-영어 균형적 이중언어 집단 총 28명(남녀 각각 14명, 균형적 이중언어집단), 언어 노출기간 및 언어 능숙도에 차이를 두기 위해 추가로 모집한 영어권 나라 거주년수 3년 이하인 한국어 우세 이중언어 집단 총 20명(남녀 각각 10명, 한국어 우세 이중언어 집단)이다. 이들은 한국어와 영어로 읽기 및 자발화 과제를 수행하였고 Praat을 통해 녹음한 음성파일의 평균 기본주파수를 분석하였다. 이후 각 성별 내 언어 ${\times}$ 과제 이원 배치 분산 분석(two-way repeated ANOVA) 및 집단 ${\times}$ 언어의 이원 혼합 분산 분석(two-way mixed ANOVA)을 실시하였다. 그 결과, 언어 및 과제에 따라 균형적 이중언어 집단의 남녀 대상군 별로 상이한 결과가 나타났다. 여성의 경우 한국어보다 영어의 평균 기본주파수가 유의하게 높았으며(p=.003), 자발화과제보다 읽기 과제에서 평균 기본주파수가 유의하게 높았다(p=.002). 그러나 남성의 경우, 어떠한 조건에서도 유의한 결과가 나타나지 않았다. 두 번째로, 언어 능숙도에 따른 집단 간 비교에서 여성 대상자들에서만 언어 간 기본주파수 변화가 통계적으로 유의하게 나타났다(p=.000). 즉, 한국어 읽기 과제에서 평균 기본주파수가 영어 읽기 과제보다 유의하게 높았다. 그러나 언어 능숙도에 따른 평균 기본주파수의 변화는 통계적으로 유의하지 않았다(p=.830). 남성 대상자의 경우는 어떤 조건에서도 유의한 결과는 없었다. 결과적으로, 이중언어 화자의 언어 간 평균 기본주파수의 변화는 언어의 능숙도와 관계없이 성별에 따라 상이하게 나타났으며 본 연구를 바탕으로 언어 간 평균 주파수의 차이가 해부생리학적 요인이나 언어학적 요인보다도 사화문화적인 요인에 의한 것임을 생각해 볼 수 있도록 한다.