• 제목/요약/키워드: 'Speech recognition

검색결과 2,053건 처리시간 0.023초

고차 미분에너지 기반 노인 음성에서의 음성 구간 검출 알고리즘 연구 (Development of Voice Activity Detection Algorithm for Elderly Voice based on the Higher Order Differential Energy Operator)

  • 이지연
    • 디지털융복합연구
    • /
    • 제14권11호
    • /
    • pp.249-255
    • /
    • 2016
  • 노인 음성은 연령에 따른 호흡, 발성, 공명 등의 생리적 변화에 의하여 다량의 잡음이 발생된다. 따라서 노인 음성으로 음성인식 및 합성, 분석 소프트웨어등과 같은 융복합 헬스케어 기기를 동작시키고자 할 때, 성능을 저하시키는 결과를 야기한다. 그러므로 노인 음성을 분석하여 그들의 목소리로 다양한 헬스케어 기기를 잘 운영할 수 있는 위한 연구 개발이 필요하다. 따라서 본 연구는 노인 음성 잡음을 고려하여 기존의 대칭 구조 고차 미분 에너지 함수를 이용하여 노인 음성에서의 음성 구간 검출 알고리즘을 연구하였으며, 자기상관함수와 AMDF 방법과 비교하여 노인 음성에서의 음성 구간 검출에 보다 우수한 성능을 가지는 것을 확인하였다. 본 논문에서 제시하는 음성 구간 검출 알고리즘은 노인을 위한 음성 인터페이스에 적용함으로써 노인들의 스마트 기기에의 접근성을 높이고, 더 나아가 노인들을 위한 융복합 웨어러블 디바이스 성능 개선 및 다양한 개발이 가능할 것으로 전망한다.

컨버전스시대 감성영역의 확장과 산업활용 -Sommerer와 Mignonneau의 인터넷 아트 분석을 중심으로- (Expansion of Sensibility Area and Industrial Application in the Convergence Era - With Special Reference to Analysis of the Internet Arts of Sommerer and Mignonneau -)

  • 김희영;이용재
    • 한국콘텐츠학회논문지
    • /
    • 제10권12호
    • /
    • pp.146-154
    • /
    • 2010
  • 오늘날 '컨버전스'와 '소통'은 모든 분야에서 키워드가 되고 있다. 예술가와 공학자는 새로운 기술에 기반을 둔 협업을 통해 그 동안의 상호단절에서 벗어나 점차 소통하고 있다. 컨버전스 시대에 예술 영역의 인터넷 아트와 기술 영역의 내비게이션과 아이폰에서 오감융합기술의 활용이 돋보인다. 소메라와 미뇨노의 인터넷 아트 $\ll$Riding the Net$\gg$, $\ll$The Living Room$\gg$, $\ll$The Living Web$\gg$은 음성인식을 통한 시각이미지와 촉각을 통한 시 공간 표현을 인터넷과 오감융합기술을 통해 구현하고 있다. 그리고 산업기술에서 내비게이션과 아이폰은 음성인식을 통한 오감융합기술을 적용하여 감성영역을 확장하여 인터넷 아트와 비슷한 기술을 선보인다. 이 연구에서 살펴본 바와 같이, 예술과 기술의 융합적 발전은 디지털 아트와 문화기술 산업의 새로운 지평을 열 것으로 보인다.

AI의 음성 디자인에서 고려해야 할 감성적 요소 및 국가별 음성 트랜드에 관한 연구 - 핀란드와 노르웨이의 전문가 인뎁스 인터뷰를 중심으로 (Research on Emotional Factors and Voice Trend by Country to be considered in Designing AI's Voice - An analysis of interview with experts in Finland and Norway)

  • 남궁기찬
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.91-97
    • /
    • 2020
  • 사용자와의 인터랙션이 가능한 음성 기반의 인터페이스는 AI 기술의 발달에 따라 사용이 확대되고 있다. 하지만, 현재까지의 음성 기반 인터페이스에 대한 연구는 음성 인식의 정확성 향상 등 기술적인 연구들이 대부분이었다. 이렇다 보니, 대부분의 음성 기반 인터페이스의 목소리는 차별화된 감성을 제공하지 않으며 획일화되어 있다. 본 연구에서는 AI 인터페이스의 음성에 적합한 감성 요소를 더하는 것을 목적으로 한다. 이를 위해 음성 인터페이스 디자인에서 고려되어야 할 감성적 요소를 도출하였다. 또한, 국가별로 차이를 보이는 보이스 트렌드를 조사하였다. 본 연구를 위해 자국의 언어를 독립적으로 사용하는 핀란드와 노르웨이, 두 국가의 음성 산업 전문가들과 인터뷰를 진행하였다.

자질집합선택 기반의 기계학습을 통한 한국어 기본구 인식의 성능향상 (Improving the Performance of Korean Text Chunking by Machine learning Approaches based on Feature Set Selection)

  • 황영숙;정후중;박소영;곽용재;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.654-668
    • /
    • 2002
  • In this paper, we present an empirical study for improving the Korean text chunking based on machine learning and feature set selection approaches. We focus on two issues: the problem of selecting feature set for Korean chunking, and the problem of alleviating the data sparseness. To select a proper feature set, we use a heuristic method of searching through the space of feature sets using the estimated performance from a machine learning algorithm as a measure of "incremental usefulness" of a particular feature set. Besides, for smoothing the data sparseness, we suggest a method of using a general part-of-speech tag set and selective lexical information under the consideration of Korean language characteristics. Experimental results showed that chunk tags and lexical information within a given context window are important features and spacing unit information is less important than others, which are independent on the machine teaming techniques. Furthermore, using the selective lexical information gives not only a smoothing effect but also the reduction of the feature space than using all of lexical information. Korean text chunking based on the memory-based learning and the decision tree learning with the selected feature space showed the performance of precision/recall of 90.99%/92.52%, and 93.39%/93.41% respectively.

한국어 연속음성인식을 위한 발음사전 구축 (Pronunciation Dictionary For Continuous Speech Recognition)

  • 이경님;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.197-199
    • /
    • 2000
  • 연속음성인식을 수행하기 위해서는 발음사전과 언어모델이 필요하다. 이 둘 사이에는 디코딩 단위가 일치하여야 하므로 발음사전 구축시 디코딩 단위로 표제어 단위를 선정하며 표제어 사이의 음운변화 현상을 반영한 발음사전을 구축하여야 한다. 한국어에 부합하는 음운변화현상을 분석하여 학습용 자동 발음열을 생성하고, 이를 통하여 발음사전을 구축한다. 전처리 단계로 기호, 단위, 숫자 등 전처리 과정 및 형태소 분석 과정을 수행하며, 디코딩 단위인 의사 형태소 단위를 생성하기 위해 규칙을 이용한 태깅 과정을 거친다. 이를 통해 나온 결과를 발음열 생성기 입력으로 하며, 결과는 학습용 발음열 또는 발음사전 구성을 위한 형태로 출력한다. 표제어간 음운변화 현상이 반영된 상태의 표제어 단위이므로 실제 음운변화가 반영되지 않은 상태의 표제어와는 그 형태가 상이하다. 이는 연속 발음시 생기는 현상으로 실제 인식에는 이 음운변화 현상이 반영된 사전이 필요하게 된다. 생성된 발음사전의 효용성을 확인하기 위해 다음과 같은 실험을 통해 성능을 평가하였다. 음향학습을 위하여 PBS(Phonetically Balanced Sentence) 낭독체 17200문장을 녹음하고 그 전사파일을 사용하여 학습을 수행하였고, 발음사전의 평가를 위하여 이 중 각각 3100문장을 사용하여 다음과 같은 실험을 수행하였다. 형태소 태그정보를 이용하여 표제어간 음운변화 현상을 반영한 최적의 발음사전과 다중 발음사전, 언어학적 기준에 의한 수작업으로 생성한 표준 발음사전, 그리고 표제어간의 음운변화 현상을 고려하지 않고 독립된 단어로 생성한 발음사전과의 비교 실험을 수행하였다. 실험결과 표제어간 음운변화 현상을 반영하지 않은 경우 단어 인식률이 43.21%인 반면 표제어간 음운변화 현상을 반영한 1-Best 사전의 경우 48.99%, Multi 사전의 경우 50.19%로 인식률이 5~6%정도 향상되었음을 볼 수 있었고, 수작업에 의한 표준발음사전의 단어 인식률 45.90% 보다도 약 3~4% 좋은 성능을 보였다.

  • PDF

Clinical features and risk factors for missed stroke team activation in cases of acute ischemic stroke in the emergency department

  • ;;;;정시경
    • 대한응급의학회지
    • /
    • 제29권5호
    • /
    • pp.437-448
    • /
    • 2018
  • Objective: Acute ischemic stroke (AIS) requires time-dependent reperfusion therapy, and early recognition of AIS is important to patient outcomes. This study was conducted to identify the clinical features and risk factors of AIS patients that are missed during the early stages of diagnosis. Methods: We retrospectively reviewed AIS patients admitted to a hospital through the emergency department. AIS patients were defined as ischemic stroke patients who visited the emergency department within 6 hours of symptom onset. Patients were classified into two groups: an activation group (A group), in which patients were identified as AIS and the stroke team was activated, and a non-activation group (NA group), for whom the stroke team was not activated. Results: The stroke team was activated for 213 of a total of 262 AIS patients (81.3%), while it was not activated for the remaining 49 (18.7%). The NA group was found to be younger, have lower initial National Institutes of Health Stroke Scale scores, lower incidence of previous hypertension, and a greater incidence of cerebellum and cardio-embolic infarcts than the A group. The chief complaints in the A group were traditional stroke symptoms, side weakness (61.0%), and speech disturbance (17.8%), whereas the NA group had non-traditional symptoms, dizziness (32.7%), and decreased levels of consciousness (22.4%). Independent factors associated with missed stroke team activation were nystagmus, nausea/vomiting, dizziness, gait disturbance, and general weakness. Conclusion: A high index of AIS suspicion is required to identify such patients with these findings. Education on focused neurological examinations and the development of clinical decision tools that could differentiate non-stroke and stroke are needed.

사용자의 스마트 주거 기술 선호와 수용에 관한 연구 (Users' Preference and Acceptance of Smart Home Technologies)

  • 조명은;김미정
    • 대한건축학회논문집:계획계
    • /
    • 제34권11호
    • /
    • pp.75-84
    • /
    • 2018
  • This study analyzed users' acceptance and intention to use in addition to needs and preferences of smart home technologies, and identified the differences in technology preference and acceptance by different factors. The subjects were residents in the 40s and 60s residing in the Seoul or suburbs of Seoul, and questionnaires were conducted in the 40s while interviews with questionnaires were conducted in the 60s. A total of 105 questionnaires were used as data, and frequency, mean, crossover, independent sample t test, one-way ANOVA and multiple regression analysis were performaed using SPSS23. The results of this study are as follows. First, hypertension, hyperlipidemia and hypercholesterolemia were the most common diseases among respondents and if there was no discomfort, they would like to continue living in the homes of the current residence. Therefore, the direction of smart home development should support the daily living and health care so that residents can live a healthy life for a long time in their living space. Second, the technologies that residents most need were a control technology of residential environments and a monitoring technology of residents' health and physiological changes. The most preferred sensor types are motion sensors and speech recognition while video cameras have a very low preference. Third, technology anxiety was the most significant factor influencing intention to accept smart home technology. The greater the technology anxiety is, the weaker the acceptance of technology. Fourth, when applying smart residential technology in homes, various resident characteristics should be considered. Age and technology intimacy were the most influential variables, and accordingly there were differences in technology preference and acceptance. Therefore, a user-friendly smart home plan should be done in the consideration of the results.

심층 신경망을 통한 자연 소리 분류를 위한 최적의 데이터 증대 방법 탐색 (Search for Optimal Data Augmentation Policy for Environmental Sound Classification with Deep Neural Networks)

  • 박진배;;배성호
    • 방송공학회논문지
    • /
    • 제25권6호
    • /
    • pp.854-860
    • /
    • 2020
  • 심층 신경망은 영상 분류 그리고 음성 인식 등 다양한 분야에서 뛰어난 성능을 보여주었다. 그 중에서 데이터 증대를 통해 생성된 다양한 데이터는 신경망의 성능을 향상하게 시키는 데 중요한 역할을 했다. 일반적으로 데이터의 변형을 통한 증대는 신경망이 다채로운 예시를 접하고 더 일반적으로 학습되는 것을 가능하게 했다. 기존의 영상 분야에서는 신경망 성능 향상을 위해 새로운 증대 방법을 제시할 뿐만 아니라 데이터와 신경망의 구조에 따라 변화할 수 있는 최적의 데이터 증대 방법의 탐색 방법을 제안해왔다. 본 논문은 이에 영감을 받아 음향 분야에서 최적의 데이터 증대 방법을 탐색하는 것을 목표로 한다. 잡음 추가, 음의 높낮이 변경 혹은 재생 속도를 조절하는 등의 증대 방법들을 다양하게 조합하는 실험을 통해 경험적으로 어떤 증대 방법이 가장 효과적인지 탐색했다. 결과적으로 자연 음향 데이터 세트 (ESC-50)에 최적화된 데이터 증대 방법을 적용함으로써 분류 정확도를 향상하게 시킬 수 있었다.

언어변이와 세계영어들 (Language Variation and World Englishes)

  • 김양순
    • 문화기술의 융합
    • /
    • 제7권1호
    • /
    • pp.234-239
    • /
    • 2021
  • 본 연구는 언어의 본질인 언어변이의 주된 방향성을 탐색하고 언어변이의 결과로 나타나는 영어의 모든 방언들, 즉 세계영어들을 연구하는 것이다. 특정지역에서 사용되는 지역적, 사회적 방언의 연구인 언어변이의 특성을 규명하기 위하여 하이브리드 언어변이모델을 제안한다. 사회적 거리두기, 대면과 비대면 소통모드, 그리고 언어적 다양성이라는 세 가지 상호영향자의 관점에서 하이브리드 언어변이모델을 제안하고 언어변이의 결과로 나타나는 세계적 영어방언 현상인 세계영어들의 다양성 특질을 연구한다. 세계영어들의 문맥에서 지역화 목적으로 영어가 어떻게 사용되는가를 살펴보면, 사회적 거리두기가 높은 비대면의 상황에서는 다양성이 감소하여 좀 더 표준적이며 글로벌한 영어가 사용되며 변이가 줄어 세계영어들의 확장 속도가 완만해진다. 동시에 지역적인 사용이 줄어들어 의사소통의 오류도 줄어든다. 반면 사회적 거리두기가 낮은 대면의 상황에서는 세계영어들의 확장 속도가 빨라지고 변이의 형태가 다양해지며 의사소통의 오류 또한 증가한다. 이러한 영어변이 현상의 특성을 살펴보기 위하여 세계영어들의 핵심 원이라고 할 수 있는 영국영어, 미국영어, 그리고 캐나다영어의 언어적, 사회적 변이의 사례를 비교 분석한다.

A Study on the Linkage Model Between Institutions Related to Lifelong Education for People with Developmental Disabilities Based on the K-PACE Center of Daegu University: A Perspective on the Whole Life Cycle for People with Developmental Disabilities

  • Kim, Young-Jun;Kim, Wha-Soo;Rhee, Kun-Yong
    • International Journal of Advanced Culture Technology
    • /
    • 제10권1호
    • /
    • pp.24-35
    • /
    • 2022
  • The purpose of this study was to form a linked model in which local institutions related to lifelong education for the disabled can cooperate based on the Daegu University K-PACE Center. The contents of the study started with recognizing the problem that the adult-centered lifelong education support system does not effectively cope with these factors, even though the independent life of people with developmental disabilities is a major factor determining the quality of life. Regarding this problem recognition, this study primarily emphasized the view that educational support for independent life of people with developmental disabilities should establish the context of the school foundation. The context of the school foundation is established for lifelong education centered on adulthood for people with developmental disabilities because the curriculum is embodied through the standards of subject matter education. In this regard, the Daegu University K-PACE Center, which established a curriculum that supports the independent life of people with developmental disabilities in terms of linking higher and lifelong education, actually reflects the context of the school foundation. As a result, this study prepared a strategy that could be considered as a transition to advance the curriculum organized by the Daegu University K-PACE Center, and the strategy was secondarily reflected as a procedure that could be linked to local lifelong education-related institutions for the disabled. Finally, this study presented a form of transition in which people with developmental disabilities can access the curriculum of lifelong education through the connection of local lifelong education-related institutions for the disabled, centering on the entire life of adulthood.