• 제목/요약/키워드: Speech pattern

검색결과 412건 처리시간 0.027초

인공지능 딥러링 학습 플랫폼에 관한 선행연구 고찰 (A Review on Deep Learning Platform for Artificial Intelligence)

  • 진찬용;신성윤;남수태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2019년도 춘계학술대회
    • /
    • pp.169-170
    • /
    • 2019
  • 인공지능이 글로벌 경쟁력 원천 기술로 부각되면서 정부도 자율주행차, 드론, 로봇 등 미래 신산업의 기반 기술이 되는 인공지능을 전략적으로 육성하고 있다. 국내 인공지능 연구 및 서비스는 네이버와 카카오를 중심으로 출시되었으나 해외에 비하면 규모나 수준이 미약한 편이다. 최근, 딥러닝 (deep learning)은 최근 음성인식과 영상인식을 비롯한 다양한 패턴인식 분야에서 혁신적인 성능을 기록하면서 많은 연구가 진행되고 있다. 그 뿐만 아니라 딥러닝은 초창기부터 산업계의 큰 관심을 끌어 구글이나 마이크로소프트, 삼성전자 등 글로벌 정보기술 회사에서 상용제품에 딥러닝 기술을 성공적으로 적용하고 있고 계속 연구개발을 진행하고 있어 대중매체에서도 관심을 가지고 주목하고 있다. 이러한 선행연구를 바탕으로 주목 받고 있는 인공지능에 대해 살펴보도록 하겠다.

  • PDF

한국어 초, 중, 종성 혼돈 단음절 최소대립쌍 (CVC)에 대한 정상 성인의 지각경계 연구 (Speech Perception Boundaries of Korean Confusing Monosyllabic Minimal Pairs (CVC) in Normal Adults)

  • 이성민;임덕환
    • 한국음향학회지
    • /
    • 제29권5호
    • /
    • pp.325-331
    • /
    • 2010
  • 청각 범주지각 (categorical perception)은 언어적 자극과 관련되어 나타나는 특징적 현상이다. 본 연구에서는 임상적으로 혼돈되기 쉬운 한국어 초성, 중성, 종성 최소대랍쌍의 지각경계에 관한 분석을 하였다. 이를 위해서 단음절어 최소대립쌍(consonant-vowel-consonant, CVC)인 /곰-공/, /논-눈/, /돈-논/을 물리적 에너지 관점에서 11가지 단계 (index)로 구분하여 변환하였다. 그리고, 정상 성인 (40명)을 대상으로 하여 지각경계 패턴, 지각경계 기울기, 지각경계 폭, 비우위 지수(non-dominant factor) 분포를 분석하였다. 이 결과에서 대립쌍들은 범주지각 과정에서 대립쌍 상호간에서 상대적인 차이가 있음을 보여 주었다. 본 자료에서는 중성 최소대립쌍의 경우가 범주지각이 가장 낮게 나타났으며, 이러한 분석 과정이 청각기능 평가 등에 응용 가능성이 있음을 확인할 수 있었다.

일본어 합성기에서 유동 Break를 이용한 합성단위 선택 방법 (A Unit Selection Methods using Flexible Break in a Japanese TTS)

  • 송영환;나덕수;김종국;배명진;이종석
    • 한국음향학회지
    • /
    • 제26권8호
    • /
    • pp.403-408
    • /
    • 2007
  • 대용량 코퍼스를 이용하는 합성단위 선택(unit selection) 기반 합성기에서 break는 자연성 및 명료성에 큰 영향을 미치는 파라미터로 unit selection 과정에서 음소 정보와 함께 중요한 특징으로 사용된다. 일본어는 피치의 상대적 높낮이로 표현되는 악센트를 가지는 언어이고, 악센트의 변화에 따라 AP(Accentual Phrase)가 결정되고 AP 경계에서 break가 형성된다. break는 규칙 기반 방식이나 통계적 방식인 J-ToBI를 이용하여 예측 할 수 있으나 다양성으로 인해 정확한 예측이 어렵다. 따라서 본 논문에서는 다양한 운율 정보를 포함하고 있는 대용량 코퍼스의 장점을 이용하기 위해 break를 고정 break와 유동 break로 나누어 합성단위 검색을 수행한다. 실험 결과 제안한 합성단위 선택 방법으로 합성음의 자연성을 향상 시킬 수 있었다.

거미의 감각기관을 모사한 초민감 균열기반 진동압력센서 (Ultrasensitive Crack-based Mechanosensor Inspired by Spider's Sensory Organ)

  • 오수연;김태일
    • 마이크로전자및패키징학회지
    • /
    • 제31권1호
    • /
    • pp.1-6
    • /
    • 2024
  • 거미는 진동감각기관을 통하여 미세한 진동까지도 감지해낸다. 뛰어난 진동 감지 능력을 활용해 먹이나 포식자가 발생시키는 진동을 감지하여 공격을 계획하거나 위협을 파악하며 생존에 활용한다. 본 논문은 거미의 진동감각기관을 모사하여 개발된 초민감 진동압력센서에 대해 기술한다. 거미가 진동을 감지하는데 사용하는 감각기관에 위치한 작은 틈에 착안하여 센서에 균열을 생성하였고, 균열의 깊이를 제어하여 외부로부터 오는 압력이나 진동을 매우 민감하게 감지할 수 있는 센서를 개발하였다. 이 센서는 10 N의 인장응력을 적용하여 2%의 변형률에서 게이지 계수가 16000에 도달한다. 이는 높은 신호대잡음비를 가져 정확하게 원하는 진동을 인식할 수 있는 소자로서 외력(압력, 진동)과 생체 신호측정 등 다양한 평가를 통해 센서의 높은 민감도를 증명하였다. 이를 통하여 생체모사 기술을 활용한 새로운 센서의 개발 및 다양한 산업 분야로의 응용 가능성을 제시한다.

뇌성마비 아동의 신체 기능수준과 재활 목적 치료 강도가 신체 기능향상에 미치는 영향: 6개월간 추적연구 (The Effects of Physical Function Level and Intensity of Treatment for Rehabilitation on Improvement of Physical Function in Children with Cerebral Palsy: Follow-up Study for 6 Months)

  • 김부영;윤영주;신용범;김수연;오태영
    • 대한물리의학회지
    • /
    • 제13권1호
    • /
    • pp.27-38
    • /
    • 2018
  • PURPOSE: The purpose of this study was to find out the treatment patterns of Children with cerebral palsy, and to analyze the effect of physical function level and treatment intensity on improvement of physical function in children with cerebral palsy for six months. METHODS: Participants were 126 children (boys 83, girls 43) diagnosed cerebral palsy that the mean age was at 33months, ranged from 8 months to 77 months. We collected data related on demography and disable characteristic, treatment pattern using by questionnaire constructed ourselves for six months on caregivers. The treatment pattern includes, type, frequency, and institute of treatment. We performed the evaluation of Gross Motor Function Measurement (GMFM) and Pediatric Evaluation of Disability Inventory (PEDI) between pre and post for six months in order to find out improvement of physical function. We analyzed the effect of physical functional level measured by Gross Motor Functional Classification system, age, treatment intensity on physical function using by repeated measures ANOVA for SPSS PC ver. 22.0. RESULTS: The average of treatment frequency for physical therapy was 5.74 times per week, occupational therapy was 3.96 times, speech therapy was 2.96 times, treatment for accompanying disability was 3.12 times. Physical function level and age was significantly factors affecting improvement of physical function, there was no significant difference according to treatment intensity. CONCLUSION: We suggest that physical function and age might be important factors on improvement of physical function and professional rehabilitation team must consider the appropriate treatment type customized to each children.

반응성 애착 장애아(反應性 愛着 障碍兒)와 정상아의 의사소통 및 모자 상호작용 유형 비교연구 (COMPARISON OF COMMUNICATION AND MOTHER-CHILD INTERACTION PATTERNS BETWEEN REACTIVE ATTACHMENT DISORDERED CHILDREN AND NORMAL CHILDREN)

  • 이혜련;최영림
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제5권1호
    • /
    • pp.118-132
    • /
    • 1994
  • 본 연구는 반응성 애착 장애아와 정상아의 의사소통 및 모자 상호작용 유형을 비교하기 위해 반응성 애착 장애아와 정상아 각 12명씩 그리고 그들의 어머니가 참석했다. 어머니와 아동은 이혜련 신경정신과 의원의 놀이치료실에 내원하여 가정에서 하듯이 놀이하라는 지시를 받고 15분간의 자유놀이를 하였고 이를 녹화하였다. 녹화된 테이프를 전사자료로 작성하여 의사소통 유형을 분석하였으며 상호작용 유형은 시간 표집 방법으로 분석하여 빈도자료를 얻었다. 이 자료는 t-검증 ,상관계수로 통계처리 되었다. 그 결과는 다음과 같았다. 1) 두 집단 아동의 비사소통 유형에서는 '수용적 발어', '정보요구', '기술', '자기기술'에서 의미있는 차이가 있었다. 2) 두 집단 어머니의 의사소통 유형에서는 '수용적 발어', '명명하기'에서 의미있는 차이가 있었다. 3) 두 집단의 상호작용 유형에서는 반응성 애착 장애아와 그들의 어머니 모두가 먼저 상호작용을시작하는 빈도가 적었고, 아동의 혼자놀이는 더 많았으며 혼자놀이 시의 어머니의 반응은 통제와 무반응이 정상아 집단보다 많았다. 4) 두 집단 아동과 어머니의 의사소통 유형과 상호작용 유형에서 의미있는 차이를 보였던 항목들간에 높은 상관을 보였는데 아동의 '수용적 발어', '정보요구', '기술'. '자기기술'은 '상호작용시작'과 정적인 상관을 보였으며 '혼자놀이', '통제', '무반응'과는 부적상관을 보였다.

  • PDF

요양병원 노인에서 수면의 질의 따른 손 기능과 수면 장애 요인 간 관련성 연구 (The Relation between Hand Function and Sleep Disturbance Factors According to Quality of Sleep among Elderly Patients in Geriatric Hospitals)

  • 강은영;정복희
    • 고령자・치매작업치료학회지
    • /
    • 제12권2호
    • /
    • pp.47-55
    • /
    • 2018
  • 목적 본 연구는 요양병원 노인에서 수면의 질에 따른 손 기능 변화와 수면의 질과 손 기능, 수면 장애 요인간의 상관관계를 알아보고자 하였다. 연구방법 2017년 11월부터 2018년 1월까지 6개월 이상 입원중인 23명의 환자를 대상으로 수면 측정도구 A를 사용하여 수면의 질, 악력계를 이용하여 악력을 평가 하였고 BBT, 9-Hole Peg test를 사용하여 협응력을 평가 하였다. 수집된 자료는 SPSS 21.0 통계 프로그램을 사용하여 대응 표본 t-검정, 피어슨 상관분석을 실시하였다. 연구결과 수면 점수 '상' 집단에서는 수면의 질과 BBT 간에, 악력과 BBT 간에 상관관계를 보였고 '중' 집단에서는 악력과 BBT 간에 상관관계를 보였다. 두군 모두에서 수면의 질과 수면 양상 간의 유의미한 높은 상관관계를 보였다. 결론 요양병원에 입소한 노인 중 수면 장애의 질적 차이를 보일 때 BBT와 악력 향상을 위한 치료의 병행은 수면의 질을 향상시킬 수 있으며 수면 양상 중재는 수면의 질을 개선하는데 효과적일 것으로 생각 된다.

뉴럴네트워크 기반에 악성 URL 탐지방법 설계 (Design of detection method for malicious URL based on Deep Neural Network)

  • 권현;박상준;김용철
    • 융합정보논문지
    • /
    • 제11권5호
    • /
    • pp.30-37
    • /
    • 2021
  • 사물인터넷 등을 통하여 각종 기기들이 인터넷으로 연결되어 있고 이로 인하여 인터넷을 이용한 공격이 발생하고 있다. 그러한 공격 중 악성 URL를 이용하여 사용자에게 잘못된 피싱 사이트로 접속하게 하거나 악성 바이러스를 유포하는 공격들이 있다. 이러한 악성 URL 공격을 탐지하는 방법은 중요한 보안 이슈 중에 하나이다. 최근 딥러닝 기술 중 뉴럴네트워크는 이미지 인식, 음성 인식, 패턴 인식 등에 좋은 성능을 보여주고 있고 이러한 뉴럴네트워크를 이용하여 악성 URL 탐지하는 분야가 연구되고 있다. 본 논문에서는 뉴럴네트워크를 이용한 악성 URL 탐지 성능을 각 파라미터 및 구조에 따라서 성능을 분석하였다. 뉴럴네트워크의 활성화함수, 학습률, 뉴럴네트워크 모델 등 다양한 요소들에 따른 악성 URL 탐지 성능에 어떠한 영향을 미치는 지 분석하였다. 실험 데이터는 Alexa top 1 million과 Whois에서 크롤링하여 데이터를 구축하였고 머신러닝 라이브러리는 텐서플로우를 사용하였다. 실험결과로 층의 개수가 4개이고 학습률이 0.005이고 각 층마다 노드의 개수가 100개 일 때, 97.8%의 accuracy와 92.94%의 f1 score를 갖는 것을 볼 수 있었다.

Prosodic Phrasing and Focus in Korea

  • Baek, Judy Yoo-Kyung
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 1996년도 10월 학술대회지
    • /
    • pp.246-246
    • /
    • 1996
  • Purpose: Some of the properties of the prosodic phrasing and some acoustic and phonological effects of contrastive focus on the tonal pattern of Seoul Korean is explored based on a brief experiment of analyzing the fundamental frequency(=FO) contour of the speech of the author. Data Base and Analysis Procedures: The examples were chosen to contain mostly nasal and liquid consonants, since it is difficult to track down the formants in stops and fricatives during their corresponding consonantal intervals and stops may yield an effect of unwanted increase in the FO value due to their burst into the following vowel. All examples were recorded three times and the spectrum of the most stable repetition was generated, from which the FO contour of each sentence was obtained, the peaks with a value higher than 250Hz being interpreted as a high tone (=H). The result is then discussed within the prosodic hierarchy framework of Selkirk (1986) and compared with the tonal pattern of the Northern Kyungsang dialect of Korean reported in Kenstowicz & Sohn (1996). Prosodic Phrasing: In N.K. Korean, H never appears both on the object and on the verb in a neutral sentence, which indicates the object and the verb form a single Phonological Phrase ($={\phi}$), given that there is only one pitch peak for each $={\phi}$. However, Seoul Korean shows that both the object and the verb have H of their own, indicating that they are not contained in one $={\phi}$. This violates the Optimality constraint of Wrap-XP (=Enclose a lexical head and its arguments in one $={\phi}$), while N.K. Korean obeys the constraint by grouping a VP in a single $={\phi}$. This asymmetry can be resolved through a constraint that favors the separate grouping of each lexical category and is ranked higher than Wrap-XP in Seoul Korean but vice versa in N.K. Korean; $Align-x^{lex}$ (=Align the left edge of a lexical category with that of a $={\phi}$). (1) nuna-ka manll-ll mEk-nIn-ta ('sister-NOM garlic-ACC eat-PRES-DECL') a. (LLH) (LLH) (HLL) ----Seoul Korean b. (LLH) (LLL LHL) ----N.K. Korean Focus and Phrasing: Two major effects of contrastive focus on phonological phrasing are found in Seoul Korean: (a) the peak of an Intonatioanl Phrase (=IP) falls on the focused element; and (b) focus has the effect of deleting all the following prosodic structures. A focused element always attracts the peak of IP, showing an increase of approximately 30Hz compared with the peak of a non-focused IP. When a subject is focused, no H appears either on the object or on the verb and a focused object is never followed by a verb with H. The post-focus deletion of prosodic boundaries is forced through the interaction of StressFocus (=If F is a focus and DF is its semantic domain, the highest prominence in DF will be within F) and Rightmost-IP (=The peak of an IP projects from the rightmost $={\phi}$). First Stress-F requires the peak of IP to fall on the focused element. Then to avoid violating Rightmost-IP, all the boundaries after the focused element should delete, minimizing the number of $={\phi}$'s intervening from the right edge of IP. (2) (omitted) Conclusion: In general, there seems to be no direct alignment constraints between the syntactically focused element and the edge of $={\phi}$ determined in phonology; all the alignment effects come from a single requirement that the peak of IP projects from the rightmost $={\phi}$ as proposed in Truckenbrodt (1995).

  • PDF

SSAE 알고리즘을 통한 2003-2016년 남한 전역 쌀 생산량 추정 (Rice Yield Estimation of South Korea from Year 2003-2016 Using Stacked Sparse AutoEncoder)

  • 마종원;이경도;최기영;허준
    • 대한원격탐사학회지
    • /
    • 제33권5_2호
    • /
    • pp.631-640
    • /
    • 2017
  • 쌀 생산량 예측 및 조사는 농가 소득 보전 및 농업 분야 기관에 영향을 주고 수급 조절과 가격 예측 등 정부의 정책 수립과 관련하여 중요한 의미를 갖는다. 이에 따라 작황 추정 모델의 구축이 필요하며 과거로부터 기상 자료 및 위성 자료를 통해 경험적 통계 모델 또는 인공신경망 알고리즘을 기반으로 한 연구가 다수 진행되었다. 현재 인공신경망 모델을 기반으로 개발된 딥 러닝 알고리즘이 패턴 인식, 컴퓨터 비전, 음성 인식 등의 분야에서 폭넓게 사용되며 뛰어난 성능을 보이고 있다. 최근 다양한 딥 러닝 알고리즘 중 SSAE 알고리즘이 시계열 자료를 통한 예측 분야에서 적용 가능성이 확인되었으며 본 연구에서는 SSAE를 통해 남한 전역에 대한 쌀 생산량 추정 연구를 진행하였다. 입력 변수로 기상자료와 위성자료를 사용하였으며 남한 벼의 생육 기간을 고려하여 입력 자료를 기간별로 나누고 최적의 입력 자료롤 찾고자 하였다. 실험 결과, 5월부터 9월까지의 위성 자료와 16일 평균값을 사용한 기상 자료와의 조합을 사용하였을 경우 평균 연도별 %RMSE, 시군구 %RMSE 각각 7.43%, 7.16%로 가장 좋은 성능을 보였으며 이를 통해 쌀 생산량 추정 분야에 대한 SSAE 알고리즘의 적용 가능성을 확인할 수 있었다.