• 제목/요약/키워드: Sound recognition

검색결과 311건 처리시간 0.028초

구개열 환자 발음 판별을 위한 특징 추출 방법 분석 (Analysis of Feature Extraction Methods for Distinguishing the Speech of Cleft Palate Patients)

  • 김성민;김우일;권택균;성명훈;성미영
    • 정보과학회 논문지
    • /
    • 제42권11호
    • /
    • pp.1372-1379
    • /
    • 2015
  • 본 논문에서는 구개열 환자의 장애 발음과 정상인의 발음을 자동으로 구분하여 판별하는데 사용될 수 있는 특징 추출 방법들의 성능을 분석하는 실험에 대하여 소개한다. 이 연구는 발성 장애인의 복지 향상을 추구하며 수행하고 있는 장애 음성 자동 인식 및 복원 소프트웨어 시스템 개발의 기초과정이다. 실험에 사용된 음성 데이터는 정상인의 발음, 구개열 환자의 발음, 그리고 모의 환자의 발음의 세 그룹으로부터 수집된 한국어 단음절로서 14개의 기본 자음과 5개의 복합 자음, 7개 모음이다. 발음의 특징 추출은 LPCC, MFCC, PLP의 세 가지 방법으로 각각 수행하였고, GMM 음향 모델로 인식 훈련을 한 후, 수집된 단음절 데이터를 대상으로 하여 인식 실험을 실시하였다. 실험 결과, 정상인과 구개열 환자의 장애 발음을 구별하기 위하여 특징을 추출함에 있어서 MFCC 방법이 전반적으로 가장 우수하였다. 본 연구의 결과는 구개열 환자의 부정확한 발음을 자동으로 인식하고 복원하는 연구와 구개열 장애 발음의 정도를 측정할 수 있는 도구에 대한 연구에 도움이 될 것으로 기대된다.

패턴 인식 성능을 향상시키는 새로운 형태의 순환신경망 (A New Thpe of Recurrent Neural Network for the Umprovement of Pattern Recobnition Ability)

  • 정낙우;김병기
    • 한국정보처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.401-408
    • /
    • 1997
  • 인간이 지식을 얻는 대부분의 수단은, 눈으로 사물을 보거나 귀로 소리를 들어 입력되는 패턴.영상또는 소리.을 인식하고 그것을 지식으로 축적하는 연속적인 과정이다. 그중 문자인식은 시각정보를 통하여 문제를 인식하고 나아가 의미를 이해하는 인간의 능력을 컴퓨터로 실현하려는 패턴인식의 한분야로서 신경망을 사용한 패턴인식 시스템으로 발전되고 있다. 신경망의 학습에 있어서를 출력값을 재사용하는 신경망모델로는, 순환신경망( Recurrent Neural Netwrek)이 있다. 최근 들어서 이러한 순환신경망을 오프라인 필기체 문자와 같은 정적인 패턴의 분류에 적용하려는 연구가 많이 진행되고 있다. 그러나 이러한 방법들의 대부분든 오프라인 필기체문자와 같은 정적인 패턴의 분류에 있어서는 효과적으로 적용되지 않는다. 이에 본 연구에서는 오프라인 필기체문자와 같은 정적인 패턴을 효과적으로 분르하기 위한 새로운 형태의 순환신경망을 제안한다.본논문에서는 Jordan과 Elman Model 을 확정 결합한 새로운 J-E(Jordan-Elman) 신경망 모델을 사용하여 숫자 및 필기체 문자와 같은 정적인 패턴의 인식에서 기존의 신명망보다 성능이 향상되었음을 보여 준다.

  • PDF

톨이론에 의한 유사도 계산과 퍼지 관계 행렬을 이용한 정합과정의 수행 - 3차원 영상을 중심으로 (Measure of similarity by toll theory and matching using fuzzy relation matrix - focused on 3-dimensional images)

  • 조동욱;한길성;조용환
    • 한국통신학회논문지
    • /
    • 제22권8호
    • /
    • pp.1698-1706
    • /
    • 1997
  • 본 논문은 2차원 정보, 3차원 정보 그리고 그 밖의 각종 유용한 정보를 취합하여 이를 상호 보완하여 인식하는 멀티미디어 시스템 중의 한 부분으로 이중 3차원 정보를 추출하고 정합 하는 방법을 제안하고자 한다. 우선 거리 영상으로부터 z축 기울기를 이용하여 표면 분류를 행하고 법선 벡터들의 교점을 통해 각 표면들에 대한 특징을 추출한다. 또한 각 표면들로 부터 이루는 각이나 거리등과 같은 특징 관계를 설정한다. 이후 정합 과정을 통해 인식을 수행하게 되는데 정합 과정은 영상인식의 최종 단계로 대단히 중요한 과정중의 하나가 된다. 왜냐하면 멀티미디어 시스템은 각종 정보를 취합하여 정합 과정을 수행해야 하기 때문에 취합한 모든 정보를 보다 보편적이고 효율적으로 정합하는 방법론의 제시가 중요하기 때문이다. 따라서 본 논문에서는 정합 과정 수행에 필요한 보편적 방법론의 제안에 초점을 맞추고자 하며 이중 우선 3차원 물체의 정합과정에 대해 다루고자 한다. 이를 위해 롤이론을 적용하여 유사도를 측정하며 이를 퍼지 관계 행렬을 구성하여 인식을 수행한다. 최종적으로 실험에 의해 본 논문의 유용성을 입증하고자 한다.

  • PDF

의인성 요관손상: 언제, 어떻게 치료할 것인가? (Iatrogenic Ureteral Injury: When and How to Treat?)

  • 서강일;이종복
    • Journal of Trauma and Injury
    • /
    • 제21권1호
    • /
    • pp.8-14
    • /
    • 2008
  • Iatrogenic ureteral injury is a complication that can occur during a variety of pelvic or abdominal surgeries. The most frequent causes are gynecological ones, followed by colon and vascular surgeries. Management of ureteric injury depends on the time of diagnosis and the severity of organ damage. Injuries diagnosed intraoperatively should be treated immediately. Occasionally, intraoperative ureteral injury is overlooked, and symptoms of the late diagnosis of ureteral injury are usually nonspecific; therefore, the diagnosis is delayed for days or weeks postoperatively. Management of injuries diagnosed postoperatively is more complex. There are differing opinions on whether an initial conservative or immediate operative intervention is the best line of action. Delayed repair is suggested on the grounds that it will reduce inflammation and tissue edema. However, many authors are in favor of early repair, perhaps because tissue planes are easier to find before fibrosis becomes too dense. Ureteral injuries occurring at the level of the pelvic brim should be best managed with an end-to-end anastomosis, preferably around a ureteric stent. More distal injuries also should be ideally managed with an end-to-end anastomosis, after excision of the crushed or compromised segments. However, if the remaining distal segment is short, ureteral reimplantation is the procedure of choice. The Boari flap technique for ureteral reimplantation is invaluable in cases with a short proximal segment. Delayed recognition of iatrogenic ureteral injury may be associated with serious complications, so prompt recognition of ureteral injuries is important. Recognition of the injury before closure is the key to easy, successful, and complications-free repair. Increased awareness of the risk for ureteral damage during certain operative maneuvers is vital to prevent injury, and to decrease the incidence of iatrogenic injury. A sound knowledge of abdominal and pelvic anatomy is the best prevention.

취소 가능한 얼굴 인식을 지원하는 치환 변환 기법에 대한 고찰 (Revisiting Permutation Transformation Scheme for Cancelable Face Recognition)

  • 김군순;강전일;이경희;양대헌
    • 정보보호학회논문지
    • /
    • 제16권6호
    • /
    • pp.37-46
    • /
    • 2006
  • 생체 정보를 사용하는 시스템에 암호학적 단방향 함수를 직접적으로 적용하는 것은 어려운 것으로 알려져 있다. 이러한 문제를 해결하기 위한 한 가지 방법으로써, 치환 변환 기법이 존재한다. 그러나 그 기법에서는 실험을 통한 구체적인 알고리즘이나 변환 기법에 따른 성능 분석을 직접 보여주지 않았다. 이 논문에서는 변환 기법의 인식률을 실험을 통하여 보여줌으로써 기법이 올바르게 동작한다는 사실을 보인다. 또한 실험 결과를 보여주는데 있어서 LDA에 치환 변환 기법을 적용하였다. 반대로 우리는 또한 치환 변환 기법에 반하는 새로운 공격에 대해서 소개하고, 마지막으로 이 문제를 해결할 수 있는 치환 변환 기법의 일반화를 간략히 소개한다.

Conformer 모델을 이용한 물체 표면 재료의 특성에 따른 가속도 신호 기반 햅틱 질감 인식 (Acceleration signal-based haptic texture recognition according to characteristics of object surface material using conformer model)

  • 김형국;정동기;김진영
    • 한국음향학회지
    • /
    • 제42권3호
    • /
    • pp.214-220
    • /
    • 2023
  • 본 논문에서는 합성곱 신경망과 트랜스포머의 장점을 결합한 Conformer 모델을 이용하여 물체 표면의 질감특성을 나타내는 햅틱 가속도 신호로부터 질감 인식 성능을 향상시키는 방식을 제안한다. 제안한 방식에서는 사람이 스타일러스와 같은 도구를 이용하여 물체 표면과 접촉하는 동안 충격음과 진동에 의해 발생한 3축 가속도 신호를 1차원 가속도 데이터로 결합하고, 오디오 신호와 유사성을 갖는 햅틱 가속도 신호로부터 로그 멜-스펙트로그램을 추출한다. 그리고 추출된 로그 멜-스펙트로그램에 Conformer 모델을 적용하여 다양한 물체의 질감을 인식하는 데 있어 주요한 지역적 및 전역적인 주파수 특징을 학습한다. 제안된 모델의 성능 평가를 위해 60개의 재질로 구성된 Lehrstuhl für Medientechnik(LMT) 햅틱 질감 데이터세트를 실험한 결과 제안된 방식이 기존 방식들보다 물체 표면 재료의 질감을 효과적으로 잘 인식할 수 있음을 보였다.

심해저용 원격 착탈 제어 시스템의 개발 (A Development of Acoustic Release System in the Seafloor)

  • 김영진;허경무;정한철
    • 제어로봇시스템학회논문지
    • /
    • 제11권9호
    • /
    • pp.774-780
    • /
    • 2005
  • For the accurate inspection of the resources and space in the ocean, the method of locating the measurement equipments in the seafloor and retrieving these equipments later after a certain period of time. is generally used. In this method, the reliability of retrieving measurement equipments is very important. In our proposed remotely-controlled acoustic release system, an underwater ultrasonic wave recognition algorithm by which we can recognize the sound signal without the influence of disturbances due to underwater environment changes is developed, and a battery is used for the reduction of electric power consumption. we show the effectiveness of our proposed system through experimental results.

보안카메라에서 소리인식 구현 (Implementation of Sound Recognition for Security Camera)

  • 윤태인;구하늘;김도은;장원석;권순각;권오준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 춘계학술대회
    • /
    • pp.491-493
    • /
    • 2012
  • 소리인식이란 우리 귀에 들리는 모든 소리를 받아 들여 소리의 값과 저장되어 있는 데이터의 값을 비교하여 인식 결과를 도출해내는 과정을 의미한다. 보안 카메라는 현재 다양한 장소에서 설치되어 있어도 여전히 보안의 사각지대는 존재하며, 이를 보완하기 위해서는 여러 방향을 촬영하기 위한 아주 많은 보완 카메라가 설치될 수 밖에 없다. 그렇게 되면 설치비용이 더욱 증가되고, 무수한 카메라는 사람들에게 심적 부담감을 줄 것이다. 본 논문은 보안 카메라에 마이크를 설치하고, 입력되는 소리를 인식하여 발생되는 상황을 판단하는 시스템을 설계하고 구현하기 위한 것이다. 이를 바탕으로 보안 카메라의 사각지대를 소리인식으로 해결할 수 있어서 보완 카메라의 설치 비용을 줄일 수 있다.

  • PDF

모바일제품을 위한 청각 아이콘 설계에 관한 연구 (Design of Auditory Icons in Mobile Applications)

  • 박동현;명노해
    • 대한인간공학회지
    • /
    • 제24권3호
    • /
    • pp.29-34
    • /
    • 2005
  • Little research has been performed regarding auditory icons even though auditory icons have great potentials as a strategy for creating informative, intuitively accessible, and unobtrusive interface. Therefore, this study was conducted to design new auditory icons through the iconic mapping for ten most frequently used mobile phone menus, and to show the usability of auditory icons. Two most familiar auditory sounds for each menu were collected and compared to the current button-pressing sound. The results show that the newly designed auditory icons had shorter recognition times, better satisfaction than the current icons. In other words, auditory icons could be an effective interface to provide a redundant feedback along with visual feedbacks in navigating mobile devices.

소셜 TV적용을 위한 사용자 반응 사운드 인식방식 비교 (Comparison of User's Reaction Sound Recognition for Social TV)

  • 류상현;김형국
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2013년도 하계학술대회
    • /
    • pp.155-156
    • /
    • 2013
  • 소셜 TV 사용 시, 사용자들은 TV를 시청하면서 타 사용자와의 소통을 위해 리모컨을 이용해서 텍스트를 작성해야하는 불편함을 가지고 있다. 본 논문에서는 소셜 TV의 이러한 불편함을 해결하기 위해 사용자 반응 사운드를 자동으로 인식하여 상대방에게 이모티콘을 전달하기 위한 시스템을 제안하며, 사용자 반응 사운드 인식에 사용되는 분류방식들을 비교한다. 사용자 반응 사운드 인식을 위해 사용되는 분류 방식들 중에서, Gaussian Mixture Model(GMM), Gaussian Mixture Model - Universal Background Model(GMM-UBM), Hidden Markov Model(HMM), Support Vector Machine(SVM)의 성능을 비교하였다. 각 분류기의 성능을 비교하기 위하여 MFCC 특징값을 각 분류기에 적용하여 사용자 반응 사운드 인식에 가장 최적화된 분류기를 선택하였다.

  • PDF