• 제목/요약/키워드: Speech recognition

검색결과 2,053건 처리시간 0.025초

DMS 모델을 이용한 음성인식에 관한 연구 (A Study on Speech Recognition using DMS Model)

  • 안태옥;변용규
    • The Journal of the Acoustical Society of Korea
    • /
    • 제13권2E호
    • /
    • pp.41-50
    • /
    • 1994
  • 본 연구는 단어 패턴 중 유사한 특성의 정보에 기초를 둔 DMS(Dynamic Multi-Section) 모델을 제안한다. 이 모델은 각각의 단어를 몇 개의 구간(Section)의 시계열로 분할하고, 각각의 구간 모두에 지속 시간 정보와 구간을 대표하는 특징 벡터를 구간의 정보로 등록해 둔 것이다. 단어 패턴에서 모델을 작성하는 절차는 대표 특징 벡터와 지속 시간의 정보를 거리에 따라 반영하면서 단어 패턴과 모델과의 매칭을 반복하여 매칭에 의한 누적 거리가 최소로 되도록 하는 것이다. 제안된 음성 인식 실험을 수행하는 것 이외에도 비교를 위해 DP 방법, HMM 방법 및 MSVQ 방법에 의한 음성 인식 실험을 같은 조건하에서 같은 데이터로 수행하였다. 또한 제안된 DMS 모델을 이용한 음성 인식시에도 DMS/DP 방법에 의한 인식 및 DMS/VQ에 의한 인식률은 89.3%이다. 또한 DMS 모델을 이용한 DMS/DP에 의한 인식률은 95.8%이고, DMS/VQ에 의한 인식률은 96.8%이다. 그러므로, DMS 모델을 이용한 DMS/VQ 방법에 의한 인식이 일반적으로 많이 이용되고 잇는 DP 방법이나 HMM 방법 및 MSVQ 방법과 비교해 볼 때 인식률도 우수하며, 기억 용량 및 계산량도 감소되어, 본 연구에서 제안하는 DMS 모델의 유용성이 입증되었다.

  • PDF

발달장애인 선거권에 대한 대학생의 인식 연구: 장애관련 교육경험 유무를 중심으로 (A Study on the Perception of the Right to Vote of Persons with Developmental Disabilities in College Students: Based on the Experience of Disability Related Education)

  • 이우진;김태강
    • 디지털융복합연구
    • /
    • 제16권2호
    • /
    • pp.65-71
    • /
    • 2018
  • 본 연구는 대학생들의 발달장애인 선거권에 대한 인식을 알아보는데 목적이 있다. 광주광역시의 A대학교와 B대학교에 재학 중인 학생들을 대상으로 편의표집을 통해 최종 370명의 자료를 분석하였다. 분석결과, 장애관련 강좌를 수강한 적이 있는 경우에 발달장애인의 선거권에 대한 인식이 높은 것으로 나타났다. 둘째, 장애관련 봉사 참여 횟수가 많을수록 발달장애인의 선거권에 대한 인식이 높은 것으로 나타났다. 셋째, 발달장애인의 참정권 필요하다고 응답한 경우가 그렇지 않은 경우보다 선거권의 인식이 긍정적인 것으로 나타났다. 이러한 결과를 통해 대학생을 포함한 비장애인들이 발달장애인의 선거권에 대한 긍정적인 태도와 인식을 확립하기 위한 방안 모색이 필요함을 제언하였다.

문자출력 무선호출기를 위한 음성인식 시스템 (Speech Recognition in the Pager System displaying Defined Sentences)

  • 박규붕;박전규;서상원;황두성;김현빈;한문성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.158-162
    • /
    • 1996
  • 본 논문에서는 문자출력이 가능한 무선호출기에 음성인식 기술을 접목한, 특성화된 한 음성인식 시스템에 대하여 설명하고자 한다. 시스템 동작 과정은, 일단 호출자가 음성인식 서버와 접속하게 되면 서버는 호출자의 자연스런 입력음성을 인식, 그 결과를 문장 형태로 피호출자의 호출기 단말기에 출력시키는 방식으로 되어 있다. 본 시스템에서는 통계적 음성인식 기법을 도입하여, 각 단어를 연속 HMM으로 모델링하였다. 가우시안 혼합 확률밀도함수를 사용하는 각 모델은 전통적인 HMM 학습법들 중의 하나인 Baum-Welch 알고리듬에 의해 학습되고 인식시에는 이들에 비터비 빔 탐색을 적용하여 최선의 결과를 얻도록 한다. MFCC와 파워를 혼용한 26 차원 특징벡터를 각 프레임으로부터 추출하여, 최종적으로, 83 개의 도메인 어휘들 및 무음과 같은 특수어휘들에 대한 모델링을 완성하게 된다. 여기에 구문론적 기능과 의미론적 기능을 함께 수행하는 FSN을 결합시켜 자연발화음성에 대한 연속음성인식 시스템을 구성한다. 본문에서는 이상의 사항들 외에도 음성 데이터베이스, 레이블링 등과 갈이 시스템 성능과 직결되는 시스템의 외적 요소들에 대해 고찰하고, 시스템에 구현되어 있는 다양한 특성들에 대해 밝히며, 실험 결과 및 앞으로의 개선 방향 등에 대해 논의하기로 한다.

  • PDF

특징 선택에서 선택적 평가를 사용하는 개미 군집 최적화의 수렴 특성 (Convergence Characteristics of Ant Colony Optimization with Selective Evaluation in Feature Selection)

  • 이진선;오일석
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.41-48
    • /
    • 2011
  • 최근 특징 선택에서 개미군집 최적화를 위한 선택적 평가 기법이 제안되었다. 이 기법은 불필요하거나 가능성이 적은 후보 해를 실제 평가 과정에서 제외함으로써 계산량을 줄인다. 실험을 통해 이 기법의 우수성을 보였으나, 하나의 데이터만을 사용하였으므로 통계적으로 충분한 신뢰성을 보여주지 못한다. 이 논문의 목적은 선택적 평가 기법의 수렴 특성을 분석하고 결론의 신뢰성을 높이는 것이다. 실험을 위해 UCI 데이터베이스에서 필기, 의료, 음성에 관련된 세가지 데이터를 선택하였다. 이들의 특징 집합 크기는 256부터 617까지 분포한다. 통계적으로 안정된 데이터를 얻기 위해, 이들 각각에 대해 프로그램을 독립적으로 12번 실행하였다. 긴 시간에 걸친 수렴을 관찰하기 위해, 각각의 프로그램 실행은 72시간 동안 이루어졌다. 실험 데이터의 분석을 바탕으로, 선택적 평가 기법의 우수성에 대한 이유와 이 기법의 적용 범위에 대해 기술한다.

차원별 Eigenvoice와 화자적응 모드 선택에 기반한 고속화자적응 성능 향상 (Performance Improvement of Fast Speaker Adaptation Based on Dimensional Eigenvoice and Adaptation Mode Selection)

  • 송화전;이윤근;김형순
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.48-53
    • /
    • 2003
  • Eigenvoice 방법은 고속화자적응에 적합하다고 알려져 있지만, 이 방법은 발화수가 증가하더라도 추가적인 인식성능향상이 이루어지지 않는 단점이 있다. 본 논문에서는 이 문제를 해결하기 위해 음성 특징벡터의 차원별로 eigenvoice의 가중치를 구하여 적응시키는 방법과 또한 적응 데이터 수에 따라 높은 인식률을 얻는 적응 방식을 선택하는 방식을 제안한다. 화자독립모델 및 eigenvoice들을 구성하기 위해 POW (Phonetically Optimized Words)데이터베이스를 사용하였으며, PBW(Phonetically Balanced Words) 452단어 중50개까지 발화 수를 변화시키면서 교사방식 (Supervised mode)로 적응에 사용하고 나머지 중 400개를 인식실험에 사용하였다. 차원별 eigenvoice 방법이 발화수가 증가함에 따라 기존의 eigenvoice 나 MLLR 방법보다 높은 성능을 보였으며, eigenvoice와 차원별 eigenvoice방법 사이의 적응 모드 선택을 통해 기존의 eigenvoice 방식에 비해 최고 26%의 단어 오인식률 감소를 얻었다.

모바일 환경에서 효과적인 사용자 인터페이스를 이용한 LMS에 관한 연구 (A Study on LMS Using Effective User Interface in Mobile Environment)

  • 김시정;조도은
    • 한국항행학회논문지
    • /
    • 제16권1호
    • /
    • pp.76-81
    • /
    • 2012
  • 다양한 모바일 기기의 보급 확산으로 u러닝 기반의 학습 관리 시스템의 연구가 활발히 진행 되고 있다. u-러닝 기반의 학습 관리 시스템은 콘텐츠 사용자의 접근 시간과 장소 그리고 다양한 접근 기기에 대한 제약이 없다는 점에서 매우 편리하다. 그러나 사용자에 대한 접근의 인증과 학습에 대한 집중 여부에 대한 판단이 매우 어렵다. 본 논문은 일반적인 사용자 이벤트 중심의 인터페이스가 아닌 음성과 사용자 안면 캡춰 인터페이스를 학습 관리 시스템에 적용 하였다. 사용자가 학습 관리 시스템에 접근 시 등록된 본인의 패스워드를 음성 입력하여 로그인 하고, 사용자가 콘텐츠를 통해 학습이 진행 되는 과정에서도 간단한 단어의 응답 발화를 통해 사용자의 학습 태도 및 학습 성과를 판단하게 한다. 제안된 학습 관리 시스템의 평가 결과 사용자의 학습 성취도와 집중도가 향상 되었으며 이에 따른 사용자의 비정상적인 학습태도에 대한 관리자의 모니터링을 가능 하게 했다.

심층신경망을 활용한 활주로 가시거리 예측 모델 개발 (Development for Estimation Model of Runway Visual Range using Deep Neural Network)

  • 구성관;홍석민
    • 한국항행학회논문지
    • /
    • 제21권5호
    • /
    • pp.435-442
    • /
    • 2017
  • 안개 등의 영향을 받는 활주로 시정은 비행장에서 항공기 이착륙의 가능 여부를 결정하는 주요 지표중 하나이다. 운송용 항공기가 운항되는 공항의 경우 활주로 시정을 포함한 주요 국지 기상 예보를 시행하며, 이를 항공종사자가 확인할 수 있도록 하고 있다. 본 논문은 최근 영상 처리, 음성 인식, 자연어 처리 등의 다양한 분야에 적용되고 있는 심층신경망을 활주로 시정 예측에 적용하여 국지 비행장의 활주로 시정 예측 모델을 개발하고 이를 활용한 예측을 수행하였다. 적용 대상 비행장의 과거 실제 기상 관측 값을 활용하여 신경망 학습 후 시정에 대한 예측을 수행하였고, 기존 관측 데이터와 비교한 결과 비교적 정확한 예측 결과를 확인하였다. 또한 개발된 모델은 별도의 예보 기능이 없는 해당 비행장에서 참고할 수 있는 기상정보를 생성하는데 사용될 수 있을 것이다.

연속형 속성을 갖는 인공 신경망의 규칙 추출 (Extracting Rules from Neural Networks with Continuous Attributes)

  • 바트셀렘;이완곤;전명중;박현규;박영택
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.22-29
    • /
    • 2018
  • 지난 수십 년 동안 인공 신경망은 음성 인식에서 이미지 분류에 이르기까지 수많은 분야에서 성공적으로 사용되었다. 그러나 인공 신경망은 특정 결론이 어떻게 도출되었는지 알 필요가 있음에도 불구하고 이러한 결과를 설명할 수 있는 능력이 부족하다. 대부분의 연구는 신경망에서 이진 규칙을 추출하는데 초점을 맞추고 있지만, 기계 학습 응용 프로그램에 사용되는 데이터는 연속된 값이 포함되어 있기 때문에 실용적이지 않은 경우가 있다. 이러한 격차를 줄이기 위해 본 논문에서는 연속된 값이 포함된 데이터로부터 학습된 신경망에서 논리 규칙을 추출하는 알고리즘을 제안한다. 초평면 기반 선형 분류기를 사용하여 입력 및 은닉 층 사이에서 학습된 가중치로부터 규칙을 추출하고, 비선형 분류 규칙을 생성하기 위해 은닉 층과 출력 층에서 학습된 이진 규칙과 분류기를 결합한다. 비선형 연속값으로 구성된 여러 데이터셋을 대상으로 진행한 실험에서 제안하는 방법이 논리적 규칙을 정확하게 추출할 수 있음을 보였다.

디지털 맘모그램을 위한 라플라시안 피라미드에서 대비 척도를 이용한 대비 향상 방법 (A Contrast Enhancement Method using the Contrast Measure in the Laplacian Pyramid for Digital Mammogram)

  • 전금상;이원창;김상희
    • 융합신호처리학회논문지
    • /
    • 제15권2호
    • /
    • pp.24-29
    • /
    • 2014
  • X-선 유방촬영술은 유방암의 조기발견을 위해 가장 일반적으로 이용되고 있다. 유방암의 조기 발견과 진단의 효율성을 증가시키기 위하여 많은 영상향상 방법들이 연구개발 되었다. 본 논문은 디지털 맘모그램을 위하여 라플라시안 피라미드에서 대비척도를 이용한 다중 스케일 대비 향상 방법을 제안한다. 제안한 방법은 입력 영상을 가우시안 피라미드와 라플라시안 피라미드로 분해하고, 분해된 다해상도 영상의 피라미드 계수들은 저주파수 성분들과 고주파수 성분들의 비율로 대역 제한된 국부 대비척도를 정의한다. 대비 향상을 위하여 정의된 대비척도를 이용하여 분해된 피라미드 계수들을 수정하고, 수정된 계수들로 피라미드 복원 과정을 거처 최종 향상된 영상을 얻는다. 제안된 방법의 성능은 실험을 통하여 기존 방법들과 향상결과를 비교하고, 대비 측정 알고리즘을 이용한 정량적인 평가결과에서 우수한 성능을 확인하였다.

회상하기 프로그램이 알츠하이머 노인의 의사소통 능력에 미치는 영향 (The Effect of Reminiscence Therapy on Communication Ability of Elderly Patient With Alzheimer's Dementia)

  • 김수정;장현진
    • 재활치료과학
    • /
    • 제9권4호
    • /
    • pp.21-31
    • /
    • 2020
  • 목적: 회상하기는 알츠하이머 치매 환자에게 심리적 측면에서 안정을 찾는 방안이면서 동시에 자신의 과거를 기억하면서 자신에 대해서 정확하게 표현하면서 의사소통에 대해 접근하는 방법이다. 따라서, 이 연구는 알츠하이머 치매노인에게 회상하기 프로그램에 적응하여 의사소통 능력의 효과를 알아보고자 한다. 연구방법: 본 연구는 70세 노인 중 알츠하이머 치매(Alzheimer's dementia; AD) 노인 4명을 대상으로 사전-치료-사후 평가 단계를 구성하여 실시하였다. 결과: 첫째, 의사소통 요소 중 회화항목 영역에서 중재 후에 향상되었다. 둘째, 의사소통 요소 중 인지력 인식 영역에서 중재 후에 향상되었다. 셋째, 의사소통 요소 중 커뮤니케이션 영역에서 중재 후에 향상되었다. 결론: 이 연구에서는 회상하기 프로그램이 알츠하이머 치매 노인이 의사소통능력의 향상에 긍정적 영향을 미쳤다. 회상하기 프로그램을 바탕으로 추후 치매 노인의 의사소통 능력을 향상시키는데 많은 도움이 될 것으로 사료된다.