• 제목/요약/키워드: Voice evaluation

검색결과 358건 처리시간 0.022초

MFC 기반 음성구동 수치지도정보 검색시스템의 구현 (Development of a Voice-activated Map Information Retrieval System based on MFC)

  • 김낙철;김태수;조명희;정현열
    • 한국지리정보학회지
    • /
    • 제3권1호
    • /
    • pp.69-77
    • /
    • 2000
  • 지리정보시스템(GIS)을 이용한 지도정보의 검색과 공간분석에 있어서 마우스나 키보드를 이용할 경우 수 차례의 동일한 작업을 반복하여 대상지역의 범위를 지정하고 있다. 본 연구에서는 이와 같은 반복작업을 제거하여 신속한 정보검색이 가능하도록 음성인식 기능을 이용한 검색시스템을 제안하고 이를 개인용 컴퓨터상에서 구현하였다. 특히 시스템의 실용화를 위한 검색화면 제어에 있어서는 OLE(object linking embedding)기법과 MFC(Microsoft fundamental class)기법을 이용하여 시스템을 구성한 후 이를 비교하였다. 개발된 시스템의 성능평가를 위해 수치지도 자료는 1:5,000의 대구광역시 수성구의 국가 기본도를 사용하였으며 검색될 목표물을 나타내는 속성정보단어와 제어단어를 포함한 68단어를 검색의 대상으로 하였다. 남성 3인이 발성한 지도검색용 68단어를 실제 사무실 환경 하에서 마이크를 통해 on-line 실험한 결과, 평균 98.02%의 인식률을 얻었으며 검색시간은 MFC만을 이용한 경우 10.38초, OLE를 이용한 경우 5.39초가 소요되어 음성구동 수치지도 검색시스템의 실용화 가능성을 확인하였다.

  • PDF

음성장애에 대한 임상적고찰 (Clinical Observation on Voice Disorder)

  • 이종원
    • 대한기관식도과학회:학술대회논문집
    • /
    • 대한기관식도과학회 1979년도 제13차 학술대회 연제순서 및 초록
    • /
    • pp.7.2-8
    • /
    • 1979
  • 음성외과는 발성기능를 취급하는 기능외과이기 때문에 수술적응의 결정 수술효과의 판정 수술성적의 비교를 위하여 발성기능의 검사가 필요하다. 청력을 취급하는 수술에서 청력검사가 필요한 것과 같다. 연자는 구유미대학 이비인후과를 방문한 각종후두환자(56례 즉Recurrent laryngeal nerve paralysis, polyp. polipoid vocal cord. sulcus vocalis, Laryngeal cancer, Benign mass, Epitherial hypertrophy. 등에서 발성지적시간, 폐활량/담성지적시간, 평균호기유율 및 후두 Stroboscopy 검사를 시행하여 다음과같은 결과를 얻었다. 1) 성대의 편측성병변은 35례(62.5%)이고 양측성병변은 21례(37.5%)로 편측성병변이 많았다. 2) 성별로는 남성이 39례(69.8%) 여성이 17례(30.2%)로 남성이 많았다. 3) 발성지적시간은 10초이하가 26례(46.4%) 10초이상이 30례(53.6%)이였다. 4) 폐활양/발성지적시간은 300m1/sec이하가 33례(58.9%) 300m1/sec이상이 23례(41.1%)이였다. 5) 평균호기류율은 300m1/sec이하가 37례(66.1%)300ml/sec 이상이 19례(33.9%)이였다. 6) 후두 stroboscopy 검사에서 성대의 대칭성, 규칙성, 진폭, 점막파동 및 성문패쇄에 대해서 관찰하였다. 7) 후두수술전후의 음성검사와 stroboscopy 검사의 비교는 수술후의 성적이 매우 좋다.

  • PDF

자폐스펙트럼장애 아동의 후두 높이 및 음성 특성 (Laryngeal height and voice characteristics in children with autism spectrum disorders)

  • 이정헌;김고운;김성태
    • 말소리와 음성과학
    • /
    • 제13권2호
    • /
    • pp.91-101
    • /
    • 2021
  • 본 연구의 목적은 자폐스펙트럼장애를 가진 아동의 후두 특성을 확인하고자 하였다. 자폐스펙트럼장애로 진단받은 2~4세 아동 8명과 같은 연령의 정상 대조군 42명을 포함하여 총 50명의 아동이 실험에 참여하였다. 모든 아동들은 경추와 후두의 중앙시상면의 X-ray 영상을 촬영하여 두 군의 후두 위치를 비교하였다. 또한 모음 연장발화 시 음성 샘플을 수집하여 음향 매개 변수들을 분석하였다. X-ray 검사 결과, 정상군의 설골 높이는 3세가 가장 낮았으며, 4세에 후두 높이가 상승하였다. 다른 한편으로, 외이도에서 설골까지의 거리는 4세가 가장 긴 것으로 나타났다. 이와는 대조적으로, 모든 연령대의 자폐스펙트럼장애군의 설골 높이는 정상군보다 낮았으며, 연령에 따른 설골 위치의 차이는 없었다. 음향학적 평가 결과, PFR, vFo, vAm은 정상 대조군에 비해 자폐스펙트럼장애군이 통계적으로 유의미하게 높게 나타났다. 결론적으로, 자폐스펙트럼장애 아동들의 낮은 후두 높이는 언어발달의 지연과 관련이 있는 것으로 사료된다. 음향학적 변수들 중 음성 조절기능을 보여주는 PFR, vFo, vAm은 정상 아동과 자폐스펙트럼장애 아동의 음질 차이를 보여주는 voice marker로 생각된다.

운동성 조음장애에서 폐쇄자음 발성의 음향학적 특성 (Acoustic Characteristics of Stop Consonant Production in the Motor Speech Disorders)

  • 홍희경;김문준;윤진;박희택;홍기환
    • 대한후두음성언어의학회지
    • /
    • 제23권1호
    • /
    • pp.33-42
    • /
    • 2012
  • Background and Objectives : Dysarthria refers to speech disorder that causes difficulties in speech communication due to paralysis, muscle weakening, and incoordination of speech muscle mechanism caused by damaged central or peripheral nerve system. Pitch, strength and speed are influenced by dysarthria during detonation due to difficulties in muscle control. As evaluation items, alternate motion rate and diadochokinesis have been commonly used, and articulation is also an important evaluation items. The purpose of this study is to find acoustic characteristics on sound production of dysarthria patients. Materials and Methods : Research subjects have been selected as 20 dysarthria patients and 20 subjects for control group, and voice sample was composed of bilabial, alveolar sound, and velar sound in diadochokinetic rate, while consonant articulation test was composed of bilabial plosive, alveolar plosive, velar plosive. Analysis items were composed of 1) speaking rate, energy, articulation time of diadochokinesis, 2) voice onset time (VOT), total duration (TD), vowel duration (VD), hold of plosives. Results and Conclusions : The number of diadochokinetic rate of dysarthria was smaller than control group. Both control group and dysarthria group was highly presented in the order of /t/>/p/>/k/. Minimum energy range per cycle during diadochokinetic rate of dysarthria group was smaller than control group, and presented statistical significance in /p/, /k/, /ptk/. Maximum energy range was larger than control group, and presented statistical significance in /t/, /ptk/. Articulation time, gap, total articulation time during diadochokinetic rate of dysarthria group was longer than control group and presented statistical significance. The articulation time was presented in both control group and dysarthria group in the order of /k/>/t/>/p/, while Gap was presented in the order of /p/>/t/>/k/ for control group and /p/>/k/>/t/ for dysarthria group. VOT, TD, VD regarding plosives of dysarthria group were longer than control group. Hold showed large deviation compared to control group that had appeared due to declined larynx and articulation organ motility.

  • PDF

건강장애 학생의 상호소통 및 교육을 위한 로봇 개발에 대한 연구 (A Study on Development of Robot for Mutual Communication and Education of Students with Health Impairments)

  • 류근재;강정배;김창걸;김경식;송병섭
    • 한국산업정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.15-24
    • /
    • 2014
  • 건강장애 학생이 특수교육 지원 대상자로 2005년 특수교육진흥법이 일부 개정되었고, 이후 교육적 약자로 분류되는 이들을 지원하기 위한 교육지원 시스템이 제안되었으며 현재는 정착이 되어 이들에게 무상으로 지원되고 있다. 법안이 개정된 초기에 대다수의 연구자들은 이들을 지원하기 위한 효과적인 교육 서비스의 형태에 관한 연구를 진행하였으며, 근래에는 이러한 연구를 바탕으로 지원되고 있는 서비스의 만족도와 문제점 도출에 관한 연구가 많이 진행되고 있는 실정이다. 하지만 이러한 사전 연구자들의 연구는 문제점 도출에 그칠 뿐 그 문제점을 보안하기 위한 근본적 대책을 제시하는데 있어 그 한계를 보이고 있다. 따라서, 본 논문에서는 사전 문헌의 고찰을 통해 건강장애의 의미를 파악하며, 현재 이들에게 지원되는 서비스의 형태와 각 서비스의 문제점을 파악하고자 한다. 아울러 파악된 문제점을 해결하기 위한 새로운 지원시스템을 제안하였으며, 제안된 시스템의 성능 테스트를 위하여 각 문항 당 Likert 5점 척도로 구성된 사용자 만족도 조사를 하였으며, 또한 대상자의 시스템 사용 중 시스템의 영상 및 음성전송의 품질에 대한 주관적 평가의 질을 높이기 위하여 이야기 비교하기와 손뼉치기와 같은 2가지의 과제를 실시하여 그 결과를 도출하였다. 그 결과 로봇시스템의 전반적 평가에 대해서는 각 문항의 평균점수가 4.31점으로 높게 나왔으며, 2가지의 과제를 통하여 영상과 음성의 전송에 문제가 없음을 알 수 있었다.

커뮤니티 케어 제도 내 생활기능 향상 중심의 작업치료 모델 개발을 위한 기초 연구 (The Preliminary Study for Development of Occupational Therapy Model Focused on Improving Living Functions within the Community Care System)

  • 이춘엽;박영주;박강현;지석연;김희정
    • 대한지역사회작업치료학회지
    • /
    • 제8권3호
    • /
    • pp.1-12
    • /
    • 2018
  • 목적 : 본 연구는 커뮤니티 케어 제도 내에서 생활기능향상 중심의 작업치료 모델을 개발하고자 기초 연구를 실시하였다. 연구방법 : 2018년 6월부터 동년 7월까지 생활기능향상 중심의 작업치료 모델을 개발하기 위하여 일본의 생활행위향상 매니지먼트(Management Tool for Daily Life Performance; MTDLP) 뿐만 아니라 스웨덴, 영국, 독일 등의 사례와 국내의 S 노인주간보호센터 및 I 보건소의 사례를 중심으로 커뮤니티 케어 관련 문헌을 조사하였다. 본 내용을 토대로 전문가 집단 회의를 거쳐 커뮤니티 케어 제도 내 작업치료 모델을 개발하였다. 결과 : 작업치료를 위한 평가를 시행하기 위하여 작업을 통한 건강 증진표, 흥미체크리스트, 생활기능향상을 위한 작업 목표, 생활기능 평가지, 일상생활시간 조사서(평일과 주말), 작업치료 종료 시 필요한 생활기능 인계지 등의 평가지를 개발하였다. 또한 작업치료사들이 이미 시행하고 있는 작업치료 중재 중 생활기능향상 프로그램, ICF모델 기반의 활동분석, 라이프 스타일 재설계 프로그램, 인지운동치료 프로그램, The Lee Silverman Voice Treatment (LSVT), 호스피스 완화 프로그램, 가정환경수정 프로그램 등을 중심으로 정리하였다. 결론 : 본 연구는 커뮤니티 케어 제도 내 작업치료의 실행을 위한 구체적 방안과 모델을 제시하였다. 작업치료가 클라이언트에게 반드시 필요한 하나의 전문 영역으로 자리매김하는데 필요한 한국형 생활기능향상 모델구축에 본 연구가 기초로 활용이 가능할 것으로 사료된다.

드론 소음 환경에서 심층 신경망 기반 음성 향상 기법 적용에 관한 연구 (A study on deep neural speech enhancement in drone noise environment)

  • 김지민;정재희;여찬은;김우일
    • 한국음향학회지
    • /
    • 제41권3호
    • /
    • pp.342-350
    • /
    • 2022
  • 본 논문에서는 재난 환경과 같은 환경에서의 음성 처리를 위해 실제 드론 소음 데이터를 수집하여 오염 음성 데이터베이스를 구축하고 음성 향상 기법인 스펙트럼 차감법과 심층 신경망을 이용한 마스크 기반 음성 향상 기법을 적용하여 성능을 평가한다. 기존의 심층 신경망 기반의 음성 향상 모델인 VoiceFilter(VF)의 성능 향상을 위해 Self-Attention 연산을 적용하고 추정한 잡음 정보를 Attention 모델의 입력으로 이용한다. 기존 VF 모델 기법과 비교하여 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)에 대해 각각 3.77 %, 1.66 %, 0.32 % 향상된 결과를 나타낸다. 인터넷에서 수집한 오염 음성 데이터를 75 % 혼합하여 훈련한 경우, 실제 드론 소음만을 사용한 경우에 비해 상대적인 성능 하락률 평균이 SDR, PESQ, STOI에 대해 각각 3.18 %, 2.79 %, 0.96 %를 나타낸다. 이는 실제 데이터를 취득하기 어려운 환경에서 실제 데이터와 유사한 데이터를 수집하여 음성 향상을 위한 모델 훈련에 효과적으로 활용할 수 있음을 확인해준다.

감성공학을 이용한 차내 경고정보 제공방식 평가 (Evaluation of In-vehicle Warning Information Modalities by Kansei Engineering)

  • 박준영;오철;김명주;장명순
    • 대한교통학회지
    • /
    • 제28권3호
    • /
    • pp.39-49
    • /
    • 2010
  • 본 연구에서는 감성공학적 분석방법론을 이용하여 운전자가 감성적인 측면에서 효과적으로 반응할 수 있는 교통안전 경고정보 제공방식 도출을 위한 연구를 수행하였다. 교통안전 경고정보는 운전자에게 전방의 위험요소를 미리 알려주어 사고회피를 위한 적절한 반응을 유도하는 역할을 하며 네비게이션과 같은 차내단말기를 통해 제공될 수 있다. 경고정보는 정보 제공방식들의 조합으로 구성되며 9개 시나리오를 설정하고 두 번의 설문조사를 시행하였다. 의미미분법, 상관분석, 수량화I류 이론을 이용한 감성공학I류 분석방법을 통해 연구를 진행하였으며, 성별차이에 따른 운전자 감성특성을 분석하였다. 분석결과 성별차이에 따라 각 정보의 제공방식에 대해 운전자가 느끼는 감성정도가 전체적으로 차이가 나는 것으로 분석되었다. 제공방식의 조합은 '청각적 요소: Beep음+음성안내', '메시지창: Text+픽토그램', '배경점멸: 빨간색 점멸'이 운전자의 감성정도와 선호도가 높게 나타났다. 본 연구의 결과는 운전자의 감성특성을 고려한 효과적인 교통안전 경고정보 설계 및 제공을 위한 유용한 자료로 활용될 것으로 기대된다.

동영상에서 모드 선택을 위한 코스트 평가 방법 (Coast Evaluation Techniques for Mode Selection in Video Coding)

  • 송대건
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.275-280
    • /
    • 2013
  • 최근 액서스망의 브로드밴드화와 영상기기의 고성능화에 따라 인터넷을 통한 음성, 영상 등의 미디어 정보를 다루는 멀티미디어 서비스가 주목받고 있으며 점차 보급되어 가고 있다. 앞으로 더욱더 영상 기기나 네트워크 환경에 발맞추어 고품질의 영상을 다루고 이용하는 형태가 점점 다양화되고 활용화 되리라 예측된다. 그 중에서도 동영상 부호화 기술 즉, 영상 정보의 압축 부호화 기술은 중심적인 역할을 하는 기술 중의 하나이다. 동영상 부호화 기술은 방대한 정보량을 필요로 하는 영상 신호 중에 포함되어 있는 용장성을 배제하고 적절한 정보량을 디지털 부호로서 효율인 영상 신호를 표현하는 기술로서 발전되어 가고 있다. 따라서 본 연구는 동영상 부호화에서의 모드 선택에 적용하는 코스트 평가 방법을 검토하고 부호화 효율을 최대화하기 위해 방법을 제안 하고자하며 이를 기존 방법과 비교해 우수성을 확인하였다.

정보기술(IT)의 가치평가분석 및 측정에 관한 연구 - 특허기술을 중심으로 - (Analysis and Measurement on the Evaluation of the Information Technology)

  • 김승환;김복수;이주연
    • 한국산업정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.106-116
    • /
    • 2008
  • 본 연구는 국내의 경제상황을 판단하여 특허권의 유통을 활성화시키고 기술력을 바탕으로 하는 기업과 기술의 가치평가에 종사하는 사람들에게 방향을 제시하기 위해 문헌조사, 사례연구를 중심으로 수행하였으며 특허권의 가치평가에 대한 개념정립을 위해 우선 특허권에 대한 다양한 접근방식과 관계요인, 이론 그리고, 특허권을 다양한 국 내외 문헌을 중심으로 정리 요약하였다. 또한, 라이센스교섭이나 그 외의 거래시 무형자산이나 지식재산의 이용과 관련한 적정한 로열티의 비율 및 특허권 침해의 액을 산정하는데 기본이 되는 특허권의 가치를 평가하는 방법을 제시한다. 더불어 주요가치평가 기법을 제시하고, 가치평가 기법의 문제점과 개선방향을 통해 새로운 가치평가방법의 새로운 방향을 고찰해보며, 특허권의 거래 및 활성화를 위한 대안, 특허권의 가치평가제도를 위한 대책을 제시한 국내 가치평가의 문제점과 국내 모 평가회사의 분석사례 및 시사점을 통해 국내기술에 대한 가치평가의 방법과 제도적, 환경적 문제의 발전방향에 대해 제시하고자 한다.

  • PDF