• 제목/요약/키워드: 대상인식

검색결과 10,407건 처리시간 0.039초

음성 인식을 이용한 자동 교환 시스템 구현 (An Implementation of the Automatic Switching System using Speech Recognition)

  • 함정표;김현아;박익현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.935-938
    • /
    • 2000
  • 본 논문에서는 음성 인식을 이용하여 전화를 교환해주는 자동 교환 시스템을 구현하고, 성능을 평가하였다. 구현된 시스템에는 필수적인 음성인식 이외에도 DSP 진단 기능, 인식 대상 어휘의 추가 및 변경기능, 음성 수집 기능 등이 구현 되었다. SCHMM (Semi-Continuous Hidden Markov Model)을 이용한 전화망에서의 화자 독립 고립 단어 가변 어휘 인식을 대상으로 하였으며, 실시간 구현을 위하여 Texas Instrument 사의 TMS320C32를 사용하였다〔6〕. 인식 어휘는 부서명 및 인명이고 1300여 단어일 때, 인식 성능은 91.5%이다.

  • PDF

ubiTrack을 이용한 방위 인식 기법 (Orientation awareness method using ubiTrack)

  • 정우진;우운택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (A)
    • /
    • pp.448-450
    • /
    • 2005
  • 유비쿼터스 컴퓨팅 환경에서의 맥락 인지 응용들은 사용자의 상황에 맞는 서비스를 제공하기 위해 위치 정보를 활용한다. 그러나 대부분의 실내 위치 추적 시스템들은 환경이 사용자의 위치를 파악함으로 프라이버시 문제가 야기 된다 또한 더욱 지능화된 서비스를 제공하기 위해 위치 정보와 더불어 방위 정보 인식의 필요성이 대두되고 있다. 본 논문에서 제안된 방법은 사용자나 대상물의 방위를 알기 위해서 기존의 ubiTrack의 수신기에 두개의 적외선 수신기 소자를 부착한다. 두개의 적외선 수신 소자는 각각의 위치를 측정하고 각각의 위치로 부터 사용자나 대상물의 위치와 더불어 방위, 크기를 인식한다. 또한 대상물에 부착되어 있는 수신기가 대상물의 위치를 환경에 일정한 시간을 간격으로 환경에 알려 주도록 하여 사용자의 프라이버시 침범되지 않는 상태에서 사용자와 대상물의 위치 및 방위 정보를 제공한다. 실험 결과 제안된 방법은 홈 환경 내에서 여러 대상물의 방위를 10도 안팎의 오차를 가지고 인식하였다. 따라서 제안된 방법은 유비쿼터스 컴퓨팅 환경에서 여러 맥락 인지 서비스와 연동하여 사용자의 의도를 반영한 절러 LBS에 쉽게 응용이 될 수 있다.

  • PDF

연속 음성 인식 기법을 이용한 단어 음성 인식 (The recognition of word by continuous speech recognition technic)

  • 조영훈
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.91-94
    • /
    • 1998
  • 우리만은 영어와는 달리 단어를 공백으로만 구분할 수 없다. 그러므로 대용량 어휘를 갖는 연속 음성을 인식하기 위한 언어모델을 만들기가 매우 어렵다. N-gram의 언어 모델을 우리말 문장에 적용하기 위해 하나의 문장을 한 단어로 구성하여 처리하였다. 우리의 인식시스템을 평가하기 위하여 시스템 공학 연구소에서 제공한 음성을 대상으로 인식률을 계산하였다. 단어의 종류는 452개이며 한명이 이 단어들을 2번씩 발음하고 총70명이 발음한 총 63,280개의 단어에 대하여 92.8%의 인식률을 얻었다. 일간지 사설로부터 추출한 단어를 대상으로 발음 사전을 10K 크기로 만들었다. 음성 모델은 uniphone을 사용하였다.

  • PDF

제한된 단어를 갖는 우리말 연속 음성 인식 (The Continuous Speech Recognition with Limited word)

  • 김석동
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 1호
    • /
    • pp.87-90
    • /
    • 1998
  • 이 논문에서 우리는 대규모 어휘를 갖는 연속 음성 인식을 위한 방법을 제시한다. 우리말은 영어와 구조적으로 달라서 대용량 어휘를 갖는 연속 음성을 인식하기 위한 언어모델을 만들기가 매우 어렵다. 언어 모델을 우리말 문장에 적용하기 위해 신문의 사설을 3-gram을 이용하여 처리하였다. 우리의 인식 시스템을 평가하기 위하여 시스템 공학 연구소에서 제공한 낭독 음성을 대상으로 인식률을 계산하였다. 589개의 문장을 대상으로 총 20명이 발음한 3,156개의 문장에 대하여 남자 92.2%, 여자 87.9%의 인식률을 얻었다. 발음사전은 낭독음성과 신문 사설에서 추출한 10K 크기이며 uniphone의 음성모델을 사용하였다.

  • PDF

도시 지역 중년여성의 비만도에 따른 체형인식 및 체중조절태도 비교 연구

  • 정인경;권성옥;이일하
    • 대한지역사회영양학회:학술대회논문집
    • /
    • 대한지역사회영양학회 2003년도 추계학술대회
    • /
    • pp.1076-1076
    • /
    • 2003
  • 최근 소득수준의 향상 및 식생활 습관의 서구화로 비만 유병율이 증가하면서 체중조절에 대한 관심이 급증하였다. 그러나 신체적 매력 중에서 날씬함을 너무 강조하는 사회적 분위기 등의 영향으로 자신의 체형을 왜곡되게 인식함으로써 이에 따른 신체에 대한 불만족은 무분별한 체중조절을 시도하도록 자극하는 요인이 되고 있으며 이러한 무리한 체중조절은 신체적·심리적 장애를 초래하는 것으로 알려지고 있다. 그러나 체형인식 및 체중조절에 대한 연구는 주로 젊은 여성들을 대상으로 한 것이 대부분으로 중년여성을 대상으로 한 연구는 거의 없는 실정이다. 따라서 본 연구에서는 자기체형에 대한 관심이 점차 높아지고 있는 중년여성들을 대상으로 비만도에 따른 체형인식 경향을 파악하고 체중조절에 영향을 미치는 요인들을 알아보고자 하였다. 조사대상은 도시지역에 거주하는 40세 이상 중년여성 249명으로 일반사항, 체형인식 및 체중조절태도, 이상식행동 등에 대하여 설문조사를 실시하였다. 모든 자료는 SAS program을 이용하여 분석하였다. 조사대상자의 평균 연령은 48.5세였으며 평균 비만도(BMI)는 22.7로서 정상범위에 속하였다. 비만도에 따른 체중군별 분포는 정상체중군이 72.9%로 가장 많았으며, 저체중군이 6.7%, 과체중군이 20.4%이었다. 자기 체형에 대한 인식도를 체중군별로 비교해본 결과, 정상체중군의 40.1%만이 자신의 체형을 ‘표준체형’으로 올바르게 인식하고 있을 뿐, 8.1%는 ‘마른 체형’으로, 51.7%는 ‘살찐 체형’으로 잘못 인식하고 있는 것으로 나타났다. 특히, 저체중군의 37.5%는 자신의 체형이 ‘표준체형’이라고 인식하고 있었다. 이상적으로 생각하는 체형에 대하여 조사대상자의 80.9%가 ‘표준체형’이라고 응답하였으며, 8.7%는 ‘마른 체형’을, 10.4%는 ‘살찐 체형’을 선호하는 것으로 나타났다. 자기 체형에 대해 조사대상자의 55.8%가 ‘불만족하다’ 고 응답한 반면 ‘만족하다’ 고 응답한 경우는 11.1%에 불과하였다. 그러나 체중조절에 대한 관심도는 체중군별로 비교해 보았을 때, 과체중군이 저체중이나 정상체중군에 비해 유의하게 높았다. 지난 1년 동안의 체중 감량 경험 여부를 조사해본 결과, 과체중군의 77.1%, 정상체중군의 65.3%, 저체중군의 62.5%가 체중감량 경험이 있는 것으로 나타났다. 체중감량 이유를 묻는 문항에 과체중군과 정상체중군의 경우 ‘건강을 위해서’라고 응답한 경우가 가장 많은 반면 저체중군의 경우 ‘체중이 증가되었기 때문에’라고 응답한 경우가 가장 많아 체중군별로 유의적인 차이를 나타냈다. 조사대상자의 53.8%가 체중감량을 하는 중 부작용을 경험한 적이 있는 것으로 나타났으며, 유의적인 차이는 없었으나 저체중군이 과체중이나 정상체중군에 비해 체중감량에 따른 부작용 경험자의 비율이 높았다. 이상식행동을 측정한 결과, 과체중이나 저체중군이 정상체중군에 비해 이상식행동 점수가 유의적으로 높았다. 세부요인별로 비교해 보았을 때, 체중조절에 대한 집착과 식이조절점수는 과체중군이 가장 높았으나, 섭식통제 관련 식행동 점수는 저체중군이 가장 높았다. 이상의 결과를 종합해 볼 때, 중년여성들의 경우 대부분이 자신의 실제 체형에 대하여 그릇된 인식을 갖고 있었으며, 체중을 감량하기 위해 지속적으로 노력하는 것으로 나타났다. 특히 저체중군의 경우 건강보다는 외모 때문에 무리한 체중감량을 시도하고 있었으며 이상식습관과 관련된 식행동 점수가 높은 경향을 보여 영양 및 건강 상태에 문제가 발생될 수 있을 것으로 생각된다. 따라서 중년여성들에게 자신의 체형과 이상체형에 대한 올바른 인식을 갖고 표준 체중을 유지할 수 있도록 지속적인 영양교육이 이루어져야 할 것으로 생각된다.

  • PDF

딥러닝 모델을 이용한 비전이미지 내의 대상체 분류에 관한 연구 (A Study on The Classification of Target-objects with The Deep-learning Model in The Vision-images)

  • 조영준;김종원
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.20-25
    • /
    • 2021
  • 본 논문은 Deep-learning 기반의 검출모델을 이용하여 연속적으로 입력되는 비디오 이미지 내의 해당 대상체를 의미별로 분류해야하는 문제에 대한 구현방법에 관한 논문이다. 기존의 대상체 검출모델은 Deep-learning 기반의 검출모델로서 유사한 대상체 분류를 위해서는 방대한 DATA의 수집과 기계학습과정을 통해서 가능했다. 대상체 검출모델의 구조개선을 통한 유사물체의 인식 및 분류를 위하여 기존의 검출모델을 이용한 분류 문제를 분석하고 처리구조를 변경하여 개선된 비전처리 모듈개발을 통해 이를 기존 인식모델에 접목함으로써 대상체에 대한 인식모델을 구현하였으며, 대상체의 분류를 위하여 검출모델의 구조변경을 통해 고유성과 유사성을 정의하고 이를 검출모델에 적용하였다. 실제 축구경기 영상을 이용하여 대상체의 특징점을 분류의 기준으로 설정하여 실시간으로 분류문제를 해결하여 인식모델의 활용성 검증을 통해 산업에서의 활용도를 확인하였다. 기존의 검출모델과 새롭게 구성한 인식모델을 활용하여 실시간 이미지를 색상과 강도의 구분이 용이한 HSV의 칼라공간으로 변환하는 비전기술을 이용하여 기존모델과 비교 검증하였고, 조도 및 노이즈 환경에서도 높은 검출률을 확보할 수 있는 실시간 환경의 인식모델 최적화를 위한 선행연구를 수행하였다.

음소인식기와 음소결합확률모델을 이용한 언어식별시스템 (Language Identification System using phoneme recognizer and phonotactic language model)

  • 이대성;김세현;오영환
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2001년도 추계학술발표대회 논문집 제20권 2호
    • /
    • pp.73-76
    • /
    • 2001
  • 본 논문에서는 음소인식기와 음소결합확률모델을 이용하여 전화음성을 대상으로 입력음성이 어느 나라 말 인지를 식별할 수 있는 언어식별시스템을 구현하였고 성능을 실험하였다. 시스템은 음소인식기로 입력음성에 대한 음소열을 인식하는 과정, 인식된 음소열을 이용하여 인식대상 언어별 음소결합확률모델을 생성하는 훈련과정, 훈련과정에서 생성된 음소결합확률모델로부터 확률 값을 계산하여 인식결과를 출력하는 식별과정으로 구성된다. 본 논문에서는 음소결합확률모델로부터 우도를 계산할 때 정보이론(Information Theory, Shannon and Weaver, 1949)을 이용하여 가중치를 적용하는 방법을 제안하였다. 시스템의 훈련 및 실험에는 OGI 11개국어 전화음성 corpus (OGI-TS)를 사용하였으며, 음소인식기는 HTK를 이용하여 구현하였고 음소인식기 훈련에는 NTIMIT 전화음성 DB를 이용하였다. 실험결과 11개국어를 대상으로 45초 길이의 음성에 대해서 평균 $74.1\%$, 10초 길이의 음성에 대해서는 평균 $57.1\%$의 인식률을 얻을 수 있었다.

  • PDF

도형을 그리는 소리: 소리를 이용한 형태정보의 전달 가능성 탐색 (Auditory shaping _Conveying shape information using auditory images)

  • 박영현;한광희
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.506-512
    • /
    • 2006
  • 시각적인 정보전달이 어려운 상황에서의 대상인식, 혹은 시각장애인의 대상인식에 있어서 소리는 어느 정도의 역할을 할 수 있을까? 이 연구는 소리를 통해 대상의 형태정보를 전달하기 위해 진행되었다. 하나의 음(musical tone)을 음높이와 음색, 지속시간을 조정한 후, 머리전달함수(Head-Related Transfer Function: HRTF)를 이용하여 수평선, 수직선, 대각선, 곡선의 형태로 운동하는 3-D 사운드 형태소로 만들었다. 그리고 이들의 연속적인 조합을 통해 단순한 도형에서부터 복잡한 도형, 이들 2차원상의 도형을 단면으로 하는 3차원상의 도형들까지 그려내는 소리자극을 구성하였다. 성인 대학생을 대상으로 한 실험에서, 이렇게 만들어진 청각이미지(auditory image)를 듣고 표상된 형태를 여러 개의 시각적인 이미지들(visual images) 중에서 선택하는 과제를 실시하였는데, 실험 결과는 평균 78%의 정확율을 보였다. 이는 소리를 이용한 형태정보 전달의 가능성이 있음을 시사하는 것이며, 이러한 시도는 청각 인터페이스의 응용범위를 확장하는데 도움이 될 것이다.

  • PDF

음성인식기능을 이용한 지도정보검색시스템을 위한 검색엔진의 성능 평가 (Performance Evaluation of Search Engine for Speech Recognition Based Map Information Retrieval System)

  • 김태수
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.39-42
    • /
    • 1998
  • 음성인식기능을 이용한 지도정보 검색 시스템의 실용화를 위하여 독자적인 지도검색 알고리즘을 구현하여 기존의 GIS 용 검색툴을 이용함으로서 소요되는 비용을 최저화하면서도 어느 정도의 검색속도를 유지할 수 있는 음성구동지도검색시스템 구현을 위해 개발한 검색엔진의 성능 평가 실험을 통하여 그 유효성을 확인하고자 한다. 지도정보 검색시스템은 크게 음성인식부, 지도검색부로 나눌 수 있으며, 음성인식부에서는 유한상태오토마타에 의한 구문 제어를 통하여 OPDP 법으로 대상 단어의 인식을 수행하고, 지도검색부에서는 기존의 시스템에 사용된 OLE 기법에 기저한 Mapinfo 툴을 이용하지 않고, Visual C++를 이용한 독자적인 알고리즘을 구성하여 지도자료를 읽어 들이도록 구성하였다. 평가결과, 사무실 환경하에서 지도검색용 68단어를 대상으로 실시한 on-line test에서 검색 대상 단어인식률은 98.02%를 얻었으며, 이 때 해당지도를 화면에 나타내는데 걸리는 시간은 평균 18.2초가 소요되었다.

  • PDF

음소 인식을 위한 수정된 LVQ2 알고리즘의 고찰 (A Modified LVQ2 Algorithm for Phonemes Recognition)

  • 황철준
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1996년도 영남지부 학술발표회 논문집 Acoustic Society of Korean Youngnam Chapter Symposium Proceedings
    • /
    • pp.76-79
    • /
    • 1996
  • 본 논무에서는 한국어 음소를 대상으로 Kohonen 이 제안한 LVQ2 방법의 결저을 보완한 MLVQ2 방법으로 인식실험을 행하고 MLVQ2 알고리즘의 유효성을 검토하고자 한다. 인식실험을 위한 음성자료는 ETRI 611단어로부터 추출한 49음소를 사용하였다. 그리고 인식실험에 있어서는 먼저 파열음을 대상으로 학습회수, 표준패턴의 수, 샘플수에 따른 인식률의 변화를 조사하였으며, 이 결과 표준패턴의 수 15개, 학습회수 10회 이하, 샘플 수 3000 개일 경우가 가장 좋은 인식률을 보였다. 이 결과를 참고로 음소군별 인식실험 결과 모음 69.11%, 파열음 74.69%, 마찰음 및 파찰음 86.31%비음 및 유음 74.51%의 평균 인식률을 얻었다. 또한 , 한국어 49음소 전음소에 대한 인식실험 결과 71.2%의 인식률 얻어 MLVQ2의 유효성을 확인하였다.

  • PDF