• 제목/요약/키워드: 디지털 사용 인식

검색결과 731건 처리시간 0.028초

Dynamic Time Warping 기법을 이용한 내용기반 디지털 오디오 검색 (Contents based digital audio retrieval using the Dynamic Time Warping Technique)

  • 성보경;고일주
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.287-292
    • /
    • 2007
  • 최근 다양한 분야에서(웹 포털, 유료 음원서비스 등) 디지털 오디오의 검색이 사용되고 있다. 이러한 분야에서 디지털 오디오의 검색은 디지털 오디오 데이터가 가지고 있는 자체 메타 정보를 이용하여 이루어진다. 하지만 메타 정보가 다르게 작성 되었거나 작성되지 않은 경우 정확한 검색은 어렵다. 요즘 이러한 문제의 보완 방안으로 내용기반 정보 검색 기법을 이용한 검색이 이루어지고 있다. 본 논문에서는 내용 기반 디지털 오디오 검색 방법에 대해 논하고자 한다. 내용기반으로 디지털 오디오를 검색하기 위해 음성 인식 문야에서 유사도 측정에 사용하는 Dynamic Time Warping 기법을 활용하여 디지털 오디오 간의 유사도 측정을 하였다. 제안된 유사도 측정을 통한 내용기반 디지털 오디오검색 방법의 검증을 위해 같은 장르에서 무작위 추출된 100곡에서 시행한 90번의 검색은 모두 성공했다. 검색에 사용된 90개의 디지털 오디오는 10개의 디지털 오디오를 압축방식과 비트율을 다르게 조합하여 만들었다.

  • PDF

제스처 인식 모듈을 이용한 대규모 멀티 인터랙티브 디스플레이 시스템 (large-scale interactive display system using gesture recognition module)

  • 강맹관;김정훈;조성현;주우석;윤태수;이동훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.803-806
    • /
    • 2010
  • 본 논문에서는 스크린을 터치를 하지 않고 또한 스크린의 영역의 크기에 상관없이 제스처를 이용하여 인터랙션이 가능한 제스쳐 인식 모듈을 이용한 대규모 멀티 인터랙티브 디스플레이 시스템을 제안한다. IR laser를 이용하여 인터랙션 영역을 생성하고 band pass filter를 장착한 적외선 카메라를 이용하여 인터랙션 영역 안의 영상을 획득한다. 획득되어진 영상은 제안하는 영상처리모듈을 이용하여 이진화->블랍-라벨링 과정을 거쳐 잡음을 제거한 후 인터랙션 영역 안에서 이루어지는 인터랙션 좌표를 획득한 후 Packet으로 저장한다. 저장 된 Packet은 네트워크 통신 시스템을 이용하여 Server로 보내어지고 Server에서는 메타포분석모듈을 이용하여 분석하여 결과를 메타포이벤트로 저장한 후 콘텐츠에 보낸다. 콘텐츠에서는 받은 메타포이벤트에 따라서 콘텐츠 결과를 보여 줌으로써 스크린을 터치 하지 않아도 터치 인터랙션이 가능하며 스크린 영역에 제한 없이 많은 사용자가 동시에 사용이 가능한 시스템 사용이 가능하도록 한다. 본 시스템은 향후 보다 다양한 인터랙션과 시스템 크기의 확장으로 보다 많은 사용자가 동시에 사용가능하며 다양한 인터랙션을 사용할 수 있는 인식 디바이스로써 활용이 가능하다.

스마트 폰 음성 인식 서비스의 상황별 만족도 조사 (Study on the Situational satisfaction survey of Smart Phone based on voice recognition technology)

  • 이윤정;김승인
    • 디지털융복합연구
    • /
    • 제15권8호
    • /
    • pp.351-357
    • /
    • 2017
  • 본 연구는 스마트 폰 음성인식 서비스를 분석하고 음성인식 서비스의 상황별 만족도 조사를 통하여 사용자들의 기대요구와 만족도 간의 관련성을 분석하여 더 나은 음성인식 서비스 발전을 모색하고자 하였다. 1차로 문헌연구를 통하여 음성인식 서비스의 개념과 현황을 알아보고, 2차로 육하원칙을 기조로 한 설문지를 통해 설문 조사를 진행하였다. 그 결과, 사용자는 스마트 폰 음성인식 서비스를 전화를 걸 때에 가장 많이 사용하며, 주로 혼자 있을 때 사용하며 시간대는 대체로 평이하지만, 저녁 시간이 가장 많았다. 또한, 해당 서비스는 집에서 가장 많이 사용하며 손을 사용할 수 없을 때 서비스를 가장 많이 사용하는 것으로 나타났다. 이러한 상황별 다양한 결과를 통해 개인화 서비스, 조건 인식 기능, 위급 상황 자동인식, 음성으로 잠금 해제 등 다양한 방안을 도출할 수 있었다. 본 연구를 바탕으로 추후 국내 스마트 폰 음성인식 서비스 개선과 웨어러블 디바이스 개발을 위해 효과적으로 활용할 수 있을 것으로 기대한다.

디지털카메라ㆍ캠코더의 "원색 촬영" 신기술-CBL Lens

  • 한국광학기기협회
    • 광학세계
    • /
    • 통권104호
    • /
    • pp.75-78
    • /
    • 2006
  • 사용의 편리성, 신속성, 간편성 등 다양한 장점을 가진 디지털카메라가 필름카메라를 제치고 전세계적으로 급속하게 확산되고 있다. 디지털카메라는 편리하고 신속하게 이미지를 얻을 수 있다는 큰 장점이 있지만 ‘왜곡된 색상’으로 인하여 필름카메라보다 못하다는 평가를 받기도 한다. 이처럼 세계적으로 디지털 카메라, 캠코더 사용자 모두가 겪는 애로점이 바로‘컬러 밸런스(화이트밸런스)’이다. 본 고에서는‘컬러 & 화이트밸런스’를 요약하여‘밸런스로’표현하고자 한다. 문제는 사용자들이 디지털카메라 사용방법에 대하여 대다수가 잘 모르고 있다는 것이다. 많은 프로들과 유저들이 디지털 카메라로 촬영한 사진은 당연히‘후 보정’을 하는 것이 정상인 것처럼 알고 있으며, 심지어 디지털 카메라는‘후 보정’을 위한 카메라인 것으로 잘못 알고 있는 경우가 그것이다. 그러나 좋은 사진은‘후 보정’을 하지 않고서‘원색’을 그대로 표현 할 수 있는 것이‘작품’으로서의 진정한 가치가 있고, 사진의‘예술’인 것이다.고급기종의 디지털 카메라를 보유한 대부분의 사용자들은 카메라의 복잡한 기능 메뉴에 번거로움을 겪고 있다. 보편적으로 오토, 태양, 구름, 노을, 형광등1.2, 백열등, K, 켈빈도, 프리셋 등의 기능이 있으나 대부분 커스텀에서 기본 세트메뉴인‘오토’등의 모드를 선택하여 촬영을 하고 있고, 핵심 기능인‘프리셋’은 사용방법조차 모르고 있는 유저들이 많다. 또한 커스텀 모드의 기본메뉴를 선택하여 촬영을 했을 때 색상이 왜곡되는 것을 디지털 카메라는 당연히 그런 것으로 알고 있으며, 따라서 후보정은 당연한 것으로 대부분이 인식하고 있다. 그중에서 원색의 중요성을 인식하는 일부 사용자들만‘프리셋’기능에서 그레이 카드 등으로 밸런스를 세팅하여 촬영을 하고 있다.그러나 가장 정확한 것으로 알고 수 십 년간 사용해오던 그레이 카드 등을 이용하여 프리셋 모드에서 밸런스를 세팅하여 촬영을 할 경우에도, 카메라에 기본적으로 내장된‘커스텀 모드’보다는 색상이 다소 좋은 것을 알 수 있으나, 정확한 원색의 이미지를 얻기는 매우 어려워, 디지털 카메라의 한계라고까지 표현을 하고 있다.

  • PDF

독립성분분석을 이용한 DSP 기반의 화자 독립 음성 인식 시스템의 구현 (Implementation of Speaker Independent Speech Recognition System Using Independent Component Analysis based on DSP)

  • 김창근;박진영;박정원;이광석;허강인
    • 한국정보통신학회논문지
    • /
    • 제8권2호
    • /
    • pp.359-364
    • /
    • 2004
  • 본 논문에서는 범용 디지털 신호처리기를 이용한 잡음환경에 강인한 실시간 화자 독립 음성인식 시스템을 구현하였다. 구현된 시스템은 TI사의 범용 부동소수점 디지털 신호처리기인 TMS320C32를 이용하였고, 실시간 음성 입력을 위한 음성 CODEC과 외부 인터페이스를 확장하여 인식결과를 출력하도록 구성하였다. 실시간 음성 인식기에 사용한 음성특징 파라메터는 일반적으로 사용되어 지는 MFCC(Mel Frequency Cepstral Coefficient)대신 독립성분분석을 통해 MFCC의 특징 공간을 변화시킨 파라메터를 사용하여 외부잡음 환경에 강인한 특성을 지니도록 하였다. 두 가지 특징 파라메터에 대해 잡음 환경에서의 인식실험 결과, 독립성분 분석에 의한 특징 파라메터의 인식 성능이 MFCC보다 우수함을 확인 할 수 있었다.

지문 인식과 터치 패턴을 이용한 원그립 기반 문고리 통합형 도어록 시스템 (One Grip based Doorpull Shaped Doorlock System using Fingerprint Recognition and Touch Pattern)

  • 장민순;박태민;이정권;왕보현
    • 한국지능시스템학회논문지
    • /
    • 제26권1호
    • /
    • pp.30-36
    • /
    • 2016
  • 디지털 도어록 시장이 활성화 되면서 생체인식기술과 스마트폰 등을 인증 수단으로 사용하는 보다 편리한 도어록 시스템이 개발되고 있다. 디지털 도어록의 성능은 보안성과 편리성이라는 두 가지 서로 상충되는 요소에 의해 결정된다. 본 논문에서는 편리성을 유지하면서 보안성을 높일 수 있는 하나의 방법으로 인증 수단을 문고리에 통합하는 원그립 기반 디지털 도어록의 디자인을 제안하고 구현하였다. 제안된 원그립 기반 문고리 통합형 도어록 시스템에서는 사용자가 문을 열기 위해 문고리를 잡는 한 번의 동작만으로 지문인식과 터치 센서를 이용한 그립패턴 인식을 순차적으로 진행하여 보안성을 한 단계 높이면서도 사용상의 편리성은 그대로 유지할 수 있다. 제안된 방법은 디지털 도어록 시스템 자체의 성능 개선 뿐 아니라 앞으로 더욱 활성화 될 것으로 예상되는 스마트 도어록 분야에서 스마트폰을 분실했을 때 발생하는 문제를 해결할 수 있을 것으로 기대한다.

워드프로세서의 영어문장 어법오류 인식개선을 통한 영어구문작성 향상방안에 대한 연구 (A Study on the improvement of English writing by applying error indication function in word processor)

  • 이재일
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.285-290
    • /
    • 2020
  • 본 연구는 워드프로세서를 사용하여 영어텍스트구문을 작성하는 사용자들의 영어작문능력을 개선하는 방안을 제시하고자 한다. 컴퓨터와 IT기술의 발달로 영어작문능력 향상을 위한 컴퓨터보조언어학습이 보편적으로 사용되고 있다. 기존의 프로그램들은 일부 단어의 철자, 접속사의 필요성, 주어-동사의 수일치 등과 같은 몇몇 문법오류사항을 인식하여 표시해주는 기능이 있다. 그러나 사용자가 작성한 영어문장의 적절성에 대한 소수의 오류사항을 알려주고 있지만 영어문장에서 가장 흔하게 사용되고 있는 명사구성립의 적법성에 대한 오류인식은 하지 못하고 있다. 따라서 본 연구는 기존 워드프로세서의 문장오류인식 프로세스에 명사구성립인식 기능을 추가하여 더 나은 오류인식기능을 갖추도록 개선하여 사용자 편의성 및 문장적법성을 향상시키는 방안을 제시한다. 제안 방법은 문장 내에 사용된 명사를 추적하여 해당 명사가 문장요소로 사용되기 위한 최소단위인 명사구성립 여부를 확인하고 그에 따라 오류표기를 하여 사용자가 인식할 수 있도록 해준다. 사용자는 오류사항에 대한 인식을 통해 자신이 작성한 텍스트의 문장 적법성을 확인하고 수정하면서 문장작성 능력 및 적절한 어법의 사용에 대한 이해도가 증가할 것이라 판단된다.

일상적 행동양식을 통한 인터페이스의 구현 (Implementing user interface through everyday gesture)

  • 안종윤;이경원
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.409-415
    • /
    • 2006
  • 컴퓨터와 인간사이의 원활한 의사소통 및 인터랙션을 위해 기존의 키보드, 마우스를 대체할 수 있는 다양한 입력장치들이 개발되고 있다. 하지만 정보를 탐색, 접근하는 데에 있어서 기존의 장치들은 클릭과 같은 제한적인 동작만을 입력 값으로 받아들이므로 이러한 방식에 익숙하지 않은 사용자의 입장에서는 부자연스러움을 느끼는 요인이 된다. 사용자의 제스처를 인식할 수 있는 인터페이스를 통해 일상에서 사물을 사용할 때의 행동양식을 그대로 가져올 수 있다면, 디지털 콘텐츠에 접근하는데 있어 보다 직관적이고 편리하게 컴퓨터와 의사소통 될 수 있다. 제스처는 동작의 자율성이 높고 때로 그 의미를 파악하기 모호하기 때문에 동작들을 정확히 인식하여 구분할 필요가 있다. 본 논문에서는 이를 바탕으로 효과적인 제스처 인터페이스의 구현을 위해 필요한 점들을 살펴보고, 기술적 구현을 통해 디지털 콘텐츠와의 인터랙션을 보여주고자 한다. 정보 접근에 있어 가장 익숙하고 전통적이라 할 수 있는 책의 메타포를 통해 페이지를 넘기는 행동양식을 인식할 수 있는 인터페이스를 개발하고 이를 입력장치로 사용한다. 사용자의 동작을 인식, 파악하여 책을 앞뒤로 넘기거나 탐색하며 원하는 정보에 접근할 수 있도록 유도하고 손 동작을 통한 인터페이스를 수단으로 컴퓨터와의 유연한 의사소통이 가능하도록 구현한다.

  • PDF

SBAR 사용능력, SBAR 이용인식 및 비판적 사고성향 간의 관계 (The Relationship among Knowledge of the SBAR, Attitudes towards SBAR and Critical Thinking Disposition for Nursing Students)

  • 이외선;노윤구
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.213-220
    • /
    • 2019
  • 본 연구는 간호대학생의 SBAR(상황-배경-사정-제안) 사용능력, SBAR 이용인식 및 비판적 사고성향 간의 관계를 파악하기 위해 시도되었다. 간호대학 3학년에 재학 중인 101명을 대상으로 설문지를 이용하여 2018년 8월 31일부터 2018년 10월 26일까지 자료를 수집하였다. SPSS WIN 23으로 빈도, t-test, ANOVA, Pearson's correlation로 분석하였다. 연구결과 간호대학생의 SBAR 사용능력은 5점 만점에 3.26점, SBAR 이용 인식은 3.31점, 비판적 사고성향은 3.50점으로 나타났다. SBAR 사용능력(r=.46, p<.001)과 SBAR 이용인식(r=.23, p=.023)은 비판적 사고성향과 정의 상관관계가 있는 것으로 나타났으며, SBAR 사용능력은 SBAR 이용 인식(r=.16, p=.113)과 관계가 없는 것으로 나타났다. 따라서 간호대학생의 비판적 사고성향을 향상시키기 위해서는 SBAR 사용능력과 SBAR 이용인식을 향상 시킬 수 있는 프로그램의 개발 및 적용이 필요하다.

노인음성인식을 위한 전처리에 관한 연구 (A Study on Preprocessing for Elderly Voice Recognition)

  • 박지웅;이승준;권순일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1646-1648
    • /
    • 2013
  • 고령화 되어 가는 현대 사회에서 노인들이 일반 성인과 동등한 수준에서 정보를 접근 가능하도록 스마트기기의 손쉬운 인터페이스 방법이 요구된다. 음성 인터페이스는 노인들의 스마트기기 활용도를 높여 줄 수 있지만, 성능이 평균적 성인연령 대의 발성행태에 최적화되어 있어, 노인들이 사용할 경우 음성인식률 저하를 초래한다. 그래서 노인 친화형 음성 인터페이스를 개발하기 위한 일환으로 노인음성에 대한 인식률을 향상시켜 줄 수 있는 전처리 알고리즘을 개발하고자 한다. 이를 위해 노인층과 청년층을 대상으로 음성샘플을 수집하여 분석하였고, 그 결과 노인이 청년에 비해 발성속도가 느리며 이는 스마트기기의 음성인식 기능저하로 이어진다는 것을 확인할 수 있었다.