• Title/Summary/Keyword: Auditory Information

검색결과 311건 처리시간 0.027초

청각모델과 회귀회로망을 이용한 음성인식에 관한 연구 (A Study on Speech Recognition Using Auditory Model and Recurrent Network)

  • 김동준;이재혁
    • 대한의용생체공학회:의공학회지
    • /
    • 제11권1호
    • /
    • pp.157-162
    • /
    • 1990
  • In this study, a peripheral auditory model is used as a frequency feature extractor and a recurrent network which has recurrent links on input nodes is constructed in order to show the reliability of the recurrent network as a recognizer by executing recognition tests for 4 Korean place names and syllables. In the case of using the general learning rule, it is found that the weights are diverged for a long sequence because of the characteristics of the node function in the hidden and output layers. So, a refined weight compensation method is proposed and, using this method, it is possible to improve the system operation and to use long data. The recognition results are considerably good, even if time worping and endpoint detection are omitted and learning patterns and test patterns are made of average length of data. The recurrent network used in this study reflects well time information of temporal speech signal.

  • PDF

Neurogram을 이용한 인공와우 자극기법 평가 연구 (Evaluation of Stimulus Strategy for Cochlear Implant Using Neurogram)

  • 양혜진;우지환
    • 대한의용생체공학회:의공학회지
    • /
    • 제34권2호
    • /
    • pp.47-54
    • /
    • 2013
  • Electrical stimulation is delivered to auditory nerve (AN) through the electrodes in cochlear implant system. Neurogram is a spectrogram that includes information of neural response to electrical stimulation. We hypothesized that the similarity between a neurogram and an input-sound spectrogram could show how well a cochlear implant system works. In this study, we evaluated electrical stimulus configuration of CIS strategy using the computational model. The computational model includes stochastic property and anatomical features of cat auditory nerve fiber. To evaluate similarity between a neurogram and an input-sound spectrogram, we calculated Structural Similarity Index (SSIM). The results show that the dynamic range and the stimulation rate per channel influenced SSIM. Finally, we suggested the optimal configuration within the given stimulus CIS. We expect that the results and the evaluating procedure could be employed to improve the performance of a cochlear implant system.

휴대용 디지털 전자제품의 사용성 향상을 위한 청각적 피드백의 고려 (Design Considerations of Auditory Feedback for Enhancing The Usability of Portable Digital Electronic Products)

  • 김형석;박민용
    • 대한인간공학회지
    • /
    • 제19권3호
    • /
    • pp.51-60
    • /
    • 2000
  • Non-verbal sound feedback, called earcon, has been used for portable digital electronic products to give appropriate information for the selected function. This study evaluated usability based on user cognition time, error rate, and subjective satisfaction using 20 male and female subjects. The study compared five major user functions from a portable digital electronic product with currently available earcons and the same functions from the product with the new earcons (suggested by this study) which considered user cognitive characteristics, such as loudness, pitch, melody, and length. For subjective evaluation, the study assessed various earcons by subjective impression of sounds using the seven-point rating scales. Major statistical results indicated that the new earcons significantly reduced user error rates and generally improved user performance functions, such as 'play, off, stop, fast forward, and rewind.'

  • PDF

감성 가치 평가를 위한 시각적, 청각적 매체의 효용에 대한 연구 (The Effects of Visual and Auditory Information as a Tool of Emotional Value Assessment)

  • 이은창;김명석
    • 한국디자인학회:학술대회논문집
    • /
    • 한국디자인학회 1999년도 추계 학술발표대회 논문집
    • /
    • pp.12-13
    • /
    • 1999
  • 디자인은 디자이너와 소비자간에 사회의 공적 영역을 배경으로 한 일종의 커뮤니케이션 모델이라고 할 수 있다. 커뮤니케이션은 일반적 의미와 구체적 의미로 나누어 냉각해 볼 수 있다. 일반적 의미는 "한 사람이 다른 사람에게 메시지를 전달하는 것”으로 정의할 수 있다. (중략)

  • PDF

한국어 단어 재인에서의 음운정보와 철자정보의 활성화(II) (The Phonological and Orthographic activation in Korean Word Recognition(II))

  • 최원일;남기춘
    • 대한음성학회:학술대회논문집
    • /
    • 대한음성학회 2003년도 10월 학술대회지
    • /
    • pp.33-36
    • /
    • 2003
  • Two experiments were conducted to support the suggestion that the same information processing was used in both input modalities, visual and auditory modality in Wonil Choi & Kichun Nam(2003)'s paper. The primed lexical decision task was performed and pseudoword prime stimuli were used. The result was that priming effect did not occur in any experimental condition. This result might be interpreted visual facilitative information and phonological inhibitory information cancelled each other.

  • PDF

청각자극을 받은 두뇌에서의 상호정보이동 (mutual Information Flow in Brain by Auditory Stimuli)

  • 조덕연;이유정;김응수
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 1999년도 춘계학술발표논문집 논문집
    • /
    • pp.285-289
    • /
    • 1999
  • 본 논문에서는 고차 뇌 정보처리연구의 일환으로서, 통신 및 정보이론 분야에서 신호간의 확률적 상관성을 나타내는 지표로 많이 활용되는 상호정보(mutual information)를 이용하여 청각자극을 받은 뇌파의 정보이동(information flow)을 분석하였다. 청각자극에 따른 뇌파의 정보이동을 분석한 결과, 자극에 따른 각 상태에서의 확률적 관계의 흐름에 차이가 있음을 볼 수 있었다.

  • PDF

Interactive information process image with minute hand gestures

  • Lim, Chan
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.799-802
    • /
    • 2016
  • It is definitely an interesting job to work with V4 to create various contents emphasizing different interfaces like 3D graphics, and multimedia such as video, audio, and camera. Moreover, beyond the other interface, as it could be used in the many aspects of the sensory sign such as visual effects, auditory effects, and touchable effects, it feels free to make a better developed model. We intended the users to feel some kind of pleasure and interactions rather than just using in aspect of Media art.

한국어 음성의 스펙트럼 변화에 관한 연구 (A Study on the Spectrum Variation of Korean Speech)

  • 이수길;송정영
    • 인터넷정보학회논문지
    • /
    • 제6권6호
    • /
    • pp.179-186
    • /
    • 2005
  • 음성학에서 음성이 가지고 있는 주파수 특성을 이용하여 스펙트럼을 추출할 수 있고 이를 이용하여 음성을 분석할 수 있다. 그러나 음성의 스펙트럼은 단모음의 경우 어느 정도 일정한 형태를 유지하지만 음절. 단어 등과 같이 자음과 모음이 서로 결합되었을 때는 상당한 변화가 발생된다. 이는 음소단위 음성인식에 있어서 가장 큰 장애가 되고 있다. 본 논문에서는 주파수 영역과 청각적 인상을 고려한 멜 대역 그리고 멜 켑스트럼을 이용하여 각 자음과 모음이 가지고 있는 스펙트럼을 분석하고, 청각적 특성을 반영한 음성의 변화를 체계화하여 음성을 음소단위로 분할할 수 있는 기반을 제공한다.

  • PDF

트라이톤 패러독스를 이용한 생체인증의 고찰 (Study of Biometrics using Tritone Paradox)

  • 정창훈;신동오;양대헌;이경희
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1085-1095
    • /
    • 2015
  • 음악 이론에서 트라이톤은 세 개의 온음(또는 여섯 개의 반음) 차이를 가지도록 구성된 음정을 말하며, 조화와 선율의 불협화음을 발생시킨다. 트라이톤 패러독스는 일종의 청각적 착각으로, 트라이톤을 들은 어떤 사람은 이것이 올라가는 연음으로 들리지만, 또 어떤 사람은 이를 내려가는 연음으로 들리는 현상을 말한다. 이 논문은 트라이톤 패러독스를 이용한 새로운 비정적 생체인증기법에 대해 검토하고, 사용자 실험을 통하여 이 기법의 유일성과 일관성을 분석한다. 그리고 이를 응용하여 키로깅, 어깨너머 훔쳐보기, 무작위 대입 등의 공격에 대해 안전한 몇 가지 인증 프로토콜을 제안한다.