• 제목/요약/키워드: Perceptual Characteristics

검색결과 255건 처리시간 0.026초

일반 청자의 아동 발화 단음절에 대한 교차 지각 분석 (Cross-sectional perception studies of children's monosyllabic word by naive listeners)

  • 하승희;소정민;윤태진
    • 말소리와 음성과학
    • /
    • 제14권1호
    • /
    • pp.21-28
    • /
    • 2022
  • 자음의 정확도와 습득 시기에 관한 국내외 선행연구들은 상당히 많은 반면, 유아 혹은 아동의 발화를 대상으로 한 비전문가 혹은 일반 성인을 대상으로 한 지각 실험은 상당히 빈약한 편이다. 본 논문에서는 그러한 공백을 채우기 위해 2세에서 6세 사이의 아동들이 자신들에게 친숙하다고 판단되는 단음절 단어를 발화하게 하여, 이 단음절 단어를 자극으로 사용하여 일반 성인화자들을 대상으로 교차 지각 실험을 수행되었다. CVC 형태의 단음절 단어들은 2-6세 사이의 아동들의 발화에서 추출되었으며, 전체 20명으로 구성된 성인 화자들을 5 그룹으로 나누어, 아동 발화를 들리는 대로 받아 적게 하는 과업을 수행하였다. 분석을 위해서는 다음의 3가지 조건을 상정하여 분석하였다: (1) VC를 고려하지 않은 상태에서 초성 자음만 아동의 조음과 성인의 화자가 일치하는 조건, (2) 종성은 고려하지 않으면서 CV 형태만 조음과 지각이 일치하는 조건, 그리고 (3) CVC 형태인 단어 전체의 조음과 지각이 일치하는 조건. 분석 결과를 살펴보면, 단어 전체의 일치도가 가장 낮았으며, 초성만 고려했을 때의 일치도가 가장 높았다. 또한 일반적인 경향은 아동들의 나이가 많아짐에 따라 아동의 발화와 성인의 지각 반응 사이에 일치도가 높아졌다. 하지만 아동 자음의 습득 연령이 빠르면 2세부터 시작되어 5세 정도면 거의 완성된다고 보고한 전문가들의 진단과는 달리, 일반 성인 화자들은 아동의 발화에 대해서 적어도 5세 정도는 되어야 75% 정도의 일치도를 보이는 것으로 관찰되었다. 본 연구는 아동의 언어 발달 과정에서 관찰되는 일반 성인들의 지각에 대한 이해를 높이는 데 중요한 기여를 하였다. 즉 본 연구가 가지는 의의는 아동의 말소리 습득과 관련하여 전문가의 정확한 판단과 아동을 양육하는 부모 혹은 전문가가 아닌 일반 성인의 지각이 다를 수 있다는 것이다. 아동 발달 과정에서 5세 전의 아동들에게서 다소 알아듣기 힘든 단어나 자음이 관찰되더라도, 이는 말소리 지연이나 언어 장애와 관련된 현상은 아니라, 아동의 말소리에 익숙하지 않은 일반 성인이 가지는 지각의 한계일 수 있다는 점을 염두에 둘 필요가 있다.

RSA 함수에 기반한 안전한 워터마킹 기법 (A Secure Digital Watermarking Scheme based on RSA Function)

  • 이진호;김태윤
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권3호
    • /
    • pp.220-228
    • /
    • 2001
  • 디지털 워터마킹(digital watermarking)은 기밀 정보를 디지털 이미지 속에 삽입시켜 이미지 소유자의 저작권을 보호하는 것을 목적으로 하는 기법이다. 저작권 보호를 위한 디지털 워터마킹 기법의 안전성을 보장하기 위해서, 삽입 정보의 위치를 결정할 때 워터마킹 공격에 대한 견고성과 육안적 비구별성을 동시에 추구해야 하고, 워터마킹 알고리즘의 은닉성 대신 키의 은닉성이 보장되어 하며, 키의 사용으로 허가받지 않은 사용자의 워터마크 검출을 방지할 수 있어야 한다. 이를 위해 본 논문에서는 암호학에서 사용되는 일방향 해쉬 함수를 사용하는 워터마킹 기법을 제안한다. 일방향 해쉬 함수를 구현하기 위해 RSA 일방향 함수와 모듈라 연산을 사용한다. 제안하는 워터마킹 기법은 LSB(least significant bit) 공격과 감마 보정 공격에 대해 견고하며 육안적 비구별성(perceptual invisibility)이 높다. 제안하는 워터마킹 기법의 실제 구현 및 실험을 통한 실험 결과를 분석하여 견고성과 육안적 비구별성의 특징을 확인한다.

  • PDF

초임부의 모성 정체성에 관한 모형구축 (Model Construction of Maternal Identity in Primi-gravida)

  • 김혜원
    • 대한간호학회지
    • /
    • 제28권2호
    • /
    • pp.510-518
    • /
    • 1998
  • It was assumed that the maternal identity in primi-gravida is one of the most attribute of the motherhood, that is not biological but cognitive phenomena, appears active process as intelligent human being. The purposes of this study were that the identification the cognitive structure and the influencing factors of the maternal identity in primi-gravida. Theoretical framework in this study, maternal identity in primi-gravida was constructed as a cognitive output, has the cognitive structure of cognitive-perceptual factor, cognitive-behavioral factor, and cognitive-emotional factor. Influencing factors of maternal identity was constructed as a cognitive input, which were pregnancy related perceptions (pregnancy intention, minor discomfort, value of motherhood), interpersonal relationship(relationship with mother, relationship with husband, relationship with social network), preparation to motherhood(maternal knowledge, antenatal self care), and biological factor (gestation period). This study was the descriptive correlational research design, was done from the 3rd January to the 15th March 1996, and the research subjects were selected conviniently 226 the primi-gravida during the gestation period, data collection method was self reported questionnaire cross-sectionally. Descriptive data analysis was done by SAS PC$^{+}$, testing the hypothetical model was done by covariance structural analysis using LISREL 8.03 program. The result of the hypothesis testing, the value of motherhood(y=.650, T=4.26) the maternal knowledge (y=.137, T=2.030), the gestation period( y=.113, T=2.621), showed significant causal effect on the maternal identity in primi-gravida. In conclusion, the maternal identity in primi-gravida had interrelated cognitive structure consist of perceptual, behavioral, and emotional factors. Significant causal factors influencing the maternal identity were value identified. It seems to contribute toward the understanding the characteristics of the maternal identity as a cognitive domains that has been regarded highly abstract concept, so has not been validated empirically.y.

  • PDF

인지 모델을 이용한 제한된 한국어 연속음 인식 (Recognition of Restricted Continuous Korean Speech Using Perceptual Model)

  • 김선일;홍기원;이행세
    • 한국음향학회지
    • /
    • 제14권3호
    • /
    • pp.61-70
    • /
    • 1995
  • 본 논문에서는 사람의 인지 특성에 가까운 PLP 켑스트럼을 사용하여 음성의 시간적 특성을 잘 반영할 수 있도록 넓은 시간대에 걸쳐 특징을 추출하였으며 인간의 학습 방법과 유사한 인공신경망을 이용하여 음소를 인식하고 인식된 음소로부터 순서 특징을 잘 반영하는 Markov 모델을 통해 음소열을 인식하였다. 음소인식은 연속음성에 나타나는 음소에서 비균일한 프레임 개수로 채취된 음성 블록들을 사용하여 7차 PLP 켑스트럼, PTP, 영교차율 및 에너지를 구하고 이를 MLP 신경망의 입력으로 사용하여 두 사람이 각각 5번씩 발음한 10종류의 한국어 문장, 총 100개를 대상으로 음소 인식을 실시하여 최대 9.4%의 음소별 인식률을 얻을 수 있었다. 문장인식은 학습에 참여했던 두 사람이 각 문장에 대해 10번씩 새로 발음한 총 200개의 데이터에 대해 음소별 인식을 거쳐 첫 번째 실험을 통해 생성된 Markov 모델을 이용하여 문장 인식을 실시한 결과 92.5%의 문장 인식률을 얻었다.

  • PDF

표준 부호 디지트 코딩을 이용한 비가청 이진 랜덤 신호 발생에 관한 연구 (Study on the Generation of Inaudible Binary Random Number Using Canonical Signed Digit Coding)

  • 남명우;이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제8권4호
    • /
    • pp.263-269
    • /
    • 2015
  • 디지털 워터마킹은 인간의 감각으로 감지할 수 없고 통계적인 방법에 의하여 검출되지 않는 정보를 디지털 데이터에 삽입하는 기술이다. 일반적으로 디지털 음향 신호에 대한 워터마킹은 의미 있는 정보를 갖는 이진 시퀀스를 원래의 디지털 음향 신호에 삽입하여 구현한다. 그러나 삽입된 이진 정보는 원래의 디지털 음향 신호의 관점에서는 잡음으로 작용하여 원래의 음향 신호를 왜곡 시키거나 열화 시키는 원인으로 작용한다. 본 논문에서는 인간의 가청 주파수 영역에서 이진 정보의 삽입으로 인한 원 음향 정보의 왜곡을 최소화시킬 수 있는 이진 정보 발생 방법을 제안하였다. 제안한 방법은 표준부호 디지트 코딩을 이용한 방법으로서 인접한 데이터간의 주파수 간섭을 최소화 하여 인간의 가청 주파수 영역에서의 이진 정보 시퀀스의 영향을 최소화 하도록 구현하였다. 제안한 방법은 일반적인 이진 정보발생 방법과 주파수 분석 비교를 통하여 성능을 평가하였다.

스펙트럼 변이를 이용한 Soft Decision 기반의 음성향상 기법 (Robust Speech Enhancement Based on Soft Decision Employing Spectral Deviation)

  • 최재훈;장준혁;김남수
    • 대한전자공학회논문지SP
    • /
    • 제47권5호
    • /
    • pp.222-228
    • /
    • 2010
  • 본 논문에서는 비정상적인 배경 잡음 환경에서 음성향상을 위한 신호의 스펙트럼 변이 (Spectral Deviation)을 적용한 Soft Decision 기반의 잡음전력 수정 기법을 제안한다. 기존의 Soft Decision 기반의 잡음전력 추정에 있어서 잡음신호의 정상성(Stationarity)을 가정한 스무딩 파라미터를 사용하여 잡음전력을 추정하고 갱신하였지만, 잡음신호의 주파수적인 특성이 상대적으로 빠르게 변하는 비정상적인 환경에서는 강인하지 못한 단점을 가지게 된다. 본 논문에서는 신호의 스펙트럼 변이를 추정하여 정상적인 잡음 환경과 비정상적인 잡음 환경에 따라 적응적으로 잡음전력을 추정하고 갱신하여 잡음신호에 의해 오염된 음성신호를 향상시킨다. 제안된 알고리즘은 다양한 배경 잡음 환경에서 객관적인 음질측정 방법인 ITU-T P.862 perceptual evaluation of speech quality (PESQ)에 의해서 평가되었으며, 기존의 Soft Decision 기반의 음성 향상 기법과 비교하여 보다 향상된 성능을 보여주었다.

갑상선 기능저하 음성에 대한 청지각적 및 파열음 분석에 대한 연구 (The Perceptual and Consonant Analysis for the Voice with Hypothyroidism)

  • 한백화;이다해;김준선;홍기환
    • 대한후두음성언어의학회지
    • /
    • 제27권2호
    • /
    • pp.95-101
    • /
    • 2016
  • Background and Objectives : The main purpose of this study is to clarify perceptual and acoustic analysis for the patients with hypothyroidism after thyroidectomy especially focused on the characteristics of speech articulation with special reference to the consonant production. Materials and Methods : The subjects of the research were 40 male and female adults (males : 5, females : 35). They were all received radioactive iodine treatment which after total thyroidectomy. Voice samples were collected during the three stages of after surgery, pre-radioisotope treatment (RIT), and post-RIT. The acoustic analysis was conducted by using Pratt (ver.5.2.21) after measuring voice onset time (VOT). The subjective evaluation of the voices used CAPE-V. Results : A significant decrease in overall severity was displayed in the CAPE-V following RIT. It may be conjectured that this is connected to the change in voice following RIT. The loudness of the sound displayed a significant decrease in the CAPE-V following RIT. It is conjectured that this is connected to the decrease in vocal intensity following RIT. No statistically significant results were revealed for the comparative analysis on the voice onset time (VOT) in all plosives during the three periods. Conclusion : Perceptually, the overall severity of the voice with hypothyroidism was changed significantly before and after RIT. Eventhough VOT were not significantly changed, it tended to decrease VOT in patients with hypothyroidism.

  • PDF

시간-주파수 구조에 근거한 지각적 오디오 부호화기 (A Perceptual Audio Coder Based on Temporal-Spectral Structure)

  • 김기수;서호선;이준용;윤대희
    • 방송공학회논문지
    • /
    • 제1권1호
    • /
    • pp.67-73
    • /
    • 1996
  • 일반적으로 고음질 오디오 부호화 방법은 전통적인 데이터 압축 기법과 인간의청각 모델을 결합한 구조를 갖고 있다. 고음질 오디오 부호화에 사용되는 주요한 청각 특성은 주파수 영역에서의 마스킹 현상이므로 서브밴드 부호화나 변환 부호화와 같은 주파수 영역 방법들이 널리 사용된다[1][2]. 그러나 지금까지의 고음질 오디오 부호화에서 시간 영역 마스킹과 시간 영역 중복성을 제거하는 방법은 적용되지 않았다. 본 논문에서 제안한 오디오 데이터 압축 방법은 시간 및 주파수 영역에서 통계적, 지각적 중복성을 제거한다. 주파수 영역으로 변환된 오디오 신호는 6프레임으로 구성된 패킷으로 나뉘어진다. 한 패킷은 1536 샘플 ($256{\times}6$)로 되어 있으며 패킷 내에서의 중복성은 시간 및 주파수 영역에서 존재한다. 각 패킷에서 두 중복성이 동시에 제거되어진다. 심리음향 모델에 있어서도 세밀한 주파수 마스킹과 함께 시간 영역 마스킹을 고려하여 보다 정확한 결과를 얻을 수 있도록 향상되었다. 양자화를 위해서 각 패킷은 비선형적인 임계 대역과 시간적인 청각 특성을 반영할 수 있도록 설계된 부블럭으로 분할되었다. 따라서 낮은 비트율에서 고음질의 복원음을 얻을 수 있었다.

  • PDF

Image Quality Assessment by Combining Masking Texture and Perceptual Color Difference Model

  • Tang, Zhisen;Zheng, Yuanlin;Wang, Wei;Liao, Kaiyang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권7호
    • /
    • pp.2938-2956
    • /
    • 2020
  • Objective image quality assessment (IQA) models have been developed by effective features to imitate the characteristics of human visual system (HVS). Actually, HVS is extremely sensitive to color degradation and complex texture changes. In this paper, we firstly reveal that many existing full reference image quality assessment (FR-IQA) methods can hardly measure the image quality with contrast and masking texture changes. To solve this problem, considering texture masking effect, we proposed a novel FR-IQA method, called Texture and Color Quality Index (TCQI). The proposed method considers both in the masking effect texture and color visual perceptual threshold, which adopts three kinds of features to reflect masking texture, color difference and structural information. Furthermore, random forest (RF) is used to address the drawbacks of existing pooling technologies. Compared with other traditional learning-based tools (support vector regression and neural network), RF can achieve the better prediction performance. Experiments conducted on five large-scale databases demonstrate that our approach is highly consistent with subjective perception, outperforms twelve the state-of-the-art IQA models in terms of prediction accuracy and keeps a moderate computational complexity. The cross database validation also validates our approach achieves the ability to maintain high robustness.

전역 음성 부재 확률 기반의 향상된 최소값 제어 재귀평균기법을 이용한 음성 향상 기법 (Speech Enhancement Based on Improved Minima Controlled Recursive Averaging Incorporating GSAP)

  • 송지현;방동혁;이상민
    • 대한전자공학회논문지SP
    • /
    • 제49권1호
    • /
    • pp.104-111
    • /
    • 2012
  • 본 논문에서는 향상된 최소값 제어 재귀 평균 기법 (improved minima controlled recursive averaging, IMCRA) 알고리즘의 잡음 전력 추정성능을 향상 시키기 위한 알고리즘을 제안한다. 기존의 IMCRA은 주파수 특성이 빠르게 변화하는 비정상적인 환경과 낮은 SNR을 갖는 상황에서 잡음 전력 추정에 직접적으로 영향을 미치는 음성 검출기의 성능이 강인하지 못한 단점이 있다. 본 연구에서는 강인한 음성 검출 성능을 위해서 기존 IMCRA의 음성 검출기에 전역 음성 부재 확률을 적용한 음성 향상 기법을 제안한다. 제안된 알고리즘의 성능 평가는 음성의 perceptual evaluation of speech quality (PESQ)와 composite measure를 통한 음질을 평가하였다. 실험 결과 다양한 잡음 환경 (car, white, babble)에서 전역 음성 부재 확률을 적용한 IMCRA의 음성 향상 기법이 향상된 결과를 보여주었다. 특히, 비정상잡음 환경인 babble 5dB에서 PESQ 0.026, composite measure 0.029의 향상된 음질을 나타내었다.