• 제목/요약/키워드: perceptual saliency

검색결과 11건 처리시간 0.023초

고설 모음 환경에서 한국어 자음의 지각적 구조 (Perceptual Structure of Korean Consonants in High Vowel Contexts)

  • 배문정
    • 말소리와 음성과학
    • /
    • 제1권2호
    • /
    • pp.95-103
    • /
    • 2009
  • We investigated the perceptual structure of Korean consonants by analyzing the confusion among consonants in various vowel contexts. The 36 CV syllable types combined by 18 consonants and 2 vowels (/i/ and /u/) were presented with masking noises or in degraded intensity. The confusion data were analyzed by the INDSCAL (Individual Difference Scaling), ADCLUS (Additive Clustering) and the probability of the transmitted information. The results were compared with those of a previous study with /a/ vowel context (Bae and Kim, 2002). The overall results showed that the laryngeal features-aspiration, lax and tense-are the most salient features in the perception of Korean consonant regardless of vowel contexts, but the perceptual saliency of place features varies across vowel conditions. In high vowel (front and back vowel) contexts, sibilant consonants were perceptually salient compared to in low vowel contexts. In back vowel contexts, grave (labial and velar) consonants were perceptually salient. These findings imply that place features and vowel features strongly interact in speech perception as well as in speech production. All statistical measures from our confusion data ensured that the perceptual structure of Korean consonants correspond to the hierarchical structure suggested in the feature geometry (Clements, 1991). We discuss the link between speech perception and production as the basis of phonology.

  • PDF

움직임 분석 기반의 시각인지 모델을 이용한 비디오 코딩 방법 (Video Coding Method Using Visual Perception Model based on Motion Analysis)

  • 오형석;김원하
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.223-236
    • /
    • 2012
  • 본 논문에서는 인간 인지 기반 비디오 코딩을 위한 비디오 처리 방법을 개발한다. 제안하는 방법은 율-왜곡(rate-distortion) 최적화의 영향뿐만 아니라 제한적인 시, 공간 해상도, 지역적인 움직임 이력(history), visual saliency에 의한 인간 시각 인지를 고려한다. 이러한 인간의 인지적인 효과들을 고려하기 위하여 본 논문에서는 움직임 패턴을 모델링하고 Hedge 알고리듬을 사용하여 움직임 패턴을 결정하는 기법을 개발한다. 그 다음, 제안한 움직임 패턴과 기존의 visual saliency와의 결합을 통하여 인간 시각 인지 모델을 수립한다. 제안된 인간 시각 인지 모델을 구현하기 위하여 기존의 foveation filtering 방법을 확장한다. 시각적 자극이 덜한 지역만을 부드럽게(smoothing)하는 기존의 foveation filtering 기법과 비교하여 제안하는 foveation filtering 기법은 인간 시각 인지 모델에 따라 지역적으로 부드럽게 또는 지역적 특성을 향상시킴으로써, 시각적 자극이 덜한 지역에서 줄여진 대역폭을 효과적으로 시각적 자극이 큰 지역에서 사용하도록 이동 시킬 수 있는 장점이 있다. 제안된 방법의 성능은 전반적인 비디오 화질을 만족할 뿐만 아니라 인간이 인지하는 화질의 품질을 12%~44% 향상시킨다.

Phonetic Functionalism in Coronal/Non-coronal Asymmetry

  • Kim, Sung-A.
    • 음성과학
    • /
    • 제10권1호
    • /
    • pp.41-58
    • /
    • 2003
  • Coronal/non-coronal asymmetry refers to the typological trend wherein coronals rather than non-coronals are more likely targets in place assimilation. Although the phenomenon has been accounted for by resorting to the notion of unmarkedness in formalistic approaches to sound patterns, the examination of rules and representations cannot answer why there should be such a process in the first place. Furthermore, the motivation of coronal/non-coronal asymmetry has remained controversial to date even in the field of phonetics. The present study investigated the listeners' perception of coronal and non-coronal stops in the context of $VC_{1}C_{2}V$ after critically reviewing the three types of phonetic accounts for coronal/non-coronal asymmetry, i.e., articulatory, perceptual, and gestural overlap accounts. An experiment was conducted to test whether the phenomenon in question may occur, given the listeners' lack of perceptual ability to identify weaker place cues in VC transitions as argued by Ohala (1990), i.e., coronals have weak place cues that cause listeners' misperception. 5pliced nonsense $VC_{1}C_{2}V$ utterances were given to 20 native speakers of English and Korean. Data analysis showed that majority of the subjects reported $C_{2}\;as\;C_{1}$. More importantly, the place of articulation of C1 did not affect the listeners' identification. Compared to non-coronals, coronals did not show a significantly lower rate of correct identifications. This study challenges the view that coronal/non-coronal asymmetry is attributable to the weak place cues of coronals, providing evidence that CV cues are more perceptually salient than VC cues. While perceptual saliency account may explain the frequent occurrence of regressive assimilation across languages, it cannot be extended to coronal/non-coronal asymmetry.

  • PDF

Image saliency detection based on geodesic-like and boundary contrast maps

  • Guo, Yingchun;Liu, Yi;Ma, Runxin
    • ETRI Journal
    • /
    • 제41권6호
    • /
    • pp.797-810
    • /
    • 2019
  • Image saliency detection is the basis of perceptual image processing, which is significant to subsequent image processing methods. Most saliency detection methods can detect only a single object with a high-contrast background, but they have no effect on the extraction of a salient object from images with complex low-contrast backgrounds. With the prior knowledge, this paper proposes a method for detecting salient objects by combining the boundary contrast map and the geodesics-like maps. This method can highlight the foreground uniformly and extract the salient objects efficiently in images with low-contrast backgrounds. The classical receiver operating characteristics (ROC) curve, which compares the salient map with the ground truth map, does not reflect the human perception. An ROC curve with distance (distance receiver operating characteristic, DROC) is proposed in this paper, which takes the ROC curve closer to the human subjective perception. Experiments on three benchmark datasets and three low-contrast image datasets, with four evaluation methods including DROC, show that on comparing the eight state-of-the-art approaches, the proposed approach performs well.

인간의 상향식 시각적 주의 특성에 바탕을 둔 현저한 영역 탐지 (Detecting Salient Regions based on Bottom-up Human Visual Attention Characteristic)

  • 최경주;이일병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.189-202
    • /
    • 2004
  • 본 논문에서는 영상 입력 장치로 입력되는 영상 내의 수많은 정보 중에서 지각적으로 중요하다고 여겨지는 현저한(salient) 영역만을 탐지해내는 새로운 방법을 제안한다. 제안하는 방법은 인간이 가지고 있는 시각적 주의 기능에 기본 바탕을 두고 있으며, 영상을 구성하고 있는 정보의 특징에 기반을 두고 있다. 가장 먼저 인간의 시각적 주의 기능에 영향을 미친다고 알려져 있는 몇 가지 특징들이 입력되는 영상의 모든 영역에 걸쳐 추출되어 각각의 특징에 해당되는 특징지도들로 형성된다. 이렇게 형성된 각각의 특징지도들을 구성하고 있는 특징 값들은 이들 각각의 국부적인 경쟁력 특성에 의하여 영상의 각 영역에서의 중요도를 나타내는 값으로 변환되어 중요도지도를 형성하게 된다. 이러한 중요도지도들은 모두 통합되어 하나의 현저함지도를 생성하게 된다. 현저함지도는 영상 내 각 장소의 현저함 정도를 미리 계산된 특징들의 공간적 중요도 측정치에 따른 스칼라 값으로 표시함으로써 영상 내에서 가장 현저한 영역을 찾을 수 있도록 가이드 한다. 제안하는 방법에 의해 시스템을 구성하여 실험한 결과, 인간이 중요하다고 여겨지는 주요 영역을 만족스럽게 탐지해 냄을 알 수 있었다.

에지 보존 필터 및 관심영역 전송에 기반한 스케일러블 코딩 방법 (A Scalable Coding Based on Edge-Preserving Filter and the Region of Interest Based on Saliency Detection)

  • 이대현;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.33-34
    • /
    • 2016
  • 본 논문에서는 HVS(human visual system)의 특성을 고려한 새로운 스케일러블 코딩방법을 제안한다. 제안된 방법은 먼저 영상 내에서 관심영역(saliency map)을 찾고 관심영역을 제외한 부분에 에지 보존 필터를 적용한다. 그 영상은 정해진 양자 파라미터 값으로 인코딩 되어 제안된 코딩 시스템의 베이스 층(base layer)이 된다. 기존 스케일러블 코딩 표준에서의 베이스 층과 다르게 본 논문의 베이스 층은 관심 있는 중요영역(foreground)을 보존하고 또한 배경(background)의 에지 성분도 보존한다. 기본 층이 전송되면 개선층(enhancement layer)은 원 영상과 복원된 베이스 층 영상간의 차분 영상에서 관심영역 순으로 보내진다. 실험은 HEVC 를 바탕으로 수행되었고 스케일러블 코딩 표준인 SHVC 와 관심영역에서 비교를 했을 때 제안된 알고리즘이 더 높은 PSNR 을 가지는 것을 확인하였다. 또한 전체적으로 지각적인 품질(perceptual quality) 또한 향상되었음을 확인하였다.

  • PDF

S-JND 모델을 사용한 주관적인 율 제어 알고리즘 기반의 HEVC 부호화 방법 (A Perceptual Rate Control Algorithm with S-JND Model for HEVC Encoder)

  • 김재련;안용조;임웅;심동규
    • 방송공학회논문지
    • /
    • 제21권6호
    • /
    • pp.929-943
    • /
    • 2016
  • 본 논문에서는 인지 화질을 고려하기 위해 S-JND 모델 기반의 율 제어 알고리즘을 제안한다. 제안하는 율 제어 알고리즘은 인간이 가지는 시각 시스템의 특징을 반영하기 위하여 시각적 민감도와 시각적 관심도를 동시에 반영할 수 있도록 제작된 S-JND (Saliency-Just Noticeable Difference) 모델을 사용한다. 율 제어 알고리즘을 통해 비트를 분배하는 과정에서 픽쳐 내에 존재하는 각 CTU (Coding Tree Unit)가 가지는 S-JND threshold를 구한다. 각 CTU의 threshold는 적응적으로 적절한 비트를 분배하는데 사용되고, 따라서 제안하는 비트 분배 모델은 인지 화질을 향상 시킬 수 있다. 제안하는 방법의 성능 검증을 위해서 제안하는 방법을 HM 16.9에 구현하였으며, CTC (Common Test Condition) RA (Random Access), Low-delay B와 Low-delay P의 경우에 Class B와 Class C 영상들에 대해 실험 하였다. 실험 결과, 제안하는 방법은 기존 율 제어 알고리즘 대비 평균 2.3%의 비트율이 감소했고 BD-PSNR은 약 0.07dB 향상이 있었으며 비트 정확도 또한 0.06% 정도 증가하였다. DSCQS (Double Stimulus Continuous Quality Scale) 방법으로 측정한 결과, 제안하는 방법은 기존 방법 대비 0.03 MOS (Mean Opinion Score) 향상을 보였다.

Blind Image Quality Assessment on Gaussian Blur Images

  • Wang, Liping;Wang, Chengyou;Zhou, Xiao
    • Journal of Information Processing Systems
    • /
    • 제13권3호
    • /
    • pp.448-463
    • /
    • 2017
  • Multimedia is a ubiquitous and indispensable part of our daily life and learning such as audio, image, and video. Objective and subjective quality evaluations play an important role in various multimedia applications. Blind image quality assessment (BIQA) is used to indicate the perceptual quality of a distorted image, while its reference image is not considered and used. Blur is one of the common image distortions. In this paper, we propose a novel BIQA index for Gaussian blur distortion based on the fact that images with different blur degree will have different changes through the same blur. We describe this discrimination from three aspects: color, edge, and structure. For color, we adopt color histogram; for edge, we use edge intensity map, and saliency map is used as the weighting function to be consistent with human visual system (HVS); for structure, we use structure tensor and structural similarity (SSIM) index. Numerous experiments based on four benchmark databases show that our proposed index is highly consistent with the subjective quality assessment.

시각 특성을 고려한 스케일러블 비디오의 패킷 손실 최적화 기법 (Packet Loss Protection Method of Scalable Video considering Perceptual Saliency)

  • 이현호;이광현;이상훈
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 하계학술대회
    • /
    • pp.563-564
    • /
    • 2011
  • 본 논문에서 우리는 unequal loss protection(ULP) 알고리즘을 기반으로 패킷이 손실될 수 있는 망 환경에서 인지적으로 재구성된 영상의 왜곡을 최소화하는 방법을 제안한다. 알고리즘에는 2가지의 주요 요인이 있다. 첫째, 인간 시각 체계의 균일하지 않은 분포의 함수로 압축된 영상에 가중치를 준다. 둘째, 패킷은 오류 전파가 일어나지 않도록 하면서 각각의 group of picture(GOP)내에서 시간적인 중요성이 할당된다. 프레임의 인지적인 중요성과 GOP의 계층적인 중요성을 동시에 고려하여, 제안하는 ULP알고리즘은 인간 시각적으로 가장 중요한 지역의 크기를 식별하여 효율적인 forword error correction(FEC) 알고리즘을 수행한다.

  • PDF

셀리언시가 높은 물체가 게임 난이도에 미치는 영향 (The Influence of Salient Objects on the Game Difficulties)

  • 이지형;이찬근;이창하
    • 한국게임학회 논문지
    • /
    • 제10권1호
    • /
    • pp.15-23
    • /
    • 2010
  • 슈팅 게임이나 플랫폼 게임과 같은 액션 게임에서는 플레이어 캐릭터가 적 캐릭터와 충돌하면 플레이어 캐릭터가 죽거나 에너지가 감소하게 되므로 적 캐릭터를 회피하는 요소가 중요하다. 본 논문에서는 적 캐릭터를 회피하는 요소가 중요한 게임에서 셀리언시(saliency)가 높은 물체가 있을 경우 게임의 난이도에 어떠한 영향을 미치는가에 대하여 고찰하였다. 플레이어는 셀리언시가 높은 물체의 움직임을 주목하게 되므로 이로 인해 셀리언시가 낮은 다른 많은 물체들의 움직임을 간과할 수 있다. 그 결과로 물체의 회피에 실패할 확률이 높아질 것이다. 본 연구에서는 셀리언시가 높은 물체의 존재여부가 게임 난이도에 미치는 영향을 검증하기 위해 사용자 실험을 수행하였으며, 셀리언시가 높은 물체가 없는 게임을 수행한 그룹이 셀리언시가 높은 물체가 있는 게임을 수행한 그룹보다 더 높은 점수를 획득하는 결과를 얻었다. 본 연구는 인간의 지각적인 측면에서 게임의 난이도에 영향을 끼칠 수 있는 요소를 살펴보고 이를 실험을 통해 검증하였고 이는 게임 제작 및 기획 단계에서 난이도 예측에 도움이 되는 요소가 될 수 있을 것이다.