• 제목/요약/키워드: Perceptual region

검색결과 47건 처리시간 0.027초

영상이해를 위한 지식유출에 관한 연구 (A Study on the Extraction of Knowledge for Image Understanding)

  • 곽윤식;이대영
    • 한국통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.757-772
    • /
    • 1993
  • 본 논문에서는 영상 이해를 위한 지식 베이스 시스템에 있어서 핵심적 기능을 수행하게 되는 저급 지식원과 중급 지식원의 추출에 관한 것으로 화소 영역에 적용되는 저급 처리 과정으로 영역 분할 처리과정, 방향 영상 변환과정, 형태 정보 추출 과정, 영역 특징량 추출과정으로 구성되며 중급 처리 과정으로 특징 베이스 분류, 기하학적 토큰 관계성, 인지적 조직과 집단화 과정으로 구성되어 있다.

  • PDF

Comfort Noise를 이용한 다중 적응 코드북 기반 패킷 손실 은닉 알고리즘 (A Packet Loss Concealment Algorithm Based on Multiple Adaptive Codebooks Using Comfort Noise)

  • 박남인;김홍국
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.873-874
    • /
    • 2008
  • In this paper, we propose a packet loss concealment (PLC) algorithm for CELP speech coders, which is based on multiple adaptive codebooks by using comfort noise for the lost packet recovery. The multiple adaptive codebooks are composed of a conventional adaptive codebook to model periodic excitation of speech and another adaptive codebook to provide a better estimate of excitation when packets are lost in the speech onset region. The performance of the proposed PLC algorithm is evaluated by implementing it into the G.729 decoder and compared with that of the PLC algorithm employed in the G.729 decoder by means of perceptual evaluation of speech quality (PESQ). It is shown from the experiments under different burstiness of packet loss rates of 3% and 5% that the proposed PLC algorithm provides higher PESQ scores than the G.729 PLC algorithm.

  • PDF

The imitation patterns of adults and children on f0 intervals in North Kyungsang Korean

  • Kim, Jungsun
    • 말소리와 음성과학
    • /
    • 제11권2호
    • /
    • pp.23-31
    • /
    • 2019
  • The present study examines whether pitch range variation in North Kyunsang Korean shows a categorical or continuous function. Specifically, the study is focused on the data imitated by adults and children in the North Kyungsang region. To investigate pitch range variation, the log-produced f0 intervals were measured and statistically analyzed. The results of the study are as follows. First, both the adults' and children's imitations were more categorical than continuous, especially for the HL-LH patterns. For the other pitch accent patterns, such as HH-HL and HH-LH, the curves were continuous or flat for most of the speakers. Second, the children's imitations were poorer than those of the adults. That is, the children's imitative responses were shown as more continuous or flat curves than categorical. For the children, the HL-LH pattern showed a categorical function at the midpoint of the curves, though the shifts were not as distinctive as the adults' data. This implies that the imitative responses of children follow the perceptual and productive trace of adults' speech behavior.

모어청자에 의한 일본어 어두 폐쇄음의 지각 (Perception of Japanese word-initial stops by native listeners)

  • 변희경
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.53-64
    • /
    • 2021
  • 일본어의 어두 폐쇄음은 일차적으로 VOT로 구별되며 유성음은 음 값의 VOT, 무성음은 양 값의 VOT를 갖는 것으로 알려져 있다. 최근의 연구에 의하면 유성음이 양 값의 VOT를 갖는 어두 유성 폐쇄음의 무성화 현상이 전국적으로 젊은 층을 중심으로 진행되고 있는 것이 확인되었다. 또한 지역마다 정도의 차이는 있으나 어두 폐쇄음 구별에 VOT 이외에 후속 모음의 F0 차이가 유효한 것이 밝혀졌다. 본고는 산출에 쓰이는 음향 변수 VOT와 F0가 지각 변수로도 유효한지를 검토한 것이다. 4개 지역의 대학생 55명을 대상으로 자연음과 합성음을 이용한 세 가지 지각 실험을 실시한 결과는 어느 지역에서나 어두 폐쇄음의 일차적 지각 변수로 기능하는 것은 VOT이며 예상했던 F0의 사용은 극히 한정적인 것으로 나타났다. F0는 VOT가 기능하지 않을 때에 높은 F0를 무성음으로 지각하는 경우는 있으나 반대로 낮은 F0를 유성음으로 지각하는 경우는 거의 보이지 않았다. 이러한 결과는 유성/무성의 구별에 관여하는 산출의 음향 변수와 지각 변수가 일치하지 않는 것을 뜻하며, 나아가 일차적 변수인 VOT의 구별이 어려운 상황에서도 F0의 적극적인 사용 없이 일상생활에서 유성/무성의 구별에 혼란이 없는 것은 VOT와 F0 이외의 다른 요인이 관여하고 있음을 시사한다. 본고에서는 산출에서 어느 정도 관여가 인정된 모음의 음질(H1-H2)이나 음향 변수가 아닌 문맥이 관여하고 있을 가능성에 대해 논하였으나 이에 대한 검증은 앞으로의 과제로 남아 있다.

인간의 상향식 시각적 주의 특성에 바탕을 둔 현저한 영역 탐지 (Detecting Salient Regions based on Bottom-up Human Visual Attention Characteristic)

  • 최경주;이일병
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.189-202
    • /
    • 2004
  • 본 논문에서는 영상 입력 장치로 입력되는 영상 내의 수많은 정보 중에서 지각적으로 중요하다고 여겨지는 현저한(salient) 영역만을 탐지해내는 새로운 방법을 제안한다. 제안하는 방법은 인간이 가지고 있는 시각적 주의 기능에 기본 바탕을 두고 있으며, 영상을 구성하고 있는 정보의 특징에 기반을 두고 있다. 가장 먼저 인간의 시각적 주의 기능에 영향을 미친다고 알려져 있는 몇 가지 특징들이 입력되는 영상의 모든 영역에 걸쳐 추출되어 각각의 특징에 해당되는 특징지도들로 형성된다. 이렇게 형성된 각각의 특징지도들을 구성하고 있는 특징 값들은 이들 각각의 국부적인 경쟁력 특성에 의하여 영상의 각 영역에서의 중요도를 나타내는 값으로 변환되어 중요도지도를 형성하게 된다. 이러한 중요도지도들은 모두 통합되어 하나의 현저함지도를 생성하게 된다. 현저함지도는 영상 내 각 장소의 현저함 정도를 미리 계산된 특징들의 공간적 중요도 측정치에 따른 스칼라 값으로 표시함으로써 영상 내에서 가장 현저한 영역을 찾을 수 있도록 가이드 한다. 제안하는 방법에 의해 시스템을 구성하여 실험한 결과, 인간이 중요하다고 여겨지는 주요 영역을 만족스럽게 탐지해 냄을 알 수 있었다.

의료 영상을 위한 추정오차 히스토그램 기반 가역 워터마킹 알고리즘 (Reversible Watermarking based on Predicted Error Histogram for Medical Imagery)

  • 오기태;장한별;도엄지;이해연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권5호
    • /
    • pp.231-240
    • /
    • 2015
  • 의료 영상은 원본 콘텐츠의 품질을 유지하는 것이 중요한 동시에 사생활 보호의 요구가 증가함에 따라서 가역 워터마킹 기술에 대한 필요성이 증가하고 있다. 기존의 가역 워터마킹 알고리즘은 의료 영상이 아닌 일반 영상에서는 고용량 고품질을 유지할 수 있으나 영상 전체에 왜곡을 야기한다. 따라서 촬영 대상물의 품질 유지가 중요한 의료 영상에 직접적으로 적용하기에는 부적합하다는 단점을 가진다. 본 논문에서는 의료 영상의 촬영 대상물 영역의 영상 품질을 유지하며, 워터마크를 효율적으로 삽입할 수 있는 가역 워터마킹 알고리즘을 제안한다. 먼저 대상물과 배경 영역을 분할하기 위한 알고리즘을 설계하고, 그 후에 분할된 대상물과 배경에 대해 추정오차 히스토그램에 기반하여 가역 워터마킹 기법을 적용한다. 대상물 영역에는 삽입 레벨을 낮게 설정하고, 배경 영역에 삽입 레벨을 높게 설정함으로써 대상물의 화질은 최소한으로 변형을 하며 효율적인 삽입이 가능하도록 하였다. 실험에서 다양한 의료 영상에 대하여 제안한 알고리즘을 기존 추정오차 히스토그램 기반 가역 워터마킹 기술과 삽입 용량 및 영상 품질에 대한 비교를 수행하였고, 그 결과 제안하는 알고리즘이 기존 알고리즘에 비해 높은 영상 품질을 유지하면서 우수한 삽입 용량을 얻을 수 있었다.

균질 연결성이 순간 노출된 형태의 지각에 미치는 영향 (The Influence of Uniform Connectedness in Perceiving Briefly Presented Forms)

  • 박창호
    • 인지과학
    • /
    • 제12권4호
    • /
    • pp.41-47
    • /
    • 2001
  • 집단화의 새 원리로 제안된(Palmer & Rock. 1994) 균질 연결성이 부분들을 한 지각 단위로 처리하는 데에 효과가 있는지를 알아보기 위해 순간 노출된 자극판에서 표적의 정체를 식별하게 하는 실험을 수행하였다. 실험 1과 2에서 균질 연결된 자극판과 분리된 자극판에서 보고 정확률의 차이가 없었다. 자극판 전체의 형태를 보고하게 하는 실험 3에서 균질 연결성의 효과가 관찰되었으나. 여전히 반복 제시된 자극판의 처리가 상대 제시된 자극판의 처리보다 열등한 부적 반복효과가 관찰되었다. 이는 순간 노출된 형태의 지각에 균질 연결성의 효과가 크지 않음을 뜻한다

  • PDF

시각주의 모델을 적용한 실내 복도에서의 위치인식 기법 (An Approach for Localization Around Indoor Corridors Based on Visual Attention Model)

  • 윤국열;최선욱;이종호
    • 제어로봇시스템학회논문지
    • /
    • 제17권2호
    • /
    • pp.93-101
    • /
    • 2011
  • For mobile robot, recognizing its current location is very important to navigate autonomously. Especially, loop closing detection that robot recognize location where it has visited before is a kernel problem to solve localization. A considerable amount of research has been conducted on loop closing detection and localization based on appearance because vision sensor has an advantage in terms of costs and various approaching methods to solve this problem. In case of scenes that consist of repeated structures like in corridors, perceptual aliasing in which, the two different locations are recognized as the same, occurs frequently. In this paper, we propose an improved method to recognize location in the scenes which have similar structures. We extracted salient regions from images using visual attention model and calculated weights using distinctive features in the salient region. It makes possible to emphasize unique features in the scene to classify similar-looking locations. In the results of corridor recognition experiments, proposed method showed improved recognition performance. It shows 78.2% in the accuracy of single floor corridor recognition and 71.5% for multi floor corridors recognition.

텔레메틱스 기반의 VoIP 음성 통화품질 향상을 위한 수신단 구조 (VoIP Receiver Structure for Enhancing Speech Quality Based on Telematics)

  • 김형국;서광덕
    • 한국ITS학회 논문지
    • /
    • 제11권3호
    • /
    • pp.48-54
    • /
    • 2012
  • 텔레메틱스 기반의 VoIP 음성통화는 지연, 지터 그리고 패킷손실과 같은 네트워크 장애요소로 인해 품질저하가 발생된다. 본 논문에서는 이런 장애요소로 인한 통화품질 문제를 해결하기 위하여 수신단 기반의 통화품질 향상 알고리즘을 제안한다. 제안된 방식은 손실은닉, 역동적인 지터추정을 이용한 적응적인 플레이아웃 버퍼 스케줄링, 그리고 전이영역에 존재하는 두 신호간의 스무딩 방법으로 구성된 플레이아웃 콘트롤 및 신호합성부를 통해 고품질의 음성통화를 가능하게 한다. 성능 측정 결과, 제안된 알고리즘은 기존 알고리즘에 비해 높은 PESQ와 낮은 버퍼링 지연을 보여주었다.

확장 JPEG의 가변 양자화기를 위한 시각적 비트율 제어 (A Perceptual Rate Control for Variable Quantizer of Extended JPEG)

  • 윤석진;박광채
    • 한국음향학회지
    • /
    • 제15권2호
    • /
    • pp.95-100
    • /
    • 1996
  • 본 논문에서는 ISO/IEC 10918-3(ITU-T REC. T84)로 표준화되어 새롭게 제안된 확장 JPEG의 가변 양자화기를 이용한 영상 부호기를 구현하였다. 인간의 시각은 공간 주파수 감도에 매우 민감하므로 가변 양자화기를 사용하므로서 블록킹 효과를 경감시킬 수 있다. 이 블록킹 효과는 높은 활동도 영역보다 낮은 활동도 영역에서 더 많이 발생된다. 따라서 가변 양자화기의 $8{\times}8$ 기본 블록 단위의 특성을 파악하기 위한 활동도는 공간영역에서 수평 수직 방향 기울기를 이용하여 계산하였다. 구해진 활동도를 가변 양자화기에 적용하기 위해 비선형 양자화 변수를 5단계로 분류하여 낮은 영역에서 좀더 새밀한 양자화가 이루어지도록 하였다. 다양한 영상을 적용하여 시뮬레이션 한 결과 주어진 비트 율에서 주관적으로나 객관적으로 품질이 향상되었다.

  • PDF