• 제목/요약/키워드: Perceptual region

검색결과 47건 처리시간 0.027초

윤곽과 선분을 이용한 내용기반 화상정보 검색시스템의 구현 (The Implementation of Content-based Image Retrieval System Using Contours and Lines)

  • 정원일;구정현;최기호
    • 한국정보처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.683-695
    • /
    • 1996
  • 본 논문에서는 화상내 객체의 윤곽정보를 얻고 객체내의 선분을 추출하여 이를 인덱싱하고 매칭하는 내용기반 화상정보 검색시스템을 구현하였다. 이를위해 선분추출 방법으로서 기존의 SLHT(Straight Line Hough Transform)의 단점을 개선시켜 FSLHT(Flexible SLHT) 를 제안하고 그 유효성을 입증하였으며, 선분에 의한 화상간의 유사도를 얻기 위해 (DP(Dynamic Programming) 알고리즘을 적용하였다. 윤곽특징을 고려할 때 화상의 윤곽이 잡음에 민감하게 반응하는 문제를 보완하기 위하여 일정간격으로 샘플링한 영역의 대 표값을 윤곽 특징으로 취하였으며, Hough 변환에 의한 선분 추출시 시각적인지에 기반한 방향성을 산출하여 변환함으로써 연속성상실 문제와 시간문제를 보완하였다.

  • PDF

가중치 결합 양방향 필터를 이용한 깊이 지도의 업샘플링 방법 (Up-Sampling Method of Depth Map Using Weighted Joint Bilateral Filter)

  • 오동률;오병태;신지태
    • 한국통신학회논문지
    • /
    • 제40권6호
    • /
    • pp.1175-1184
    • /
    • 2015
  • 3D 영상의 획득을 위해 이용하는 깊이 지도는 영상의 깊이 정보를 가지고 있다. 그러나 일반적으로 고해상도이며 잡음이 제거된 고화질의 깊이 지도를 카메라로부터 직접 획득하는 것은 어렵다. 그래서 저해상도의 깊이 지도를 획득하고 업샘플링 및 전/후 영상처리를 통해 높은 품질의 고해상도 깊이 지도를 획득하는 기법들이 연구되고 있다. 하지만 기존의 연구는 영상의 질에 큰 변수로 작용하는 에지 부분의 효과적 업샘플링이 미흡하다. 그래서 본 논문은 에지 부분을 차별적으로 고려하는 인지적인 특성을 반영한 영상품질향상 연구에 초점을 맞춰 결합 양방향 필터의 가중치를 적응적으로 조절함으로써 깊이 지도와 합성 영상을 개선한 고해상도의 깊이 지도를 얻는 업샘플링 방법을 제안하였다. 제안 방식을 기존의 방식과 비교하였을 때 PSNR 측면과 주관적 품질에서 이득이 있음을 보였다.

MCE기반의 다중 특징 파라미터 스코어의 결합을 통한 화자인식 성능 향상 (Performance Improvement of Speaker Recognition by MCE-based Score Combination of Multiple Feature Parameters)

  • 강지훈;김보람;김규영;이상훈
    • 한국산학기술학회논문지
    • /
    • 제21권6호
    • /
    • pp.679-686
    • /
    • 2020
  • 본 논문에서는 화자인식 성능 향상을 위해 음원에서 개선된 특징추출 방식과 최소 분류 오차 기반의 다중 특징 벡터 스코어에 대한 가중치 추정을 사용하여 스코어 결합을 제안하였다. 제안한 특징 벡터는 Glottal Flow에서 무의미한 정보구간인 평탄한 스펙트럼 구간을 제거하기 위하여 저역통과 필터를 수행한 신호에서 인지적 선형 예측 캡스트럼 계수, 왜도, 첨도를 추출하여 구성하였다. 제안한 특징 벡터는 종래의 음원에서 멜-주파수 캡스트럼 계수, 인지적 선형 예측 캡스트럼 계수를 추출하여 가우시안 혼합 모델로 모델링한 화자인식 시스템을 개선하기 위해 사용된다. 또한, 스코어 추정과정의 신뢰성을 높이기 위하여 기존의 스코어의 확률 분포를 사용하여 가중치를 추정하는 대신 제안한 특징 벡터에서 평가된 점수와 종래의 특징 벡터에서 평가된 점수에 대하여 최소 분류 오차 기법으로 가중치를 추정하여 스코어를 결합함으로써 최적의 화자를 찾는다. 실험 결과 제안한 특징 벡터가 화자를 인식하는데 유효한 정보를 포함하고 있는 것을 확인하였다. 또한, 최소 분류 오차 기반의 다중 특징 파라미터 스코어를 결합하여 화자인식을 수행하였을 때, 종래의 화자인식 성능보다 더 우수한 성능을 나타내는 것을 확인할 수 있으며, 특히 가우시안 혼합 모델이 낮을 때 더 높은 성능향상을 보였다.

집중의 신경해부와 정신생리 (The Neuroanatomy and Psychophysiology of Attention)

  • 이성훈;박윤조
    • 수면정신생리
    • /
    • 제5권2호
    • /
    • pp.119-133
    • /
    • 1998
  • Attentional processes facilitate cognitive and behavioral performance in several ways. Attention serves to reduce the amount of information to receive. Attention enables humans to direct themselves to appropriate aspects of external environmental events and internal operations. Attention facilitates the selection of salient information and the allocation of cognitive processing appropriate to that information. Attention is not a unitary process that can be localized to a single neuroanatomical region. Before the cortical registration of sensory information, activation of important subcortical structures occurs, which is called as an orienting response. Once sensory information reaches the sensory cortex, a large number of perceptual processes occur, which provide various levels of perceptual resolution of the critical features of the stimuli. After this preattentional processing, information is integrated within higher cortical(heteromodal) systems in inferior parietal and temporal lobes. At this stage, the processing characteristics can be modified, and the biases of the system have a direct impact on attentional selection. Information flow has been traced through sensory analysis to a processing stage that enables the new information to be focused and modified in relation to preexisting biases. The limbic and paralimbic system play significant roles in modulating attentional response. It is labeled with affective salience and is integrated according to ongoing pressures from the motivational drive system of the hypothalamus. The salience of information greatly influences the allocation of attention. The frontal lobe operate response selection system with a reciprocal interaction with both the attention system of the parietal lobe and the limbic system. In this attentional process, the search with the spatial field is organized and a sequence of attentional responses is generated. Affective, motivational and appectitive impulses from limbic system and hypothalamus trigger response intention, preparation, planning, initiation and control of frontal lobe on this process. The reticular system, which produces ascending activation, catalyzes the overall system and increases attentional capacity. Also additional energetic pressures are created by the hypothalamus. As psychophysiological measurement, skin conductance, pupil diameter, muscle tension, heart rate, alpha wave of EEG can be used. Event related potentials also provide physiological evidence of attention during information process. NI component appears to be an electrophysiological index of selective attention. P3 response is developed during the attention related to stimulus discrimination, evaluation and response.

  • PDF

도호쿠 일본어의 폐쇄음 지각에 있어서 voice onset time(VOT)과 후속모음 fundamental frequency(F0)의 역할 (The role of voice onset time (VOT) and post-stop fundamental frequency (F0) in the perception of Tohoku Japanese stops)

  • 변희경
    • 말소리와 음성과학
    • /
    • 제15권1호
    • /
    • pp.35-45
    • /
    • 2023
  • 일본어의 전통적인 어두 폐쇄음은 파열 전에 성대 진동을 동반하는 유성음과 파열 후에 약간의 기음을 동반하는 무성음으로 이분된다. 한편 도호쿠지방의 유성음은 어느 세대나 파열 전에 성대 진동을 동반하지 않고 무성화한 유성음으로 실현되어 다른 지역과 대조를 이룬다. 무성화한 유성음은 voice onset time(VOT)이 양값으로 나타나고 그러면 기존의 무성음의 VOT와 충돌하게 되어 카테고리 구별에 영향을 미치게 된다. 이에 대해 도호쿠지방의 화자는 생성 시에 다른 지역과는 달리 폐쇄음 구별에 후속 모음의 fundamental frequency(F0)를 적극적으로 사용하는 것이 여러 연구에 의해 확인되었다. 본 연구는 인지면에서도 F0가 폐쇄음 구별에 중요한 역할을 하고 있는지를 밝히기 위해 VOT와 함께 검토한 것이다. VOT와 F0를 재합성한 자극음을 사용하여 도호쿠지방 청자를 대상으로 조건을 달리한 여러 개의 지각실험을 실시하였다. 결과에서는 무의미어의 경우 지역차(도호쿠 지방 vs.주부 지방)는 유의하지 않았으나 유의미어에서는 어휘에 따라 F0 사용에 유의한 차이가 있었으며 이러한 차이는 F0를 적극적으로 사용하는 몇몇의 청자들에게서 기인하는 것으로 밝혀졌다. 논의에서는 이들이 혁신 청자들로 여겨지며 이들을 중심으로 폐쇄음 지각에 F0 역할이 일반화되고 지각특성으로서 F0가 확립될 가능성에 대해 추론해 보았다.

언어적 측면에서 고찰한 도서관의 커뮤니케이션에 관한 연구 -의미전달을 중심으로-

  • 손연옥
    • 한국도서관정보학회지
    • /
    • 제8권
    • /
    • pp.69-96
    • /
    • 1981
  • We all know that we can not keep a proper social life without language. Yet language is so much a part of our environment that we hardly realize it is there. The purpose of this study is to provide an understanding of the linguistical aspect of communication process in order to carry out a successful human relations in the operation of libraries. Human development rests upon man's capacity to digest large quantities of knowledge and it is language which allows facts to be communicated, stored, and disseminated. An attempt was made in this study to illustrate the elementary meaning-of-words aspect of communication. In order to share the most commonly agreed meanings in interpersonal communication, a careful study of semantic noises is important. In a constant struggle to meet client needs, staff and administrators, librarian must understand communication dialogues, their messages and be able to read all level of meanings. In order to perform a successful function of the librarian, to act as a link-man or communicator and to cope with its ever growing information, it is suggested that the deep understanding of the following linguistical aspect of communication elements is essential. 1. Characteristics of Language: (1) Words have different meanings to different people. (2) Words vary in the degree of abstraction. (3) Language is incomplete by its nature. (4) Language reflects not only the personality of the individual but also the culture of man's society. 2. Noises in transmitting meanings: (1) Mechanical or Technical noises. (2) Semantic Noises (3) Noises caused by the psychological factors a. attention b. perception, sensation, cognition and perceptual field. 3. Linguistic Stratum Languages differ considerably in vocabulary by the physical and cultural environment setting as well as situation of individual living. There are seven different language stratum which reflects different region, sex, age, profession, special social stratum, academic and tabooed words.

  • PDF

동심원 확장 및 추적 알고리즘을 이용한 손동작 인식 (Hand-Gesture Recognition Using Concentric-Circle Expanding and Tracing Algorithm)

  • 황동현;장경식
    • 한국정보통신학회논문지
    • /
    • 제21권3호
    • /
    • pp.636-642
    • /
    • 2017
  • 본 논문은 동심원 확장 및 추적 기법을 이용하여 손동작을 인식하는 알고리즘을 제안한다. 제안하는 알고리즘은 웹 카메라로부터 영상을 입력받아 전처리 과정을 통해 손 영상에 대한 ROI를 추출한 뒤 동심원을 사용하여 펴진 손가락의 개수뿐만 아니라 손가락의 끝점, 손가락의 기저의 위치정보, 손가락 사이의 각도를 추출하여 HCI분야에서 활용할 수 있는 다양한 입력 방법을 제공한다. 또한 이 알고리즘은 이미지 전체의 화소를 참조하는 래스터 스캔방식과 비교하여 동심원을 구성하는 화소만을 참조함으로서 계산복잡도를 줄일 수 있다. 제안하는 알고리즘은 9가지의 손동작을 평균 90.7%의 인식률과 평균 78ms의 수행속도를 보여줌을 확인했고, 가상현실, 증강현실 및 혼합현실 그리고 HCI 분야 전반의 입력수단으로의 적용가능성을 확인하였다.

건축 평면에서 공간 형상의 구조 체계에 관한 연구 - 부분이 전체를 이루는 합체 도식 개발을 중심으로 - (A Study on the Structural System of Space Configuration in Architectural Plane - Focusing on the Coalesce scheme development for part-whole Process -)

  • 박순매;윤재신
    • 대한건축학회논문집:계획계
    • /
    • 제34권9호
    • /
    • pp.9-20
    • /
    • 2018
  • There are many large and small spaces in the interior of the building, and these spaces are arranged and connected to form a systematic spatial structure. A structure is a collection of several parts to form a whole. In other words, the spatial structure in architecture can be seen as a whole organized and organized as individual unit spaces are gathered together. Therefore, in order to understand the spatial structure, we first need to define the unit spaces that form part, how they are interconnected and arranged, and then understand how and how these unit spaces are organized to form a whole. The main purpose of this study is to study the structural system of space based on the shape information of space on architectural plane. This means interpreting the process and method of how the unit spaces defined as a certain shape on the architectural plane are organized step by step, integrated into a higher level, and eventually integrated into one whole. In this paper, the shape and layout of the unit space are identified in the architectural plan, the connection relation is defined, and expressed in the network form. And suggests a new methodology for interpreting the organizational process in which the following spaces are integrated as a whole. This new methodology is based on human perceptual characteristics. When people recognize an object, they recognize the object partly and completely. We want to explain the relationship between parts of space and the whole according to their characteristics.

ISFRNet: A Deep Three-stage Identity and Structure Feature Refinement Network for Facial Image Inpainting

  • Yan Wang;Jitae Shin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권3호
    • /
    • pp.881-895
    • /
    • 2023
  • Modern image inpainting techniques based on deep learning have achieved remarkable performance, and more and more people are working on repairing more complex and larger missing areas, although this is still challenging, especially for facial image inpainting. For a face image with a huge missing area, there are very few valid pixels available; however, people have an ability to imagine the complete picture in their mind according to their subjective will. It is important to simulate this capability while maintaining the identity features of the face as much as possible. To achieve this goal, we propose a three-stage network model, which we refer to as the identity and structure feature refinement network (ISFRNet). ISFRNet is based on 1) a pre-trained pSp-styleGAN model that generates an extremely realistic face image with rich structural features; 2) a shallow structured network with a small receptive field; and 3) a modified U-net with two encoders and a decoder, which has a large receptive field. We choose structural similarity index (SSIM), peak signal-to-noise ratio (PSNR), L1 Loss and learned perceptual image patch similarity (LPIPS) to evaluate our model. When the missing region is 20%-40%, the above four metric scores of our model are 28.12, 0.942, 0.015 and 0.090, respectively. When the lost area is between 40% and 60%, the metric scores are 23.31, 0.840, 0.053 and 0.177, respectively. Our inpainting network not only guarantees excellent face identity feature recovery but also exhibits state-of-the-art performance compared to other multi-stage refinement models.

단면분석을 통한 조선시대 상류주택 안마당의 시지각 특성에 관한 연구 - 경북지방 'ㅁ'자형 주택을 중심으로 - (A Study on the Perceptual Characteristics of Upper-class Houses in the Joseon Dynasty through Sectional Analysis - Focused on the Kyeong Buk Region 'ㅁ' Shape of House -)

  • 성재중;이승용
    • 한국농촌건축학회논문집
    • /
    • 제24권4호
    • /
    • pp.9-16
    • /
    • 2022
  • The purpose of this study is to analyze the cross-sectional ratio of the courtyard, an external space that not only was used as a workplace, shelter, and playground in our lives, but also gave symbolic meaning to Koreans. Since the beginning of 2000, Hanok began to receive rapid attention from people, and Hanok construction and remodeling were actively carried out in urban and rural areas. In particular, Bukchon and Seochon in Seoul, around Cheonmachong in Gyeongju, and Hanok Village in Jeonju became popular places related to hanok, and Gyeongju, Buyeo, Gongju, and Iksan were designated as ancient districts to encourage the construction of hanok. However, although hanok is being built with national trends, support, and interest, attention is focused only on the external form, materials, and convenience of use, and the composition and system of the external space have not been properly reviewed. Therefore, this study aims to understand the functions and meanings of the yard in traditional housing, and to analyze the proportion of the height of the building surrounding the yard and the depth of the yard in terms of closure and opening. In addition, the system and characteristics of the external space of traditional architecture felt by this can be used as basic data in designing traditional architecture.