• 제목/요약/키워드: Visual Search Task

검색결과 42건 처리시간 0.096초

사전제시 자극의 지각적 정보가 목표자극 탐색에 미치는 영향: 안구추적연구 (Influence of Perceptual Information of Previewing Stimulus on the Target Search Process: An Eye-tracking Study)

  • 이동훈;김신정;정명영
    • 인지과학
    • /
    • 제25권3호
    • /
    • pp.211-232
    • /
    • 2014
  • 사람들은 하루에도 수없이 어떤 물체나 사람을 찾는다. 이때 찾아야 하는 대상이 무엇인가 하는 정보 외에도 그 대상이 가지고 있는 지각적 정보도 시각탐색에 영향을 줄 수 있다. 본 연구에서는 안구운동추적기를 사용하여 탐색 목표를 알려주는 사전제시 자극의 크기 정보가 시각탐색과정에 영향을 주는지를 알아 보고자 하였다. 실험참가자는 화면가운데 제시된 특정 기호 자극(사전제시 자극)을 먼저 확인하고, 이후 화면 주변에 원형으로 제시된 8개의 자극들(탐색 디스플레이) 중 그 자극(목표자극)을 찾아 그 크기가 사전제시시와 동일한지 혹은 달라졌는지를 판단하는 과제를 실시하였다. 실험조건은 탐색 디스플레이가 모두 동일한 크기를 가진 항목들로 이루어졌는지 여부(동질적 디스플레이/이질적 디스플레이)와 목표자극의 사전제시시 크기(큼/작음)와 탐색시 크기(큼/작음)에 따라 8개의 피험자내 조건으로 구성되었다. 연구가설은 탐색 함목들이 다른 크기를 가진 이질적 디스플레이 조건에서 실험참가자는 사전제시 자극의 크기 정보와 일치하는 항목들을 먼저 살펴볼 전략을 사용할 것이라고 예측하였다. 실험결과, 과제수행 반응시간에서 탐색 디스플레이의 주효과, 목표자극의 탐색시 크기 주효과, 그리고 디스플레이 조건에 따라 다른 목표자극의 사전제시시와 탐색시 크기의 일치성 효과가 관찰되었다. 안구운동 측정치들을 분석한 결과, 그 첫 도약이 탐색 목표자극으로 향한 비율(Initial Saccade to Target Ratio)에서 반응시간과 유사하게 탐색 디스플레이 조건에 따라 목표자극의 크기 일치성 효과가 각각 달리 나타났다. 즉, 목표자극의 크기의 일치성 효과는 이질적 디스플레이 조건에서만 관찰되었는데, 이는 실험참가자들이 목표자극의 크기 정보를 바탕으로 탐색 항목들 중 사전 목표자극의 크기와 같은 항목들에게 먼저 주의를 기울였음을 나타낸다. 사후 분석 결과, 목표자극의 크기가 일관될 때는 이질적 디스플레이 조건의 안구움직임과 과제수행이 동질적 디스플레이 조건 보다 조금 더 빨랐으나, 목표 자극의 크기가 달라질 때는 오히려 더 느려졌음을 알 수 있었다.

변화출현확률이 시각단기기억 기반 변화탐지 수행에 미치는 영향 (The Influence of Change Prevalence on Visual Short-Term Memory-Based Change Detection Performance)

  • 손한결;현주석
    • 인지과학
    • /
    • 제32권3호
    • /
    • pp.117-139
    • /
    • 2021
  • 짧은 시차를 두고 출현하는 기억과 검사배열 사이에 차이 항목의 유무를 찾아내는 변화탐지 원리는 검사배열 출현 시 기억항목들과 견주어 차이가 있는 한 항목을 탐색한다는 점에서 시각탐색 원리와 닮아있다. 본 연구는 두 과제 사이의 이러한 유사성을 배경으로, 시각단기기억 기반 변화탐지 과제에서 변화의 출현 가능성 증감이 변화탐지 반응의사결정에 미치는 영향 즉 변화출현확률 효과의 양상을 조사했다. 이를 위해 네 개의 색상 사각형에 뒤이어 출현한 또 다른 네 개의 색상 사각형 사이의 색상들을 비교해 색상 변화 항목의 유무를 판단하는 단순세부특징 변화탐지 과제를 실시했다. 변화 항목의 출현 가능성은 전체 시행 대비 20, 50 및 80% 확률로 처치되었으며 그에 따른 변화탐지 수행 오류와 탐지민감도 및 반응시간을 분석했다. 그 결과 변화 항목의 출현 가능성이 증가할수록 오경보는 증가하고 실수 반응은 감소했으며 정기각 반응시간 또한 지연된 것이 관찰되었다. 이 변화출현확률 효과는 시각탐색 과제에서 표적의 출현 가능성 증감에 따라 관찰되는 표적출현확률 효과와 매우 유사했으며 이는 두 효과를 초래하는 배경 원리가 서로 닮아있을 가능성을 시사한다.

Mapping Studies on Visual Search, Eye Movement, and Eye track by Bibliometric Analysis

  • Rhie, Ye Lim;Lim, Ji Hyoun;Yun, Myung Hwan
    • 대한인간공학회지
    • /
    • 제34권5호
    • /
    • pp.377-399
    • /
    • 2015
  • Objective: The aim of this study is to understand and identify the critical issues in vision research area using content analysis and network analysis. Background: Vision, the most influential factor in information processing, has been studied in a wide range of area. As studies on vision are dispersed across a broad area of research and the number of published researches is ever increasing, a bibliometric analysis towards literature would assist researchers in understanding and identifying critical issues in their research. Method: In this study, content and network analysis were applied on the meta-data of literatures collected using three search keywords: 'visual search', 'eye movement', and 'eye tracking'. Results: Content analysis focuses on extracting meaningful information from the text, deducting seven categories of research area; 'stimuli and task', 'condition', 'measures', 'participants', 'eye movement behavior', 'biological system', and 'cognitive process'. Network analysis extracts relational aspect of research areas, presenting characteristics of sub-groups identified by community detection algorithm. Conclusion: Using these methods, studies on vision were quantitatively analyzed and the results helped understand the overall relation between concepts and keywords. Application: The results of this study suggests that the use of content and network analysis helps identifying not only trends of specific research areas but also the relational aspects of each research issue while minimizing researchers' bias. Moreover, the investigated structural relationship would help identify the interrelated subjects from a macroscopic view.

시각작업시 등반응시간영역의 생성 (Generation of lsoresponse Time Regions in Visual Tasks)

  • 정의승;정민근;기도형
    • 대한산업공학회지
    • /
    • 제19권2호
    • /
    • pp.53-64
    • /
    • 1993
  • Successful completion of a visual task in a predetermined time is very crucial to many operations such as piloting an aircraft. Although existing ergonomic interface models often provide a function of vision tests, it determines only the visibility at any given location. To complement this problem in existing models, the isoresponse time region considering the factors related to visual tasks is presented. Using a multiple regression model, equal response time regions were obtained within which mean response time is expected to be the same and is asymmetrical in shape. Among the factors considered, expectancy significantly decreased response time, and when cued, the effects of field heterogeneity, target uncertainty, density, size contrast and peripheral position on search time were less significant than those in unexpected cases. Response time and error rate, gender and visual acuity were not significantly correlated, and response time and age was positively correlated. These results are expected to be directly applicable to designing various visual tasks in real-life situations.

  • PDF

Multi-level Cross-attention Siamese Network For Visual Object Tracking

  • Zhang, Jianwei;Wang, Jingchao;Zhang, Huanlong;Miao, Mengen;Cai, Zengyu;Chen, Fuguo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권12호
    • /
    • pp.3976-3990
    • /
    • 2022
  • Currently, cross-attention is widely used in Siamese trackers to replace traditional correlation operations for feature fusion between template and search region. The former can establish a similar relationship between the target and the search region better than the latter for robust visual object tracking. But existing trackers using cross-attention only focus on rich semantic information of high-level features, while ignoring the appearance information contained in low-level features, which makes trackers vulnerable to interference from similar objects. In this paper, we propose a Multi-level Cross-attention Siamese network(MCSiam) to aggregate the semantic information and appearance information at the same time. Specifically, a multi-level cross-attention module is designed to fuse the multi-layer features extracted from the backbone, which integrate different levels of the template and search region features, so that the rich appearance information and semantic information can be used to carry out the tracking task simultaneously. In addition, before cross-attention, a target-aware module is introduced to enhance the target feature and alleviate interference, which makes the multi-level cross-attention module more efficient to fuse the information of the target and the search region. We test the MCSiam on four tracking benchmarks and the result show that the proposed tracker achieves comparable performance to the state-of-the-art trackers.

A Real-time Pedestrian Detection based on AGMM and HOG for Embedded Surveillance

  • Nguyen, Thanh Binh;Nguyen, Van Tuan;Chung, Sun-Tae
    • 한국멀티미디어학회논문지
    • /
    • 제18권11호
    • /
    • pp.1289-1301
    • /
    • 2015
  • Pedestrian detection (PD) is an essential task in various applications and sliding window-based methods utilizing HOG (Histogram of Oriented Gradients) or HOG-like descriptors have been shown to be very effective for accurate PD. However, due to exhaustive search across images, PD methods based on sliding window usually require heavy computational time. In this paper, we propose a real-time PD method for embedded visual surveillance with fixed backgrounds. The proposed PD method employs HOG descriptors as many PD methods does, but utilizes selective search so that it can save processing time significantly. The proposed selective search is guided by restricting searching to candidate regions extracted from Adaptive Gaussian Mixture Model (AGMM)-based background subtraction technique. Moreover, approximate computation of HOG descriptor and implementation in fixed-point arithmetic mode contributes to reduction of processing time further. Possible accuracy degradation due to approximate computation is compensated by applying an appropriate one among three offline trained SVM classifiers according to sizes of candidate regions. The experimental results show that the proposed PD method significantly improves processing speed without noticeable accuracy degradation compared to the original HOG-based PD and HOG with cascade SVM so that it is a suitable real-time PD implementation for embedded surveillance systems.

Sorting Instagram Hashtags all the Way throw Mass Tagging using HITS Algorithm

  • D.Vishnu Vardhan;Dr.CH.Aparna
    • International Journal of Computer Science & Network Security
    • /
    • 제23권11호
    • /
    • pp.93-98
    • /
    • 2023
  • Instagram is one of the fastest-growing online photo social web services where users share their life images and videos with other users. Image tagging is an essential step for developing Automatic Image Annotation (AIA) methods that are based on the learning by example paradigm. Hashtags can be used on just about any social media platform, but they're most popular on Twitter and Instagram. Using hashtags is essentially a way to group together conversations or content around a certain topic, making it easy for people to find content that interests them. Practically on average, 20% of the Instagram hashtags are related to the actual visual content of the image they accompany, i.e., they are descriptive hashtags, while there are many irrelevant hashtags, i.e., stophashtags, that are used across totally different images just for gathering clicks and for search ability enhancement. Hence in this work, Sorting instagram hashtags all the way through mass tagging using HITS (Hyperlink-Induced Topic Search) algorithm is presented. The hashtags can sorted to several groups according to Jensen-Shannon divergence between any two hashtags. This approach provides an effective and consistent way for finding pairs of Instagram images and hashtags, which lead to representative and noise-free training sets for content-based image retrieval. The HITS algorithm is first used to rank the annotators in terms of their effectiveness in the crowd tagging task and then to identify the right hashtags per image.

음풍경 디자인을 위한 도입음 선정에 관한 연구 (The Selection of Introducing Sounds to Soundscape Design)

  • 송혁;이태강;국찬;장길수
    • 한국소음진동공학회:학술대회논문집
    • /
    • 한국소음진동공학회 2004년도 추계학술대회논문집
    • /
    • pp.810-813
    • /
    • 2004
  • The task of introducing sounds leads to the realization of a comfortable acoustic environment and the design of good soundscape. This paper aims to rate the preference of environmental sounds suitable to the public spaces such as park, garden, bus terminal, urban street. And aims to search for the methodology how to select the introducing sounds by subjective and objective procedures. Seventeen kinds of introducing sounds were rated by nine adjectives in the presence of visual site informations. Also adequate sound levels were calculated by adjusting the volume of introducing sounds in the presence of the background sounds and visual informations. The results of psycho-acoustic experiments are as follows. 1. Proposal of various introducing sounds were evaluated to be possible at the rather calm natural park. 2. The introducing sounds which have opposite visual image or already existing at the place were evaluated not adequate to the sound circumstances of the place. 3. By the sounds with the same meaning, the identity of the street and the improvement of sound circumstance can be obtained.

  • PDF

양안경합의 감각적 상충 경험에 기초한 시각적 변화탐지 경험에 대한 이해 (Understanding the Experience of Visual Change Detection Based on the Experience of a Sensory Conflict Evoked by a Binocular Rivalry)

  • 신영선;현주석
    • 감성과학
    • /
    • 제16권3호
    • /
    • pp.341-350
    • /
    • 2013
  • 본 연구는 시야에 발생하는 현저한 시각적 변화에 대한 탐지 경험과 양안경합이 초래한 감각적 상충에 대한 탐지 경험을 상호 비교함으로써 변화탐지 경험의 감각적 특성에 대한 이해를 시도하였다. 이를 위해, 실험 1에서는 2, 4, 6개의 항목을 단기파지 한 후 뒤이어 제시되는 검사항목과의 비교를 요구하는 변화탐지 과제가 사용되었다. 전체 변화탐지 시행 중 시각적 변화가 발생한 일부 시행에서는 검사항목 중 변화를 야기하는 한 항목에 양쪽 단안 분리 입력을 통해 서로 다른 항목이 제시되는 양안경합을 처치하였다. 실험 결과, 양안 경합이 처치되지 않은 경우 항목 개수 증가에 따른 변화탐지 정확도의 분명한 감소가 관찰된 반면 양안 경합이 처치된 경우 이러한 항목 개수 효과는 관찰되지 않았다. 실험 2에서는 항목 개수를 4, 8, 16개로 달리하는 탐색 배열 중 양안경합이 초래하는 감각적 상충을 보유한 표적 항목에 대한 탐색 효율성을 측정한 결과, 양안경합 처치 유무에 관계없이 탐색이 매우 효율적인 것이 관찰되었다. 실험 1과 2의 결과는 시야의 현저한 변화에 대한 탐지 경험은 기억부담의 증감에 따라 경우에 따라서는 양안경합 자극이 초래하는 감각적 상충에 대한 탐지 경험과 유사할 가능성을 시사한다.

  • PDF

관계 추론 심층 신경망 모델의 성능개선 연구 (A Study on Improving Performance of the Deep Neural Network Model for Relational Reasoning)

  • 이현옥;임희석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권12호
    • /
    • pp.485-496
    • /
    • 2018
  • 지금까지 인공지능의 한 분야인 딥러닝 방법은 구조화되지 않은 데이터로부터 문제를 해결하는 놀라울만한 성과를 이루어왔지만, 인간처럼 여러 상황들을 종합적으로 판단, 그것들의 연관성을 추론하고, 그 다음 상황을 예측하는 수준의 지능을 갖는데 도달하지 못하였다. 최근 발표된 복잡한 관계 추론을 수행하는 심층 신경망은 인공지능이 인간의 핵심 지적 능력인 관계 추론을 보유할 수 있다는 것을 증명하였다. 본 논문에서는 관계 추론 심층 신경망 중에서 Relation Networks (RN)의 성능을 분석 및 관찰해 보고자 Sort-of-CLEVR 데이터 셋을 사용한 시각적 질의응답과 bAbI task를 사용한 텍스트 기반 질의응답 두 유형의 RN 기반 심층 신경망 모델을 구축하여 baseline 모델과의 비교를 통한 성능검증을 하였다. 또한 모델의 성능을 극대화하기 위하여 하이퍼 파라미터 튜닝 등 다양각도의 성능개선 실험으로 관계 추론을 위한 RN 기반 심층 신경망 모델의 성능개선 방법을 제안하였다. 제안한 성능개선 방법은 시각적 질의응답 모델과 텍스트 기반 질의응답 모델에 적용하여 그 효과를 검증하였고, 기존의 RN 모델에서 사용해보지 않았던 Dialog-based LL 데이터 셋을 사용하여 새로운 도메인에서의 제안한 성능개선 방법의 효과를 다시 한 번 검증하였다. 실험 결과 두 유형의 RN 모델 모두에서 초기 학습률이 모델의 성능을 결정하는 핵심 요인임을 알 수 있었고, 제안한 random search 방법에 의해 찾은 최적의 초기 학습률 설정이 모델의 성능을 최고 99.8%까지 향상 시킬 수 있다는 것을 확인하였다.