사람들은 하루에도 수없이 어떤 물체나 사람을 찾는다. 이때 찾아야 하는 대상이 무엇인가 하는 정보 외에도 그 대상이 가지고 있는 지각적 정보도 시각탐색에 영향을 줄 수 있다. 본 연구에서는 안구운동추적기를 사용하여 탐색 목표를 알려주는 사전제시 자극의 크기 정보가 시각탐색과정에 영향을 주는지를 알아 보고자 하였다. 실험참가자는 화면가운데 제시된 특정 기호 자극(사전제시 자극)을 먼저 확인하고, 이후 화면 주변에 원형으로 제시된 8개의 자극들(탐색 디스플레이) 중 그 자극(목표자극)을 찾아 그 크기가 사전제시시와 동일한지 혹은 달라졌는지를 판단하는 과제를 실시하였다. 실험조건은 탐색 디스플레이가 모두 동일한 크기를 가진 항목들로 이루어졌는지 여부(동질적 디스플레이/이질적 디스플레이)와 목표자극의 사전제시시 크기(큼/작음)와 탐색시 크기(큼/작음)에 따라 8개의 피험자내 조건으로 구성되었다. 연구가설은 탐색 함목들이 다른 크기를 가진 이질적 디스플레이 조건에서 실험참가자는 사전제시 자극의 크기 정보와 일치하는 항목들을 먼저 살펴볼 전략을 사용할 것이라고 예측하였다. 실험결과, 과제수행 반응시간에서 탐색 디스플레이의 주효과, 목표자극의 탐색시 크기 주효과, 그리고 디스플레이 조건에 따라 다른 목표자극의 사전제시시와 탐색시 크기의 일치성 효과가 관찰되었다. 안구운동 측정치들을 분석한 결과, 그 첫 도약이 탐색 목표자극으로 향한 비율(Initial Saccade to Target Ratio)에서 반응시간과 유사하게 탐색 디스플레이 조건에 따라 목표자극의 크기 일치성 효과가 각각 달리 나타났다. 즉, 목표자극의 크기의 일치성 효과는 이질적 디스플레이 조건에서만 관찰되었는데, 이는 실험참가자들이 목표자극의 크기 정보를 바탕으로 탐색 항목들 중 사전 목표자극의 크기와 같은 항목들에게 먼저 주의를 기울였음을 나타낸다. 사후 분석 결과, 목표자극의 크기가 일관될 때는 이질적 디스플레이 조건의 안구움직임과 과제수행이 동질적 디스플레이 조건 보다 조금 더 빨랐으나, 목표 자극의 크기가 달라질 때는 오히려 더 느려졌음을 알 수 있었다.
짧은 시차를 두고 출현하는 기억과 검사배열 사이에 차이 항목의 유무를 찾아내는 변화탐지 원리는 검사배열 출현 시 기억항목들과 견주어 차이가 있는 한 항목을 탐색한다는 점에서 시각탐색 원리와 닮아있다. 본 연구는 두 과제 사이의 이러한 유사성을 배경으로, 시각단기기억 기반 변화탐지 과제에서 변화의 출현 가능성 증감이 변화탐지 반응의사결정에 미치는 영향 즉 변화출현확률 효과의 양상을 조사했다. 이를 위해 네 개의 색상 사각형에 뒤이어 출현한 또 다른 네 개의 색상 사각형 사이의 색상들을 비교해 색상 변화 항목의 유무를 판단하는 단순세부특징 변화탐지 과제를 실시했다. 변화 항목의 출현 가능성은 전체 시행 대비 20, 50 및 80% 확률로 처치되었으며 그에 따른 변화탐지 수행 오류와 탐지민감도 및 반응시간을 분석했다. 그 결과 변화 항목의 출현 가능성이 증가할수록 오경보는 증가하고 실수 반응은 감소했으며 정기각 반응시간 또한 지연된 것이 관찰되었다. 이 변화출현확률 효과는 시각탐색 과제에서 표적의 출현 가능성 증감에 따라 관찰되는 표적출현확률 효과와 매우 유사했으며 이는 두 효과를 초래하는 배경 원리가 서로 닮아있을 가능성을 시사한다.
Objective: The aim of this study is to understand and identify the critical issues in vision research area using content analysis and network analysis. Background: Vision, the most influential factor in information processing, has been studied in a wide range of area. As studies on vision are dispersed across a broad area of research and the number of published researches is ever increasing, a bibliometric analysis towards literature would assist researchers in understanding and identifying critical issues in their research. Method: In this study, content and network analysis were applied on the meta-data of literatures collected using three search keywords: 'visual search', 'eye movement', and 'eye tracking'. Results: Content analysis focuses on extracting meaningful information from the text, deducting seven categories of research area; 'stimuli and task', 'condition', 'measures', 'participants', 'eye movement behavior', 'biological system', and 'cognitive process'. Network analysis extracts relational aspect of research areas, presenting characteristics of sub-groups identified by community detection algorithm. Conclusion: Using these methods, studies on vision were quantitatively analyzed and the results helped understand the overall relation between concepts and keywords. Application: The results of this study suggests that the use of content and network analysis helps identifying not only trends of specific research areas but also the relational aspects of each research issue while minimizing researchers' bias. Moreover, the investigated structural relationship would help identify the interrelated subjects from a macroscopic view.
Successful completion of a visual task in a predetermined time is very crucial to many operations such as piloting an aircraft. Although existing ergonomic interface models often provide a function of vision tests, it determines only the visibility at any given location. To complement this problem in existing models, the isoresponse time region considering the factors related to visual tasks is presented. Using a multiple regression model, equal response time regions were obtained within which mean response time is expected to be the same and is asymmetrical in shape. Among the factors considered, expectancy significantly decreased response time, and when cued, the effects of field heterogeneity, target uncertainty, density, size contrast and peripheral position on search time were less significant than those in unexpected cases. Response time and error rate, gender and visual acuity were not significantly correlated, and response time and age was positively correlated. These results are expected to be directly applicable to designing various visual tasks in real-life situations.
KSII Transactions on Internet and Information Systems (TIIS)
/
제16권12호
/
pp.3976-3990
/
2022
Currently, cross-attention is widely used in Siamese trackers to replace traditional correlation operations for feature fusion between template and search region. The former can establish a similar relationship between the target and the search region better than the latter for robust visual object tracking. But existing trackers using cross-attention only focus on rich semantic information of high-level features, while ignoring the appearance information contained in low-level features, which makes trackers vulnerable to interference from similar objects. In this paper, we propose a Multi-level Cross-attention Siamese network(MCSiam) to aggregate the semantic information and appearance information at the same time. Specifically, a multi-level cross-attention module is designed to fuse the multi-layer features extracted from the backbone, which integrate different levels of the template and search region features, so that the rich appearance information and semantic information can be used to carry out the tracking task simultaneously. In addition, before cross-attention, a target-aware module is introduced to enhance the target feature and alleviate interference, which makes the multi-level cross-attention module more efficient to fuse the information of the target and the search region. We test the MCSiam on four tracking benchmarks and the result show that the proposed tracker achieves comparable performance to the state-of-the-art trackers.
Nguyen, Thanh Binh;Nguyen, Van Tuan;Chung, Sun-Tae
한국멀티미디어학회논문지
/
제18권11호
/
pp.1289-1301
/
2015
Pedestrian detection (PD) is an essential task in various applications and sliding window-based methods utilizing HOG (Histogram of Oriented Gradients) or HOG-like descriptors have been shown to be very effective for accurate PD. However, due to exhaustive search across images, PD methods based on sliding window usually require heavy computational time. In this paper, we propose a real-time PD method for embedded visual surveillance with fixed backgrounds. The proposed PD method employs HOG descriptors as many PD methods does, but utilizes selective search so that it can save processing time significantly. The proposed selective search is guided by restricting searching to candidate regions extracted from Adaptive Gaussian Mixture Model (AGMM)-based background subtraction technique. Moreover, approximate computation of HOG descriptor and implementation in fixed-point arithmetic mode contributes to reduction of processing time further. Possible accuracy degradation due to approximate computation is compensated by applying an appropriate one among three offline trained SVM classifiers according to sizes of candidate regions. The experimental results show that the proposed PD method significantly improves processing speed without noticeable accuracy degradation compared to the original HOG-based PD and HOG with cascade SVM so that it is a suitable real-time PD implementation for embedded surveillance systems.
International Journal of Computer Science & Network Security
/
제23권11호
/
pp.93-98
/
2023
Instagram is one of the fastest-growing online photo social web services where users share their life images and videos with other users. Image tagging is an essential step for developing Automatic Image Annotation (AIA) methods that are based on the learning by example paradigm. Hashtags can be used on just about any social media platform, but they're most popular on Twitter and Instagram. Using hashtags is essentially a way to group together conversations or content around a certain topic, making it easy for people to find content that interests them. Practically on average, 20% of the Instagram hashtags are related to the actual visual content of the image they accompany, i.e., they are descriptive hashtags, while there are many irrelevant hashtags, i.e., stophashtags, that are used across totally different images just for gathering clicks and for search ability enhancement. Hence in this work, Sorting instagram hashtags all the way through mass tagging using HITS (Hyperlink-Induced Topic Search) algorithm is presented. The hashtags can sorted to several groups according to Jensen-Shannon divergence between any two hashtags. This approach provides an effective and consistent way for finding pairs of Instagram images and hashtags, which lead to representative and noise-free training sets for content-based image retrieval. The HITS algorithm is first used to rank the annotators in terms of their effectiveness in the crowd tagging task and then to identify the right hashtags per image.
The task of introducing sounds leads to the realization of a comfortable acoustic environment and the design of good soundscape. This paper aims to rate the preference of environmental sounds suitable to the public spaces such as park, garden, bus terminal, urban street. And aims to search for the methodology how to select the introducing sounds by subjective and objective procedures. Seventeen kinds of introducing sounds were rated by nine adjectives in the presence of visual site informations. Also adequate sound levels were calculated by adjusting the volume of introducing sounds in the presence of the background sounds and visual informations. The results of psycho-acoustic experiments are as follows. 1. Proposal of various introducing sounds were evaluated to be possible at the rather calm natural park. 2. The introducing sounds which have opposite visual image or already existing at the place were evaluated not adequate to the sound circumstances of the place. 3. By the sounds with the same meaning, the identity of the street and the improvement of sound circumstance can be obtained.
본 연구는 시야에 발생하는 현저한 시각적 변화에 대한 탐지 경험과 양안경합이 초래한 감각적 상충에 대한 탐지 경험을 상호 비교함으로써 변화탐지 경험의 감각적 특성에 대한 이해를 시도하였다. 이를 위해, 실험 1에서는 2, 4, 6개의 항목을 단기파지 한 후 뒤이어 제시되는 검사항목과의 비교를 요구하는 변화탐지 과제가 사용되었다. 전체 변화탐지 시행 중 시각적 변화가 발생한 일부 시행에서는 검사항목 중 변화를 야기하는 한 항목에 양쪽 단안 분리 입력을 통해 서로 다른 항목이 제시되는 양안경합을 처치하였다. 실험 결과, 양안 경합이 처치되지 않은 경우 항목 개수 증가에 따른 변화탐지 정확도의 분명한 감소가 관찰된 반면 양안 경합이 처치된 경우 이러한 항목 개수 효과는 관찰되지 않았다. 실험 2에서는 항목 개수를 4, 8, 16개로 달리하는 탐색 배열 중 양안경합이 초래하는 감각적 상충을 보유한 표적 항목에 대한 탐색 효율성을 측정한 결과, 양안경합 처치 유무에 관계없이 탐색이 매우 효율적인 것이 관찰되었다. 실험 1과 2의 결과는 시야의 현저한 변화에 대한 탐지 경험은 기억부담의 증감에 따라 경우에 따라서는 양안경합 자극이 초래하는 감각적 상충에 대한 탐지 경험과 유사할 가능성을 시사한다.
지금까지 인공지능의 한 분야인 딥러닝 방법은 구조화되지 않은 데이터로부터 문제를 해결하는 놀라울만한 성과를 이루어왔지만, 인간처럼 여러 상황들을 종합적으로 판단, 그것들의 연관성을 추론하고, 그 다음 상황을 예측하는 수준의 지능을 갖는데 도달하지 못하였다. 최근 발표된 복잡한 관계 추론을 수행하는 심층 신경망은 인공지능이 인간의 핵심 지적 능력인 관계 추론을 보유할 수 있다는 것을 증명하였다. 본 논문에서는 관계 추론 심층 신경망 중에서 Relation Networks (RN)의 성능을 분석 및 관찰해 보고자 Sort-of-CLEVR 데이터 셋을 사용한 시각적 질의응답과 bAbI task를 사용한 텍스트 기반 질의응답 두 유형의 RN 기반 심층 신경망 모델을 구축하여 baseline 모델과의 비교를 통한 성능검증을 하였다. 또한 모델의 성능을 극대화하기 위하여 하이퍼 파라미터 튜닝 등 다양각도의 성능개선 실험으로 관계 추론을 위한 RN 기반 심층 신경망 모델의 성능개선 방법을 제안하였다. 제안한 성능개선 방법은 시각적 질의응답 모델과 텍스트 기반 질의응답 모델에 적용하여 그 효과를 검증하였고, 기존의 RN 모델에서 사용해보지 않았던 Dialog-based LL 데이터 셋을 사용하여 새로운 도메인에서의 제안한 성능개선 방법의 효과를 다시 한 번 검증하였다. 실험 결과 두 유형의 RN 모델 모두에서 초기 학습률이 모델의 성능을 결정하는 핵심 요인임을 알 수 있었고, 제안한 random search 방법에 의해 찾은 최적의 초기 학습률 설정이 모델의 성능을 최고 99.8%까지 향상 시킬 수 있다는 것을 확인하였다.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.