• 제목/요약/키워드: Visual context

검색결과 357건 처리시간 0.025초

지능형 이동 로봇에서 강인 물체 인식을 위한 영상 문맥 정보 활용 기법 (Utilization of Visual Context for Robust Object Recognition in Intelligent Mobile Robots)

  • 김성호;김준식;권인소
    • 로봇학회논문지
    • /
    • 제1권1호
    • /
    • pp.36-45
    • /
    • 2006
  • In this paper, we introduce visual contexts in terms of types and utilization methods for robust object recognition with intelligent mobile robots. One of the core technologies for intelligent robots is visual object recognition. Robust techniques are strongly required since there are many sources of visual variations such as geometric, photometric, and noise. For such requirements, we define spatial context, hierarchical context, and temporal context. According to object recognition domain, we can select such visual contexts. We also propose a unified framework which can utilize the whole contexts and validates it in real working environment. Finally, we also discuss the future research directions of object recognition technologies for intelligent robots.

  • PDF

실제 이미지에서 현저성과 맥락 정보의 영향을 고려한 시각 탐색 모델 (Visual Search Model based on Saliency and Scene-Context in Real-World Images)

  • 최윤형;오형석;명노해
    • 대한산업공학회지
    • /
    • 제41권4호
    • /
    • pp.389-395
    • /
    • 2015
  • According to much research on cognitive science, the impact of the scene-context on human visual search in real-world images could be as important as the saliency. Therefore, this study proposed a method of Adaptive Control of Thought-Rational (ACT-R) modeling of visual search in real-world images, based on saliency and scene-context. The modeling method was developed by using the utility system of ACT-R to describe influences of saliency and scene-context in real-world images. Then, the validation of the model was performed, by comparing the data of the model and eye-tracking data from experiments in simple task in which subjects search some targets in indoor bedroom images. Results show that model data was quite well fit with eye-tracking data. In conclusion, the method of modeling human visual search proposed in this study should be used, in order to provide an accurate model of human performance in visual search tasks in real-world images.

이모티콘에 적용된 환유 유형과 현저성 속성 - 고 맥락과 저 맥락 이모티콘의 비교를 중심으로 - ((Types of metonymy applied to emoticons and their salience attributes - Focusing on the comparison of high-context and low-context emoticons -))

  • 김찬희;류시천
    • 스마트미디어저널
    • /
    • 제10권4호
    • /
    • pp.91-101
    • /
    • 2021
  • 소셜미디어상의 이모티콘처럼 사회·문화적 맥락에 기초한 시각적 커뮤니케이션이 점점 증가하고 있다. 따라서 시각문화 시대의 커뮤니케이션 방식을 올바르게 이해하기 위한 수단으로서 환유의 시각적 표현에 관한 연구가 필요하다. 본 연구의 목적은 문화 맥락 안에서 환유가 어떤 방식으로 시각화되는지를 탐색하는 것이다. 구체적으로는 환유 발현의 대표적인 기저 현상인 <현저성(Salience)>과 이를 통해 재현되는 다양한 <이모티콘>의 표현 원리를 문화 맥락과 짝지어 규명하는 것이다. 사회과학 분야의 대표 담론인 맥락이론을 기반으로 고 맥락의 <아프리카TV> 이모티콘과 저 맥락의 <트위치> 이모티콘을 사례연구 대상으로 선정하여 비교하였다. 주요 발견점은 다음과 같다. 첫째, 환유가 어떤 과정을 거쳐 시각적 결과물로 재현되는지에 관한 환유의 시각적 적용 모형을 제안하였다. 둘째, 이모티콘 표현방식에 적용된 환유 유형과 현저성 속성을 세부적으로 파악하였다. 셋째, 맥락이론에 기초하여 고 맥락의 시각적 환유와 저 맥락의 시각적 환유의 특성이 어떻게 상이한지를 제시하였다. 향후, 현지화 전략 구사가 필요한 디자인 개발과정에서 디자인 결과물의 현지 수용성, 현지 적합도 등을 판단하는 기준으로서 본 연구 결과를 활용할 수 있을 것이다.

Multimodal Context Embedding for Scene Graph Generation

  • Jung, Gayoung;Kim, Incheol
    • Journal of Information Processing Systems
    • /
    • 제16권6호
    • /
    • pp.1250-1260
    • /
    • 2020
  • This study proposes a novel deep neural network model that can accurately detect objects and their relationships in an image and represent them as a scene graph. The proposed model utilizes several multimodal features, including linguistic features and visual context features, to accurately detect objects and relationships. In addition, in the proposed model, context features are embedded using graph neural networks to depict the dependencies between two related objects in the context feature vector. This study demonstrates the effectiveness of the proposed model through comparative experiments using the Visual Genome benchmark dataset.

멀티모달 맥락정보 융합에 기초한 다중 물체 목표 시각적 탐색 이동 (Multi-Object Goal Visual Navigation Based on Multimodal Context Fusion)

  • 최정현;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권9호
    • /
    • pp.407-418
    • /
    • 2023
  • MultiOn(Multi-Object Goal Visual Navigation)은 에이전트가 미지의 실내 환경 내 임의의 위치에 놓인 다수의 목표 물체들을 미리 정해준 일정한 순서에 따라 찾아가야 하는 매우 어려운 시각적 탐색 이동 작업이다. MultiOn 작업을 위한 기존의 모델들은 행동 선택을 위해 시각적 외관 지도나 목표 지도와 같은 단일 맥락 지도만을 이용할 뿐, 다양한 멀티모달 맥락정보에 관한 종합적인 관점을 활용할 수 없다는 한계성을 가지고 있다. 이와 같은 한계성을 극복하기 위해, 본 논문에서는 MultiOn 작업을 위한 새로운 심층 신경망 기반의 에이전트 모델인 MCFMO(Multimodal Context Fusion for MultiOn tasks)를 제안한다. 제안 모델에서는 입력 영상의 시각적 외관 특징외에 환경 물체의 의미적 특징, 목표 물체 특징도 함께 포함한 멀티모달 맥락 지도를 행동 선택에 이용한다. 또한, 제안 모델은 점-단위 합성곱 신경망 모듈을 이용하여 3가지 서로 이질적인 맥락 특징들을 효과적으로 융합한다. 이 밖에도 제안 모델은 효율적인 이동 정책 학습을 유도하기 위해, 목표 물체의 관측 여부와 방향, 그리고 거리를 예측하는 보조 작업 학습 모듈을 추가로 채용한다. 본 논문에서는 Habitat-Matterport3D 시뮬레이션 환경과 장면 데이터 집합을 이용한 다양한 정량 및 정성 실험들을 통해, 제안 모델의 우수성을 확인하였다.

Online Visual Merchandising: an Impression Formation Perspective

  • Kwon, Wi-Suk
    • International Journal of Costume and Fashion
    • /
    • 제9권2호
    • /
    • pp.19-34
    • /
    • 2009
  • The purpose of this paper was to provide an overview of the existing literature on online visual merchandising and to propose an alternative theoretical framework in which online visual merchandising research can be conducted. Two streams of research including the e-tail service quality literature and the store environment literature from environmental psychology perspectives were reviewed in the context of online visual merchandising. An impression formation paradigm from social psychology was adopted to establish the alternative framework to supplement the existing online visual merchandising research and generate deeper insights into the online visual merchandising phenomenon.

A Comparison Study on the Error Criteria in Nonparametric Regression Estimators

  • Chung, Sung-S.
    • Journal of the Korean Data and Information Science Society
    • /
    • 제11권2호
    • /
    • pp.335-345
    • /
    • 2000
  • Most context use the classical norms on function spaces as the error criteria. Since these norms are all based on the vertical distances between the curves, these can be quite inappropriate from a visual notion of distance. Visual errors in Marron and Tsybakov(1995) correspond more closely to "what the eye sees". Simulation is performed to compare the performance of the regression smoothers in view of MISE and the visual error. It shows that the visual error can be used as a possible candidate of error criteria in the kernel regression estimation.

  • PDF

MPEG-4 Shape Decoder의 적합성 검사 (Conformance Test for MPEG-4 Shape Decoders)

  • 황혜전;박인수;박수현;이병욱
    • 한국통신학회논문지
    • /
    • 제25권6B호
    • /
    • pp.1060-1067
    • /
    • 2000
  • MPEG-4 영상압축 방식은 객체지향적이다. 기존의 H.261, MPEG-1, MPEG-2에서 화면 전체를 부호화 해주는 것과 달리 MPEG-4에서는 한 화면을 물체, 배경 등 여러 객체들로 나누어 각각의 객체를 따로 부호화한다. 이렇게 전송된 객체들은 수신 단말기에서 다시 합성하여 완성된 화면으로 보여준다. MPEG-4의 형상 부호화는 화면에서 visual 객체에 해당하는 부분만을 부호화 해주는 부분이다. 본 논문에서는 MPEG-4 디코더가 형상 복호화의 표준 규격을 따르는지를 시험하는 방법을 제안한다. 본 논문은 BAB type을 결정하는 mode 복호화의 모든 경우와 Context-based Arithmetic 복호화의 Context computation에 대한 모든 경우에 대해 확인하는 방법을 제안하였다.

  • PDF

이미지 속에서 살아남다? 초상화에서의 삶과 죽음 (Afterlife with Image: Life and Death in Portraiture)

  • 신승철
    • 미술이론과 현장
    • /
    • 제16호
    • /
    • pp.139-174
    • /
    • 2013
  • Pliny the Elder said that multiple cultures agree that the painting began as a shadow trace. A daughter of Butades, the potter in Corinth, traced an outline around a man's shadow, and it was the very beginning of painting. In this anecdote, the profile, i. e. the portrait substitutes body of the absent lover. It makes the absent body present and replaces his place. In this context Hans Belting put the anthropological value to this visual practice. Human being made images to cope actively with the shock of death and the disappearing of body. With the aid of the representation of the bodily presence, the image struggles to resist the death. This paper is a study on the critical meaning of representation in the context of bodily survival by image. The representation is the paradoxical trick of consciousness, an ability to see something as 'there' and 'not there' at the same time. So the connection between image and the body would be suspicious. Although this relation was tight in the ancient shadow painting and the medieval effigies, the modern visual practice forsakes this connection and exposes the trick of representation. It insists that image was not real and even expels the medieval visual practice from the boundary of fine arts. The genealogy of the portraiture is formed by two different visual practices. The belief and the disbelief in the image are observed in the process of representation and anti-representation, and this ambivalence transforms the ontological meaning of portrait in the visual representation.

  • PDF

시-공간 도표정보의 3차원 지도 기반 가시화기법 (Visual Mapping from Spatiotemporal Table Information to 3-Dimensional Map)

  • 이석준;정순기
    • 한국HCI학회논문지
    • /
    • 제1권2호
    • /
    • pp.51-58
    • /
    • 2006
  • 다양한 과학 분야와 공학 분야에서는 그들이 다루고 있는 특정한 주제의 정보를 좀 더 신속하고, 명확하게 사용자에게 전달하기 위해서 여러 가지 정보가시화(information visualization) 기법을 사용한다. 정보를 가시화 할 때는 기본적으로 세 가지 과정을 거치는데, 원 데이터(raw data)로부터 데이터 모델(data model)로 변환하고, 변환된 데이터 모델을 가시화 구조상(visual structure)에 매핑(mapping)시킨 후 정보화 모델(information model)로 변환하게 된다. 본 논문에서는 특정 행사가 진행되고 있는 건물내부에서 발생하는 시간, 공간적인 정보를 정리한 도표메타포(table metaphor)를 토대로, 해당 데이터 모델로부터 추출한 다양한 정보를 3차원 지도로 구성된 정보화 모델상에 반영하기 위한 방법을 제안하였다. 또한, 정보를 단순히 공간상에 반영하기 보다는 사용자의 관심영역(interest area)에 따른 정보의 공간적 의미에 중점을 두어 3차원 공간상에 표현하였다.

  • PDF