• 제목/요약/키워드: Visual Intelligence

검색결과 251건 처리시간 0.02초

3차원 자세 추정 기법의 성능 향상을 위한 임의 시점 합성 기반의 고난도 예제 생성 (Hard Example Generation by Novel View Synthesis for 3-D Pose Estimation)

  • 김민지;김성찬
    • 대한임베디드공학회논문지
    • /
    • 제19권1호
    • /
    • pp.9-17
    • /
    • 2024
  • It is widely recognized that for 3D human pose estimation (HPE), dataset acquisition is expensive and the effectiveness of augmentation techniques of conventional visual recognition tasks is limited. We address these difficulties by presenting a simple but effective method that augments input images in terms of viewpoints when training a 3D human pose estimation (HPE) model. Our intuition is that meaningful variants of the input images for HPE could be obtained by viewing a human instance in the images from an arbitrary viewpoint different from that in the original images. The core idea is to synthesize new images that have self-occlusion and thus are difficult to predict at different viewpoints even with the same pose of the original example. We incorporate this idea into the training procedure of the 3D HPE model as an augmentation stage of the input samples. We show that a strategy for augmenting the synthesized example should be carefully designed in terms of the frequency of performing the augmentation and the selection of viewpoints for synthesizing the samples. To this end, we propose a new metric to measure the prediction difficulty of input images for 3D HPE in terms of the distance between corresponding keypoints on both sides of a human body. Extensive exploration of the space of augmentation probability choices and example selection according to the proposed distance metric leads to a performance gain of up to 6.2% on Human3.6M, the well-known pose estimation dataset.

뇌과학 기반의 디즈니 애니메이션 흥행 예측 AI 모형 개발 연구 (A Study on Development of Disney Animation's Box-office Prediction AI Model Based on Brain Science)

  • 이종은;양은영
    • 디지털융복합연구
    • /
    • 제16권9호
    • /
    • pp.405-412
    • /
    • 2018
  • 영화 흥행의 예측이 필요한 시점은 영화 제작 전에 시나리오에 대한 투자를 결정하는 시점이다. 이런 요구에 따라 최근 인공지능 기반 시나리오 분석 서비스가 출시되었으나, 아직 그 알고리즘이 완벽하지는 않다. 본 연구의 목적은 인간의 뇌 작동 기작에 기반 하여, 영화 시나리오 흥행 예측 모형을 제시하는 것이다. 이를 위해 베버의 자극 반응 법칙과 뇌의 자극 기작 이론 등을 적용하여, 디즈니 애니메이션 흥행작의 시각, 청각, 인지적 자극의 타임 스펙트럼 패턴 도출을 시도한 결과는 다음과 같다. 첫째, 흥행작에서 나타난 뇌 자극의 빈도가 비 흥행작보다 약 1.79배가 많았다. 둘째로, 흥행작에서는 지각 자극 코드들이 타임 스펙트럼 상에 고른 분포를 보인 반면에 비흥행작에서는 집중 분포를 보였다. 셋째로, 흥행작에서는 인지적 부담이 큰 인지적 자극은 주로 단독적으로 등장한 반면에, 인지적 부담이 적은 시각적, 청각적 자극은 두 가지가 동시에 등장하였다.

캐릭터 스테이터스에 따른 플레이어 캐릭터 외형 변화 연구 -MMORPG를 중심으로- (A Research on the Physique Reformation of the Player Character Depending on the Character Status in MMORPG)

  • 길태숙;백형목;장준호;이대웅
    • 한국게임학회 논문지
    • /
    • 제9권6호
    • /
    • pp.21-30
    • /
    • 2009
  • 본 논문에서는 MMORPG에서의 플레이어 캐릭터 스테이터스의 변화를 캐릭터 그래픽에 시각적으로 드러낼 것을 제안하였다. 힘, 체력, 의지, 지능, 민첩 등의 기본적인 캐릭터 스테이터스 중 캐릭터 그래픽에 영향을 끼칠 수 있는 요소인 힘과 민첩을 활용하면 캐릭터 스테이터스 변화의 시각적으로 구현할 수 있다. 민첩의 수치를 캐릭터의 각 뼈대의 길이에 관여하게 하고, 힘의 수치는 주로 캐릭터의 각 뼈대의 두께에 영향을 주도록 함으로써 캐릭터 스테이터스의 변화를 플레이어가 처음에 생성한 캐릭터 그래픽에 나타내는 것이다. 이와 같은 캐릭터 스테이터스의 수치변화에 대한 시각적 표현은 플레이어 캐릭터 아이덴티티를 드러낼 수 있도록 하는 효과가 있다. 또한 플레이어의 캐릭터 육성 방향과 캐릭터의 경험의 시각적 표현이 가능하다는 점에서 다양한 엔터테인먼트로의 응용이 가능하다.

  • PDF

조현병 환자와 발병하지 않은 일차친족에서 신경인지의 결함 (Neurocognitive Deficits in Patients with Schizophrenia and Unaffected First-Degree Relatives)

  • 김도훈;김지우;황선영;김병수;원승희
    • 생물정신의학
    • /
    • 제21권2호
    • /
    • pp.65-73
    • /
    • 2014
  • Objectives This study aimed to identify the differences and the profiles of cognitive deficits in remitted patients with schizophrenia and first-degree relatives of schizophrenic probands. Methods A total of 26 remitted states of schizophrenia patients were included in the study and the same number of unaffected first-degree relatives of schizophrenic probands and healthy controls were matched for age, sex, years of education. Cognitive function of all participants was measured by using the Digit span test, the Continuous performance test, the Rey auditory & visual learning test, the Complex figure test, the Verbal fluency test, the Wisconsin card sorting test and the Finger tapping test. The effects of subsyndromal symptomatology and general intelligence score were controlled. Results Schizophrenia patients' group showed more significant impairment than other groups in verbal memory (learning, immediate recall, delayed recall), visual memory (copy, immediate recall, delayed recall) and cognitive flexibility domains. The family group and the patient group commonly performed significantly worse than healthy controls in working memory and verbal fluency (category) tests. There were no differences in sustained attention, psychomotor performance. Conclusions Our research shows that the deficit in working memory and verbal fluency could be strong candidates of endophenotypic marker in schizophrenia.

복식 디자인에 표현된 의미적 열린 구조 (A Study on Meaning of Open Structure in Clothing Design)

  • 조애래;김영인
    • 복식
    • /
    • 제56권9호
    • /
    • pp.1-13
    • /
    • 2006
  • The purpose of this study is to apply a concept of open structure to clothing design and to verify the characteristics found in the various types of clothing which has open structure. The literatures from various academic fields including philosophy, literature, social science, architecture, and fine arts are investigated to define the concept of openness and to analyze it from the perspectives both of the visual and of the moaning of openness. This paper is to identify the types and the characteristics of clothing by future intention, complexity, discontinuity of open structure. By closely examining fashion design after 1980s found in fashion collection publications and designer's websites, the results of this study are as follows: first, the concept of openness can be classified into two different levels, that is, visual and meaning, secondly, in clothing the concept of open structure is applied to the meaning side by future intention, by complexity and by discontinuity. Open structure through future Intention has new content and interpretation and must have the possibility of intelligence awakening, future guidance and basic contents. Open structure through complexity has secondary function exists concurrent with the shape key example is the smart clothes with the digital functions. It has functions of amusement, supplement and protective, and is future clothes which satisfies with health, welfare, desire of beauty. Open structure with discontinuity is clothes with dramatic changes in system, structures and states. Structure can be changed by silhouette, detail, or fabric, material, or dramatic and practical function as tools in terms of productions and environment. This study can help to formulate and to integrate the concept of open structure in clothing with various phases and enhance the value of clothes by showing an application of the concept of openness to the clothing in meaning level.

시각-언어 이동 에이전트를 위한 복합 학습 (Hybrid Learning for Vision-and-Language Navigation Agents)

  • 오선택;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권9호
    • /
    • pp.281-290
    • /
    • 2020
  • 시각-언어 이동 문제는 시각 이해와 언어 이해 능력을 함께 요구하는 복합 지능 문제이다. 본 논문에서는 시각-언어 이동 에이전트를 위한 새로운 학습 모델을 제안한다. 이 모델은 데모 데이터에 기초한 모방 학습과 행동 보상에 기초한 강화 학습을 함께 결합한 복합 학습을 채택하고 있다. 따라서 이 모델은 데모 데이터에 편향될 수 있는 모방 학습의 문제와 상대적으로 낮은 데이터 효율성을 갖는 강화 학습의 문제를 상호 보완적으로 해소할 수 있다. 또한, 제안 모델에서는 기존의 목표 기반 보상 함수들의 문제점을 해결하기 위해 설계된 새로운 경로 기반 보상 함수를 이용한다. 본 논문에서는 Matterport3D 시뮬레이션 환경과 R2R 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해, 제안 모델의 높은 성능을 입증하였다.

U-net기반 동적 연기 탐지 기법 (Tracking Method of Dynamic Smoke based on U-net)

  • 곽경민;노영주
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권4호
    • /
    • pp.81-87
    • /
    • 2021
  • 4차 산업혁명 시대에 맞추어 인공지능 기술은 눈에 띄게 발전하고 있다. 그 중 CNN 등을 활용한 시각 데이터 기반의 인공지능이 활발히 연구 진행 중이다. 시각 기반 모델 중 하나인 U-net은 Semantic Segmentation에 강한 정확도를 보이고 있다. 기존의 U-net을 활용하여 여러 가지 연구들이 진행 되어왔지만 가스, 연기와 같이 외곽선이 뚜렷하지 않은 연구들은 아직 부족한 실정이다. 또한 이와 대조적으로 가스, 연기 탐지에 대해 많은 연구들이 진행이 되어왔지만 U-net 등을 활용하여 단순한 Detection이 아닌 Segmentation 연구는 부족하다. 이를 토대로 본 연구에서는 U-net을 활용하여 가스, 연기 등을 탐지하는 연구를 진행하였다. 본 논문에서는 설정한 실험환경에서 3D camera를 활용하여 데이터를 수집하고 학습 및 테스트 셋을 생성한 방법을 기술하고, U-net을 적용한 방법과 얻은 결과를 검증한 내용을 서술하고, 마지막으로 활용방안 등에 대하여 논하였다.

MPEG CDVA 전역 특징 서술자 압축 방법 (Compression Method for MPEG CDVA Global Feature Descriptors)

  • 김준수;조원;임근택;윤정일;곽상운;정순흥;정원식;추현곤;서정일;최유경
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.295-307
    • /
    • 2022
  • 본 논문은 동영상의 시각적 특징을 추출하는 MPEG CDVA 표준 기술에서 개별 프레임의 전역적인 특징을 표현하는 scalable Fisher vector (SCFV)의 새로운 압축 방법을 제안한다. CDVA 표준은 전역 특징 서술자에 대한 시간적 중복성 제거 기법을 도입하였으며, 구체적으로 부호화 단위 세그먼트 내의 SCFV 들이 서로 유사할 가능성이 높다는 점을 활용하여 SCFV에 대한 차분을 부호화하는 방식을 사용하고 있다. 그러나 SCFV의 구조적 특징에 의해 SCFV의 차분을 부호화 한 결과물이 원본 데이터보다도 용량이 큰 경우가 발생하게 된다. 이와 같은 현상을 방지하기 위해 비대칭적 SCFV의 차분 계산 방법과 변경된 SCFV 차분을 활용하여 원본 SCFV를 복원하는 새로운 방법을 제안하였다. FIVR 데이터셋을 활용한 실험결과는 전역 특징 서술자의 압축 효율이 기존 CDVA Experimental Model에 대비하여 유의미하게 증가함을 보여준다.

SLAM을 이용한 카메라 기반의 실내 배송용 자율주행 차량 구현 (Implementation of Camera-Based Autonomous Driving Vehicle for Indoor Delivery using SLAM)

  • 김유중;강준우;윤정빈;이유빈;백수황
    • 한국전자통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.687-694
    • /
    • 2022
  • 본 논문에서는 Visual 동시적 위치추정 및 지도작성(SLAM : Simultaneous Localization and Mapping)기술을 응용하여 실내에서 생성된 SLAM 맵을 기반으로 지정된 목적지에 물건을 배달하는 자율주행 차량 플랫폼을 제안하였다. 실내에서 SLAM 맵을 생성하기 위해 소형 자율주행 차량 플랫폼의 상단에 SLAM 맵 생성을 위한 심도 카메라를 설치하고 SLAM 맵 속에서의 정확한 위치추정을 하기 위해 추적 카메라를 장착하여 구현하였다. 또한, 목적지의 표찰을 인식하기 위해 합성곱 신경망(CNN : Convolutional neural network)을 사용하여 목적지에 정확하게 도착할 수 있도록 주행 알고리즘을 적용하여 설계하였다. 실내 배송 자율주행 차량을 실제로 제작하였고 SLAM 맵의 정확도 확인과 CNN을 통한 목적지 표찰 인식 실험을 수행하였다. 결과적으로 표찰 인식의 성공률을 향상시켜 구현한 실내 배송용 자율주행 차량의 활용 적합성 여부를 확인하였다.

소셜 지능로봇의 특성이 만족과 사용의도에 미치는 영향: 1인 가구 소셜 지능로봇 사용자를 중심으로 (The Effect of Characteristics of Social Intelligence Robots on Satisfaction and Intention to Use: Focused on User of Single Person Households)

  • 전규리;이채현;정성미;최정일
    • 품질경영학회지
    • /
    • 제52권1호
    • /
    • pp.95-113
    • /
    • 2024
  • Purpose: This study focused on the societal changes associated with the entry into an ultra-aged society and the increase in single-person households. The core objective of this research is to investigate how social intelligent robots can bring about positive changes in the lives of individuals in single-person households and how such changes influence user satisfaction and the intention to use these robots. Methods: The study employed a cross-sectional analysis using a structural equation model. A survey designed to assess the impact of social intelligent robots' characteristics, such as perceived encouragement, empathy, presence, appearance, and attachment, on user satisfaction and usage intentions was conducted. Data were collected from a total of 335 users and analyzed using the structural equation model. Results: In the characteristics of social intelligent robots for single-person households, it was found that empathy, presence, and attachment significantly influenced satisfaction, while perceived encouragement, empathy, and attachment significantly influenced usage intentions. The research results indicate differences between enhancing user satisfaction and increasing the intention to use social intelligent robots. The findings suggest the essential need for a user-centric approach in the design and development of social intelligent robots. Additionally, it was observed that emotional support plays a crucial role in users' experiences with social intelligent robots. Conclusion: This study verified the impact of social intelligent robots on satisfaction and usage intentions based on users' experiences. It examined the influence of linguistic, visual, and personal characteristics of robots on user experiences, providing insights into how technological and human aspects of social intelligent robots interact to shape user satisfaction and usage intentions. Consequently, the study confirmed that social intelligent robots can bring positive changes to human life, emphasizing the necessity for the advancement of robot technology in a human-centric direction.