• 제목/요약/키워드: 시각지능

검색결과 498건 처리시간 0.03초

비디오 시각적 관계 이해 기술 동향 (Trends in Video Visual Relationship Understanding)

  • 권용진;김대회;김종희;오성찬;함제석;문진영
    • 전자통신동향분석
    • /
    • 제38권6호
    • /
    • pp.12-21
    • /
    • 2023
  • Visual relationship understanding in computer vision allows to recognize meaningful relationships between objects in a scene. This technology enables the extraction of representative information within visual content. We discuss the technology of visual relationship understanding, specifically focusing on videos. We first introduce visual relationship understanding concepts in videos and then explore the latest existing techniques. Next, we present benchmark datasets commonly used in video visual relationship understanding. Finally, we discuss future research directions in video visual relationship understanding.

AI Bots를 위한 멀티에이전트 협업 기술 동향 (Research Trends of Multi-agent Collaboration Technology for Artificial Intelligence Bots)

  • 강동오;정준영;이천희;박민호;이전우;이용주
    • 전자통신동향분석
    • /
    • 제37권6호
    • /
    • pp.32-42
    • /
    • 2022
  • Recently, decentralized approaches to artificial intelligence (AI) development, such as federated learning are drawing attention as AI development's cost and time inefficiency increase due to explosive data growth and rapid environmental changes. Collaborative AI technology that dynamically organizes collaborative groups between different agents to share data, knowledge, and experience and uses distributed resources to derive enhanced knowledge and analysis models through collaborative learning to solve given problems is an alternative to centralized AI. This article investigates and analyzes recent technologies and applications applicable to the research of multi-agent collaboration of AI bots, which can provide collaborative AI functionality autonomously.

자율성장 인공지능 기술 (Self-Improving Artificial Intelligence Technology)

  • 송화전;김현우;정의석;오성찬;이전우;강동오;정준영;이윤근
    • 전자통신동향분석
    • /
    • 제34권4호
    • /
    • pp.43-54
    • /
    • 2019
  • Currently, a majority of artificial intelligence is used to secure big data; however, it is concentrated in a few of major companies. Therefore, automatic data augmentation and efficient learning algorithms for small-scale data will become key elements in future artificial intelligence competitiveness. In addition, it is necessary to develop a technique to learn meanings, correlations, and time-related associations of complex modal knowledge similar to that in humans and expand and transfer semantic prediction/knowledge inference about unknown data. To this end, a neural memory model, which imitates how knowledge in the human brain is processed, needs to be developed to enable knowledge expansion through modality cooperative learning. Moreover, declarative and procedural knowledge in the memory model must also be self-developed through human interaction. In this paper, we reviewed this essential methodology and briefly described achievements that have been made so far.

3차원 아바타를 이용한 관절 가동 범위 시각화 시스템 개발 (Development of Range of Motion Visualization System using 3D Avatar)

  • 윤창락;장윤섭;김재철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.303-304
    • /
    • 2022
  • 근골격계 질환 재활환자들의 신체 능력을 평가하기 위한 주요 측정 도구로 관절 가동 범위(ROM: Range of Motion)가 사용된다. 본 논문에서는 근골격계 환자들의 재활운동을 통한 관절 가동 범위 정보를 시각적 이해하기 용이하도록 서비스하기 위하여 3차원 아바타를 이용한 관절 가동 범위 시각화 시스템을 제안한다. 제안하는 3차원 아바타를 이용한 관절 가동 범위 시각화 시스템은 근골격계 질환 재활환자들의 관절 가동 범위 데이터를 3차원 아바타의 대응하는 관절 작동 범위로 사상하고 다양한 시점으로 시각화하거나 애니메이션으로 재현함으로써 재활 수준의 변화를 직관적으로 제공할 수 있다.

소프트웨어 테스트 정지시각 결정 방법에 대한 연구

  • 최규식;장원석;김종기
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2001년도 춘계정기학술대회
    • /
    • pp.485-488
    • /
    • 2001
  • 소프트웨어의 신뢰도모델을 적용하는 중요한 일 중의 하나는 소프트웨어 발행시각을 결정하는 일이다. 이 문제에 대해서 여러 연구자들이 그동안 많은 연구논문을 발표하였다. 본 논문에서는 최적발행시각을 결정하는 문제를 심도있게 다루고자 하였다. 특정한 발행시각을 결정하는데 있어서 신뢰도 요건 및 비용 모델 모두를 고려하여 고찰한다. 신뢰도 목표로서 허용치 이내의 고장강도를 사용해야 하며, 최적 발행방책은 순차적인 접근법에 근거하여 검토

  • PDF

인공지능을 이용한 영화제작 : 시각효과를 중심으로 (Film Production Using Artificial Intelligence with a Focus on Visual Effects)

  • 유태경
    • 한국엔터테인먼트산업학회논문지
    • /
    • 제15권1호
    • /
    • pp.53-62
    • /
    • 2021
  • 영화는 대중에게 처음 소개된 이래로 테크놀로지의 발전과 변화 과정을 함께하고 있다. 영화 제작 과정에 시각효과를 중심으로 한 포스트 프로덕션과 디지털 기술들이 본격적으로 적용되면서 영화 산업은 제작 방식에 있어서 큰 변화를 겪었을 뿐만 아니라 최신 기술들을 폭넓게 수용하며 산업적 기회의 폭을 넓혀가고 있다. 디지털 영화로 변화한 지 오래지 않은 지금, 영화의 디지털화가 시작되기도 전인 1956년 다트머스 회의에서 처음 알려진 인공지능이란 개념이 다시 영화 산업의 큰 변화를 가져올 것으로 예상된다. 디지털 영화의 제작 파이프라인은 거대한 디지털 데이터를 체계적으로 운용하고 만들어 내기 때문에 머신러닝과 딥러닝으로 대표되는 최근 인공지능 기술들을 적용하기 용이하고 시각효과 제작 과정에는 반복적인 작업과 분석을 통한 재현이 많고 계산 시간이 오래 걸리는 과정들이 있기 때문에 최근 주요 시각효과 스튜디오들을 중심으로 인공지능 기술의 활용이 두드러지고 있다. 본 연구에서는 제작 도구로서 인공지능 기술을 이용한 영화 시각효과 제작 사례에 대한 분석을 통해서 향후 인공지능 기술이 영화 산업을 어떻게 바꿔놓을지 예측하고 시각효과 기술로서 인공지능의 산업적 가능성을 조망해 보고자 한다.

가스 센서 데이터셋 시각화를 위한 데이터 전처리 기법 (Data Preprocessing Techniques for Visualizing Gas Sensor Datasets)

  • 김준수;박경원;임태범;박구만
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.21-22
    • /
    • 2021
  • 최근 AI(Artificial Intelligence)를 기반으로 정밀한 가스 성분 감지를 위한 후각지능(Olfactory intelligence) 기술에 연구가 활발히 진행 중이다. 후각지능 학습데이터는 다른 감지 방식의 가스 센서들이 동시에 적용되는 멀티모달리티의 특성을 지니며 또한, 공간상에 분포된 센서 배열을 통해 획득된 다차원의 시계열 특성을 지닌다. 따라서 대량의 다차원 데이터에 대한 정확한 이해와 분석을 위해서는 데이터를 전처리하고 시각화할 수 있는 기술이 필요하다. 본 논문에서는 후각지능 학습을 위한 다차원의 복잡한 가스 데이터의 시각화를 위해 잡음 등의 불필요한 값을 제거하고, 데이터가 일관성을 가지도록 하며, 데이터의 차원을 시각화 가능하도록 축소하기 위한 전처리 방법을 제시한다.

  • PDF

로보트의 시각시스템

  • 최종수
    • 전기의세계
    • /
    • 제33권12호
    • /
    • pp.726-734
    • /
    • 1984
  • 본고에서는 아직도 연구지향의 성격을 띄고 있는 인공지능로보트의 시각시스템에 관해 기술하였고, 이들의 연구를 바탕으로 하여 needs에 답하는 형식인 응용지향인 산업용로보트의 시각시스템에 관해 언급하였다. 끝으로 필자의 연구실에서 발표한 인쇄악보의 인식에 관해 간단히 소개하였다.

  • PDF

멀티모달 인터페이스(3차원 시각과 음성 )를 이용한 지능적 가상검객과의 전신 검도게임 (A Full Body Gumdo Game with an Intelligent Cyber Fencer using Multi-modal(3D Vision and Speech) Interface)

  • 윤정원;김세환;류제하;우운택
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권4호
    • /
    • pp.420-430
    • /
    • 2003
  • 본 논문에서는 멀티모달(multi-modal) 인터페이스를 통해 지능적 가상검객과 체감형 검도게임을 할 수 있는 시스템을 제안한다. 제안된 검도게임 시스템은 멀티모달 인터페이스(시각과 청각), 인공지능(AI), 피드백(스크린과 사운드) 등 크게 세 가지 모듈로 구성된다. 첫 번째로, 멀티모달 인터페이스는 시각기반, 3차원 인터페이스를 이용하여 사용자가 자유롭게 3차원 공간에서 움직일 수 있도록 하고, 음성기반 인터페이스를 이용하여 사용자가 현실감 있는 검도게임을 즐길 수 있도록 한다. 두 번째, 인공지능은 가상검객에게 멀티모달 인터페이스에서 입력되는 시각과 음성을 인식하여 가상검객의 반응을 유도한다. 마지막으로, 대형 스크린과 스피커를 통한 시청각 피드백은 체감형 상호작용을 통하여 사용자가 몰입감을 느끼며 검도게임을 경험할 수 있도록 한다. 따라서 제안된 시스템은 전신의 움직임으로 사용자에게 몰입감의 검도게임을 제공한다. 제안된 시스템은 오락 외에 교육, 운동, 예술행위 등 다양한 분야에 적용될 수 있다.

딥러닝 기반 시각-관성을 활용한 드론 주행기록 추정 (Deep Learning based Visual-Inertial Drone Odomtery Estimation)

  • 송승연;박상원;김한결;최수한
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.842-845
    • /
    • 2020
  • 본 연구는 시각-관성 기반의 딥러닝 학습으로 자유분방하게 움직이는 드론의 주행기록을 정확하게 추정하는 것을 목표로 한다. 드론의 비행주행은 드론의 온보드 센서와 조정값을 이용하는 것이 일반적이다. 본 연구에서는 이 온보드 센서 데이터를 학습에 사용하여 비행주행의 위치추정을 실험하였다. 선행연구로써 DeepVO[1]룰 구현하여 KITTI[3] 데이터와 Midair[4] 데이터를 비교, 분석하였다. 3D 좌표면에서의 위치 추정에 선행연구 모델의 한계가 있음을 확인하고 IMU를 Feature로써 사용하였다. 본 모델은 FlowNet[2]을 모방한 CNN 네트워크로부터 Optical Flow Feature에 IMU 데이터를 더해 RNN으로 학습을 진행하였다. 본 연구를 통해 주행기록 예측을 다소 정확히 했다고 할 수 없지만, IMU Feature를 통해 주행기록의 예측이 가능함을 볼 수 있었다. 본 연구를 통해 시각-관성 분야에서 사람의 지식이나 조정이 들어가는 센서를 융합하는 기존의 방식에서 사람의 제어가 들어가지 않는 End-to-End 방식으로 인공지능을 학습했다. 또한, 시각과 관성 데이터를 통해 주행기록을 추정할 수 있었고 시각적으로 그래프를 그려 정답과 얼마나 차이 있는지 확인해보았다.