• Title/Summary/Keyword: 비전모델

Search Result 556, Processing Time 0.026 seconds

Lightweight Key Point Detection Model Based on Multi-Scale Ghost Convolution for YOLOv8 (YOLOv8 을 위한 다중 스케일 Ghost 컨볼루션 기반 경량 키포인트 검출 모델)

  • Zihao Li;Inwhee Joe
    • Annual Conference of KIPS
    • /
    • 2024.05a
    • /
    • pp.604-606
    • /
    • 2024
  • 컴퓨터 비전 응용은 우리 생활에서 중요한 역할을 한다. 현재, 대규모 모델의 등장으로 딥 러닝의 훈련 및 운행 비용이 급격히 상승하고 있다. 자원이 제한된 환경에서는 일부 AI 프로그램을 실행할 수 없게 되므로, 경량화 연구가 필요하다. YOLOv8 은 현재 주요 목표 검출 모델 중 하나이며, 본 논문은 다중 스케일 Ghost 컨볼루션 모듈을 사용하여 구축된 새로운 YOLOv8-pose-msg 키포인트 검출 모델을 제안한다. 다양한 사양에서 새 모델의 매개변수 양은 최소 34% 감소할 수 있으며, 최대 59%까지 감소할 수 있다. 종합적인 검출 성능은 비교적 대규모 데이터셋에서 원래의 수준을 유지할 수 있으며, 소규모 데이터셋에서의 키포인트 검출은 30% 이상 증가할 수 있다. 동시에 최대 25%의 훈련 및 추론 시간을 절약할 수 있다.

Detecting Adversarial Examples Using Edge-based Classification

  • Jaesung Shim;Kyuri Jo
    • Journal of the Korea Society of Computer and Information
    • /
    • v.28 no.10
    • /
    • pp.67-76
    • /
    • 2023
  • Although deep learning models are making innovative achievements in the field of computer vision, the problem of vulnerability to adversarial examples continues to be raised. Adversarial examples are attack methods that inject fine noise into images to induce misclassification, which can pose a serious threat to the application of deep learning models in the real world. In this paper, we propose a model that detects adversarial examples using differences in predictive values between edge-learned classification models and underlying classification models. The simple process of extracting the edges of the objects and reflecting them in learning can increase the robustness of the classification model, and economical and efficient detection is possible by detecting adversarial examples through differences in predictions between models. In our experiments, the general model showed accuracy of {49.9%, 29.84%, 18.46%, 4.95%, 3.36%} for adversarial examples (eps={0.02, 0.05, 0.1, 0.2, 0.3}), whereas the Canny edge model showed accuracy of {82.58%, 65.96%, 46.71%, 24.94%, 13.41%} and other edge models showed a similar level of accuracy also, indicating that the edge model was more robust against adversarial examples. In addition, adversarial example detection using differences in predictions between models revealed detection rates of {85.47%, 84.64%, 91.44%, 95.47%, and 87.61%} for each epsilon-specific adversarial example. It is expected that this study will contribute to improving the reliability of deep learning models in related research and application industries such as medical, autonomous driving, security, and national defense.

A Bio-Inspired Modeling of Visual Information Processing for Action Recognition (생체 기반 시각정보처리 동작인식 모델링)

  • Kim, JinOk
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.3 no.8
    • /
    • pp.299-308
    • /
    • 2014
  • Various literatures related computing of information processing have been recently shown the researches inspired from the remarkably excellent human capabilities which recognize and categorize very complex visual patterns such as body motions and facial expressions. Applied from human's outstanding ability of perception, the classification function of visual sequences without context information is specially crucial task for computer vision to understand both the coding and the retrieval of spatio-temporal patterns. This paper presents a biological process based action recognition model of computer vision, which is inspired from visual information processing of human brain for action recognition of visual sequences. Proposed model employs the structure of neural fields of bio-inspired visual perception on detecting motion sequences and discriminating visual patterns in human brain. Experimental results show that proposed recognition model takes not only into account several biological properties of visual information processing, but also is tolerant of time-warping. Furthermore, the model allows robust temporal evolution of classification compared to researches of action recognition. Presented model contributes to implement bio-inspired visual processing system such as intelligent robot agent, etc.

3D Facial Model Expression Creation with Head Motion (얼굴 움직임이 결합된 3차원 얼굴 모델의 표정 생성)

  • Kwon, Oh-Ryun;Chun, Jun-Chul;Min, Kyong-Pil
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.1012-1018
    • /
    • 2007
  • 본 논문에서는 비전 기반 3차원 얼굴 모델의 자동 표정 생성 시스템을 제안한다. 기존의 3차원 얼굴 애니메이션에 관한 연구는 얼굴의 움직임을 나타내는 모션 추정을 배제한 얼굴 표정 생성에 초점을 맞추고 있으며 얼굴 모션 추정과 표정 제어에 관한 연구는 독립적으로 이루어지고 있다. 제안하는 얼굴 모델의 표정 생성 시스템은 크게 얼굴 검출, 얼굴 모션 추정, 표정 제어로 구성되어 있다. 얼굴 검출 방법으로는 얼굴 후보 영역 검출과 얼굴 영역 검출 과정으로 구성된다. HT 컬러 모델을 이용하며 얼굴의 후보 영역을 검출하며 얼굴 후보 영역으로부터 PCA 변환과 템플릿 매칭을 통해 얼굴 영역을 검출하게 된다. 검출된 얼굴 영역으로부터 얼굴 모션 추정과 얼굴 표정 제어를 수행한다. 3차원 실린더 모델의 투영과 LK 알고리즘을 이용하여 얼굴의 모션을 추정하며 추정된 결과를 3차원 얼굴 모델에 적용한다. 또한 영상 보정을 통해 강인한 모션 추정을 할 수 있다. 얼굴 모델의 표정을 생성하기 위해 특징점 기반의 얼굴 모델 표정 생성 방법을 적용하며 12개의 얼굴 특징점으로부터 얼굴 모델의 표정을 생성한다. 얼굴의 구조적 정보와 템플릿 매칭을 이용하여 눈썹, 눈, 입 주위의 얼굴 특징점을 검출하며 LK 알고리즘을 이용하여 특징점을 추적(Tracking)한다. 추적된 특징점의 위치는 얼굴의 모션 정보와 표정 정보의 조합으로 이루어져있기 때문에 기하학적 변환을 이용하여 얼굴의 방향이 정면이었을 경우의 특징점의 변위인 애니메이션 매개변수를 획득한다. 애니메이션 매개변수로부터 얼굴 모델의 제어점을 이동시키며 주위의 정점들은 RBF 보간법을 통해 변형한다. 변형된 얼굴 모델로부터 얼굴 표정을 생성하며 모션 추정 결과를 모델에 적용함으로써 얼굴 모션 정보가 결합된 3차원 얼굴 모델의 표정을 생성한다.

  • PDF

A Study on the New Manager Model in Service Economy Era (서비스경제시대의 신경영자 모델 연구)

  • Kim, Hyunsoo
    • Journal of Service Research and Studies
    • /
    • v.10 no.3
    • /
    • pp.1-22
    • /
    • 2020
  • This study was conducted to derive the new manager model in service economy era. It was logically explained that the modern economic society is different from the existing economic society, the modern organization that is the subject of management is different from the existing organization, and the tasks required by management are different from the existing tasks. It suggested the managerial model required for new managers. According to the proposed manager's model, the tasks required of new managers and essential qualities as managers to perform the tasks were presented. It suggested the role model that managers with required qualities should play. The role of a manager who becomes one with customers, the role of a manager who controls even his irrationality, the role of a manager who combines discernment and indiscriminateness, a flexible leadership role that combines charisma and tenderness, an administrator role that embraces regulations and non-regulations, and vision and non-vision. We derived the role of a manager who manages management, and a manager role model that utilizes both competition and non-competition. The managers engage in two opposing roles and perform management activities in a spiral dialectical cycle that develops while resolving the contradictions of each role. The method of embracing the two opposing parties internally and externally and the dialectical management execution process according to the change of the space-time axis were presented by borrowing the models of The Book of Change. Future research needs an empirical analytical study on this new Model. There is a need for studies that expand this study and develop it into a practical model and verify it in an analytical way.

Egomotion Compensation of a Humanoid Robot by Using Stereo Vision (스테레오 비전을 이용한 휴머노이드 로봇의 자기 움직임 보정)

  • Kang, Tae-Koo;Park, Gwi-Tae
    • Proceedings of the KIEE Conference
    • /
    • 2008.04a
    • /
    • pp.257-258
    • /
    • 2008
  • 지능형 로봇에서 환경인식과 이러한 환경에 따른 행동 결정 능력은 로봇이 필수적으로 갖추어야 할 기능이다. 특히 상체의 움직임이 많은 휴머노이드 로봇에서 비전기반의 높은 환경에 대한 인식 기능을 위해서는 전처리 단계로 로봇 자체의 움직임을 감쇄 시켜주는 기능이 필수적이다. 본 논문에서는 Gaussian 모델과 Wavelet을 사용하여 추적하고자 하는 영역을 추출하고 PCA와 FNCC를 이용하여 움직임을 상쇄시키는 방법을 제안한다. 본 방법은 기존의 픽셀 단위로 움직임을 분석하는 방법에 비하여 간단하면서도 우수한 성능을 보인다. 본 시스템을 제작한 로봇에 적용한 결과 보다 높은 인식 성능을 얻을 수 있었다.

  • PDF

Conception and Implementation Strategies for u-Multi-Functional Administrative City (u-행복도시 구상 및 추진전략)

  • Kim, Jeong-Hun;Choe, Byung-Nam;Sin, Jeong-Yeop;Lee, Mi-Suk
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 2005.11a
    • /
    • pp.113-120
    • /
    • 2005
  • 최근의 정보통신기술의 급격한 발전으로 인해 향후 도시를 건설할 때 도시운영 및 관리뿐만 아니라 도시민들이 향유할 각종 서비스에 정보통신기술 변화를 반영하여야 할 것이다. 행정중심복합도시를 건설하기 위해서도 이러한 정보기술의 변화를 전망하고, 이를 구현하기 위한 추진방안이 모색되어야 한다. 행정중심복합도시는 과거의 전형적인 도시개발방식에서 탈피하고, 새로운 방식과 모델을 도입하여 21세기의 모범적인 도시를 건설하는 것이 필요하다. 그리고 IT의 비약적인 발전에 따라 도시의 물리적 거리와 시간에 구애받지 않고 무한한 정보를 매체로 새로운 도시공간으로 구현되어야 한다. 또한 이러한 정보기술의 발전을 통해 행정중심복합도시의 가치를 높이고 새로운 비즈니스 기회를 창출할 필요가 있다. 이를 위해 본 연구에서는 u-행복도시의 비전을 '사람과 자연과 기술이 하나되는 세계제일의 지능정보도시'로 정의하고 이러한 비전을 토대로 행적 효율과 시민 편익이 제고되는 전자 행정중심 도시, 자연과 인간이 함께 하는 지능형 환경 도시, 시민 안전을 도모하는 첨단정보관리 도시, 사람과 사물이 연결되는 정보 네트워크 도시에 대한 구현방안을 모색하였다.

  • PDF

Development of a Lane Sensing Algorithm Using Vision Sensors (비전 센서를 이용한 차선 감지 알고리듬 개발)

  • Park, Yong-Jun;Heo, Geon-Su
    • Transactions of the Korean Society of Mechanical Engineers A
    • /
    • v.26 no.8
    • /
    • pp.1666-1671
    • /
    • 2002
  • A lane sensing algorithm using vision sensors is developed based on lane geometry models. The parameters of the lane geometry models are estimated by a Kalman filter and utilized to reconstruct the lane geometry in the global coordinate. The inverse perspective mapping from image plane to global coordinate assumes earth to be flat, but roll and pitch motions of a vehicle are considered from the perspective of the lane sensing. The proposed algorithm shows robust lane sensing performance compared to the conventional algorithms.

Vision-based 3D Hand Gesture Recognition for Human-Robot Interaction (휴먼-로봇 상호작용을 위한 비전 기반3차원 손 제스처 인식)

  • Roh, Myung-Cheol;Chang, Hye-Min;Kang, Seung-Yeon;Lee, Seong-Whan
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.421-425
    • /
    • 2006
  • 최근 들어서 휴머노이드 로봇을 비롯한 로봇에 대하여 관심이 증대되고 있다. 이에 따라, 외모를 닮은 로봇 뿐 만 아니라, 사람과 상호 작용을 할 수 있는 로봇 기술의 중요성이 부각되고 있다. 이러한 상호 작용을 위한 효율적이고, 가장 자연스러운 방법 중의 하나가 비전을 기반으로 한 제스처 인식이다. 제스처를 인식하는데 있어서 가장 중요한 것은 손의 모양과 움직임을 인식하는3차원 제스처 인식이다. 본 논문에서는 3차원 손 제스처를 인식하기 위하여3차원 손 모델 추정 방법과 명령형 제스처 인식 시스템을 소개하고, 수화, 지화 등으로의 확장성을 위한 프레임워크를 제안한다.

  • PDF

Research Trends of Adversarial Attacks in Image Segmentation (Segmentation 기반 적대적 공격 동향 조사)

  • Hong, Yoon-Young;Shin, Yeong-Jae;Choi, Chang-Woo;Kim, Ho-Won
    • Annual Conference of KIPS
    • /
    • 2022.05a
    • /
    • pp.631-634
    • /
    • 2022
  • 컴퓨터 비전에서 딥러닝을 활용한 이미지 분할 기법은 핵심 분야 중 하나이다. 이미지 분할 기법이 다양한 도메인에 사용되면서 딥러닝 네트워크의 오작동을 일으키는 적대적 공격에 대한 방어와 강건함이 요구되고 있으며 자율주행 자동차, 질병 분석과 같이 모델의 보안 취약성이 심각한 사고를 불러 올 수 있는 영역에서 적대적 공격은 많은 관심을 받고 있다. 본 논문에서는 이미지 분할 기법에 따른 구별방법과 최근 연구되고 있는 적대적 공격의 방향성을 설명하며 향후 컴퓨터 비전 분야 연구의 효율성을 위해 중점적으로 검토되고 있는 연구주제를 설명한다