• 제목/요약/키워드: 비전모델

검색결과 545건 처리시간 0.026초

문자 인식 향상을 위한 회전 정렬 알고리즘에 관한 연구 (A Study on Rotational Alignment Algorithm for Improving Character Recognition)

  • 진고환
    • 한국융합학회논문지
    • /
    • 제10권11호
    • /
    • pp.79-84
    • /
    • 2019
  • 영상을 기반으로 하는 기술들의 지속적인 발전으로 다양한 분야에서 활용되고 있고, 카메라를 통하여 획득한 영상의 객체를 분석하고 판별하는 비전 시스템의 기술 수요가 급속하게 증가하고 있다. 비전 시스템의 핵심 기술인 영상처리는 반도체 생산 분야의 불량 검사, 타이어 표면의 숫자 및 심볼과 같은 객체 인식 검사 등에 사용되고 있고, 자동차 번호판 인식 등의 연구가 계속하여 이루어지고 있는 실정으로, 객체를 신속, 정확하게 인식할 필요가 있다. 본 논문에서는 곡면과 같은 곳에 마킹되어 있는 숫자나 심볼과 같이 기울어진 객체를 인식하기 위하여 입력된 영상 이미지의 객체 기울기에 대한 각도 값을 확인하여 객체의 회전 정렬을 통한 인식 모델을 제안한다. 제안 모델은 컨투어 알고리즘을 기반으로 객체 영역을 추출하고, 객체의 각도를 산출한 후, 회전 정렬된 이미지에 대한 객체 인식을 진행할 수 있는 모델이다. 향후 연구에서는 기계학습을 통한 탬플릿 매칭 연구가 필요하다.

생성형 AI를 활용한 소프트웨어교육 수업모델 연구 - ChatGPT를 중심으로 (Software Education Class Model using Generative AI - Focusing on ChatGPT)

  • 이명숙
    • 실천공학교육논문지
    • /
    • 제16권3_spc호
    • /
    • pp.275-282
    • /
    • 2024
  • 본 연구는 생성형 AI를 활용한 소프트웨어교육에 관한 수업모델을 연구하였다. 연구 목적은 ChatGPT를 소프트웨어교육에 활용함으로써 비전공학생들의 프로그래밍 수업에서 교수자의 보조자 역할로 ChatGPT를 활용하기 위함이다. 또한, ChatGPT를 이용해 학습자 개별 교육이 가능하도록 설계하고, 학생들이 필요로 한 시점에 즉각적인 피드백을 제공하고자 하였다. 연구 방법은 교양과목의 파이썬 수업을 듣는 컴퓨터 비전공자를 대상으로 ChatGPT를 보조자로 활용하여 수업을 진행하였다. 그리고 비전공학생의 프로그래밍 교육에서 ChatGPT가 보조자로서 가능성이 있는지 확인하였다. 학생들은 ChatGPT를 과제작성, 오류수정, 코딩 작성 및 지식 습득에 활발히 사용하였으며, 오류 해결에 많은 시간이 걸리는 것을 프로그램을 이해하는데 집중할 수 있는 등 다양한 이점을 확인하였다. ChatGPT가 학생들의 학습 효율을 높일 수 있는 가능성 볼 수 있었으며, 교육에 활용하는 데 있어서 더 많은 연구가 필요함을 알 수 있었다. 향후에는 ChatGPT를 활용한 교육 모델의 발전과 보완, 평가 방법에 관한 연구가 이루어질 것이다.

Lightening of Human Pose Estimation Algorithm Using MobileViT and Transfer Learning

  • Kunwoo Kim;Jonghyun Hong;Jonghyuk Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권9호
    • /
    • pp.17-25
    • /
    • 2023
  • 본 논문에서는 매개변수가 더 적고, 빠르게 추정 가능한 MobileViT 기반 모델을 통해 사람 자세 추정 과업을 수행할 수 있는 모델을 제안한다. 기반 모델은 합성곱 신경망의 특징과 Vision Transformer의 특징이 결합한 구조를 통해 경량화된 성능을 입증한다. 본 연구에서 주요 매커니즘이 되는 Transformer는 그 기반의 모델들이 컴퓨터 비전 분야에서도 합성곱 신경망 기반의 모델들 대비 더 나은 성능을 보이며, 영향력이 커지게 되었다. 이는 사람 자세 추정 과업에서도 동일한 상황이며, Vision Transformer기반의 ViTPose가 COCO, OCHuman, MPII 등 사람 자세 추정 벤치마크에서 모두 최고 성능을 지키고 있는 것이 그 적절한 예시이다. 하지만 Vision Transformer는 매개변수의 수가 많고 상대적으로 많은 연산량을 요구하는 무거운 모델 구조를 가지고 있기 때문에, 학습에 있어 사용자에게 많은 비용을 야기시킨다. 이에 기반 모델은 Vision Transformer가 많은 계산량을 요구하는 부족한 Inductive Bias 계산 문제를 합성곱 신경망 구조를 통한 Local Representation으로 극복하였다. 최종적으로, 제안 모델은 MS COCO 사람 자세 추정 벤치마크에서 제공하는 Validation Set으로 ViTPose 대비 각각 5분의 1과 9분의 1만큼의 3.28GFLOPs, 972만 매개변수를 나타내었고, 69.4 Mean Average Precision을 달성하여 상대적으로 우수한 성능을 보였다.

돌봄서비스 제공인력의 직무만족 영향에 대한 융복합 연구 : 수퍼비전의 매개효과를 중심으로 (Converged Study on the Factors Affecting of Care Service Personnel's Job Satisfaction: Focusing on mediator effect of supervision)

  • 이형하
    • 한국융합학회논문지
    • /
    • 제7권6호
    • /
    • pp.229-236
    • /
    • 2016
  • 본 연구에서는 돌봄서비스 제공인력의 직무만족에 영향을 미치는 근로조건, 직무스트레스, 수퍼비전의 다차원적 영향요인을 규명하고자 구조방정식 모델을 사용하여 분석하였다. 연구결과, 첫째, 종속변인인 직무만족에 근로조건(B=.247), 직무스트레스(B=-.610), 수퍼비전(B=.635)은 통계적으로 유의미한 영향력을 갖는 것으로 분석되었다. 연구모형에 투입된 변인들을 통하여 직무만족의 약 34.9%를 설명하는 것으로 나타났다. 둘째, 직무만족에 영향을 미치는 데 있어서 수퍼비전은 직무스트레스(B=-.047)에 매개효과를 나타냈다. 본 연구결과는 향후 돌봄서비스 분야 뿐만 아니라 사회서비스 제공인력에 대한 직무만족 향상을 위한 관리자 교육과정에 수퍼비전을 통한 효율적인 인력 관리방안에도 활용될 것이다.

GUI를 이용한 병렬/분산 시뮬레이션 환경의 개발 (Development of a GUI-based Parallel and Distributed Simulation Environment)

  • 강원석
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 1999년도 춘계학술대회 논문집
    • /
    • pp.174-178
    • /
    • 1999
  • 병렬/분산 시뮬레이션은 시뮬레이션의 수행 속도를 높이려는 시도로서 많이 연구되고 있는 분야이다. 기존의 병렬/분산 시뮬레이션 연구에서는 주로 시뮬레이션 속도를 향상시키려는 동기화 기법에 대해 연구의 초점이 맞추어져 왔다. 따라서 전문가가 아니면 병렬 모델을 만들기 매우 힘든 문제점이 있었다. 본 논문에서는 병렬/분산 시뮬레이션을 위한 GUI 기반의 모델링 및 시뮬레이션 환경을 제시한다. 제시된 환경에서는 사용자가 모델기술을 GUI기반으로 쉽게 할 수 있고 병렬 시뮬레이션을 위해 모델을 자동으로 파티션 및 수행 코드를 발생시켜준다. 따라서 비전문가도 쉽게 분산 시뮬레이션을 할 수 있도록 자동화 할 수 있다.

  • PDF

컴퓨터비전을 활용한 건설현장 중장비의 단독작업 자동 인식 모델 개발 (Solitary Work Detection of Heavy Equipment Using Computer Vision)

  • 정인수;김진우;지석호;노명일
    • 대한토목학회논문집
    • /
    • 제41권4호
    • /
    • pp.441-447
    • /
    • 2021
  • 건설현장에서는 수많은 중장비와 작업자가 다양한 작업을 동시다발적으로 수행하기 때문에 복잡하고 위험한 상황이 자주 발생한다. 복잡한 현장에서 중장비가 단독으로 작업할 경우 운전자의 시야제한, 판단오류 등으로 인해 안전사고가 발생할 수 있으며, 이에 따라 중장비는 신호수와의 상호작용을 통해 주변 상황에 대한 정보를 수집하면서 작업을 수행해야 한다. 중장비를 자동으로 모니터링하고 위험상황을 탐지하기 위해 많은 컴퓨터비전 기술들이 개발되었지만, 기존의 방법들은 중장비 단독작업 인식에 필요한 중장비와 신호수 간 상호작용을 고려하지 않았다는 한계가 있다. 이러한 한계를 보완하기 위해 본 연구는 중장비-신호수 간의 상호작용을 고려한 컴퓨터비전 기반 중장비의 단독작업 자동 인식 모델을 제안함을 목표로 한다. 개발된 모델을 검증하기 위해 실제 건설현장으로부터 영상 데이터를 수집하여 실험을 수행하였다. 그 결과, 학습된 모델은 중장비와 사람을 83.4 %의 정확도로 인식하였고, 일반 작업자와 신호수를 84.2 %의 정확도로 분류하였으며, 중장비-신호수 간 상호작용 또한 95.1 %의 높은 정확도로 분석하였다. 본 연구결과는 건설현장에서 위험한 상황을 초래할 수 있는 중장비의 단독작업을 사전에 탐지하여 안전사고를 예방할 수 있다.

이미지-텍스트 쌍을 활용한 이미지 분류 정확도 향상에 관한 연구 (A Study on Improvement of Image Classification Accuracy Using Image-Text Pairs)

  • 김미희;이주혁
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.561-566
    • /
    • 2023
  • 딥러닝의 발전으로 다양한 컴퓨터 비전 연구를 수행할 수 있게 됐다. 딥러닝은 컴퓨터 비전 연구 중 이미지 처리에서 높은 정확도와 성능을 보여줬다. 하지만 대부분의 이미지 처리 방식은 이미지의 시각 정보만을 이용해 이미지를 처리하는 경우가 대부분이다. 이미지-텍스트 쌍을 활용할 경우 이미지와 관련된 설명, 주석 등의 텍스트 데이터가 이미지 자체에서는 얻기 힘든 추가적인 맥락과 시각 정보를 제공할 수 있다. 본 논문에서는 이미지-텍스트 쌍을 활용하여 이미지와 텍스트를 분석하는 딥러닝 모델 제안한다. 제안 모델은 이미지 정보만을 사용한 딥러닝 모델보다 약 11% 향상된 분류 정확도 결과를 보였다.

ViT 기반 모델 역전 공격 및 방어 기법들에 대한 연구 (Survey of the Model Inversion Attacks and Defenses to ViT)

  • 유미선;백윤흥
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.15-17
    • /
    • 2023
  • ViT(Vision Transformer)는 트랜스포머 구조에 이미지를 패치들로 나눠 한꺼번에 인풋으로 입력하는 모델이다. CNN 기반 모델보다 더 적은 훈련 계산량으로 다양한 이미지 인식 작업에서 SOTA(State-of-the-art) 성능을 보이면서 다양한 비전 작업에 ViT 를 적용하는 연구가 활발히 진행되고 있다. 하지만, ViT 모델도 AI 모델 훈련시에 생성된 그래디언트(Gradients)를 이용해 원래 사용된 훈련 데이터를 복원할 수 있는 모델 역전 공격(Model Inversion Attacks)에 안전하지 않음이 증명되고 있다. CNN 기반의 모델 역전 공격 및 방어 기법들은 많이 연구되어 왔지만, ViT 에 대한 관련 연구들은 이제 시작 단계이고, CNN 기반의 모델과 다른 특성이 있기에 공격 및 방어 기법도 새롭게 연구될 필요가 있다. 따라서, 본 연구는 ViT 모델에 특화된 모델 역전 공격 및 방어 기법들의 특징을 서술한다.

지능형 엣지 컴퓨팅 기기를 위한 온디바이스 AI 비전 모델의 경량화 방식 분석 (Analysis on Lightweight Methods of On-Device AI Vision Model for Intelligent Edge Computing Devices)

  • 주혜현;강남희
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.1-8
    • /
    • 2024
  • 실시간 처리 및 프라이버시 강화를 위해 인공지능 모델을 엣지에서 동작시킬 수 있는 온디바이스 AI 기술이 각광받고 있다. 지능형 사물인터넷 기술이 다양한 산업에 적용되면서 온디바이스 AI 기술을 활용한 서비스가 크게 증가하고 있다. 그러나 일반적인 딥러닝 모델은 추론 및 학습을 위해 많은 연산 자원을 요구하고 있다. 따라서 엣지에 적용되는 경량 기기에서 딥러닝 모델을 동작시키기 위해 양자화나 가지치기와 같은 다양한 경량화 기법들이 적용되어야 한다. 본 논문에서는 다양한 경량화 기법 중 가지치기 기술을 중심으로 엣지 컴퓨팅 기기에서 딥러닝 모델을 경량화하여 적용할 수 있는 방안을 분석한다. 특히, 동적 및 정적 가지치기 기법을 적용하여 경량화된 비전 모델의 추론 속도, 정확도 그리고 메모리 사용량을 시험한다. 논문에서 분석된 내용은 실시간 특성이 중요한 지능형 영상 관제 시스템이나 자율 이동체의 영상 보안 시스템에 적용될 수 있다. 또한 사물인터넷 기술이 적용되는 다양한 서비스와 산업에 더욱 효과적으로 활용될 수 있을 것으로 기대된다.

컴퓨터 비전공자를 위한 파이썬 기반 소프트웨어 교육 모델 (Python-based Software Education Model for Non-Computer Majors)

  • 이영석
    • 한국융합학회논문지
    • /
    • 제9권3호
    • /
    • pp.73-78
    • /
    • 2018
  • 컴퓨팅 기술을 다양한 분야와 융합하여 새로운 가치를 만들어내고자 하는 노력이 현대 사회에서 강조되고 있다. 이제 소프트웨어를 설계하고 제작하는 능력을 포함한 컴퓨터 소양 교육은 전공분야와 상관없이 누구에게나 이뤄져야 하는 사회 보편적인 교육으로 자리 잡고 있다. 많은 대학들이 컴퓨터 비전공 학생들을 포함하여 컴퓨팅 기술을 활용한 문제 해결력을 향상시키기 위해 소프트웨어 교육을 필수 이수하도록 시도하고 있다. 하지만, 아직은 컴퓨터 전공 학생들을 위한 프로그래밍 교육 관점에서의 소프트웨어 교육을 실시하다 보니 프로그래밍 언어 문법을 학습하는 과정에서 많은 어려움을 호소하고 있다. 이러한 문제를 해결하기 위하여, 본 논문에서는 기존의 소프트웨어 교육 모델 연구결과를 분석한 뒤, 컴퓨터 비전공자를 위한 파이썬 기반 소프트웨어 교육 모델을 제안한다. 이를 위해, 파이썬 기반 소프트웨어 교육 모델을 위한 학습절차와 교수 전략 및 한 학기 분량의 커리큘럼을 제안하였으며, 교양 수업에 적용하여 유의미한 결과를 도출하였다. 제안하는 소프트웨어 교육 모델을 적용한 강의가 진행한다면 학생들에게 흥미와 관심을 유도하면서 컴퓨팅 사고력과 문제 해결력을 향상시킬 수 있을 것이다.