• 제목/요약/키워드: vision model

검색결과 1,333건 처리시간 0.026초

LVLN: 시각-언어 이동을 위한 랜드마크 기반의 심층 신경망 모델 (LVLN : A Landmark-Based Deep Neural Network Model for Vision-and-Language Navigation)

  • 황지수;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권9호
    • /
    • pp.379-390
    • /
    • 2019
  • 본 논문에서는 시각-언어 이동 문제를 위한 새로운 심층 신경망 모델인 LVLN을 제안한다. LVLN 모델에서는 자연어 지시의 언어적 특징과 입력 영상 전체의 시각적 특징들 외에, 자연어 지시에서 언급하는 주요 장소와 랜드마크 물체들을 입력 영상에서 탐지해내고 이 정보들을 추가적으로 이용한다. 또한 이 모델은 자연어 지시 내 각 개체와 영상 내 각 관심 영역, 그리고 영상에서 탐지된 개별 물체 및 장소 간의 서로 연관성을 높일 수 있도록 맥락 정보 기반의 주의 집중 메커니즘을 이용한다. 그뿐만 아니라, LVLN 모델은 에이전트의 목표 도달 성공율을 향상시키기 위해, 목표를 향한 실질적인 접근을 점검할 수 있는 진척 점검기 모듈도 포함하고 있다. Matterport3D 시뮬레이터와 Room-to-Room (R2R) 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해, 본 논문에서 제안하는 LVLN 모델의 높은 성능을 확인할 수 있었다.

Predicting Brain Tumor Using Transfer Learning

  • Mustafa Abdul Salam;Sanaa Taha;Sameh Alahmady;Alwan Mohamed
    • International Journal of Computer Science & Network Security
    • /
    • 제23권5호
    • /
    • pp.73-88
    • /
    • 2023
  • Brain tumors can also be an abnormal collection or accumulation of cells in the brain that can be life-threatening due to their ability to invade and metastasize to nearby tissues. Accurate diagnosis is critical to the success of treatment planning, and resonant imaging is the primary diagnostic imaging method used to diagnose brain tumors and their extent. Deep learning methods for computer vision applications have shown significant improvements in recent years, primarily due to the undeniable fact that there is a large amount of data on the market to teach models. Therefore, improvements within the model architecture perform better approximations in the monitored configuration. Tumor classification using these deep learning techniques has made great strides by providing reliable, annotated open data sets. Reduce computational effort and learn specific spatial and temporal relationships. This white paper describes transfer models such as the MobileNet model, VGG19 model, InceptionResNetV2 model, Inception model, and DenseNet201 model. The model uses three different optimizers, Adam, SGD, and RMSprop. Finally, the pre-trained MobileNet with RMSprop optimizer is the best model in this paper, with 0.995 accuracies, 0.99 sensitivity, and 1.00 specificity, while at the same time having the lowest computational cost.

실시간 로봇 위치 제어를 위한 확장 칼만 필터링의 비젼 저어 기법 개발 (Development of Vision Control Scheme of Extended Kalman filtering for Robot's Position Control)

  • 장완식;김경석;박성일;김기영
    • 비파괴검사학회지
    • /
    • 제23권1호
    • /
    • pp.21-29
    • /
    • 2003
  • 실시간 로봇 위치 제어를 위해 비젼시스템을 사용할 때 이 모델에 포함된 매개변수를 추정하는데 있어 계산시간을 줄이는 것은 매우 중요하다. 불행히도 흔히 사용되고 있는 일괄 처리 기법은 반복적으로 계산이 수행되기 때문에 많은 계산 시간을 필요로 하여 실시간 로봇 위치 제어를 어렵게 한다. 반면에 본 연구에서 사용하고자 하는 화장 칼만 필터링은 사용하기 편리하고, 또한 순환적 방법으로 계산되기 때문에 비젼시스템의 매개변수를 계산하는데 있어 시간을 줄이는 커다란 장점을 가지고 있다. 따라서 본 연구에서는 실시간 로봇 위치 제어를 위해 사용하는 비젼 제어 기법에 확장 칼만 필터링을 적용되었다 여기서 사용된 비젼시스템 모델은 카메라 내부 매개변수(방향, 초점거리 등) 및 외부 매개변수(카메라와 로봇 사이의 상대적 위치)를 설명하기 위해 6개 매개변수를 포함하고 있다. 이러한 매개변수를 추정하기 위해 확장 칼만 필터링 기법이 적용되었다. 또한 이렇게 추정된 6개 매개변수를 사용하여 로봇을 구동시키기 위해 필요한 로봇 회전각 추정에도 화장 칼만 필터링 기법이 적용되었다. 최종적으로 확장 칼만 필터링을 사용하여 개발된 비젼 제어 기법의 타당성을 로봇 위치 제어 실험을 수행하여 확인하였다.

소형 머신 비전 검사 장비에 기반한 O링 치수 측정 (O-ring Size Measurement Based on a Small Machine Vision Inspection Equipment)

  • 정유수;박길흠
    • 한국산업정보학회논문지
    • /
    • 제19권4호
    • /
    • pp.41-52
    • /
    • 2014
  • 본 논문은 O링의 치수 측정에 있어 고가의 대 중형 머신비전 장비를 대체할 수 있는 소형 머신 비전 검사 장비에 기반한 O링 부품 내 외경 측정 알고리즘을 제안한다. 백라이트 조명하에 하나의 CCD 카메라를 이용하여 측정 평면으로 부터 영상을 획득하는 소형 머신 비전 검사장비에 의해 획득된 영상을 제안한 영상처리 기법 알고리즘을 이용하여 O링의 외경 및 내경치수를 측정한다. 치수 측정의 정확도를 높이기 위해 렌즈계 왜곡 보정과 원근 왜곡 보정을 소프트웨어적 기법으로 보정 하였고 O링 형상을 고려하여 타원정합 모델을 적용하였으며 보다 타원 정합의 신뢰성을 높이기 위해 RANSAC알고리즘을 적용하였다.

영상기반항법을 위한 파티클 필터 기반의 특징점 추적 필터 설계 (Particle Filter Based Feature Points Tracking for Vision Based Navigation System)

  • 원대희;성상경;이영재
    • 한국항공우주학회지
    • /
    • 제40권1호
    • /
    • pp.35-42
    • /
    • 2012
  • 본 논문은 영상기반항법에서 특징점의 이동변위가 큰 경우에도 추적 성능을 확보할 수 있는 파티클 필터 기반의 특징점 추적 필터를 설계하였다. 기존 KLT(Kanade-Lucas-Tomasi) 알고리즘에서 이동량이 큰 경우의 추적 성능을 향상시키기 위해 특징점의 동역학 모델을 적용하였고, 불규칙적인 영상정보의 특성을 반영하기 위해 파티클 필터를 사용하였다. 저장된 이미지로 KLT 알고리즘과의 특징점 추적 성능을 비교한 결과 제안한 알고리즘은 큰 이동량을 갖는 경우에도 추적 기능을 유지하는 것을 확인하였다.

스테레오 비전센서를 이용한 차선감지 시스템 연구 (A Study on Lane Sensing System Using Stereo Vision Sensors)

  • 하건수;박재식;이광운;박재학
    • 대한기계학회논문집A
    • /
    • 제28권3호
    • /
    • pp.230-237
    • /
    • 2004
  • Lane Sensing techniques based on vision sensors are regarded promising because they require little infrastructure on the highway except clear lane markers. However, they require more intelligent processing algorithms in vehicles to generate the previewed roadway from the vision images. In this paper, a lane sensing algorithm using vision sensors is developed to improve the sensing robustness. The parallel stereo-camera is utilized to regenerate the 3-dimensional road geometry. The lane geometry models are derived such that their parameters represent the road curvature, lateral offset and heading angle, respectively. The parameters of the lane geometry models are estimated by the Kalman filter and utilized to reconstruct the lane geometry in the global coordinate. The inverse perspective mapping from the image plane to the global coordinate considers roll and pitch motions of a vehicle so that the mapping error is minimized during acceleration, braking or steering. The proposed sensing system has been built and implemented on a 1/10-scale model car.

이동 타겟 추적을 위한 N-R과 EKF방법의 로봇비젼제어기법에 관한 연구 (A Study on the Robot Vision Control Schemes of N-R and EKF Methods for Tracking the Moving Targets)

  • 홍성문;장완식;김재명
    • 한국생산제조학회지
    • /
    • 제23권5호
    • /
    • pp.485-497
    • /
    • 2014
  • This paper presents the robot vision control schemes based on the Newton-Raphson (N-R) and the Extended Kalman Filter (EKF) methods for the tracking of moving targets. The vision system model used in this study involves the six camera parameters. The difference is that refers to the uncertainty of the camera's orientation and focal length, and refers to the unknown relative position between the camera and the robot. Both N-R and EKF methods are employed towards the estimation of the six camera parameters. Based on the these six parameters estimated using three cameras, the robot's joint angles are computed with respect to the moving targets, using both N-R and EKF methods. The two robot vision control schemes are tested by tracking the moving target experimentally. Given the experimental results, the two robot control schemes are compared in order to evaluate their strengths and weaknesses.

동적 스테레오 카메라 모델링 (An active stereo camera modeling)

  • 도경민;이쾌희
    • 제어로봇시스템학회논문지
    • /
    • 제3권3호
    • /
    • pp.297-304
    • /
    • 1997
  • In stereo vision, camera modeling is very important because the accuracy of the three dimensional locations depends considerably on it. In the existing stereo camera models, two camera planes are located in the same plane or on the optical axis. These camera models cannot be used in the active vision system where it is necessary to obtain two stereo images simultaneously. In this paper, we propose four kinds of stereo camera models for active stereo vision system where focal lengths of the two cameras are different and each camera is able to rotate independently. A single closed form solution is obtained for all models. The influence of the stereo camera model to the field of view, occlusion, and search area used for matching is shown in this paper. And errors due to inaccurate focal length are analyzed and simulation results are shown. It is expected that the three dimensional locations of objects are determined in real time by applying proposed stereo camera models to the active stereo vision system, such as a mobile robot.

  • PDF

Sentiment Analysis From Images - Comparative Study of SAI-G and SAI-C Models' Performances Using AutoML Vision Service from Google Cloud and Clarifai Platform

  • Marcu, Daniela;Danubianu, Mirela
    • International Journal of Computer Science & Network Security
    • /
    • 제21권9호
    • /
    • pp.179-184
    • /
    • 2021
  • In our study we performed a sentiments analysis from the images. For this purpose, we used 153 images that contain: people, animals, buildings, landscapes, cakes and objects that we divided into two categories: images that suggesting a positive or a negative emotion. In order to classify the images using the two categories, we created two models. The SAI-G model was created with Google's AutoML Vision service. The SAI-C model was created on the Clarifai platform. The data were labeled in a preprocessing stage, and for the SAI-C model we created the concepts POSITIVE (POZITIV) AND NEGATIVE (NEGATIV). In order to evaluate the performances of the two models, we used a series of evaluation metrics such as: Precision, Recall, ROC (Receiver Operating Characteristic) curve, Precision-Recall curve, Confusion Matrix, Accuracy Score and Average precision. Precision and Recall for the SAI-G model is 0.875, at a confidence threshold of 0.5, while for the SAI-C model we obtained much lower scores, respectively Precision = 0.727 and Recall = 0.571 for the same confidence threshold. The results indicate a lower classification performance of the SAI-C model compared to the SAI-G model. The exception is the value of Precision for the POSITIVE concept, which is 1,000.

ISO9004 모델을 이용한 지속가능 성공경영시스템에 관한 연구 (A Study of Sustainable Successful Management System Using ISO9004 Model)

  • 김석은
    • 대한안전경영과학회:학술대회논문집
    • /
    • 대한안전경영과학회 2012년 춘계학술대회
    • /
    • pp.139-155
    • /
    • 2012
  • A fundamental concepts of business environment changes and the importance of stakeholder's value creation is changing in the business. This study ISO9004: 2009 quality management system of Category 5: Strategy and Policy, Category 10: improvement, innovation and learning (Note) SBK target was to develop a model that is the company's sustained success. Three concepts of the new revision of ISO9004" in response to environmental changes," "learning", "innovation" (Note) SBK applied to the project settings and talent establish long-term vision was to establish the process as the organization's learning content was TDR for the creation of exceptional and innovative programs were introduced. As a result, (Note) SBK three years of continuous business performance indicator has grown dramatically to more than 50% continued success is going to create business models. But 100 years to accomplish the vision, ISO9004 model needs to extends the entire category as a management system to achieve the optimization needed.

  • PDF