• 제목/요약/키워드: Vision assistant

검색결과 29건 처리시간 0.026초

비전 기반 측위 보조 알고리즘의 성능 분석 (Performance Analysis of Vision-based Positioning Assistance Algorithm)

  • 박종수;이용;권재현
    • 한국측량학회지
    • /
    • 제37권3호
    • /
    • pp.101-108
    • /
    • 2019
  • 최근 컴퓨터 처리 속도의 향상과 영상 처리 기술의 발달로 인해 카메라에서 획득하는 정보를 기존의 GNSS(Global Navigation Satellite System), 추측 항법 기반의 측위 기술과 결합하여 안정적인 위치를 결정하기 위한 연구가 활발히 진행 중이다. 기존 연구에서는 단안 카메라를 이용한 연구가 주로 수행되었으나 이 경우 관심 객체의 절대좌표가 구축이 되어 있어야 한다는 한계점이 있다. 이러한 한계를 극복하기 위해 본 연구에서는 스테레오 영상으로부터 삼각측량법을 적용하여 카메라와 관심 객체간 거리를 추정하는 비전 기반 측위 보조 알고리즘을 개발하고 성능 분석을 수행하였다. 또한, 추정된 거리와 카메라 영상 획득 간격을 이용해 상대적인 속도를 계산하고 이를 기존에 개발된 GNSS/이동체 내부 센서 기반 측위 알고리즘과 결합하여 통합 측위 알고리즘을 구현하였다. 실제 주행 자료를 기반으로 통합측위 알고리즘에 대한 성능을 분석한 결과 기존에 개발된 GNSS/이동체 내부 센서 기반 측위 알고리즘에 비해 속도 정보를 항법해 보정에 활용하였을 때 약 4%의 미미한 위치 정확도 향상 효과를 확인하였다. 이는 영상으로부터 추정된 속도 정보의 정밀도가 낮고, 터널 등을 지날 때는 영상으로부터 적절한 정보를 추출할 수 없다는 한계가 있어 이를 보완한 추가 연구가 필요하다고 판단된다.

물품 검사를 위한 X-선 영상 처리 시스템 개발 (The Development of X-ray image processing system for product inspection.)

  • 문하정;이동훈
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.826-828
    • /
    • 2014
  • 최근 제품의 소형화로 인해 물품의 표면뿐 만 아니라 내부 부품 결함 검사 또한 필요하게 되었다. 일반적으로 생산 공정에서의 물품에 대한 검사로 광학 검사를 많이 이용한다. 하지만 이는 표면상의 결함만을 검사할 뿐 물품 내부의 검사는 하기 어렵다. 이러한 제한점을 극복하기 위해 광학 장치 대신 X-선 발생 장치를 이용하여 영상을 얻는 동시에 제품 불량을 판별할 수 있는 시스템을 개발하였다. 머신 비전 기능을 이용하여 X-선 영상을 얻은 후 영상 처리를 통해 설정한 기준 값에 설정한 오차범위 수준이면 통과, 그렇지 않으면 불량으로 인식되도록 프로그램 하였다. 또한, 물품의 불량 유무 결과와 그 수치는 사용자가 저장할 수 있도록 하였다.

  • PDF

웹 구축 보조 시스템에 대한 GUI 객체 감지 및 대규모 언어 모델 활용 연구 (A Study on the Web Building Assistant System Using GUI Object Detection and Large Language Model)

  • 장현철;장형국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.830-833
    • /
    • 2024
  • As Large Language Models (LLM) like OpenAI's ChatGPT[1] continue to grow in popularity, new applications and services are expected to emerge. This paper introduces an experimental study on a smart web-builder application assistance system that combines Computer Vision with GUI object recognition and the ChatGPT (LLM). First of all, the research strategy employed computer vision technology in conjunction with Microsoft's "ChatGPT for Robotics: Design Principles and Model Abilities"[2] design strategy. Additionally, this research explores the capabilities of Large Language Model like ChatGPT in various application design tasks, specifically in assisting with web-builder tasks. The study examines the ability of ChatGPT to synthesize code through both directed prompts and free-form conversation strategies. The researchers also explored ChatGPT's ability to perform various tasks within the builder domain, including functions and closure loop inferences, basic logical and mathematical reasoning. Overall, this research proposes an efficient way to perform various application system tasks by combining natural language commands with computer vision technology and LLM (ChatGPT). This approach allows for user interaction through natural language commands while building applications.

디지털 X-ray 장치 제작 및 영상 처리 알고리즘 구현 (The Manufacture of Digital X-ray Devices and Implementation of Image Processing Algorithm)

  • 김소영;박승우;이동훈
    • 융합신호처리학회논문지
    • /
    • 제21권4호
    • /
    • pp.195-201
    • /
    • 2020
  • 본 연구에서 하루 종일 컴퓨터 앞에 앉아 있는 직장인들과 스마트폰을 자주 사용하는 현대인들의 생활 패턴으로 인해 발생하는 대표적인 현대 질병인 척추측만증에 대해 연구했다. 척추측만증은 우리나라 전체 인구의 80% 이상이 한 번 이상 걸리는 전형적인 합병증이다. X-ray는 이러한 합병증을 검사하는 데 사용된다. 조영제나 다른 기구 없이도 흉부, 복부, 뼈 등 다양한 부위에서 척추측만증을 쉽게 수행하고 촬영할 수 있는 비파괴검사법 X-선 발생 장치와 NI DAQ를 이용해 디지털 X-선 영상 장치를 소형화하고, X-선 차폐함 안에 영상 증배관과 Vision Assistant를 활용해 X-선 영상을 획득해 척추 상하부에 선을 그려 실시간으로 각도, 즉 곡률 등을 측정한다. 이와 같이 척추측만증 환자의 상태를 쉽게 볼 수 있도록 돕고, 현대인의 자세교정 문제를 해결하고 신속한 치료를 돕기 위해 연구를 수행되었다.

교통 표지판의 3차원 추적 경로를 이용한 자동차의 주행 차로 추정 (Lane-Level Positioning based on 3D Tracking Path of Traffic Signs)

  • 박순용;김성주
    • 로봇학회논문지
    • /
    • 제11권3호
    • /
    • pp.172-182
    • /
    • 2016
  • Lane-level vehicle positioning is an important task for enhancing the accuracy of in-vehicle navigation systems and the safety of autonomous vehicles. GPS (Global Positioning System) and DGPS (Differential GPS) are generally used in navigation service systems, which however only provide an accuracy level up to 2~3 m. In this paper, we propose a 3D vision based lane-level positioning technique which can provides accurate vehicle position. The proposed method determines the current driving lane of a vehicle by tracking the 3D position of traffic signs which stand at the side of the road. Using a stereo camera, the 3D tracking paths of traffic signs are computed and their projections to the 2D road plane are used to determine the distance from the vehicle to the signs. Several experiments are performed to analyze the feasibility of the proposed method in many real roads. According to the experimental results, the proposed method can achieve 90.9% accuracy in lane-level positioning.

영상 영역 특징 추가 및 유전 알고리즘 기반 최적화를 통한 스틱셀 분할 개선 방법 (Improvement of Stixel Segmentation Using Additive Image Domain Features and Genetic Algorithm-based Optimization)

  • 이선영;서재규;정호기
    • 한국자동차공학회논문집
    • /
    • 제23권6호
    • /
    • pp.565-574
    • /
    • 2015
  • Recently, a medium-level representation named "Stixel" has been extensively researched in stereo vision-based environmental perception. Obstacle detection using Stixel representation consists of three steps: static Stixel generation, dynamic Stixel generation, and Stixel segmentation. This paper focuses on the Stixel segmentation step and has two contributions. One is that it shows that Stixel segmentation performance can be enhanced by utilizing both image domain and real world domain features. The other is that it suggests that parameters used for Stixel segmentation can be effectively tuned based on genetic algorithm. The proposed method was quantitatively evaluated and the result showed that the proposed method increased Stixel segmentation accuracy compared with the previous method.

지능형 자동차의 적응형 제어를 위한 차선인식 (Lane Detection for Adaptive Control of Autonomous Vehicle)

  • 김현구;주영환;이종훈;박용완;정호열
    • 대한임베디드공학회논문지
    • /
    • 제4권4호
    • /
    • pp.180-189
    • /
    • 2009
  • Currently, most automobile companies are interested in research on intelligent autonomous vehicle. They are mainly focused on driver's intelligent assistant and driver replacement. In order to develop an autonomous vehicle, lateral and longitudinal control is necessary. This paper presents a lateral and longitudinal control system for autonomous vehicle that has only mono-vision camera. For lane detection, we present a new lane detection algorithm using clothoid parabolic road model. The proposed algorithm in compared with three other methods such as virtual line method, gradient method and hough transform method, in terms of lane detection ratio. For adaptive control, we apply a vanishing point estimation to fuzzy control. In order to improve handling and stability of the vehicle, the modeling errors between steering angle and predicted vanishing point are controlled to be minimized. So, we established a fuzzy rule of membership functions of inputs (vanishing point and differential vanishing point) and output (steering angle). For simulation, we developed 1/8 size robot (equipped with mono-vision system) of the actual vehicle and tested it in the athletics track of 400 meter. Through the test, we prove that our proposed method outperforms 98 % in terms of detection rate in normal condition. Compared with virtual line method, gradient method and hough transform method, our method also has good performance in the case of clear, fog and rain weather.

  • PDF

Client/Server구조를 이용한 PDA기반의 문자 추출 시스템 (PDA-based Text Extraction System using Client/Server Architecture)

  • 박안진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권2호
    • /
    • pp.85-98
    • /
    • 2005
  • 최근, PDA를 이용한 모바일 비젼 시스템에 관한 많은 연구가 진행되고 있다. 대부분의 PDA에서 사용하는 CPU는 실수 연산 구성요소(floating-computation component)가 없는 정수(integer)형 CPU를 사용하므로, 실수 연산이 많은 영상 처리 및 비젼 시스템에서는 많은 시간이 소요되는 단점이 있다 본 논문에서는 이를 해결하기 위해 무선 랜(LAN)으로 연결된 Client(PDA)/server(PC)구조론 이용한 시스템을 제안하며, 연속 영상에서 Client(PDA)와 Server(PC) 각각의 CPU를 이용하여 파이프라이닝 형식으로 시스템을 구축함으로써 수행 시간을 단축한다. Client(PDA)는 에지 밀도(edge density)론 이용하여 대략적인 문자 영역을 추출하며, Server(PC)는 Client(PDA)에서 대략적으로 검출된 견과를 바탕으로 정밀한 문자 영역을 추출하기 위해, MLP(multi-layer perceptron) 기반의 텍스춰 분류 방법과 연결 성분(connected component: CC) 기반의 필터링 방법을 이용한다. 본 실험에서 제안한 방법은 MLP와 CC를 이용함으로써 효과적인 문자 추출 결과를 보였으며, 파이프라이닝 형식의 Client(PDA)/server(PC)구조를 이용함으로써 빠른 수행 시간을 보였다.

YOLO알고리즘을 활용한 시각장애인용 식사보조 시스템 개발 (Development a Meal Support System for the Visually Impaired Using YOLO Algorithm)

  • 이군호;문미경
    • 한국전자통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.1001-1010
    • /
    • 2021
  • 시각이 온전한 사람들은 식사를 할 때 시각에 대한 의존도를 깊게 인지하지 못한다. 그러나 시각장애인은 식단에 어떤 음식이 있는지 알지 못하기 때문에 옆에 있는 보조인이 시각장애인 수저로 음식의 위치를 시계방향 또는 전후좌우 등 일정한 방향으로 설명하여 그릇 위치를 확인한다. 본 논문에서는 시각장애인이 스마트폰의 카메라를 이용하여 자신의 식단을 비추면 각각의 음식 이미지를 인식하여 음성으로 음식의 이름을 알려주는 식사보조 시스템의 개발 내용에 대해 기술한다. 이 시스템은 음식과 식기도구(숟가락)의 이미지를 학습한 YOLO모델을 통해 숟가락이 놓인 음식을 추출해 내고, 이 음식이 무엇인지를 인식하여 이를 음성으로 알려준다. 본 시스템을 통해 시각장애인은 식사보조인의 도움없이 식사를 할 수 있음으로써 자립의지와 만족도를 높일 수 있을 것으로 기대한다.

저시력과 사회경제적 상태와의 관계 (The Relationships Between Low Vision and Socioeconomic Status in Korean Adults)

  • 박지현
    • 한국안광학회지
    • /
    • 제16권3호
    • /
    • pp.319-325
    • /
    • 2011
  • 목적: 본 연구는 저시력과 가구 소득, 교육 수준 및 직업과 같은 사회경제적 요인과의 관련성을 평가하고자 하였다. 방법: 국민건강영양조사(2009년) 데이터를 이용하여 교정시력 검사를 받은 2,514명을 대상으로 가구소득, 교육수준, 직업에 따른 저시력의 유병률을 t-검정 및 $\chi^2$ 검정하였고, 대응위험도(odds ratio)를 측정하기 위하여 이분형 로지스틱 회귀분석을 이용하였다. 결과: 가구 소득, 교육수준, 직능 수준이 낮을수록 저시력 발생이 높은 것으로 나타났으며, 가구소득이 '하'인 경우 대응위험도는 2.77(95% CI, 1.72-4.47)이었고, 교육수준이 '초졸 이하'인 경우는 4.02(95% CI, 1.75-9.23)이었으며, 직업이 '무직'인 경우는 3.65(95% CI, 1.14-11.68)이었다. 결론: 사회적으로 저시력에 대한 관심이 필요하며, 정책적으로 저시력 환자들의 눈 건강형평성을 해소하기 위한 안 보건 교육, 안질환 조기발견을 위한 검진 사업, 저시력 보조기구 사용교육 등 폭넓고 세심한 지원 그리고 이를 위해 가능한 보건 정책이 개발되어야 할 것으로 생각된다.