• 제목/요약/키워드: dataset navigation

검색결과 44건 처리시간 0.027초

항로표지 보호를 위한 디지털 영상기반 해무 강도 측정 알고리즘 (Sea Fog Level Estimation based on Maritime Digital Image for Protection of Aids to Navigation)

  • 유은지;이효찬;조성윤;권기원;임태호
    • 인터넷정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.25-32
    • /
    • 2021
  • 미래 해상 환경 변화에 맞춰 해상 항로표지가 다양한 분야에 걸쳐 활용되며 쓰임이 증대되고 있다. 해상 항로표지는 항행하는 선박의 위치, 방향 및 장애물의 위치를 알려주는 항행보조시설로, 현재는 단순히 선박의 안전 항해를 도울 뿐 아니라, 여러 센서와 카메라를 탑재하여 해양 기상환경을 파악하고 기록하는 수단으로 변모하고 있다. 하지만 주로 선박과의 충돌로 인해 소실되며 특히 해무로 인한 관측 시야 저하로 안전사고가 발생한다. 해무 유입은 항만, 해상교통 등에 위험을 초래하고 시간과 지역에 따라 발생 가능성의 차이가 커 예측이 쉽지 않다. 또한, 전 해역에 분포되어있는 항로표지의 특성상 개별 관리가 어렵다. 이를 해결하고자 본 논문에서는 항로표지에 설치된 카메라에서 촬영한 영상으로 해무 강도를 측정하는 방안을 통하여 해양 기상환경을 파악해 보완하고 날씨로 인한 항로표지 안전사고를 해결하는 것을 목적으로 한다. 설치가 어렵고 높은 비용이 드는 광학 및 온도 센서 대신 항로표지에 설치된 카메라의 일반 영상을 사용하여 해무 강도를 측정한다. 덧붙여 다양한 해역에서의 실시간 해무 파악을 위한 선행 연구로, 안개 모델(Haze Model), Dark Channel Prior(DCP)를 이용해 해무 강도 측정 기준을 제시한다. DCP를 적용한 영상에서 특정 픽셀값의 문턱값(Threshold value)을 설정하고, 이를 기준으로 전체 영상에서 해무가 존재하지 않는 픽셀의 수를 통해 해무 강도를 추정한다. 합성 해무 데이터셋과 실제 해무 동영상을 캡처해 만든 실제 해무 데이터셋으로 해무 강도 측정 여부를 검증했다.

[논문철회]무인비행기의 항행 데이터 분석을 통한 최적화된 프로파일 설계 및 구현 ([Retracted]Design and Implementation of Optimized Profile through analysis of Navigation Data Analysis of Unmanned Aerial Vehicle)

  • 이원진
    • 한국멀티미디어학회논문지
    • /
    • 제25권2호
    • /
    • pp.237-246
    • /
    • 2022
  • Among the technologies of the 4th industrial revolution, drones that have grown rapidly and are being used in various industries can be operated by the pilot directly or can be operated automatically through programming. In order to be controlled by a pilot or to operate automatically, it is essential to predict and analyze the optimal path for the drone to move without obstacles. In this paper, after securing and analyzing the pilot training dataset through the unmanned aerial vehicle piloting training platform designed through prior research, the profile of the dataset that should be preceded to search and derive the optimal route of the unmanned aerial vehicle was designed. The drone pilot training data includes the speed, movement distance, and angle of the drone, and the data set is visualized to unify the properties showing the same pattern into one and preprocess the properties showing the outliers. It is expected that the proposed big data-based profile can be used to predict and analyze the optimal movement path of an unmanned aerial vehicle.

Real-Time Comprehensive Assistance for Visually Impaired Navigation

  • Amal Al-Shahrani;Amjad Alghamdi;Areej Alqurashi;Raghad Alzahrani;Nuha imam
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.1-10
    • /
    • 2024
  • Individuals with visual impairments face numerous challenges in their daily lives, with navigating streets and public spaces being particularly daunting. The inability to identify safe crossing locations and assess the feasibility of crossing significantly restricts their mobility and independence. Globally, an estimated 285 million people suffer from visual impairment, with 39 million categorized as blind and 246 million as visually impaired, according to the World Health Organization. In Saudi Arabia alone, there are approximately 159 thousand blind individuals, as per unofficial statistics. The profound impact of visual impairments on daily activities underscores the urgent need for solutions to improve mobility and enhance safety. This study aims to address this pressing issue by leveraging computer vision and deep learning techniques to enhance object detection capabilities. Two models were trained to detect objects: one focused on street crossing obstacles, and the other aimed to search for objects. The first model was trained on a dataset comprising 5283 images of road obstacles and traffic signals, annotated to create a labeled dataset. Subsequently, it was trained using the YOLOv8 and YOLOv5 models, with YOLOv5 achieving a satisfactory accuracy of 84%. The second model was trained on the COCO dataset using YOLOv5, yielding an impressive accuracy of 94%. By improving object detection capabilities through advanced technology, this research seeks to empower individuals with visual impairments, enhancing their mobility, independence, and overall quality of life.

시각-언어 이동 에이전트를 위한 복합 학습 (Hybrid Learning for Vision-and-Language Navigation Agents)

  • 오선택;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권9호
    • /
    • pp.281-290
    • /
    • 2020
  • 시각-언어 이동 문제는 시각 이해와 언어 이해 능력을 함께 요구하는 복합 지능 문제이다. 본 논문에서는 시각-언어 이동 에이전트를 위한 새로운 학습 모델을 제안한다. 이 모델은 데모 데이터에 기초한 모방 학습과 행동 보상에 기초한 강화 학습을 함께 결합한 복합 학습을 채택하고 있다. 따라서 이 모델은 데모 데이터에 편향될 수 있는 모방 학습의 문제와 상대적으로 낮은 데이터 효율성을 갖는 강화 학습의 문제를 상호 보완적으로 해소할 수 있다. 또한, 제안 모델에서는 기존의 목표 기반 보상 함수들의 문제점을 해결하기 위해 설계된 새로운 경로 기반 보상 함수를 이용한다. 본 논문에서는 Matterport3D 시뮬레이션 환경과 R2R 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해, 제안 모델의 높은 성능을 입증하였다.

영상기반 자동항법을 위한 실시간 위치인식 및 지도작성 (Real-time Simultaneous Localization and Mapping (SLAM) for Vision-based Autonomous Navigation)

  • 임현;임종우;김현진
    • 대한기계학회논문집A
    • /
    • 제39권5호
    • /
    • pp.483-489
    • /
    • 2015
  • 본 논문에서는 넓은 지역에서의 영상기반 자동 항법을 위한 실시간 위치인식 및 지도작성 방법을 제안한다. 한 대의 카메라에서 입력된 영상으로부터 제안된 방법은 6 자유도 카메라 자세와 3 차원 특징점 위치를 연속적으로 계산한다. 제안된 방법은 넓은 지역을 주행하며 촬영된 영상에 적용하여 그 위치와 환경지도를 성공적으로 작성하였이다. 본 논문에서는 이진기술자(binary descriptor)와 수치-위상(metric-topological)지도 표현법을 사용하여 GPU 나 영상의 축소 없이 실시간 성능과 광범위한 지역에서의 회귀점 검출(loop detection)을 하였다. 제안된 방법은 여러 환경에서 촬영된 영상과, 해당 영상의 GPS 기준값과 비교하여 평가하였다.

A Study on the Impact of Slow Steaming on Containership Operations under the Carbon Intensity Indicator Regulation

  • Daesik Seo;Youngran Shin
    • 한국항해항만학회지
    • /
    • 제48권2호
    • /
    • pp.97-103
    • /
    • 2024
  • As there is growing concern about the environmental impact of greenhouse gas emissions from ships, the International Maritime Organization (IMO) has introduced several regulations targeting reductions in carbon dioxide emissions of 50% by 2050. This study pays particular attention to the carbon intensity indicator (CII) and investigates the impact of slow steaming, one of the short-term measures in the regulation, on containership operations. To this end, a dataset of 8 containerships with various ages and sizes was collected. Based on operation data in 2021, the CII ratings of the containerships were estimated in the business-as-usual scenario for the 2023-2030 period. Then, the speed reductions required to keep the minimum CII rating were calculated for individual containerships. Finally, working day losses resulting from the speed reductions were calculated. The findings in this study were threefold. First, it was found that containerships will undergo degradation in the CII rating every 3 or 4 years without slow steaming. Second, a speed reduction of 2 knots between 2023 and 2030 is required to keep the minimum CII rating. Finally, speed reductions result in the loss of as many as 6 or 7 working days per year.

달 탐사 로버의 적응형 움직임 가중치에 따른 스테레오 준직접방식 비주얼 오도메트리 (Stereo Semi-direct Visual Odometry with Adaptive Motion Prior Weights of Lunar Exploration Rover)

  • 정재형;허세종;박찬국
    • 한국항공우주학회지
    • /
    • 제46권6호
    • /
    • pp.479-486
    • /
    • 2018
  • 위성항법시스템이 없는 달 표면에서 탐사 로버의 신뢰성 있는 항법성능을 확보하기 위해 관성측정장치나 카메라와 같은 추가적인 센서를 활용한 항법 알고리즘이 필수적이다. 일례로 미국의 화성 탐사 로버에 스테레오 카메라를 이용한 비주얼 오도메트리(VO)가 성공적으로 사용된 바 있다. 본 논문에서는 달 유사환경의 스테레오 흑백 이미지를 입력받아 달 탐사 로버의 6 자유도 움직임을 추정하였다. 제안하는 알고리즘은 희소 이미지 정렬 기반의 준직접방식 VO를 통해 연속된 이미지간의 상대 움직임을 추정한다. 또한 비선형성에 취약한 직접방식 VO를 보완하고자 최적화 시 로버의 움직임에 따른 가중치를 비용 함수에 고려하였고, 그 가중치는 이전 단계에서 계산된 포즈의 선형 함수로 제안한다. 본 논문에서 제안하는 로버의 움직임에 따른 가중치를 통해 실제 달 환경의 특성을 반영하는 토론토 대학의 달 유사환경 데이터셋에서 VO 성능이 향상됨을 확인하였다.

LVLN: 시각-언어 이동을 위한 랜드마크 기반의 심층 신경망 모델 (LVLN : A Landmark-Based Deep Neural Network Model for Vision-and-Language Navigation)

  • 황지수;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권9호
    • /
    • pp.379-390
    • /
    • 2019
  • 본 논문에서는 시각-언어 이동 문제를 위한 새로운 심층 신경망 모델인 LVLN을 제안한다. LVLN 모델에서는 자연어 지시의 언어적 특징과 입력 영상 전체의 시각적 특징들 외에, 자연어 지시에서 언급하는 주요 장소와 랜드마크 물체들을 입력 영상에서 탐지해내고 이 정보들을 추가적으로 이용한다. 또한 이 모델은 자연어 지시 내 각 개체와 영상 내 각 관심 영역, 그리고 영상에서 탐지된 개별 물체 및 장소 간의 서로 연관성을 높일 수 있도록 맥락 정보 기반의 주의 집중 메커니즘을 이용한다. 그뿐만 아니라, LVLN 모델은 에이전트의 목표 도달 성공율을 향상시키기 위해, 목표를 향한 실질적인 접근을 점검할 수 있는 진척 점검기 모듈도 포함하고 있다. Matterport3D 시뮬레이터와 Room-to-Room (R2R) 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해, 본 논문에서 제안하는 LVLN 모델의 높은 성능을 확인할 수 있었다.

언어-기반 제로-샷 물체 목표 탐색 이동 작업들을 위한 인공지능 기저 모델들의 활용 (Utilizing AI Foundation Models for Language-Driven Zero-Shot Object Navigation Tasks)

  • 최정현;백호준;박찬솔;김인철
    • 로봇학회논문지
    • /
    • 제19권3호
    • /
    • pp.293-310
    • /
    • 2024
  • In this paper, we propose an agent model for Language-Driven Zero-Shot Object Navigation (L-ZSON) tasks, which takes in a freeform language description of an unseen target object and navigates to find out the target object in an inexperienced environment. In general, an L-ZSON agent should able to visually ground the target object by understanding the freeform language description of it and recognizing the corresponding visual object in camera images. Moreover, the L-ZSON agent should be also able to build a rich spatial context map over the unknown environment and decide efficient exploration actions based on the map until the target object is present in the field of view. To address these challenging issues, we proposes AML (Agent Model for L-ZSON), a novel L-ZSON agent model to make effective use of AI foundation models such as Large Language Model (LLM) and Vision-Language model (VLM). In order to tackle the visual grounding issue of the target object description, our agent model employs GLEE, a VLM pretrained for locating and identifying arbitrary objects in images and videos in the open world scenario. To meet the exploration policy issue, the proposed agent model leverages the commonsense knowledge of LLM to make sequential navigational decisions. By conducting various quantitative and qualitative experiments with RoboTHOR, the 3D simulation platform and PASTURE, the L-ZSON benchmark dataset, we show the superior performance of the proposed agent model.

위성 영상 분류 기법 선정을 위한 의사 결정 지원 시스템 (Decision support system on selection of classification method for remote sensing imagery)

  • 황보주원;유기윤;김용일
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 GIS/RS 공동 춘계학술대회 논문집
    • /
    • pp.341-346
    • /
    • 2004
  • 본 연구에서는 사례기반추론(case-based reasoning)을 기본으로 하여 실무자의 분류 기법 또는 분류 구조 결정을 돕는 의사 결정 지원 시스템의 모델을 제시한다. 주요한 네 가지 고려 항목은 자료종류(dataset), 위치(location), 기후(climate), 그리고 분류항목(class)이며 사용자는 이들 네 항목에 대해 적합한 값을 선택하게 된다. 본 시스템은 색인화(indexing) 규칙에 따라 관계형 데이터베이스에 저장된 사례들을 추출하여 제시하며 사용자는 그 중 가장 높은 일치도를 보인 사례들을 참고할 수 있다. 본 연구에서는 위계구조를 통해 다양한 분류 조건을 스크린 상에서 선택할 수 있게 함으로써 사용자가 이에 내재된 논리를 분류 구조의 설계에 반영할 수 있게 한다. 또한 Statistics 기능을 통해 여러 사례의 항목당 분포를 사용자가 검토할 수 있게 함으로써 가장 적합한 사례를 의사결정 지원 시스템과의 피드백을 통해 찾아낼 수 있게 해준다. 이밖에 분류 조건을 변화 시켜가면서 상황의 변화를 참고할 수 있도록 Navigation 기능을 고안하였다.

  • PDF