• 제목/요약/키워드: 분할 모델

검색결과 2,285건 처리시간 0.033초

딥러닝 모델을 이용한 2D 레고 조립 설명서 생성 (Generating 2D LEGO Instruction Manual Using Deep Learning Model)

  • 안종석;이승현;김철희;강동희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.481-484
    • /
    • 2024
  • 본 논문에서는 레고(LEGO®) 조립 설명서를 생성하기 위해 딥러닝을 이용한 조립 및 설명서 생성 시스템을 제안한다. 이 시스템은 사용자가 제공한 단일 이미지를 기반으로 레고 조립 설명서를 자동 생성한다. 해당 시스템은 딥러닝 기반 이미지 분할 기술을 활용하여 물체를 배경으로부터 분리하고 이를 통해 조립 설명서를 생성하는 과정을 포함하며, 조립을 위한 알고리즘을 새로 설계하였다. 이 시스템은 기존 레고 제품의 한계를 극복하고, 사용자에게 주어진 부품으로 다양한 모델을 자유롭게 조립할 수 있게 한다. 또한, 복잡한 레고 조립 과정을 간소화하고, 조립의 장벽을 낮추는 데 도움을 준다.

  • PDF

의미론적 분할 기반 모델을 이용한 조선소 사외 적치장 객체 자동 관리 기술 (Segmentation Foundation Model-based Automated Yard Management Algorithm)

  • 정민규;노정현;김장현;하성헌;강태선;이병학;강기룡;김준현;박진선
    • 스마트미디어저널
    • /
    • 제13권2호
    • /
    • pp.52-61
    • /
    • 2024
  • 조선소에서는 사외 적치장의 관리를 위해 일정 주기로 Unmanned Aerial Vehicle (UAV)을 이용해 항공영상을 획득하고, 이를 사람이 판독하여 적치장 현황을 파악한다. 이러한 방법은 넓은 면적의 사외 적치장 현황을 파악하는 데 상당한 시간과 인력을 요구한다. 본 논문에서는 이러한 문제점을 해결하고 정확한 사외 적치장 현황을 파악하기 위해 사전 학습된 의미론적 분할 기반 모델(Foundation Model)을 활용한 자동 관리 기술을 제안한다. 또한, 조선소 사외 적치장의 경우 관련 부품이나 장비를 포함한 공개 데이터셋이 충분하지 않기 때문에, 의미론적 분할 기반 모델에 필요한 객체 프롬프트(Prompt)를 생성하기 위한 소규모 사외 적치장 객체 데이터셋을 직접 구축하였다. 이를 이용해 객체 검출기를 소규모 데이터셋에 추가 학습하여 초기 객체 후보를 추출하고, 의미론적 분할 기반 모델인 Segment Anything Model (SAM)의 프롬프트로 활용해 정확한 의미론적 분할 결과를 얻는다. 더 나아가, 지속적인 적치장 데이터셋 수집을 위해 SAM을 활용한 훈련 데이터 생성 파이프라인을 제안한다. 본 연구에서 제안한 방법은 기존의 의미론적 분할 방법과 비교하여 평균적 4.00%p, SegFormer에 비해 5.08%p 높은 성능을 달성하였다.

자동 변형 모델을 이용한 다중 물체 검출 및 추적 (A Multiple Object Detection and Tracking Using Automatic Deformable Model)

  • 우장명;김성동;최기호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.290-293
    • /
    • 2003
  • 다중 물체 추적은 움직이는 물체를 추출하고 검출된 정보와 물체 정보를 이용하여 움직임 궤도률 추적하는 것이다. 따라서 정확한 움직임 추적이 수행되려면 효율적인 물체의 추출이 선행 되어 져야 한다. 일반적으로 영상 분할 알고리즘은 다양한 증류의 영상에 대한 물체의 수학적 모델이 찌대로 설정되어 있지 않기 때문에 물체를 정확하게 분리해 내기 어렵다. 그러나 물체의 추출에 주로 처리 속도가 빠른 배경영상을 이용한 차(difference) 영상 기법과 반 자동 영상분할인 Snake Model이 갖는 Active Contour 알고리즘과 같이 물체 추출 과정에서 물체의 정의니 semantic 정보를 부여 한다면 개선된 영상 분할의 결과를 얻을 수 있다. 따라서 차 영상 기법과 semantic 정보를 가진 영상분할 알고리즘은 동영상에서 움직임 물체의 VOP(Video Object Plane)를 생성하는 매우 현실적인 방법이다. 본 논문에서는 영상의 상위 레벨Semantic 정보를 이용하기 위해 변형 Snake Model를 이용한 영상분할 방법을 이용하여 영상을 추출한다. 추출된 물체는 윤곽선(곡선) 정보와 함께 에지 성분의 기울기에서 얻은 특징 점을 이용하여 물체를 추적해 나간다.

  • PDF

모발 정밀검사에서 탈모 진단을 위한 머리카락 검출 방법 (Method of Hair Detection for Diagnosis of Hair loss in Phototrichogram)

  • 김보민;민재은;박병철;최상일
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.221-222
    • /
    • 2022
  • 본 논문에서는 모발 정밀검사(Phototrichogram)를 통해 일정 간격을 두고 촬영된 환자의 모발 두피 사진을 이용하여 머리카락 검출 및 머리카락의 개수 변화 추이에 따른 환자의 탈모 진단에 도움을 줄 방법을 제안하였다. 모발 정밀검사를 진행하여 촬영된 환자의 모발 사진으로부터 딥러닝 기반의 영상 분할 기법(Image Segmentation)의 하나인 DetectoRS 모델을 활용하여 머리카락을 자동 검출한다. 실험 결과 DetectoRS 모델의 분할 성능은 74.74%로 효과적으로 머리카락을 검출하였음을 확인할 수 있었다.

  • PDF

편광 셀프어텐션의 공간정보 강조 모듈을 결합한 HRNet 모델 설계 및 구현 (Design and Implementation of HRNet Model Combined with Spatial Information Attention Module of Polarized Self-attention)

  • 김진성;박준;정세훈;심춘보
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.485-487
    • /
    • 2023
  • 컴퓨터 비전의 하위 태스크(Task)인 의미론적 분할(Semantic Segmentation)은 자율주행, 해상에서 선박찾기 등 다양한 분야에서 연구되고 있다. 기존 FCN(Fully Conovlutional Networks) 기반 의미론적 분할 모델은 다운샘플링(Dowsnsampling)과정에서 공간정보의 손실이 발생하여 정확도가 하락했다. 본 논문에서는 공간정보 손실을 완화하고자 PSA(Polarized Self-attention)의 공간정보 강조 모듈을 HRNet(High-resolution Networks)의 합성곱 블록 사이에 추가한다. 실험결과 파라미터는 3.1M, GFLOPs는 3.2G 증가했으나 mIoU는 0.26% 증가했다. 공간정보가 의미론적 분할 정확도에 영향이 미치는 것을 확인했다.

터널 막장 3차원 지형모델 상에서의 불연속면 자동 매핑을 위한 딥러닝 기법 적용 방안 (Deep Learning Approach for Automatic Discontinuity Mapping on 3D Model of Tunnel Face)

  • 추엔 팜;신휴성
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.508-518
    • /
    • 2023
  • 이 논문은 LiDAR 스캔 또는 사진측량 기술에 의해 재구성된 3D 디지털 모델을 기반으로 터널 벽면의 불연속면을 자동으로 매핑하는 새로운 접근 방식을 제안한다. 본 제안에서는 U-Net이라 불리는 딥러닝 시맨틱 영역분할 모델을 사용하며, 터널 막장면의 3D 지형 모델에서 불연속면 영역을 식별해 낸다. 제안된 딥러닝 모델은 투영된 RGB 이미지, 면의 깊이 이미지 및 국부적인 면의 표면 속성 이미지(즉, 법선 벡터 및 곡률 이미지)를 포함한 다양한 정보를 종합 학습하여 기본 3차원 이미지에서 불연속면 영역을 효과적으로 분할한다. 이후 영역분할 결과는 면의 깊이 맵과 투영 행렬을 사용하여 3D 모델로 다시 투영시키고, 3D 공간 내에서 불연속면의 위치 및 범위를 정확하게 표현한다. 영역분할 모델의 성능은 영역 분할된 결과를 해당 지면 실측 값과 비교함으로써 평가하였으며, IoU(intersection-over-union) 값이 약 0.8 정도로 나타나 영역분할 결과의 높은 정확성을 확인하였다. 여전히 학습데이터가 제한적 이었음에도 불구하고, 제안 기법은 3D 모델의 점군 데이터를 불연속면의 유사군으로 그룹화하기 위해 전 막장면의 법선 벡터와 클러스터링과 같은 비지도 학습기반 알고리즘에만 의존하던 기존 접근 방식의 한계의 극복 가능성을 보여주었다.

중학교 수학 교사들의 분수나눗셈에 대한 이해 (Middle School Mathematics Teachers' Understanding of Division by Fractions)

  • 김영옥
    • 대한수학교육학회지:수학교육학연구
    • /
    • 제17권2호
    • /
    • pp.147-162
    • /
    • 2007
  • 본 논문은 교수를 위한 중학교 수학교사들의 수학적 지식을 조사한 저자의 학위논문의 일부분으로써, 19명의 한국 및 중국 중학교 수학교사들의 분수 나눗셈(division by fractions)에 대한 개념적 실생활 모델을 조사, 분석하였다. 분수 나눗셈에 대한 이론적 배경을 제공함과 동시에, 실제 현장 교사들이 가지고 있는 분수 나눗셈에 대한 개념적 이해를 조사, 분석함으로써 분수 나눗셈을 효과적으로 가르치기 위한 교사 지식의 구체적 예들을 제공하고 있다. 본 연구에서는, 연구에 참가한 교사들 대부분이 분수 나눗셈을 "역수 곱하기(invert and multiply)"와 같은 전통적 알고리즘에 기초하여 이해하고 있었으며, 분수 나눗셈의 의미를 실생활 모델로 나타내는 교수과제를 성공적으로 수행한 교사는 단 두 명에 뿐이었다. 이러한 현상은 그 교사들 대부분이 가지고 있는 범자연수 나눗셈 모델이 분할 모델 (partitive model)로 제한되어 있기 때문이었다. 하지만, 또 다른 흥미로운 연구 결과는, 교사가 분할모델 만을 가지고 있더라도, 그 모델의 개념적 구조(conceptual structure)를 깊이 이해하고 있을 때는, 그 기본적 개념 구조를 변형하여 분수 나눗셈의 실생활 모델을 응용해 내는 사고의 융통성을 보였다. 본 논문에서는 이러한 교사들의 성공적 사례뿐만 아니라, 주어진 교수 과제를 수행하는데 실패한 교사들의 인터뷰결과들도 분석, 해석하여 제공하였다.

  • PDF

혀의 색상 분석에 의한 새로운 한방 설진(舌診) 모델 개발 (A development of a new tongue diagnosis model in the oriental medicine by the color analysis of tongue)

  • 최민;이민택;이규원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.801-804
    • /
    • 2013
  • 미각의 종류별 구획에 따른 설진 모델을 제안한다. 시스템의 전체 구성은 혀 영상획득, 혀 영역 검출, 혀 영역 분할, 분할 영역의 색상분포 검출, 이상 유무 판별로 구성된다. 혀의 DB는 정상 및 비정상 혀로 분류되었으며 실제 한방병원에 내원하는 환자들의 혀 사진으로 구축하였다. 혀 영역으로부터 짠맛, 신맛, 단맛, 쓴맛의 네 가지 영역으로 나누어 분할하고, HSI 컬러모델을 이용하여 색상분석을 시행하였다. 이때, 주변 조도의 영향을 최소화하기 위하여 I(Intensity)값을 제외한 H(Hue)와 S(Saturation) 성분의 히스토그램을 이용하여 색상을 분석하였다. 제안하는 색상분석 진단모델과 한의학 전문의의 진단 결과를 비교하여 미각별 영역의 이상 유무를 판단하였다. 제안하는 설진 알고리즘으로 판단한 결과 87.5%가 전문의의 분류의 결과 일치함을 확인하였다.

  • PDF

콘크리트 라이닝 균열 분할 딥러닝 모델 평가 방법 (An evaluation methodology for cement concrete lining crack segmentation deep learning model)

  • 함상우;배수현;이임평;이규필;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제24권6호
    • /
    • pp.513-524
    • /
    • 2022
  • 터널을 비롯한 여러 가지 기반시설물에 발생한 콘크리트 균열을 영상과 딥러닝 기반으로 자동 탐지하는 연구가 최근 활발히 이루어지고 있다. 이러한 연구성과를 실제 현장에 적용하려면 딥러닝 모델의 신뢰성을 설명할 수 있어야한다. 본 연구에서는 선형성이 강한 균열의 기하적인 특성을 고려했을 때 화소 기반으로 계산하는 기존 평가지표가 충분치 않다는 점을 지적하며, 균열 분할 딥러닝 모델의 성능을 더 합리적으로 설명할 수 있는 다른 평가지표를 제시하고 비교 분석한다. 먼저 선형 객체의 유사성을 측정할 수 평가방법을 제시한다. 구체적으로는 기준 데이터에 허용 버퍼(tolerance buffer)를 부여하여 평가하는 방법을 설계, 구현, 검증한다. 실험 결과 본 연구에서 제안하는 방법은 균열 분할 딥러닝 모델 평가시 기존 대비 과대평가 또는 과소평가 문제를 해결할 수 있었으며, 화소 기반 성능 평가 지표에 비해 균열 분할 딥러닝 모델의 성능을 더 잘 설명할 것으로 기대한다.

강건한 음향모델을 위한 모델의 상태와 문맥환경에 관한 연구 (A Study on Context Environment and Model State for Robustness Acoustic Models)

  • 최재영;오세진;황도삼
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.366-369
    • /
    • 2003
  • 본 연구에서는 강건한 문맥의존 음향모델을 작성하기 위한 기초적인 연구로서 문맥환경과 상태수의 변화에 따른 음향모델의 성능을 고찰하고자 한다. 음성은 시간함수로 표현되며 음절, 단어, 연속음성을 발성할때 자음과 모음에 따라 발성시간에 차이가 있으며 음성인식의 최소 인식단위로 널리 사용되는 음소의 앞과 뒤에 오는 문맥환경에 따라 인식성능에 많은 차이를 보이고 있다. 따라서 본 연구에서는 시간의 변화(상태수의 변화)와 상태분할 과정에서 문맥환경의 변화를 고려하여 다양한 형태의 문맥의존 음향모델을 작성하였다. 모델학습은 음소결정트리 기반 SSS 알고리즘(Phonetic Decision Tree-based Successive State Splitting: PDT-555)을 이용하였다 PDT-SSS 알고리즘은 미지의 문맥정보를 해결하기 위해 문맥방향과 시간방향으로 목표 상태수에 도달할 때까지 상태분할을 수행하여 모델을 작성하는 방법이다. 본 연구에서 강건한 문맥의존 음향모델을 학습하기 위한 방법의 유효성을 확인하기 위해 국어공학센터의 452 단어를 대상으로 음소와 단어인식 실험을 수행하였다. 실험결과, 음성의 시간변이에 따른 모델의 상태수와 각 음소의 문맥환경에 따라 인식성능의 변화를 고찰할 수 있었다. 따라서 본 연구는 향후 음성인식 시스템의 강건한 문맥의존 음향모델을 작성하는데 유효할 것으로 기대된다.

  • PDF