• 제목/요약/키워드: Deep-Learning

검색결과 5,506건 처리시간 0.03초

Back TranScription(BTS)기반 데이터 구축 검증 연구 (A Study on Verification of Back TranScription(BTS)-based Data Construction)

  • 박찬준;서재형;이설화;문현석;어수경;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.109-117
    • /
    • 2021
  • 최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다.

Hellinger 거리 IoU와 Objectron 적용을 기반으로 하는 객체 감지 (Object Detection Based on Hellinger Distance IoU and Objectron Application)

  • 김용길;문경일
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권2호
    • /
    • pp.63-70
    • /
    • 2022
  • 2D 객체 감지 시스템은 최근 몇 년 동안 심층 신경망과 대규모 이미지 데이터세트의 사용으로 크게 개선되었지만, 아직도 범주 내에서 데이터 부족, 다양한 외관 및 객체 형상 때문에 자율 탐색 등과 같은 로봇 공학과 관련된 응용에서 2D 물체 감지 시스템은 적절하지 않다. 최근에 소개되고 있는 구글 Objectron 또한 증강 현실 세션 데이터를 사용하는 새로운 데이터 파이프라인이라는 점에서 도약이라 할 수 있지만, 3D 공간에서 2D 객체 이해라는 측면에서 마찬가지로 한계가 있다. 이에 본 연구에서는 더 성숙한 2D 물체 감지 방법을 Objectron에 도입하는 3D 물체 감지 시스템을 나타낸다. 대부분의 객체 감지 방법은 경계 상자를 사용하여 객체 모양과 위치를 인코딩한다. 본 작업에서는 가우스 분포를 사용하여 객체 영역의 확률적 표현을 탐색하는데, 일종의 확률적 IoU라 할 수 있는 Hellinger 거리를 기반으로 하는 가우스 분포에 대한 유사성 측도를 제시한다. 이러한 2D 표현은 모든 객체 감지기에 원활하게 통합할 수 있으며, 실험 결과 데이터 집합에서 주석이 달린 분할 영역에 더 가까워서 Objectron의 단점이라 할 수 있는 3D 감지 정확도를 높일 수 있다.

개발제한구역 모니터링체계 개선방안 연구 (A study on The Improvement Plan of The Restricted Development Zone Monitoring system)

  • 이세원
    • 지적과 국토정보
    • /
    • 제52권1호
    • /
    • pp.17-36
    • /
    • 2022
  • 본 연구의 목적은 현행 개발제한구역 단속 및 관리체계의 문제점을 진단하고 데이터 기반 모니터링 체계로 전환할 수 있도록 구축방안을 마련하는 것이다. 개발제한구역은 타 용도지역지구와 달리 최소한의 유지 외 모든 개발행위를 금지하고 지자체에서 엄격히 단속 및 관리해야 하는 구역이다. 그러나 현재의 개발제한구역 관리체계는 지자체별 여건에 따라 분산 운영되고, 설문 결과와 같이 전체 개발제한구역의 변화를 모니터링하기보다 민원(신고)에 의존하거나 단속업무 수행에 어려움을 겪는 등 데이터 기반의 모니터링체계를 필요로 하고 있다. 특히 본 연구에서는 AI 기반 모니터링체계를 도입하여 국토교통부에서 매년 정기적 시점(월별·분기별)을 두고 동일한 단속 기준으로 전국 권역별 변화를 탐지한 결과를 지자체에 송부하고 지자체에서는 단속 결과를 입력하면서 신뢰할 수 있는 개발제한구역 관리현황 통계정보가 생산될 수 있는 체계로의 전환 방법을 구체적으로 제안하였다. 이러한 방법론 제안을 위해 첫째, 지자체와 관련 전문가를 대상으로 설문조사 및 인터뷰를 수행하였다. 설문 결과 현장 단속과 인허가 관련 행정업무에 어려움을 겪고 있으며, AI 기반 모니터링체계 도입에 대해서는 긍정적 답변이 우세하였다. 둘째, AI 영상분석을 통한 객체 검출 방법론을 실증 지자체에 적용한 사례를 분석하여 모니터링체계 도입에 따른 단속업무 효율화 방안을 제안하였다. 셋째, (현(現))개발제한구역관리정보시스템의 고도화를 기반으로 한 개발제한구역 모니터링체계 구축방안을 마련하였다. 지자체업무 수요에 기반해 드론 촬영 및 분석, 모바일 단속지원체계 등 필요한 서비스들이 지원될 수 있도록 프레임워크를 구성하였다. 이러한 모니터링체계는 향후 주기적 단속과 관리가 필요한 토지를 대상으로 확대 적용이 가능하며 본 연구에서는 이를 실현하기 위한 방법론과 정책을 제안하고자 하였다.

학습패치 크기와 ConvNeXt 적용이 CycleGAN 기반 위성영상 모의 정확도에 미치는 영향 (The Effect of Training Patch Size and ConvNeXt application on the Accuracy of CycleGAN-based Satellite Image Simulation)

  • 원태연;조수민;어양담
    • 한국측량학회지
    • /
    • 제40권3호
    • /
    • pp.177-185
    • /
    • 2022
  • 본 연구에서는 딥러닝을 통해 고해상도 광학 위성영상에 동종센서로 촬영한 영상을 참조하여 폐색 영역을 복원하는 방법을 제안하였다. 패치 단위로 분할된 영상에서 원본 영상의 화소 분포를 최대한 유지하며 폐색 영역을 모의한 영상과 주변 영상의 자연스러운 연속성을 위해 ConvNeXt 블록을 적용한 CycleGAN (Cycle Generative Adversarial Network) 방법을 사용하여 실험을 진행하였고 이를 3개의 실험지역에 대해 분석하였다. 또한, 학습패치 크기를 512*512화소로 하는 경우와 2배 확장한 1024*1024화소 크기의 적용 결과도 비교하였다. 서로 특징이 다른 3개의 지역에 대하여 실험한 결과, ConvNeXt CycleGAN 방법론이 기존의 CycleGAN을 적용한 영상, Histogram matching 영상과 비교하여 개선된 R2 값을 보여줌을 확인하였다. 학습에 사용되는 패치 크기별 실험의 경우 1024*1024화소의 패치를 사용한 결과, 약 0.98의 R2값이 산출되었으며 영상밴드별 화소 분포를 비교한 결과에서도 큰 패치 크기로 학습한 모의 결과가 원본 영상과 더 유사한 히스토그램 분포를 나타내었다. 이를 통해, 기존의 CycleGAN을 적용한 영상 및 Histogram matching 영상보다 발전된 ConvNeXt CycleGAN을 사용할 때 원본영상과 유사한 모의 결과를 도출할 수 있었고, 성공적인 모의를 수행할 수 있음을 확인하였다.

위성기반 증발산량 및 토양수분량 산정 국내 연구동향 (Research Status of Satellite-based Evapotranspiration and Soil Moisture Estimations in South Korea)

  • 최가영;조영현
    • 대한원격탐사학회지
    • /
    • 제38권6_1호
    • /
    • pp.1141-1180
    • /
    • 2022
  • 최근 수문 및 수자원 분야에서 위성영상의 활용성이 높아짐에 따라 관련 전용 위성 개발연구와 연계하여 위성을 활용한 증발산량과 토양수분량 산정 연구의 필요성이 강조되고 있다. 본 연구에서는 이러한 위성을 기반으로 증발산량 및 토양수분량의 국내 연구현황과 그 산정 방법론을 조사하여 현재까지의 연구동향을 파악하고자 하였다. 국내 연구현황을 세부 방법론 별로 살펴본 결과 일반적으로 증발산량의 경우는 Surface Energy Balance Algorithm for Land (SEBAL), Mapping Evapotranspiration with Internalized Calibration (METRIC)과 같은 에너지수지 기반 모형과 Penman-Monteith (PM) 및 Priestley-Taylor (PT) 산출식을 기반으로 산정되었으며, 토양수분량의 경우 능동형(AMSR-E, AMSR2, MIRAS, SMAP) 및 수동형(ASCAT, SAR)와 같은 마이크로파 센서를 통한 산정이 주를 이루었다. 통계적 측면에서는 증발산량 및 토양수분량 공통적으로 회귀식 및 인공지능을 이용한 산출사례를 찾을 수 있었다. 또한 위성기반 자료들을 이용한 Evaporative Stress Index (ESI), Temperature-Vegetation Dryness Index (TVDI), Soil Moisture Deficit Index (SMDI) 등의 다양한 지표를 산정하여 가뭄 특성파악에 적용한 연구 사례도 다수 있었으며, 지표모형(Land Surface Model, LSM)을 기반으로 하여 위성 다중센서에서 얻을 수 있는 주요 자료들을 활용해 증발산량과 토양수분량의 수문순환인자를 산출하기도 하였다. 본 논문에서는 이렇게 기존 연구사례 조사 및 내용파악 과정을 통해 위성을 활용한 주요 세부 방법론을 비교·검토 제시함으로써 관련 연구분야 기준 참고자료로의 활용 및 향후 위성기반 관련 수문순환 자료 산출 고도화 연구의 초석을 다지고자 한다.

YOLOv5와 YOLOv7 모델을 이용한 해양침적쓰레기 객체탐지 비교평가 (A Comparative Study on the Object Detection of Deposited Marine Debris (DMD) Using YOLOv5 and YOLOv7 Models)

  • 박강현;윤유정;강종구;김근아;최소연;장선웅;박수호;공신우;곽지우;이양원
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1643-1652
    • /
    • 2022
  • 해양생태계 및 수산자원, 해상안전에 부정적인 영향을 미치는 해양침적쓰레기는 주로 음파탐지기, 인양틀 및 잠수부를 통해 탐지되고 있다. 시간과 비용을 고려하여 최근에는 수중영상과 인공지능을 결합한 방법이 시도되고 시작했다. 본 연구에서는 효율적이고 정확한 해양침적쓰레기 탐지를 위하여, 수중영상과 딥러닝 객체탐지 모델인 You Only Look Once Version 5 (YOLOv5)와 You Only Look Once Version 7 (YOLOv7)을 학습 및 비교평가를 수행하였다. 유리, 금속, 어망, 타이어, 나무, 플라스틱 등의 객체탐지에 있어, 두 모델 모두 0.85 이상의 Mean Average Precision (mAP@0.5)를 기록하였다. 향후 영상자료 용량이 충분해지면, 보다 객관적인 성능평가 및 모델 개선이 가능할 것으로 사료된다.

데이터 확장을 통한 토지피복분류 U-Net 모델의 성능 개선 (The Performance Improvement of U-Net Model for Landcover Semantic Segmentation through Data Augmentation)

  • 백원경;이명진;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1663-1676
    • /
    • 2022
  • 최근 딥러닝을 활용한 토지피복분류 기법 연구가 다수 수행되고 있다. 그런데 양질의 토지피복 학습데이터를 충분하게 구축되지 못하여 성능이 저하되는 양상이 확인되었다. 이에 따라 본 연구에서는 데이터 확장 기법의 적용을 통한 토지피복분류 성능의 향상을 확인하였다. 분류 모델로는 U-Net이 활용되었으며 AI Hub에서 제공하는 토지피복 위성 이미지 자료를 연구자료로 활용하였다. 원본 데이터로 학습한 모델과 데이터 확장 기법이 적용된 데이터로 학습한 모델의 픽셀 정확도는 각각 0.905와 0.923이었으며 평균 F1 스코어는 각각 0.720과 0.775로 데이터 확장 기법을 적용하였을 때가 보다 우수한 성능을 나타내는 사실을 확인할 수 있었다. 또한 원본 학습데이터를 활용하여 학습한 모델의 경우 건물, 도로, 논, 밭, 산림, 비대상 지역 클래스에 대한 F1 스코어가 0.770, 0.568, 0.733, 0.455, 0.964 그리고 0.830이었으며, 데이터 확장을 적용하였을 때에 각 클래스에 대한 F1 스코어는 각각 0.838, 0.660, 0.791, 0.530, 0.969 그리고 0.860으로 모든 클래스에 대해 데이터 확장이 성능향상에 유효하다는 사실을 확인하였다. 또한, 클래스 균형에 대한 고려없이 데이터 확장을 적용했음에도 불구하고 데이터 불균형에 의한 클래스별 성능 왜곡을 완화할 수 있다는 사실을 확인할 수 있었다. 이는 절대적인 학습데이터의 양이 증가했기 때문이라 판단된다. 본 연구 결과는 다양한 영상 처리 분야에서 데이터 확장 기법의 중요성과 효과를 증명하는 기반 자료의 역할을 수행할 것으로 기대한다.

도시침수 모의 기술 국내 연구동향 리뷰: 2001-2022 (A review on urban inundation modeling research in South Korea: 2001-2022)

  • 이승수;김보미;최현진;노성진
    • 한국수자원학회논문집
    • /
    • 제55권10호
    • /
    • pp.707-721
    • /
    • 2022
  • 본 총설연구에서는 도시침수 모의 기술의 체계와 발전 과정을 정리하고, 주요 성과와 한계점을 파악하여 향후 연구 방향과 도전 과제를 제시하였다. 이를 위해 2000년대 이후 국내 주요 학술논문집에 수록된 도시침수 모의 관련 논문 160여편을 분석하여 연구의 핵심 주제와 내용을 살펴본 후, 물리 및 데이터 기반 모형의 침수모의 세부 방법론별로 기술의 발전 현황에 대해 정리하였다. 또한, 국내 도시침수 모의 기술의 활용목적별 동향, 국외 및 연관 분야 연구동향에 대해서도 분석하였다. 국내 도시침수 모의 연구에서 Storm Water Management Model (SWMM) 모형을 활용하는 비율이 60%를 넘는 것으로 조사되었으며, 이중 배제(dual drainage)의 도시침수 물리 과정을 상세히 해석하는 국내 기술에 대한 연구가 필요한 것으로 판단되었다. 한편, 딥러닝(deep learning) 등 데이터 기반 모의 기술은 도시침수 해석의 새로운 분야로 자리매김하였다. 다만, 모형 훈련을 위한 극한기상조건에 대한 침수자료는 관측 만으로 확보할 수 없으므로, 고정확도 물리 모형과 데이터 기반 모형 연구는 상호보완적으로 진행되어야 할 필요가 있다. 도시침수 모의 기술은 인공지능이나 IoT, 메타버스 등 타 분야 신기술과의 접목이 활발히 이루어지고 있으며, 기후 위기 적응과 재해 피해 저감을 위해 지속적인 사회적 투자와 융합 연구가 필요한 분야로 판단된다.

연속파 레이다를 활용한 이진 신경망 기반 사람 식별 및 동작 분류 시스템 설계 및 구현 (Design and Implementation of BNN based Human Identification and Motion Classification System Using CW Radar)

  • 김경민;김성진;남궁호정;정윤호
    • 한국항행학회논문지
    • /
    • 제26권4호
    • /
    • pp.211-218
    • /
    • 2022
  • 연속파 레이다는 카메라나 라이다와 같은 센서에 비해서 안정성과 정확성이 보장된다는 장점이 있다. 또한 이진 신경망은 다른 딥러닝 기술에 비해서 메모리 사용량과 연산 복잡도를 크게 줄일 수 있는 특징이 있다. 따라서 본 논문에서는 연속파 레이다와 이진 신경망 기반 사람 식별 및 동작 분류 시스템을 제안한다. 연속파 레이다 센서를 통해 수신된 신호를 단시간 푸리에 변환함으로써 스펙트로그램을 생성한다. 이 스펙트로그램을 기반으로 레이다를 향해 사람이 다가오는지 감지하는 알고리즘을 제안한다. 더불어, 최적화된 이진 신경망 모델을 설계하여 사람 식별 90.0%, 동작 분류 98.3%의 우수한 정확도를 지원할 수 있음을 확인하였다. 이진 신경망 연산을 가속하기 위해 FPGA (field programmable gate array)를 이용하여 이진 신경망 연산에 대한 하드웨어 가속기를 설계하였다. 해당 가속기는 1,030개의 로직, 836개의 레지스터, 334.906 Kbit의 블록 메모리를 사용하여 구현되었고, 추론에서 결과 전송까지 총 연산 시간이 6 ms로 실시간 동작이 가능함을 확인하였다.

결합된 파라메트릭 활성함수를 이용한 완전연결신경망의 성능 향상 (Performance Improvement Method of Fully Connected Neural Network Using Combined Parametric Activation Functions)

  • 고영민;이붕항;고선우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.1-10
    • /
    • 2022
  • 완전연결신경망은 다양한 문제를 해결하는데 널리 사용되고 있다. 완전연결신경망에서 비선형활성함수는 선형변환 값을 비선형 변환하여 출력하는 함수로써 비선형 문제를 해결하는데 중요한 역할을 하며 다양한 비선형활성함수들이 연구되었다. 본 연구에서는 완전연결신경망의 성능을 향상시킬 수 있는 결합된 파라메트릭 활성함수를 제안한다. 결합된 파라메트릭 활성함수는 간단히 파라메트릭 활성함수들을 더함으로써 만들어낼 수 있다. 파라메트릭 활성함수는 입력데이터에 따라 활성함수의 크기와 위치를 변환시키는 파라미터를 도입하여 손실함수를 최소화하는 방향으로 최적화할 수 있는 함수이다. 파라메트릭 활성함수들을 결합함으로써 더욱 다양한 비선형간격을 만들어낼 수 있으며 손실함수를 최소화하는 방향으로 파라메트릭 활성함수들의 파라미터를 최적화할 수 있다. MNIST 분류문제와 Fashion MNIST 분류문제를 통하여 결합된 파라메트릭 활성함수의 성능을 실험하였고 그 결과 기존에 사용되는 비선형활성함수, 파라메트릭 활성함수보다 우수한 성능을 가짐을 확인하였다.