• 제목/요약/키워드: 딥러닝 융합연구

검색결과 434건 처리시간 0.024초

얼굴 특징점을 활용한 영상 편집점 탐지 (Detection of video editing points using facial keypoints)

  • 나요셉;김진호;박종혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.15-30
    • /
    • 2023
  • 최근 미디어 분야에도 인공지능(AI)을 적용한 다양한 서비스가 등장하고 있는 추세이다. 하지만 편집점을 찾아 영상을 이어 붙이는 영상 편집은, 대부분 수동적 방식으로 진행되어 시간과 인적 자원의 소요가 많이 발생하고 있다. 이에 본 연구에서는 Video Swin Transformer를 활용하여, 발화 여부에 따른 영상의 편집점을 탐지할 수 있는 방법론을 제안한다. 이를 위해, 제안 구조는 먼저 Face Alignment를 통해 얼굴 특징점을 검출한다. 이와 같은 과정을 통해 입력 영상 데이터로부터 발화 여부에 따른 얼굴의 시 공간적인 변화를 모델에 반영한다. 그리고, 본 연구에서 제안하는 Video Swin Transformer 기반 모델을 통해 영상 속 사람의 행동을 분류한다. 구체적으로 비디오 데이터로부터 Video Swin Transformer를 통해 생성되는 Feature Map과 Face Alignment를 통해 검출된 얼굴 특징점을 합친 후 Convolution을 거쳐 발화 여부를 탐지하게 된다. 실험 결과, 본 논문에서 제안한 얼굴 특징점을 활용한 영상 편집점 탐지 모델을 사용했을 경우 분류 성능을 89.17% 기록하여, 얼굴 특징점을 사용하지 않았을 때의 성능 87.46% 대비 성능을 향상시키는 것을 확인할 수 있었다.

스킨-림프-칩 상에서 LymphanaxTM 의 림프 형성 촉진능 (LymphanaxTM Enhances Lymphangiogenesis in an Artificial Human Skin Model, Skin-lymph-on-a-chip)

  • 박필준;김민섭;최시은;김현수;정석
    • 대한화장품학회지
    • /
    • 제50권2호
    • /
    • pp.119-129
    • /
    • 2024
  • 인체 피부 림프계는 간질액을 배출하고 면역 시스템을 활성화하는 중요한 역할을 한다. 자외선과 자연적인 노화와 같은 환경 요인들은 종종 이러한 림프관의 구조적 변화를 일으키며, 이로 인해 피부 기능 장애를 발생시키기도 한다. 그러나 이러한 연구를 위한 동물 실험 대체 방안이 없기 때문에 여전히 연구를 진행하기엔 적합하지 않은 제한 사항들이 존재한다. 인체 피부 림프계를 더 잘 이해하고 림프관 형성에 관련된 분자 및 생리학적 변화를 조사하기 위해, 생체 모방 미세유체 플랫폼인 'skin-lymph-on-a-chip'을 제작하여, 새로운 체외 인체 피부 림프 모델을 개발하였다. 간단히 말해, 이 플랫폼은 체외에서 분화된 일차 정상 인간 표피 각질형성세포(NHEKs)와 피부 림프 내피세포(HDLECs)를 공동 배양하는 것을 의미한다. 약 500 시간 동안 자연 발효를 통해 확보하고 집약된 인삼 뿌리 추출물인 LymphanaxTM의 림프관 형성 효과를 평가하기 위해 해당 시스템에 적용하였고, 분자 수준 요인들의 변화는 딥러닝 기반 알고리즘을 사용하여 분석하였다. 결론적으로, LymphanaxTM는 skin-lymph-on-a-chip에서 건강한 림프관 형성을 촉진하였고, 그 성분들이 칩내에서 분화된 NHEKs를 거의 침투하지 않는 결과를 통해, HDELCs에 간접적으로 영향을 미쳤음을 확인하였다. 전반적으로, 이 연구는 기존과 차별화된 체외 인체 피부 림프모델 시스템의 확보와 더불어 이를 통한 LymphanaxTM의 림프 활성화 효과에 대한 새로운 관점을 제공한다.

딥러닝을 이용한 연안 소형 어선 주요 치수 추정 연구 (A study on estimating the main dimensions of a small fishing boat using deep learning)

  • 장민성;김동준;자오양
    • 수산해양기술연구
    • /
    • 제58권3호
    • /
    • pp.272-280
    • /
    • 2022
  • The first step is to determine the principal dimensions of the design ship, such as length between perpendiculars, beam, draft and depth when accomplishing the design of a new vessel. To make this process easier, a database with a large amount of existing ship data and a regression analysis technique are needed. Recently, deep learning, a branch of artificial intelligence (AI) has been used in regression analysis. In this paper, deep learning neural networks are used for regression analysis to find the regression function between the input and output data. To find the neural network structure with the highest accuracy, the errors of neural network structures with varying the number of the layers and the nodes are compared. In this paper, Python TensorFlow Keras API and MATLAB Deep Learning Toolbox are used to build deep learning neural networks. Constructed DNN (deep neural networks) makes helpful in determining the principal dimension of the ship and saves much time in the ship design process.

5G 기반 물류 자동화 로봇을 활용한 스마트 물류 창고 시스템 구현을 위한 연구 (A Research to realize a smart logistics warehouse system using 5G-based Logistics Automation Robot)

  • 박태욱;윤만석
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.532-534
    • /
    • 2022
  • 5G 시대가 상용화를 넘어 고도화되는 시점에서 기존 단순 물류 창고 업무를 처리하던 곳들이 IT 융합기술과 플랫폼을 접목하면서 스마트 물류 창고로 탈바꿈하고 있다. 스마트 물류 창고는 5G 기반으로 AI, 딥 러닝, 로봇 기술로 제품의 정확한 수요 및 재고 예측이 가능하고, 입출고 상태에 대한 정보를 실시간으로 제공한다. 이커머스 시장이 커짐에 따라 스마트 물류 분야도 급격한 성장을 이루고 있다. 본 논문에서는 스마트 물류 창고 시스템을 구현하며, 5G 기반 물류 자동화 로봇 활용으로 신속하고 정확한 물류 시스템 구축하는 방법을 연구하여 제안한다.

  • PDF

Wavelet 기반의 영상 디테일 향상 잡음 제거 네트워크 (WDENet: Wavelet-based Detail Enhanced Image Denoising Network)

  • 정군;위승우;정제창
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.725-737
    • /
    • 2021
  • 현재 카메라 성능이 점점 발전해 왔지만 카메라로부터 얻은 디지털 영상에는 잡음 (Noise)이 존재하고 이는 높은 해상도의 영상을 획득하는 데 있어서 방해요소로 작용한다. 전통적으로 잡음을 제거하기 위하여 필터링 방법을 사용해 왔고 최근 딥 러닝 기법의 하나인 합성곱 신경망 (Convolutional Neural Network)은 영상 잡음 제거 분야에서 전통적인 기법보다 좋은 성능을 나타내고 있어 많은 연구가 진행되고 있다. 하지만 합성곱 신경망으로 학습하는 과정에서 영상 내 디테일한 부분이 손실될 수 있는 문제점이 있다. 본 논문에서는 웨이블릿 변환 (Wavelet Transform)을 기반으로 영상 내 디테일 정보도 같이 학습하여 영상 디테일을 향상하는 잡음 제거 합성곱 신경망 네트워크를 제안한다. 제안하는 네트워크는 디테일 향상 서브 네트워크 (Detail Enhancement Subnetwork)와 영상 잡음 추출 서브 네트워크 (Noise Extraction Subnetwork)를 이용하게 된다. 실험은 가우시안 잡음과 실제 카메라 잡음을 통해 진행했고 제안하는 방법은 기존 알고리듬보다 디테일 손실 문제를 효과적으로 해결할 수 있었고 객관적 품질 평가와 주관적 품질 비교에서 모두 우수한 결과가 나온 것을 확인하였다.

Back TranScription(BTS)기반 데이터 구축 검증 연구 (A Study on Verification of Back TranScription(BTS)-based Data Construction)

  • 박찬준;서재형;이설화;문현석;어수경;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.109-117
    • /
    • 2021
  • 최근 인간과 컴퓨터의 상호작용(HCI)을 위한 수단으로 음성기반 인터페이스의 사용률이 높아지고 있다. 이에 음성인식 결과에 오류를 교정하기 위한 후처리기에 대한 관심 또한 높아지고 있다. 그러나 sequence to sequence(S2S)기반의 음성인식 후처리기를 제작하기 위해서는 데이터 구축을 위해 human-labor가 많이 소요된다. 최근 기존의 구축 방법론의 한계를 완화하기 위하여 음성인식 후처리기를 위한 새로운 데이터 구축 방법론인 Back TranScription(BTS)이 제안되었다. BTS란 TTS와 STT 기술을 결합하여 pseudo parallel corpus를 생성하는 기술을 의미한다. 해당 방법론은 전사자(phonetic transcriptor)의 역할을 없애고 방대한 양의 학습 데이터를 자동으로 생성할 수 있기에 데이터 구축에 있어서 시간과 비용을 단축할 수 있다. 본 논문은 기존의 BTS 연구를 확장하여 어떠한 기준 없이 데이터를 구축하는 것보다 어투와 도메인을 고려하여 데이터 구축을 해야함을 실험을 통해 검증을 진행하였다.

LSTM을 이용한 Piney River유역의 최대강우시 유량예측 (LSTM Prediction of Streamflow during Peak Rainfall of Piney River)

  • ;성연정;정영훈
    • 한국방재안전학회논문집
    • /
    • 제14권4호
    • /
    • pp.17-27
    • /
    • 2021
  • 유량예측은 효과적인 홍수관리 및 수자원 계획을 위한 매우 중요한 재난방지 접근법이다. 현재 기후변화로 인한 집중호우가 나날이 증가하고 있어 막대한 기반시설 손실과 재산, 인명 피해가 발생하고 있다. 본 연구는 미국 테네시주 Hickman County의 Vernon에 있는 Piney Resort의 최근 홍수사례분석을 통해 최대 강우 시나리오에서 유량예측에 대한 강우의 기여도를 측정했다. Piney River 유역내 USGS 두개의 관측소(03602500, 03599500)에서 20년(2000-2019) 동안의 일별 하천 유량, 수위 및 강우 데이터를 수집했고, Long Short Term Memory(LSTM)을 사용하였다. 또한, Tensorflow, Keras Machine learning frameworks, Python을 이용하여 14일로 구별된 유량 값을 예측하였다. 또한, 모델이 2021년 8월 21일의 범람 이벤트를 예측할 수 있었는지를 결정하는 데 사용되었다. 전체 데이터(수위, 유량 및 강우량)가 포함된 LSTM 모델은 일부 강우 모델을 제외하고 지속성 모델보다 우수한 성능을 보였으며, 강우자료만 이용하여 유량예측을 하는 것은 충분하지 않음을 나타냈다. 결과는 LSTM 모델은 0.68 및 13.84m3/s의 최적 NSE 및 RMSE 값을 나타냈고, 가장 낮은 예측 오차로 예측 최대유량은 94m3/s로 나타났다. 향후 강우 패턴에 대한 다양한 분석이 이루어진다면 효율적인 홍수 경보 시스템 및 정책을 설계하는 관련 연구에 도움을 줄 것으로 판단된다.

적대적 생성망을 이용한 부동산 시계열 데이터 생성 방안 (A Methodology for Realty Time-series Generation Using Generative Adversarial Network)

  • 유재필;한창훈;신현준
    • 한국융합학회논문지
    • /
    • 제12권10호
    • /
    • pp.9-17
    • /
    • 2021
  • 최근 빅데이터 분석, 인공지능, 기계학습 등의 발전으로 인해서 데이터를 과학적으로 분석하는 기술이 발전하고 있으며 이는 의사결정 문제를 최적으로 해결해주고 있다. 그러나 특정 분야의 경우에는 데이터의 양이 부족해서 과학적 방식에 적용하는 것이 어렵다. 예컨대 부동산과 같은 데이터는 데이터 발표 시점이 최근이거나 비 유동성 자산이다 보니 발표 주기가 긴 경우가 많다. 따라서 본 연구에서는 이런 문제점을 극복하기 위해서 TimeGAN 모형을 통해 기존의 시계열의 확장 가능성에 대해서 연구하고자 한다. 이를 위해 부동산과 관련된 총 45개의 시계열을 데이터 셋에 맞게 2012년부터 2021년까지 주 단위로 데이터를 수집하고 시계열 간의 상관관계를 고려해서 총 15개의 최종 시계열을 선정한다. 15개의 시계열에 대해서 TimeGAN 모형을 통해 데이터 확장을한 결과, PCA 및 T-SNE 시각화 알고리즘을 통해 실제 데이터와 확장 데이터 간의 통계적 분포가 유사하다는 것을 확인할 수 있었다. 따라서 본 논문을 통해서 데이터의 과적합 또는 과소적합이라는 한계점을 극복할 수 있는 다양한 실험이 연구되기를 기대한다.

대화문 재구조화를 통한 한국어 대화문 요약 (Summarization of Korean Dialogues through Dialogue Restructuring)

  • 김은희;임명진;신주현
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.77-85
    • /
    • 2023
  • COVID-19 이후 온라인을 통한 소통이 증가하여 다양한 플랫폼을 기반으로 소통을 위한 대화 텍스트 데이터가 대량으로 축적되고 있다. 텍스트 데이터로부터 유의미한 정보를 추출하기 위한 텍스트 요약에 대한 중요성이 더욱 증가함에 따라 딥러닝을 활용한 추상 요약 연구가 활발하게 이루어지고 있다. 그러나 대화 데이터는 뉴스 기사와 같은 정형화된 텍스트에 비해 누락 및 변형이 많아 대화 상황을 다양한 관점에서 고려해야 하는 특이성이 있다. 특히 어휘 생략과 동시에 내용과 관련 없는 표현 요소들이 대화의 내용을 요약하는 데 방해가 된다. 그러므로 본 연구에서는 한국어 대화 데이터의 특성을 고려하여 발화문을 재구조화하고 KoBART 기반의 사전학습된 텍스트 요약 모델을 파인 튜닝후, 요약문에서 중복 요소를 제거하는 정제 작업을 통해 대화 데이터 요약 성능을 향상시키고자 한다. 발화문을 재구조화하는 방법으로는 발화 순서에 따라 재구조화는 방법과 중심 발화자를 기준으로 재구조화하는 방법을 결합하였다. 대화문 재구조화 방법을 적용한 결과, Rouge-1 점수가 4 정도 향상되었다. 본 연구의 대화 특성을 고려한 재구조화 방법이 한국어 대화 요약 성능 향상에 유의미함을 입증하였다.

신경망을 이용한 세일링 요트 리제너레이션 시스템의 배터리 충전 예측 (Battery charge prediction of sailing yacht regeneration system using neural networks)

  • 이태희;황우성;최명렬
    • 디지털융복합연구
    • /
    • 제18권11호
    • /
    • pp.241-246
    • /
    • 2020
  • 본 논문에서는 해양 전기추진 시스템과 딥러닝 알고리즘을 융합하여 전기추진 리제너레이션 시스템에서 DC/DC 컨버터 출력 전류 예측 및 리제너레이션 수행 시 배터리 충전량을 예측하기 위해 신경망 모델을 제안한다. 제안 된 신경망을 실험하기 위해 PCM의 입력 전압과 전류를 측정하고 시제품 PCM 보드의 출력 결과를 통해 데이터 세트를 구성하였다. 또한 불충분 한 데이터 세트에서 학습 결과를 향상시키기 위해 기존 데이터 세트를 데이터 피팅하여 학습을 진행하였다. 학습 후 신경망 모델의 데이터 예측 결과와 실제 측정 데이터의 차이를 그래프를 통해 확인하였다. 제안한 신경망 모델은 입력 전압과 전류 변화에 따른 배터리 충전량 예측을 효율적으로 보여주었다. 또한, DC/DC 컨버터를 구성하는 아날로그 회로의 특성변화를 신경망을 통하여 예측함으로써, 리제너레이션 시스템의 설계 시, 아날로그 회로의 특성을 고려해야 할 것으로 판단된다.