• Title/Summary/Keyword: 특징변환

검색결과 1,733건 처리시간 0.031초

신재생 에너지 최적 활용을 위한 축열조 온도 예측 모델 연구 (A Study on the Thermal Prediction Model cf the Heat Storage Tank for the Optimal Use of Renewable Energy)

  • 오한별;장경민;오지영;이명배;박장우;조용윤;신창선
    • 스마트미디어저널
    • /
    • 제12권10호
    • /
    • pp.63-70
    • /
    • 2023
  • 최근 스마트팜 에너지 비용 중 35% 낸난방비 에너지 소비가 증가되어 에너지 소비 효율화가 요구되며, 전기료 현실화에 대한 우려로 신재생 에너지 중요성이 증가하고 있다. 신재생 에너지는 수력, 풍력, 태양광 등에 속하며, 이중 태양광 에너지는 전기에너지로 변환하는 발전기술로, 이 기술은 에너지원이 환경에 미치는 영향이 적고, 유지 보수가 간편하다는 특징을 갖고 있다. 본 연구에서는 온실 축열조, 히트펌프 데이터 기반으로 축열조 영향을 많이 미치는 요소를 선정하고 축열조 공급 온도예측 모델을 개발하고자 한다. 시계열 데이터 분석 및 예측에 효과적인 LSTM(Long Short-Term Memory)과 다른 앙상블 학습 기법보다 뛰어난 XGBoost 모델을 이용하여 예측한다. 히트펌프 축열조 온도를 예측함으로써 에너지 소비를 최적화하여 시스템 운영을 최적화할 수 있다. 또한, 태양광 활용에 따른 냉난방비 절감 및 농가의 에너지 자립도 개선 등 스마트팜 에너지 통합 운영 시스템에 연계하고자 한다. 플랫폼을 통해 폐열 에너지의 공급을 관리하고 최대 난방부하 및 계절, 시간별 작물생장에 필요한 에너지값을 도출하여 이를 기반으로 최적 에너지 운용방안을 도출하고자 한다.

Reproducing Summarized Video Contents based on Camera Framing and Focus

  • Hyung Lee;E-Jung Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.85-92
    • /
    • 2023
  • 본 논문에서는 장편의 드라마나 영화에서 스토리 기반의 축약된 요약본을 자동으로 제작하기 위한 방법을 제안한다. 촬영 단계에서 황금분할을 고려한 공간감 있는 프레임 구성과 내용 전달 차원에서 시청자들의 시선을 집중시키기 위한 관심 대상에 대한 초점을 기본 전제로 했다. 이에 적정한 프레임들을 추출하기 위한 방법을 고려하기 위해서 기존의 씬(scene) 및 숏(shot) 검출에 대한 연구, 초점과 관련된 블러 정도를 파악하는 연구들에서 활용되었던 요소 기술들을 활용했다. 유튜브에서 공유되는 영상을 프레임 단위로 변환한 후 프레임별로 특징을 추출하기 위한 영역으로 프레임 전체 영역과 3개의 부분 영역으로 구분했고, 해당 영역별로 각각 라플라시안 연산자와 FFT를 적용한 결과들을 비교하여 상대적으로 일관성 있고 강건한 FFT를 선택했다. 프레임 전체에 대한 계산값과 3개 영역의 계산값들을 비교하여 상대적으로 선명한 영역을 확인할 수 있는 조건을 기반으로 대상 프레임을 선별했다. 이렇게 선별된 결과를 토대로 숏 내에서 프레임들의 연속성을 확보하기 위해 오프라인 변화점 탐지기법을 적용한 결과와 접목시켜 최종 프레임들을 추출했고, 이를 기반으로 편집결정리스트를 구성하였으며, F1-스코어 75.9%를 갖는 62.77%로 축약된 요약본을 제작했다.

CNN 기반 스펙트로그램을 이용한 자유발화 음성감정인식 (Spontaneous Speech Emotion Recognition Based On Spectrogram With Convolutional Neural Network)

  • 손귀영;권순일
    • 정보처리학회 논문지
    • /
    • 제13권6호
    • /
    • pp.284-290
    • /
    • 2024
  • 음성감정인식(Speech Emotion Recognition, SER)은 사용자의 목소리에서 나타나는 떨림, 어조, 크기 등의 음성 패턴 분석을 통하여 감정 상태를 판단하는 기술이다. 하지만, 기존의 음성 감정인식 연구는 구현된 시나리오를 이용하여 제한된 환경 내에서 숙련된 연기자를 대상으로 기록된 음성인 구현발화를 중심의 연구로 그 결과 또한 높은 성능을 얻을 수 있지만, 이에 반해 자유발화 감정인식은 일상생활에서 통제되지 않는 환경에서 이루어지기 때문에 기존 구현발화보다 현저히 낮은 성능을 보여주고 있다. 본 논문에서는 일상적 자유발화 음성을 활용하여 감정인식을 진행하고, 그 성능을 향상하고자 한다. 성능평가를 위하여 AI Hub에서 제공되는 한국인 자유발화 대화 음성데이터를 사용하였으며, 딥러닝 학습을 위하여 1차원의 음성신호를 시간-주파수가 포함된 2차원의 스펙트로그램(Spectrogram)로 이미지 변환을 진행하였다. 생성된 이미지는 CNN기반 전이학습 신경망 모델인 VGG (Visual Geometry Group) 로 학습하였고, 그 결과 7개 감정(기쁨, 사랑스러움, 화남, 두려움, 슬픔, 중립, 놀람)에 대해서 성인 83.5%, 청소년 73.0%의 감정인식 성능을 확인하였다. 본 연구를 통하여, 기존의 구현발화기반 감정인식 성능과 비교하면, 낮은 성능이지만, 자유발화 감정표현에 대한 정량화할 수 있는 음성적 특징을 규정하기 어려움에도 불구하고, 일상생활에서 이루어진 대화를 기반으로 감정인식을 진행한 점에서 의의를 두고자 한다.

과학교육에서 제시하는 과학적 관찰의 의미와 과정에 대한 분석 (An Analysis of Meanings and Processes about Scientific Observation in the Science Education)

  • 변정호;이준기;권용주
    • 한국과학교육학회지
    • /
    • 제29권5호
    • /
    • pp.531-540
    • /
    • 2009
  • 과학적 관찰은 과학 탐구 및 과학적 지식생성과정에 있어 기초적이며, 매우 중요한 과정으로써 인식되고 있다. 그러나 과학적 관찰의 중요성에 대한 인식에 비해 학습자에게 제시되어야 하는 과학적 관찰의 의미와 과정에 대한 연구는 미비한 실정이다. 과학적 관찰에 대한 대다수의 연구들은 관찰행동과 관찰사실의 특징과 유형을 알아보기 위한 것들로써 학습자에게 제공되는 관찰활동이 어떻게 구조화되어야 하는지에 대한 해답을 제시하는데 한계점을 지니고 있다. 이 연구에서는 이전의 체계적이고 다양한 연구결과들을 바탕으로 과학적 관찰의 의미와 과정에 대해 알아보았다. 과학적 관찰이란 대상으로부터 얻을 수 있는 감각 정보를 수용하여 관찰자의 주관적 요소로 구성된 지적틀을 통해 정보를 인식하는 활동이라고 할 수 있다. 또한, 관찰행동을 통해 인식된 정보는 관찰자의 주관적 요소에 해당하는 지적틀을 통해 관찰사실로 생성되어 추론과 독립적으로 지적틀에 영향을 미치거나, 추론에 의해 변환되어 지적틀에 영향을 주게 된다. 결국, 관찰자의 지적틀은 과학적 관찰에 의해 계속적으로 변화됨으로써, 이후에 수행되는 관찰행동과 관찰 사실 생성에 영향을 주는 것이라고 할 수 있다. 그러므로 과학적 관찰활동은 학습자의 주관적 요소가 고려되어야 하며, 추론과 연계된 관찰활동이 제시되어야 한다. 또한, 다양한 대상에 대한 관찰뿐만 아니라, 지속적 관찰활동을 통해 학습자의 지적틀이 변화될 수 있는 기회가 제공되어야 한다.

딥러닝 기반 비디오 캡셔닝의 연구동향 분석 (Analysis of Research Trends in Deep Learning-Based Video Captioning)

  • 려치;이은주;김영수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제13권1호
    • /
    • pp.35-49
    • /
    • 2024
  • 컴퓨터 비전과 자연어 처리의 융합의 중요한 결과로서 비디오 캡셔닝은 인공지능 분야의 핵심 연구 방향이다. 이 기술은 비디오 콘텐츠의 자동이해와 언어 표현을 가능하게 함으로써, 컴퓨터가 비디오의 시각적 정보를 텍스트 형태로 변환한다. 본 논문에서는 딥러닝 기반 비디오 캡셔닝의 연구 동향을 초기 분석하여 CNN-RNN 기반 모델, RNN-RNN 기반 모델, Multimodal 기반 모델, 그리고 Transformer 기반 모델이라는 네 가지 주요 범주로 나누어 각각의 비디오 캡셔닝 모델의 개념과 특징 그리고 장단점을 논하였다. 그리고 이 논문은 비디오 캡셔닝 분야에서 일반적으로 자주 사용되는 데이터 집합과 성능 평가방안을 나열하였다. 데이터 세트는 다양한 도메인과 시나리오를 포괄하여 비디오 캡션 모델의 훈련 및 검증을 위한 광범위한 리소스를 제공한다. 모델 성능 평가방안에서는 주요한 평가 지표를 언급하며, 모델의 성능을 다양한 각도에서 평가할 수 있도록 연구자들에게 실질적인 참조를 제공한다. 마지막으로 비디오 캡셔닝에 대한 향후 연구과제로서 실제 응용 프로그램에서의 복잡성을 증가시키는 시간 일관성 유지 및 동적 장면의 정확한 서술과 같이 지속해서 개선해야 할 주요 도전과제와 시간 관계 모델링 및 다중 모달 데이터 통합과 같이 새롭게 연구되어야 하는 과제를 제시하였다.

트랜스포머 기반의 다중 시점 3차원 인체자세추정 (Multi-View 3D Human Pose Estimation Based on Transformer)

  • 최승욱;이진영;김계영
    • 스마트미디어저널
    • /
    • 제12권11호
    • /
    • pp.48-56
    • /
    • 2023
  • 3차원 인체자세추정은 스포츠, 동작인식, 영상매체의 특수효과 등의 분야에서 널리 활용되고 있는 기술이다. 이를 위한 여러 방법들 중 다중 시점 3차원 인체자세추정은 현실의 복잡한 환경에서도 정밀한 추정을 하기 위해 필수적인 방법이다. 하지만 기존 다중 시점 3차원 인체자세추정 모델들은 3차원 특징 맵을 사용함에 따라 시간 복잡도가 높은 단점이 있다. 본 논문은 계산 복잡도가 적은 트랜스포머 기반 기존 단안 시점 다중 프레임 모델을 다중 시점에 대한 3차원 인체자세추정으로 확장하는 방법을 제안한다. 다중 시점으로 확장하기 위하여 먼저 2차원 인체자세 검출자 CPN(Cascaded Pyramid Network)을 활용하여 획득한 4개 시점의 17가지 관절에 대한 2차원 관절좌표를 연결한 8차원 관절좌표를 생성한다. 그 다음 이들을 패치 임베딩 한 뒤 17×32 데이터로 변환하여 트랜스포머 모델에 입력한다. 마지막으로, 인체자세를 출력하는 MLP(Multi-Layer Perceptron) 블록을 매 반복 마다 사용한다. 이를 통해 4개 시점에 대한 3차원 인체자세추정을 동시에 수정한다. 입력 프레임 길이 27을 사용한 Zheng[5]의 방법과 비교했을 때 제안한 방법의 모델 매개변수의 수는 48.9%, MPJPE(Mean Per Joint Position Error)는 20.6mm(43.8%) 감소했으며, 학습 횟수 당 평균 학습 소요 시간은 20배 이상 빠르다.

  • PDF

활성슬러지 공정을 위한 모델링과 지능제어의 적용 (Modeling and Intelligent Control for Activated Sludge Process)

  • 천성표;김봉철;김성신;김창원;김상현;우혜진
    • 대한환경공학회지
    • /
    • 제22권10호
    • /
    • pp.1905-1919
    • /
    • 2000
  • 활성슬러지 공정에 기반을 둔 연속식반응기는 시스템이 가진 고유한 비선형성뿐만 아니라 계절, 기후 등의 환경변화에 따른 유입수의 유량 및 특성 등의 외부적인 조건의 변화를 고려하여 제어하여야 한다. 수학적 모델링 과정에서 고려하지 못했거나 무시되었던 부분을 포함한 시스템에 관련된 특징과 한정된 공간에서 기본적인 제어방법에 의한 현재의 운전방법을 고려하여 불 때 활성슬러지 공정은 개선할 수 있는 여지가 많다. 또한 숙련된 운전자의 지식을 구현할 수 있는 지능제어기법을 적용하여 전체적인 공정의 효율 향상을 도모할 수 있다. 제어방법의 적용에 앞서 제어대상공정인 활성슬러지 공정을 분석하여 이를 $Matlab^{(R)}5.3/Simulink^{(R)}3.0$을 이용하여 연속식반응기 모델을 구현하였다. IWA(International Water Association)와 COST(European Cooperation in the field of Scientific and Technical Research)에서 제시한 정상상태의 유입수 특성을 이용하여 모델의 정확성을 검증하였다. 본 논문에서는 이미 현장에서 사용중인 제어기법의 구현 및 성능 평가뿐만 아니라 다양한 고급제어기법들을 적용하여 새롭게 제안한 제어기법들이 실제 폐수처리장에 적용가능한지 여부를 검증하였다. 제어방법으로는 현장에서 일반적으로 사용되고 있는 비례-적분-미분제어기(Proportional-Integral-Derivative Controller; PID controller)와 PID제어기가 가진 장점과 퍼지 논리 제어기법이 가진 장점을 결합함과 동시에 제어기의 성능 향상 및 경제성을 높일 수 있는 퍼지 PID이득 조절기(fuzzy PID gain tuner)와 퍼지 셋포인트 변환기(fuzzy setpoint changer)를 적용하여 봄으로써 외란에 대해 강인한 제어기 설계의 가능성을 검증하였다.

  • PDF

KOMPSAT-3/3A 기준영상의 기하품질에 따른 상호좌표등록 결과 분석 (Analysis of Co-registration Performance According to Geometric Processing Level of KOMPSAT-3/3A Reference Image)

  • 윤예린;김태헌;오재홍;한유경
    • 대한원격탐사학회지
    • /
    • 제37권2호
    • /
    • pp.221-232
    • /
    • 2021
  • 본 연구는 KOMPSAT-3 및 KOMPSAT-3A호에서 전처리 단계에 따라 구분하여 제공하는 Level 1R 영상과 Level 1G 영상을 이용하여 기준영상의 기하품질에 따른 상호좌표등록 결과 분석을 수행하였다. 기준영상으로 Level 1R 영상 및 1G 영상 각각을 사용하고 대상영상은 Level 1R 영상을 사용하여 상호좌표등록을 수행하였다. 실험을 위해 대전지역에서 촬영된 KOMPSAT-3 및 3A호의 Level 1R, 1G 영상 총 7장을 이용하였다. 상호좌표등록을 수행하기 위해, 우선적으로 특징기반 정합기법인 SURF (Speeded-Up Robust Feature) 기법과 영역기반 정합기법인 위상상관 (Phase Correlation) 기법을 함께 이용한 반복적 정합기법을 통해 두 영상의 기하학적 위치를 개략적으로 일치시켜 주었다. 개략적으로 일치된 영상에서 SURF 기법을 이용하여 정합쌍을 추출하고 Affine 변환모델과 Piecewise Linear 변환모델을 각각 구성하여 상호좌표등록을 수행하였다. 실험결과, 기하오차가 보정된 Level 1G 영상을 기준영상으로 선정하였을 경우, Level 1R 영상을 이용하였을 때보다 상대적으로 많은 수의 정합쌍을 추출하였다. 또한, 기준영상이 Level 1G 영상일 때의 상호좌표등록 RMSE (Root Mean Square Error) 값이 평균 5화소 미만으로 Level 1R 영상을 이용하였을 때보다 더 낮은 것을 확인하였다. 이는 상호좌표등록 수행 시 두 위성영상 간의 초기위치관계가 상호좌표등록 결과에 영향을 끼칠 수 있음을 의미하며, 기준영상의 기하품질이 우수할수록 안정적인 상호좌표등록 정확도를 나타내는 것을 확인하였다.

계층 클러스터 트리 기반 라만 스펙트럼 식별 고속 검색 알고리즘 (A Hierarchical Cluster Tree Based Fast Searching Algorithm for Raman Spectroscopic Identification)

  • 김순금;고대영;박준규;박아론;백성준
    • 한국산학기술학회논문지
    • /
    • 제20권3호
    • /
    • pp.562-569
    • /
    • 2019
  • 최근에 원 거리에서 폭발 물질의 감지를 위해 라만 분광 기기의 관심이 점차 증가하고 있다. 더불어 측정된 화학물질에 대한 라만 스펙트럼을 대용량 데이터베이스의 알려진 라만 스펙트라와 비교하여 식별할 수 있는 고속 검색 방법에 대한 요구도 커지고 있다. 지금까지 가장 간단하고 널리 사용되는 방법은 주어진 스펙트럼과 데이터베이스 스펙트라 사이의 유클리드 거리를 계산하고 비교하는 방법이다. 하지만 고차원 데이터의 속성으로 검색의 문제는 그리 간단하지 않다. 가장 큰 문제점중의 하나는 검색 방법에 있어서 연산량이 많아 계산 시간이 너무 오래 걸린다는 것이다. 이러한 문제점을 극복하기 위해, 우리는 정렬된 분산에 따른 MPS Sort+PDS 방법을 제안하였다. 이 방법은 벡터의 두 개의 주요한 특징으로 평균과 분산을 사용하여 후보가 될 수 없는 많은 코드워드를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 본 논문에서 우리는 기존의 방법보다 더욱 더 향상된 2가지 새로운 방법의 고속 검색 알고리즘을 제안한다. PCA+PDS 방법은 전체 데이터를 사용하는 거리 계산과 똑같은 결과를 가지면서 PCA 변환을 통해 데이터의 차수를 감소시켜 계산량을 줄여준다. Hierarchical Cluster Tree 알고리즘은 PCA 변환된 스펙트라 데이터를 사용하여 이진 계층 클러스터 트리를 만든다. 그런 후 입력 스펙트럼과 가장 가까운 클러스터부터 검색을 시작하여 후보가 될 수 없는 많은 스펙트라를 계산하지 않으므로 연산량을 줄이고 계산 시간을 줄여준다. 실험은 정렬된 분산에 따른 MPS Sort+PDS와 비교하여 PCA+PDS는 60.06%의 성능 향상을 보였다. Hierarchical Cluster Tree는 PCA+PDS와 비교하여 17.74%의 성능향상을 보였다. 실험결과는 제안된 알고리즘이 고속 검색에 적합함을 확인시켜 준다.

램버시안 구름 모델의 운정기압 오차가 OMI 오존 프로파일 산출에 미치는 영향 (Impact of Lambertian Cloud Top Pressure Error on Ozone Profile Retrieval Using OMI)

  • 남현식;김재환;신대근;백강현
    • 대한원격탐사학회지
    • /
    • 제35권3호
    • /
    • pp.347-358
    • /
    • 2019
  • 램버시안 구름 모델(Lambertian Cloud Model)은 구름이 존재하는 대기의 연직 오존 분포를 효과적으로 산출하기 위해 사용되는 단순화된 구름 모델이다. 램버시안 구름 모델을 사용함으로써 복사 전달 모의에 필요한 구름의 광학적 특징들은 Optical Centroid Cloud Pressure(OCCP)와 Effective Cloud Fraction(ECF)으로 모수화되며, 각 모수의 정확도는 복사 모의 정확도에 큰 영향을 미친다. 하지만 OCCP 오차에 따라 발생하는 연직 오존 산출 오차는 복사 환경과 알고리듬 설정에 따라 다르게 나타나기 때문에 일반화가 매우 어렵다. 또한, OCCP 오차의 영향은 연직 오존 산출 과정에서 발생하는 다른 오차들과 혼재하기 때문에 이를 분석하는 것 또한 어렵다. 본 연구는 두 가지 방법을 사용하여 OCCP 오차로 인한 오존 산출 오차를 분석하였다. 첫 번째로, OCCP 오차가 최적 추정법(Optimal Estimation)에서 오존 산출에 미치는 영향을 모의하였다. 이를 위해 OCCP 오차에 따른 복사량 오차를 LIDORT 복사 모델로 산출하였다. 복사량 오차를 오존 산출 오차로 변환하기 위해 최적 추정법의 변환식에 복사량 오차를 대입하였고, 그 결과 OCCP를 100 hPa 높게 입력했을 때 전체 오존량이 약 2.7% 과대산출되는 것으로 나타났다. 두 번째로, 사례 분석을 통해 OCCP 오차로 인한 오존 오차를 확인하였다. 사례 분석을 위해 OCCP 오차를 가정하여 오존 산출 오차를 모의하였고, 이를 OMI 오존 프로파일 산출물인 PROFOZ 2005-2006의 사례에서 나타난 오존 오차와 비교하였다. 사례에서 나타난 오존 오차를 정의하기 위해서 이상적인 가정을 전제하였으며, 가정을 전제할 수 있도록 지표 반사도, 오존의 수평 변화율 등을 고려하여 비교적 안정적으로 오존 오차를 근사할 수 있는 49개의 사례를 선정하였다. 사례 분석 결과, 49개의 사례 중 27개(약 55%)의 사례에서 0.5 이상의 상관관계가 나타났다. 오존 프로파일 산출 특성을 고려하였을 때, 이러한 결과는 OCCP의 오차가 오존 프로파일 산출 정확도에 상당한 영향을 주고 있는 것으로 판명되었다.