• 제목/요약/키워드: 기계학습 및 인공지능

검색결과 193건 처리시간 0.025초

음질 및 속도 향상을 위한 선형 스펙트로그램 활용 Text-to-speech (Text-to-speech with linear spectrogram prediction for quality and speed improvement)

  • 윤혜빈
    • 말소리와 음성과학
    • /
    • 제13권3호
    • /
    • pp.71-78
    • /
    • 2021
  • 인공신경망에 기반한 대부분의 음성 합성 모델은 고음질의 자연스러운 발화를 생성하기 위해 보코더 모델을 사용한다. 보코더 모델은 멜 스펙트로그램 예측 모델과 결합하여 멜 스펙트로그램을 음성으로 변환한다. 그러나 보코더 모델을 사용할 경우에는 많은 양의 컴퓨터 메모리와 훈련 시간이 필요하며, GPU가 제공되지 않는 실제 서비스 환경에서 음성 합성이 오래 걸린다는 단점이 있다. 기존의 선형 스펙트로그램 예측 모델에서는 보코더 모델을 사용하지 않으므로 이 문제가 발생하지 않지만, 대신에 고품질의 음성을 생성하지 못한다. 본 논문은 뉴럴넷 기반 보코더를 사용하지 않으면서도 양질의 음성을 생성하는 Tacotron 2 & Transformer 기반의 선형 스펙트로그램 예측 모델을 제시한다. 본 모델의 성능과 속도 측정 실험을 진행한 결과, 보코더 기반 모델에 비해 성능과 속도 면에서 조금 더 우세한 점을 보였으며, 따라서 고품질의 음성을 빠른 속도로 생성하는 음성 합성 모델 연구의 발판 역할을 할 것으로 기대한다.

통합 다중 시뮬레이션에 의한 신경망 기반 주식 거래 시스템의 성능 최적화 (Integrated Multiple Simulation for Optimizing Performance of Stock Trading Systems based on Neural Networks)

  • 이재원;오장민
    • 정보처리학회논문지B
    • /
    • 제14B권2호
    • /
    • pp.127-134
    • /
    • 2007
  • 기계 학습 등 인공 지능 기법의 발전에 힘입어 지능형 주식 거래 시스템에 관한 많은 연구가 이루어져 왔다. 그러나 현실 주식 거래에서 적절한 거래 정책의 수립이 거래의 결과에 커다란 영향을 미치는 중요 요소로 작용하고 있음에도 불구하고, 기존의 연구에서는 예측 모듈의 예측 성능 향상에 주력하였거나, 거래 정책을 다룬 경우라도 예측 모듈에 종속적인 단순한 정책만을 제시하였다. 본 논문에서는 이러한 문제를 개선하기 위한 방안의 하나로, 신경망 기반 주식 거래 시스템의 구축을 위한 통합 개발 도고인 NXShell에서 채택하고 있는 ‘통합 다중 시뮬레이션‘ 기법을 제안한다. 통합 다중 시뮬레이션 기법에서는 신경망의 출력 값과 거래 정책 인자들 간의 모든 주어진 예측기의 특성에 맞는 고유의 최적 거래 정책을 수립한다. 제안된 기법의 효용성을 검증하기 위해, 한국 거래소 시장 및 코스닥 시장에서 수집한 데이터를 사용하여 수행한 거래 성능 비교 실험 결과를 제시한다.

인공지능 기반 온실 환경인자의 시간영역 추정 (A Research about Time Domain Estimation Method for Greenhouse Environmental Factors based on Artificial Intelligence)

  • 이정규;오종우;조용진;이동훈
    • 생물환경조절학회지
    • /
    • 제29권3호
    • /
    • pp.277-284
    • /
    • 2020
  • 스마트 팜 관리의 활용 효율성을 높이기 위해서는 작물 및 환경 변화에 대한 사전 검사를 실시간으로 평가하기 위한 모델링 기법이 필요하다. 시설 온실 내부의 CO2와 같은 필수 환경 요소는 다양한 상관 변수가 밀접하게 결합 된 시간 영역에서 신뢰할 수 있는 추정 모델을 확립하기가 어렵다. 따라서 본 연구는 입력 영역과 출력 변수를 CO2와 같은 시간 관점에서 인접 영역에 분포된 환경 정보를 이용하여 시간 복잡도를 줄이기 위한 인공 신경망을 개발하기 위해 수행되었다. 스마트 팜을 계측하기 위한 센서 모듈을 통해 환경 요소를 지속적으로 측정하였다. 실험기간의 평균 데이터로 예측하는 모델링 1, 전일 데이터로 예측하는 모델링 2을 구성하여 CO2 환경인자의 상호관계를 예측하였다. 전일의 데이터 학습으로 예측하는 모델링 2가 60일 평균값으로 예측한 모델링 1에 비해 성능이 우수하였다. 30일 이전까지는 대부분 0.70~0.88사이의 결정계수를 보였으며 모델링 2가 약0.05정도 높게 나타났다. 하지만 30일 이후에는 두 가지 모델링 모두 결정 계수 값이 0.50 이하로 낮은 값을 보였다. 모델링 접근법에 따라 결정 요인의 값을 비교하고 분석 한 결과 인접한 시간대의 데이터는 고정 신경망 모델을 사용하는 대신 예측이 필요한 지점에서 상대적으로 높은 성능을 나타냈다.

점진적 스마트 팩토리 환경 구축을 위한 CNC 절단 장비 기반 원격 제어 시스템 개발 (Development of Remote Control System based on CNC Cutting Machine for Gradual Construction of Smart Factory Environment)

  • 정진화;안동혁
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제8권12호
    • /
    • pp.297-304
    • /
    • 2019
  • 통신, 센서, 인공지능 등의 기술 발전으로 인해 스마트 팩토리 구축이 진행되고 있다. 스마트 팩토리는 기존의 자동화 공정에서 생산되는 데이터를 대상으로 기계 학습과 같은 지능화 기술을 활용해 효율적인 공정 제어를 목표로 한다. 스마트 팩토리로의 구축으로 인해 생산성이 높아지지만 비용도 높아진다. 따라서 소규모 업체들은 스마트 팩토리로 단계별 전환이 효율적이다. CNC 절단기 기반의 소규모 스마트 팩토리 구축을 위해서 본 논문에서는 기존 제조 장비의 데이터를 수집, 모니터링 및 제어할 수 있는 원격 제어 시스템을 제안한다. 원격 제어 시스템의 구조 및 설계와 효율적인 센싱 데이터 전송 방법 등을 제시하였다. 실현 가능성을 검증하기 위해 CNC 절단 장비를 대상으로 시스템을 구현하였고 기능을 검증하였다. 성능 평가를 위해 모니터링 웹 페이지 접속시간을 측정하였고, 구현된 시스템이 사용 가능한 수준이라는 것을 확인하였다.

머신러닝 기반의 온실 VPD 예측 모델 비교 (Comparison of Machine Learning-Based Greenhouse VPD Prediction Models)

  • 장경민;이명배;임종현;오한별;신창선;박장우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권3호
    • /
    • pp.125-132
    • /
    • 2023
  • 본 연구에서는 식물의 영양분 흡수에 따른 식물 성장뿐만 아니라 기공 기능 및 광합성에도 영향을 끼치는 온실의 수증기압차(VPD, Vapor Pressure Deficit)예측을 위한 머신러닝 모델들의 성능을 비교해보았다. VPD 예측을 위해 온실 내·외부 환경요소 및 시계열 데이터의 시간적 요소들과의 상관관계를 확인하고 상관관계가 높은 요소들이 VPD에 어떤 영향을 미치는지 확인하였다. 예측 모델의 성능을 분석하기 전 분석 시계열 데이터의 양(1일, 3일, 7일), 간격(20분, 1시간)이 예측 성능에 미치는 영향을 확인하여 데이터의 양과 간격을 조절하였다. 마지막으로 4개의 머신러닝 예측 모델(XGB Regressor, LGBM Regressor, Random Forest Regressor 등)을 적용하여 모델별 예측 성능을 비교했다. 모델의 예측 결과로 20분 간격의 1일의 데이터를 사용했을 때 LGBM에서 MAE는 0.008, RMSE는 0.011의 가장 높은 예측 성능을 보였다. 또한 20분 후 VPD 예측에 가장 큰 영향을 미치는 요소는 환경적 요인보다는 과거 20분 전의 VPD(VPD_y__71)임을 확인하였다. 본 연구의 결과를 활용하여 VPD 예측을 통해 작물의 생산성을 높이고, 온실의 결로, 병 발생 예방 등이 가능하다. 향후 온실의 환경 데이터 예측뿐만 아니라 더 나아가 생산량 예측, 스마트팜 제어 모델 등 다양한 분야에 활용할 수 있을 것이다.

전통문화 이미지를 위한 세부 자질 주목형 이미지 자동 분석기 (Detail Focused Image Classifier Model for Traditional Images)

  • 김규경;허윤아;김경민;유원희;임희석
    • 한국융합학회논문지
    • /
    • 제8권12호
    • /
    • pp.85-92
    • /
    • 2017
  • 이 논문에서는 최근 전통문화의 늘어나는 콘텐츠와 대조적으로 전통문화에 대한 접근성이 떨어지는 점에 주목하여 이러한 콘텐츠의 접근성의 향상을 위해 지속된 관리와 연구를 위하여 전통문화 이미지를 위한 이미지 자동 분석기를 소개한다. 이 논문에서 소개하는 이미지 자동 분석기는 인공신경망을 기반으로 입력 이미지의 자질들을 벡터스페이스로 변환하여 이를 RNN 기반의 모델을 통하여 세부 자질들을 파악하여 전통문화 이미지의 분류를 행한다. 이러한 방법을 통하여 전체적으로 비슷하게 보이는 전통문화 이미지들의 분류를 가능케 한다. 해당 모델의 훈련을 위하여 한민족정보문화마당 기반의 형식을 토대로 넓은 폭의 이미지 데이터를 수집 및 정리하여 차후 전통문화 이미지 관련 분야에서 사용할 수 있는 데이터셋의 구축에 기여를 하였다. 또한 이러한 연구가 최종적으로 전통문화와 관련된 수요, 공급 및 연구가 한층 더 활발해지는 것에 기여를 한다.

증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용한 공모주의 상장 이후 주가 등락 예측 (The prediction of the stock price movement after IPO using machine learning and text analysis based on TF-IDF)

  • 양수연;이채록;원종관;홍태호
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.237-262
    • /
    • 2022
  • 본 연구는 개인투자자들의 투자의사결정에 도움을 주고자, 증권신고서의 TF-IDF 텍스트 분석과 기계학습을 이용해 공모주의 상장 5거래일 이후 주식 가격 등락을 예측하는 모델을 제시한다. 연구 표본은 2009년 6월부터 2020년 12월 사이에 신규 상장된 691개의 국내 IPO 종목이다. 기업, 공모, 시장과 관련된 다양한 재무적 및 비재무적 IPO 관련 변수와 증권신고서의 어조를 분석하여 예측했고, 증권신고서의 어조 분석을 위해서 TF-IDF (Term Frequency - Inverse Document Frequency)에 기반한 텍스트 분석을 이용해 신고서의 투자위험요소란의 텍스트를 긍정적 어조, 중립적 어조, 부정적 어조로 분류하였다. 가격 등락 예측에는 로지스틱 회귀분석(Logistic Regression), 랜덤 포레스트(Random Forest), 서포트벡터머신(Support Vector Machine), 인공신경망(Artificial Neural Network) 기법을 사용하였고, 예측 결과 IPO 관련 변수와 증권신고서 어조 변수를 함께 사용한 모델이 IPO 관련 변수만을 사용한 모델보다 높은 예측 정확도를 보였다. 랜덤 포레스트 모형은 1.45%p 높아진 예측 정확도를 보였으며, 인공신공망 모형과 서포트벡터머신 모형은 각각 4.34%p, 5.07%p 향상을 보였다. 추가적으로 모형간 차이를 맥니마 검정을 통해 통계적으로 검증한 결과, 어조 변수의 유무에 따른 예측 모형의 성과 차이가 유의확률 1% 수준에서 유의했다. 이를 통해, 증권신고서에 표현된 어조가 공모주의 가격 등락 예측에 영향을 미치는 요인이라는 것을 확인할 수 있었다.

머신 러닝을 이용한 PIC 로봇 암 강성 향상에 대한 연구 (Stiffness Enhancement of Piecewise Integrated Composite Robot Arm using Machine Learning)

  • 지승민;함석우;전성식
    • Composites Research
    • /
    • 제35권5호
    • /
    • pp.303-308
    • /
    • 2022
  • PIC(Piecewise Integrated Composite)는 적층 복합재의 기계적 특성을 향상시키기 위해 다양한 적층 순서를 모자이크 방식으로 할당하여 복합 구조를 설계하는 새로운 개념이다. 또한 머신 러닝은 인공 지능의 하위 범주로, 컴퓨터가 데이터에서 지속적으로 학습하고 데이터를 기반으로 예측하는 능력을 개발한 다음 추가 프로그래밍 없이 조정하는 과정을 의미한다. 본 연구에서는 구조적 강성을 높이기 위해 기계학습을 기반으로 넓고 얇은 LCD 디스플레이를 운반 및 이송하기 위한 테이퍼 박스형 빔형 PIC 로봇 암이 설계되었다. 필수 학습 데이터는 예비 FE 해석 과정에서 유한 요소 모델 중 의도적으로 배치된 참조 요소에서 수집되었다. 또한 인장, 압축 또는 전단과 같은 지배적인 외부 하중 유형을 판단하기 위해 각 유한 요소에 대한 3축 특성 값을 얻었다. 학습 데이터를 이용하여 머신 러닝 모델을 훈련하고 평가되었으며, 정확도 레벨을 만족한 머신 러닝 모델을 이용해 요소의 로딩 유형을 예측하였다. 특정 하중 유형에 대해 우세한 것으로 알려진 세 가지 유형의 적층 각도 순서가 PIC 로봇 암에 모자이크 방식으로 할당되었습니다. 이후 굽힘형 FE 해석을 수행한 결과 PIC 로봇 암이 기존의 단일 적층 각도 순서로 제작된 복합재 로봇 암에 비해 강성이 증가된 것으로 나타났다.

디지털 트윈, 환경 모니터링 등 디지털·그린 뉴딜 정책 관련 지질자원 유망기술·시장 분석 (Analysis of Emerging Geo-technologies and Markets Focusing on Digital Twin and Environmental Monitoring in Response to Digital and Green New Deal)

  • 안은영;이재욱;배준희;김정민
    • 자원환경지질
    • /
    • 제53권5호
    • /
    • pp.609-617
    • /
    • 2020
  • 4차 산업혁명(industry 4.0)으로 제시되는 지능정보사회 전환 정책 이후, 정부는 2020년 한국형 뉴딜 정책으로 디지털 뉴딜과 그린 뉴딜 정책을 발표하였다. 본 연구는 해당 정책을 분석하고 지질자원 분야 공공연구기관의 정부출연 R&D사업을 분석하였다. 해당 사업 중에서 유망기술 분야로 디지털 트윈, 환경 모니터링에 주목하여 유망기술·시장 분석을 실시하였다. 한국판 뉴딜 종합계획의 '데이터댐'과 관련하여 지질자원 기술 분야에서는 실감기술(AR/VR)을 적용한 디지털 지질자원 콘텐츠 개발, 공공데이터 구축·공유 시스템 개발이 가능하다. '1, 2, 3차 전산업으로 5G, AI 융합 확산'에 대응하여 스마트 마이닝, 디지털 오일 필드 등 ICT와 융합한 지질자원기술의 산업적용이 필요하다. '디지털 트윈'과 관련하여 정부는 도심지 등 주요지역 3D 지도 구축을 제시하고 있다. 지질자원 기술 분야에서는 안전한 국토/시설 관리를 위한 3차원 지도 및 사물인터넷(IoT) 시스템 개발이 가능하다. 그린 뉴딜 정책으로 정부는 자원순환을 포함한 녹색산업 기술개발, CCUS 통합실증, 전기차·수소차 보급 확대를 제시하였으며 한국지질자원연구원은 관련 연구사업 수행 및 국내 에너지 저장광물 개발 연구를 착수했다. 디지털 트윈 관련하여 논문 및 국제 시장분석기관에서 석유가스분야를 제시하고 있으며 광산자동화, 디지털 지도 측면에서도 많은 진전이 일어나고 있다. 디지털 트윈어스(Digital Twin Earth) 구축 또한 지질자원 분야의 유망 기술 분야이다. 디지털 트윈, 환경 모니터링 관련 지질자원 연구 분야는 데이터 분석, 시뮬레이션, 인공지능·기계학습, 사물인터넷(IoT)과 깊은 관련이 있으며, 관련 센서 및 컴퓨팅 소프트웨어/시스템 등 민간 회사와의 협업이 중요하다.

벡터 심볼릭 구조의 부호화 및 복호화 성능 평가에 관한 연구 (Study on the Performance Evaluation of Encoding and Decoding Schemes in Vector Symbolic Architectures)

  • 이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.229-235
    • /
    • 2024
  • 최근 몇 년 동안 인공지능과 기계 학습 분야에서 대량의 데이터를 효율적으로 처리하고 해석하는 방법에 대한 연구가 활발히 진행되고 있다. 이러한 데이터 처리 기술 중 하나인 벡터 기호 아키텍처(Vector Symbolic Architecture, VSA)는 고차원 벡터를 이용하여 복잡한 기호와 데이터를 표현하는 혁신적인 접근법을 제시한다. VSA는 특히 자연어 처리, 이미지 인식, 로봇 공학 등 다양한 응용 분야에서 주목받고 있다. 본 연구는 VSA 방법론들의 특성과 성능을 정량적으로 평가하기 MNIST 데이터셋에 5가지 VSA 방법론을 적용하여 인코딩 속도, 디코딩 속도, 메모리 사용량, 복원 정확도와 같은 주요 성능 지표를 벡터 길이별로 측정하였다. 인코딩 속도와 디코딩 속도에서 BSC와 VT가 상대적으로 빠른 성능을 보였으며, MAP과 HRR은 상대적으로 느렸다. 메모리 사용량에서는 BSC가 가장 효율적이었고, MAP이 가장 많은 메모리를 사용하였다. 복원 정확도는 MAP이 가장 높았으며, BSC가 가장 낮았으며 연구 결과는 적용 영역에 따라 적절한 VSA 방법론을 선택할 수 있는 기준을 제시할 수 있다.