• 제목/요약/키워드: Deep Learning based System

검색결과 1,194건 처리시간 0.031초

x-vector를 이용한 다화자 음성합성 시스템 (A Multi-speaker Speech Synthesis System Using X-vector)

  • 조민수;권철홍
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.675-681
    • /
    • 2021
  • 최근 인공지능 스피커 시장이 성장하면서 사용자와 자연스러운 대화가 가능한 음성합성 기술에 대한 수요가 증가하고 있다. 따라서 다양한 음색의 목소리를 생성할 수 있는 다화자 음성합성 시스템이 필요하다. 자연스러운 음성을 합성하기 위해서는 대용량의 고품질 음성 DB로 학습하는 것이 요구된다. 그러나 많은 화자가 발화한 고품질의 대용량 음성 DB를 수집하는 것은 녹음 시간과 비용 측면에서 매우 어려운 일이다. 따라서 각 화자별로는 소량의 학습 데이터이지만 매우 많은 화자의 음성 DB를 사용하여 음성합성 시스템을 학습하고, 이로부터 다화자의 음색과 운율 등을 자연스럽게 표현하는 기술이 필요하다. 본 논문에서는 화자인식 기술에서 사용하는 딥러닝 기반 x-vector 기법을 적용하여 화자 인코더를 구성하고, 화자 인코더를 통해 소량의 데이터로 새로운 화자의 음색을 합성하는 기술을 제안한다. 다화자 음성합성 시스템에서 텍스트 입력에서 멜-스펙트로그램을 합성하는 모듈은 Tacotron2로, 합성음을 생성하는 보코더는 로지스틱 혼합 분포가 적용된 WaveNet으로 구성되어 있다. 학습된 화자 임베딩 신경망에서 추출한 x-vector를 Tacotron2에 입력으로 추가하여 원하는 화자의 음색을 표현한다.

COVID-19 팬데믹에서 Airbnb 호스트의 마케팅 전략의 변화가 공유성과에 미치는 영향 (The Effect of Changes in Airbnb Host's Marketing Strategy on Listing Performance in the COVID-19 Pandemic)

  • 김소영;심지환;정여진
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.1-27
    • /
    • 2021
  • 전 세계적인 COVID-19의 유행으로 인해 관광산업 전반이 큰 타격을 받고 있다. 최근 공유경제의 확산으로 팽창되고 있는 Airbnb와 같은 숙박 공유서비스는 공급자와 수요자 간의 신뢰와 소통을 기반으로 거래가 이루어지기 때문에 팬데믹으로 인한 영향을 특히 크게 받고 있다. 팬데믹 상황이 개인의 여행에 대한 인식과 행동을 변화시킴에 따라 이를 개선하기 위한 전략에 대한 논의가 이루어지고 있지만 대부분의 연구는 전통적인 외식업, 숙박업 공급자와 정부 측면의 거시적 전략을 제시하고 있다. 본 연구는 Peer-to-Peer 거래 중심의 공유경제의 특수성을 고려하여 COVID-19 팬데믹 발생 전후로 Airbnb 개별 호스트의 마케팅 전략의 변화가 공유성과에 미치는 영향을 실증적으로 분석함으로써 개별 호스트 측면의 팬데믹 전략에 대해 논한다. Airbnb의 호스트가 본인의 시설을 홍보하는 통로인 시설소개 텍스트를 수집하여 딥러닝 기반 특성추출방법인 Attention-based aspect extraction 모델로부터 9개의 주요 특성을 추출하였다. 추출된 특성이 해당 텍스트에서 등장하는 빈도가 COVID-19 발생 전후 변화량을 측정하여 이것이 공유성과에 미치는 영향을 분석하였다. 또한 이러한 영향을 숙박시설의 유형 간에 비교함으로써 시설 유형별 효과적으로 작용하는 특성을 관찰하였다. 회귀분석 결과 주방시설, 정원, 호스트와의 교류 순으로 공유성과에 긍정적인 영향을 보이지만 시설 유형에 따라 공유성과에 미치는 영향은 다소 차이가 있었다. 특히 집 전체를 대여하는 경우 개인실 대여에 비해 주방시설에 대한 설명이 상당한 효과를 보여주었다. 이를 통해 본 연구는 공유숙박 서비스의 개별 서비스 제공자가 시설의 종류에 따라 취할 수 있는 팬데믹 위기 대처전략에 대한 아이디어를 제시한다.

베이지안 확률 및 폐쇄 순차패턴 마이닝 방식을 이용한 설명가능한 로그 이상탐지 시스템 (An Interpretable Log Anomaly System Using Bayesian Probability and Closed Sequence Pattern Mining)

  • 윤지영;신건윤;김동욱;김상수;한명묵
    • 인터넷정보학회논문지
    • /
    • 제22권2호
    • /
    • pp.77-87
    • /
    • 2021
  • 인터넷과 개인용 컴퓨터가 발달하면서 다양하고 복잡한 공격들이 등장하기 시작했다. 공격들이 복잡해짐에 따라 기존에 사용하던 시그니처 기반의 탐지 방식으로 탐지가 어려워졌으며 이를 해결하기 위해 행위기반의 탐지를 위한 로그 이상탐지에 대한 연구가 주목 받기 시작했다. 최근 로그 이상탐지에 대한 연구는 딥러닝을 활용해 순서를 학습하는 방식으로 이루어지고 있으며 좋은 성능을 보여준다. 하지만 좋은 성능에도 불구하고 판단에 대한 근거를 제공하지 못한다는 한계점을 지닌다. 판단에 대한 근거 및 설명을 제공하지 못할 경우, 데이터가 오염되거나 모델 자체에 결함이 발생해도 이를 발견하기 어렵다는 문제점을 지닌다. 결론적으로 사용자의 신뢰성을 잃게 된다. 이를 해결하기 위해 본 연구에서는 설명가능한 로그 이상탐지 시스템을 제안한다. 본 연구는 가장 먼저 로그 파싱을 진행해 로그 전처리를 수행한다. 이후 전처리된 로그들을 이용해 베이지안 확률 기반 순차 규칙추출을 진행한다. 결과적으로 "If 조건 then 결과, 사후확률(θ)" 형식의 규칙집합을 추출하며 이와 매칭될 경우 정상, 매칭되지 않을 경우, 이상행위로 판단하게 된다. 실험으로는 HDFS 로그 데이터셋을 활용했으며, 그 결과 F1score 92.7%의 성능을 나타내었다.

차량 내·외부 데이터 및 딥러닝 기반 차량 위기 감지 시스템 설계 (A Design of the Vehicle Crisis Detection System(VCDS) based on vehicle internal and external data and deep learning)

  • 손수락;정이나
    • 한국정보전자통신기술학회논문지
    • /
    • 제14권2호
    • /
    • pp.128-133
    • /
    • 2021
  • 현재 자율주행차량 시장은 3레벨 자율주행차량을 상용화하고 있으나, 안정성의 문제로 완전 자율주행 중에도 사고가 발생할 가능성이 있다. 실제로 자율주행차량은 81건의 사고를 기록하고 있다. 3레벨과 다르게 4레벨 이후의 자율주행차량은 긴급상황을 스스로 판단하고 대처해야 하기 때문이다. 따라서 본 논문에서는 CNN을 통하여 차량 외부의 정보를 수집하여 저장하고, 저장된 정보와 차량 센서 데이터를 이용하여 차량이 처한 위기 상황을 0~1 사이의 수치로 출력하는 차량 내·외부 데이터 및 딥러닝 기반 차량 위기 감지 시스템을 제안한다. 차량 위기 감지 시스템은 CNN기반 신경망 모델을 사용하여 주변 차량과 보행자 데이터를 수집하는 차량 외부 상황 수집 모듈과 차량 외부 상황 수집 모듈의 출력과 차량 내부 센서 데이터를 이용하여 차량이 처한 위기 상황을 수치화하는 차량 위기 상황 판단 모듈로 구성된다. 실험 결과, VESCM의 평균 연산 시간은 55ms 였고, R-CNN은 74ms, CNN은 101ms였다. 특히, R-CNN은 보행자수가 적을 때 VESCM과 비슷한 연산 시간을 보이지만, 보행자 수가 많아 질수록 VESCM보다 많은 연산 시간을 소요했다. 평균적으로 VESCM는 R-CNN보다 25.68%, CNN보다 45.54% 더 빠른 연산 시간을 가졌고, 세 모델의 정확도는 모두 80% 이하로 감소하지 않으며 높은 정확도를 보였다.

집행관배훈안례연구(阐述工商业背景下的有限合理性):집행관배훈안례연구(执行官培训案例研究) (Interpreting Bounded Rationality in Business and Industrial Marketing Contexts: Executive Training Case Studies)

  • Woodside, Arch G.;Lai, Wen-Hsiang;Kim, Kyung-Hoon;Jung, Deuk-Keyo
    • 마케팅과학연구
    • /
    • 제19권3호
    • /
    • pp.49-61
    • /
    • 2009
  • 本文为执行官提供了他们在处理日常业务问题和市场机会时如何阐述自己思考过程的培训. 本研究建立在Schank提出的教学基础上, 包括: (1)经验学习和最好的指导提供给学习者从诸如全球背景, 团队项目和专家经历等的互动的故事提炼知识和技能的机会. (2) 告诉不会导致学习, 因为在学习需要的行动训练环境中, 应强调积极使用故事, 案例和项目. 每个培训案例包括执行官解释自己的决策系统分析(DSA, 还需要执行官做DSA简报. 在训练时要求执行官写DSA简报. 在执行官学员写书面报告的说明中包括(1) DSA路线图的本质的细节(2) 警告和机会的陈述, 读者的行政地图及图内的DSA解释. 该报告的最大长度为500字, 其规则就是使行政人员培训课程行之有效. 引言之后是第二部分文献综述, 简要地总结了有关人们在对问题和机会的背景下的想法及文献. 第三部分通过使用对不同的贴牌生产客户定价相同的化学产品的培训练习来解释DSA的起源和过程, 第四部分展示一个炼油设备公司订价决策的培训练习. 第五部分提供一个商业客户办公家具采购的市场策略案例. 第六部分是结论和建议. 这些建议是关于使用培训课程和发展其他培训课程来磨练执行官制定决策的能力. 文章引导读者利用工具箱研究综合的报告, (DSA)路线图根据生态合理性理论将战略与环境相匹配. 这三个案例的研究让学习者在意愿层面征求建议来作出决策. Todd and Gigerenzer 提出人们使用简单启发式,因为他们在自然的决策环境中通过探索信息的结构使适应性行为有可能产生. "简单是一种美德, 而不是诅咒", 有限理性理论强调了西蒙的命题中心, "人类理性的行为仿佛一把剪刀, 其刀片则是任务环境的结构和执行者的计算能力". Gigerenzer的观点和西蒙的环境的危害相关, 也和本文中三个环境结构的案例相关. "环境这个词, 在这里, 并不是指总的物理和生理的环境, 而只是指被给予需要和目标的重要有机体 本文关注了结合任务环境的结构和使用适应的工具箱启发的报告. (DSA)路线图根据生态理性理论将战略与环境相匹配. 渴望适应理论是这一方针的核心. 渴望适应理论将决策制定作为一个没有把目标整合的多目标问题模拟成一个把所有决策选项进行完全的优先顺序化. 这三个案例研究让学习者在意愿层面征求建议来作出决策. 渴望适应用一系列的调整步骤的形式. 一个调整步骤通过仅一个目标变量的变化就可以改变在渴望网格上邻近点当前的渴望水平. 上调步骤是目标变量的提高, 下调步骤是目标变量的下降. 创造和使用渴望适应水平是对有限理性理论的整合. 文章通过提供学习者经验和实践环节增加了意愿采纳和有限合理性的理解和特点. 利用DSA图排列CTSs和撰写TOP可以清晰和深化Selten的观点 "清晰, 意愿采纳必须作为研究的解决方案整合到整个蓝图中". 这些有限理性的研究许可了在现实生活中为什么, 如何作决策的理论和在自然的环境中利用启发式的学习训练两方面的发展. 本文中的练习鼓励根据不同使用目的学习快速而简洁的启发式技巧和原则. 这也正回应了Schank的思想 "从本质上来看, 教育不是让学生们知道发生了什么, 而是让他们感受到所发生的事情. 这不容易做到. 在如今的学校教育是没有情感的, 这是一个很大的问题". 这三个案例和附加的练习问题遵守了Schank的观点. "这种教育过程最好是通过参与他们其中来实现, 也可以这样认为, 精神层面的积极讨论".

  • PDF

기계학습을 이용한 수출신용보증 사고예측 (The Prediction of Export Credit Guarantee Accident using Machine Learning)

  • 조재영;주지환;한인구
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.83-102
    • /
    • 2021
  • 2020년 8월 정부는 한국판 뉴딜을 뒷받침하기 위한 공공기관의 역할 강화방안으로서 각 공공기관별 역량을 바탕으로 5대 분야에 걸쳐 총 20가지 과제를 선정하였다. 빅데이터(Big Data), 인공지능 등을 활용하여 대국민 서비스를 제고하고 공공기관이 보유한 양질의 데이터를 개방하는 등의 다양한 정책을 통해 한국판 뉴딜(New Deal)의 성과를 조기에 창출하고 이를 극대화하기 위한 다양한 노력을 기울이고 있다. 그중에서 한국무역보험공사(KSURE)는 정책금융 공공기관으로 국내 수출기업들을 지원하기 위해 여러 제도를 운영하고 있는데 아직까지는 본 기관이 가지고 있는 빅데이터를 적극적으로 활용하지 못하고 있는 실정이다. 본 연구는 한국무역보험공사의 수출신용보증 사고 발생을 사전에 예측하고자 공사가 보유한 내부 데이터에 기계학습 모형을 적용하였고 해당 모형 간에 예측성과를 비교하였다. 예측 모형으로는 로지스틱(Logit) 회귀모형, 랜덤 포레스트(Random Forest), XGBoost, LightGBM, 심층신경망을 사용하였고, 평가 기준으로는 전체 표본의 예측 정확도 이외에도 표본별 사고 확률을 구간으로 나누어 높은 확률로 예측된 표본과 낮은 확률로 예측된 경우의 정확도를 서로 비교하였다. 각 모형별 전체 표본의 예측 정확도는 70% 내외로 나타났고 개별 표본을 사고 확률 구간별로 세부 분석한 결과 양 극단의 확률구간(0~20%, 80~100%)에서 90~100%의 예측 정확도를 보여 모형의 현실적 활용 가능성을 보여주었다. 제2종 오류의 중요성 및 전체적 예측 정확도를 종합적으로 고려할 경우, XGBoost와 심층신경망이 가장 우수한 모형으로 평가되었다. 랜덤포레스트와 LightGBM은 그 다음으로 우수하며, 로지스틱 회귀모형은 가장 낮은 성과를 보였다. 본 연구는 한국무역보험공사의 빅데이터를 기계학습모형으로 분석해 업무의 효율성을 높이는 사례로서 향후 기계학습 등을 활용하여 실무 현장에서 빅데이터 분석 및 활용이 활발해지기를 기대한다.

미세먼지 예측 성능 개선을 위한 시공간 트랜스포머 모델의 적용 (Application of spatiotemporal transformer model to improve prediction performance of particulate matter concentration)

  • 김영광;김복주;안성만
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.329-352
    • /
    • 2022
  • 미세먼지는 폐나 혈관에 침투해 각종 심장 질환이나 폐암 등의 호흡기 질환을 일으키는 것으로 보고되고 있다. 지하철은 일 평균 천만 명이 이용하는 교통수단으로, 깨끗하고 쾌적한 환경조성이 중요하나 지하터널을 통과하는 지하철의 운행 특성과 터널에 갇힌 미세먼지가 열차 풍으로 인해 지하역사로 이동하는 등의 문제로 지하역사의 미세먼지 오염도는 높은 것으로 나타나고 있다. 환경부와 서울시는 지하역사 공기질 개선대책을 수립하여 다양한 미세먼지 저감 노력을 기울이고 있다. 스마트 공기질 관리 시스템은 공기질 데이터 수집 및 미세먼지 농도를 예측하여 공기질을 관리하는 시스템으로 미세먼지 농도 예측 모델이 중요한 구성 요소이다. 그동안 시계열 데이터 예측에 관한 다양한 연구가 진행되어왔지만, 지하철 역사의 미세먼지 농도 예측과 관련해서는 통계나 순환신경망 기반의 딥러닝 모델 연구에 국한되어 있다. 이에 본 연구에서는 시공간 트랜스포머를 포함한 4개의 트랜스포머 기반 모델을 제안한다. 서울시 지하철 역사의 대합실을 대상으로 한 시간 후의 미세먼지 농도 예측실험을 수행한 결과, 트랜스포머 기반 모델들의 성능이 기존의 ARIMA, LSTM, Seq2Seq 모델들에 비해 우수한 성능을 나타냄을 확인하였다. 트랜스포머 기반 모델 중에서는 시공간 트랜스포머의 성능이 가장 우수하였다. 데이터 기반의 예측을 통하여 운영되는 스마트 공기질 관리 시스템은 미세먼지 예측의 정확도가 향상될수록 더욱더 효과적이고 에너지 효율적으로 운영될 수 있다. 본 연구 결과는 스마트 공기질 관리 시스템의 효율적 운영에 기여할 수 있을 것으로 기대된다.

입력변수 및 학습사례 선정을 동시에 최적화하는 GA-MSVM 기반 주가지수 추세 예측 모형에 관한 연구 (A Study on the Prediction Model of Stock Price Index Trend based on GA-MSVM that Simultaneously Optimizes Feature and Instance Selection)

  • 이종식;안현철
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.147-168
    • /
    • 2017
  • 오래 전부터 학계에서는 정확한 주식 시장의 예측에 대한 많은 연구가 진행되어 왔고 현재에도 다양한 기법을 응용한 예측모형들이 연구되고 있다. 특히 최근에는 딥러닝(Deep-Learning)을 포함한 다양한 기계학습기법(Machine Learning Methods)을 이용해 주가지수를 예측하려는 많은 시도들이 진행되고 있다. 전통적인 주식투자거래의 분석기법으로는 기본적 분석과 기술적 분석방법이 사용되지만 보다 단기적인 거래예측이나 통계학적, 수리적 기법을 응용하기에는 기술적 분석 방법이 보다 유용한 측면이 있다. 이러한 기술적 지표들을 이용하여 진행된 대부분의 연구는 미래시장의 (보통은 다음 거래일) 주가 등락을 이진분류-상승 또는 하락-하여 주가를 예측하는 모형을 연구한 것이다. 하지만 이러한 이진분류로는 추세를 예측하여 매매시그널을 파악하거나, 포트폴리오 리밸런싱(Portfolio Rebalancing)의 신호로 삼기에는 적합치 않은 측면이 많은 것 또한 사실이다. 이에 본 연구에서는 기존의 주가지수 예측방법인 이진 분류 (binary classification) 방법에서 주가지수 추세를 (상승추세, 박스권, 하락추세) 다분류 (multiple classification) 체계로 확장하여 주가지수 추세를 예측하고자 한다. 이러한 다 분류 문제 해결을 위해 기존에 사용하던 통계적 방법인 다항로지스틱 회귀분석(Multinomial Logistic Regression Analysis, MLOGIT)이나 다중판별분석(Multiple Discriminant Analysis, MDA) 또는 인공신경망(Artificial Neural Networks, ANN)과 같은 기법보다는 예측성과의 우수성이 입증된 다분류 Support Vector Machines(Multiclass SVM, MSVM)을 사용하고, 이 모델의 성능을 향상시키기 위한 래퍼(wrapper)로서 유전자 알고리즘(Genetic Algorithm)을 이용한 최적화 모델을 제안한다. 특히 GA-MSVM으로 명명된 본 연구의 제안 모형에서는 MSVM의 커널함수 매개변수, 그리고 최적의 입력변수 선택(feature selection) 뿐만이 아니라 학습사례 선택(instance selection)까지 최적화하여 모델의 성능을 극대화 하도록 설계하였다. 제안 모형의 성능을 검증하기 위해 국내주식시장의 실제 데이터를 적용해본 결과 ANN이나 CBR, MLOGIT, MDA와 같은 기존 데이터마이닝 기법들이나 인공지능 알고리즘은 물론 현재까지 가장 우수한 예측 성과를 나타내는 것으로 알려져 있던 전통적인 다분류 SVM 보다도 제안 모형이 보다 우수한 예측성과를 보임을 확인할 수 있었다. 특히 주가지수 추세 예측에 있어서 학습사례의 선택이 매우 중요한 역할을 하는 것으로 확인 되었으며, 모델의 성능의 개선효과에 다른 요인보다 중요한 요소임을 확인할 수 있었다.

합성곱 신경망 기반 맨하탄 좌표계 추정 (Estimation of Manhattan Coordinate System using Convolutional Neural Network)

  • 이진우;이현준;김준호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제23권3호
    • /
    • pp.31-38
    • /
    • 2017
  • 본 논문에서는 도심 영상에 대해 맨하탄 좌표계를 추정하는 합성곱 신경망(Convolutional Neural Network) 기반의 시스템을 제안한다. 도심 영상에서 맨하탄 좌표계를 추정하는 것은 영상 조정, 3차원 장면 복원 등 컴퓨터 그래픽스 및 비전 문제 해결의 기본이 된다. 제안하는 합성곱 신경망은 GoogLeNet[1]을 기반으로 구성한다. 합성곱 신경망을 훈련하기 위해 구글 스트리트 뷰 API로 영상을 수집하고 기존 캘리브레이션 방법으로 맨하탄 좌표계를 계산하여 데이터셋을 생성한다. 장면마다 새롭게 합성곱 신경망을 학습해야하는 PoseNet[2]과 달리, 본 논문에서 제안하는 시스템은 장면의 구조를 학습하여 맨하탄 좌표계를 추정하기 때문에 학습되지 않은 새로운 장면에 대해서도 맨하탄 좌표계를 추정한다. 제안하는 방법은 학습에 참여하지 않은 구글 스트리트 뷰 영상을 검증 데이터로 테스트하였을 때 $3.157^{\circ}$의 중간 오차로 맨하탄 좌표계를 추정하였다. 또한, 동일 검증 데이터에 대해 제안하는 방법이 기존 맨하탄 좌표계 추정 알고리즘[3]보다 더 낮은 중간 오차를 보이는 것을 확인하였다.

미래 기상정보를 사용하지 않는 LSTM 기반의 피크시간 태양광 발전량 예측 기법 (A LSTM Based Method for Photovoltaic Power Prediction in Peak Times Without Future Meteorological Information)

  • 이동훈;김관호
    • 한국전자거래학회지
    • /
    • 제24권4호
    • /
    • pp.119-133
    • /
    • 2019
  • 최근 태양광 발전량 예측은 태양광 발전량 설비 시스템의 안정적인 작동을 위한 조정 계획, 설비 규격 결정 및 생산 계획 일정을 수립하기 위해 필수적인 요소로 고려된다. 특히, 대부분의 태양광 발전량은 피크시간에 측정되기 때문에, 태양광 시스템 운영자의 이익 최대화와 전력 계통량 안정화를 위해 피크시간의 태양광 발전량 예측은 매우 중요한 요소이다. 또한, 기존 연구들은 광범위한 지역에서 예측된 불확실한 기후 정보들을 이용하여 태양광 발전량을 예측하는 한계점 때문에 일사량, 운량, 온도 등과 기상정보 없이 피크시간의 태양광 발전량을 예측하는 것은 매우 어려운 문제로 고려된다. 따라서 본 논문에서는 피크이전의 기후, 계절 및 관측된 태양광 발전량을 이용하여 미래의 기후 및 계절 정보 없이 피크시간의 태양광 발전량을 예측할 수 있는 LSTM(Long-Shot Term Memory) 기반의 태양광 발전량 예측 기법을 제안한다. 본 연구에서 제안한 모델을 기반으로 실 데이터를 통한 실험 결과, 단기 및 장기적 관점에서 높은 성능을 보였으며, 이는 본 연구에서 목표로 한 피크시간의 태양광 발전량 예측 성능 향상에 긍정적인 영향을 나타내었음을 보여준다.