• 제목/요약/키워드: business intelligence

검색결과 1,224건 처리시간 0.025초

딥러닝의 모형과 응용사례 (Deep Learning Architectures and Applications)

  • 안성만
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.127-142
    • /
    • 2016
  • 딥러닝은 인공신경망(neural network)이라는 인공지능분야의 모형이 발전된 형태로서, 계층구조로 이루어진 인공신경망의 내부계층(hidden layer)이 여러 단계로 이루어진 구조이다. 딥러닝에서의 주요 모형은 합성곱신경망(convolutional neural network), 순환신경망(recurrent neural network), 그리고 심층신뢰신경망(deep belief network)의 세가지라고 할 수 있다. 그 중에서 현재 흥미로운 연구가 많이 발표되어서 관심이 집중되고 있는 모형은 지도학습(supervised learning)모형인 처음 두 개의 모형이다. 따라서 본 논문에서는 지도학습모형의 가중치를 최적화하는 기본적인 방법인 오류역전파 알고리즘을 살펴본 뒤에 합성곱신경망과 순환신경망의 구조와 응용사례 등을 살펴보고자 한다. 본문에서 다루지 않은 모형인 심층신뢰신경망은 아직까지는 합성곱신경망 이나 순환신경망보다는 상대적으로 주목을 덜 받고 있다. 그러나 심층신뢰신경망은 CNN이나 RNN과는 달리 비지도학습(unsupervised learning)모형이며, 사람이나 동물은 관찰을 통해서 스스로 학습한다는 점에서 궁극적으로는 비지도학습모형이 더 많이 연구되어야 할 주제가 될 것이다.

빅데이터 시대의 개인정보 과잉이 사용자 저항에 미치는 영향 (Personal Information Overload and User Resistance in the Big Data Age)

  • 이환수;임동원;조항정
    • 지능정보연구
    • /
    • 제19권1호
    • /
    • pp.125-139
    • /
    • 2013
  • 최근 주목 받기 시작한 빅데이터 기술은 대량의 개인 정보에 대한 접근, 수집, 저장을 용이하게 할 뿐만 아니라 개인의 원하지 않는 민감한 정보까지 분석할 수 있게 한다. 이러한 기술이나 서비스를 이용하는 사람들은 어느 정도의 프라이버시 염려를 가지고 있으며, 이것은 해당 기술의 사용을 저해하는 요인으로 작용할 수 있다. 대표적 예로 소셜 네트워크 서비스의 경우, 다양한 이점이 존재하는 서비스이지만, 사용자들은 자신이 올린 수많은 개인 정보로 인해 오히려 프라이버시 침해 위험에 노출될 수 있다. 온라인 상에서 자신이 생성하거나 공개한 정보일 경우에도 이러한 정보가 의도하지 않은 방향으로 활용되거나 제3자를 의해 악용되면서 프라이버시 문제를 일으킬 수 있다. 따라서 본 연구는 사용자들이 이러한 환경에서 인지할 수 있는 개인정보의 과잉이 프라이버시 위험과 염려에 어떠한 영향을 주는지를 살펴보고, 사용자 저항과 어떠한 관계가 있는지 분석한다. 데이터 분석을 위해 설문과 구조방정식 방법론을 활용했다. 연구결과는 소셜 네트워크 상의 개인정보 과잉 현상은 사용자들의 프라이버시 위험 인식에 영향을 주어 개인의 프라이버시 염려 수준을 증가 시키는 요인으로 작용할 수 있음을 보여준다.

충동성이 모바일뱅킹 사용률에 미치는 영향: 신용카드 사용 여부의 조절효과와 SNS 중독의 매개효과 (Impact of impulsiveness on mobile banking usage: Moderating effect of credit card use and mediating effect of SNS addiction)

  • 이유미;남기환
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.113-137
    • /
    • 2021
  • 모바일뱅킹의 성장세 뚜렷한 가능성에 따라 이와 관련한 연구들이 다수 진행되고 있으나, 국내의 경우 기술적인 요소나 소비자의 이용 의도 및 행동, 만족에 대한 분석으로 집중되어 있는 실정이다. 또한 20대라는 견고한 고객층을 보유하였음에도 이러한 고객 집단을 특정하여 진행된 연구는 거의 찾아볼 수 없다. 모바일뱅킹이 한 단계 도약하기 위해서는 그 자체에 대한 연구뿐만 아니라 모바일뱅킹에 영향을 미치는 외부요인에 대한 연구를 통해 다양한 관점을 확보하는 전략이 필요하다. 따라서 본 연구는 20대의 모바일뱅킹에 유의미한 영향을 미칠 수 있는 다양한 외부요인 중 충동성, 신용카드사용 여부, SNS 중독을 분석하였다. 충동성의 네 가지 하위요인인 부정긴급성, 긍정긴급성, 계획성부족, 지속성부족과 모바일뱅킹 사용률 간의 관계를 검토하고, 여기에 신용카드 사용 여부가 영향을 미치는지 확인하였다. 또한 충동성의 각 하위요인과 SNS 중독의 세 가지 하위요인인 조절실패 및 일상생활장애, 몰입 및 내성, 부정정서회피 간의 관계를 탐색하였다. 이때 모바일 기반의 SNS 중독이 충동성과 모바일뱅킹 사용률 간의 관계에서 어떠한 매개효과를 보이는지 확인하였다. 이러한 분석을 위해 20대 남녀 150명을 대상으로 설문조사를 진행하였고, 수집된 자료는 SPSS Statistics 25 프로그램을 이용하여 연구문제에 따라 상관분석, 회귀분석 등을 실시하였다. 연구결과는 다음과 같다. 첫째, 긍정긴급성은 모바일뱅킹 사용률에 유의한 정적 영향을 미치는 것으로 나타났다. 둘째, 신용카드 사용 여부는 부정긴급성과 모바일뱅킹 사용률의 관계에서 조절효과를 보였다. 셋째, 충동성의 하위요인은 모두 SNS 중독의 하위요인과 유의미한 정적 관계가 있는 것으로 나타났다. 넷째, 긍정긴급성 및 SNS 중독, 모바일뱅킹 사용률의 관계에서 총효과와 직접효과가 나타나는 것으로 확인되었다.

소비자 감성 분석 기반의 음악 추천 알고리즘 개발 (Development of Music Recommendation System based on Customer Sentiment Analysis)

  • 이승준;서봉군;박도형
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.197-217
    • /
    • 2018
  • 음악은 인간의 감성을 소리로 표현하는 창조적 예술 행위이다. 음악은 사람들의 기분을 우울하게 혹은 기쁘게 변화시킬 수 있다. 따라서 음악을 감상하는 데 있어 감성은 소비자에게 적합한 음악을 찾고 들려주는 데 매우 중요한 요소인데, 다양한 음원 서비스에서 제공하는 추천 알고리즘은 사용자의 기본적인 정보(성별, 나이, 감상 횟수 등)와 사용자의 플레이 기록에 기반한 음악 추천 방식을 주로 사용하고 있다. 본 연구에서는 음악을 감상하는 개인의 감성을 고려하여 각 음원이 가지는 고유의 감성을 기본으로 한 음악 추천 알고리즘을 제안해 보고자 한다. 구체적으로, 사용자들이 자주 듣는 음악과 그렇지 않은 음악을 기준으로 '감정 패턴'을 추출 후 상관관계를 확인하고자 하며, 앞선 결과를 기반으로 사용자들이 원하는 노래에 대한 검색과 사용자 감성 기반 추천 방법을 도출해내보고자 한다. 이를 위해 본 연구에서는 사례기반추론 기법을 이용하여 사람들이 주로 듣는 음악과 비슷한 '감성 패턴'을 갖는 특정한 곡을 추천해주는 알고리즘을 개발하였다. 먼저, 분석에 필요한 감정 형용사를 정리하여 변수화 시키고, 의미 있는 것끼리 묶어 음악 감성지수를 개발하였고, 분석의 대상이 될 음원에 대해 고유의 감성지수 점수를 측정하였다. 마지막으로 도출된 점수의 결과를 통해 유사한 감정 패턴이 나오는 곡들을 유사 곡 리스트로 분류하고 사용자들에게 추천하는 과정을 거친다. 앞선 일련의 과정을 거처 도출된 결과는 음원 추천 시스템뿐만 아니라, 인기 있는 곡과 아닌 곡에 영향을 미치는 변수 도출 및 음원 출시 전, 해당 곡의 스트리밍 수 예측 모형 구축 등 다양한 용도로 사용될 수 있을 것으로 기대한다.

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

텍스트마이닝을 활용한 북한 관련 뉴스의 기간별 변화과정 고찰 (An Investigation on the Periodical Transition of News related to North Korea using Text Mining)

  • 박철수
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.63-88
    • /
    • 2019
  • 북한의 변화와 동향 파악에 대한 연구는 북한관련 정책에 대한 방향을 결정하고 북한의 행위를 예측하여 사전에 대응 할 수 있다는 측면에서 매우 중요하다. 현재까지 북한 동향에 대한 연구는 전문가를 중심으로 과거 사례를 서술적으로 분석하여, 향후에 북한의 동향을 분석하고 대응하여 왔다. 이런 전문가 서술 중심의 북한 변화 및 동향 연구에서 비정형데이터를 이용한 텍스트마이닝 분석이 더해지면 보다 과학적인 북한 동향 분석이 가능할 것이다. 특히 북한의 동향 파악과 북한의 대남 관련 행위와 연관된 연구는 통일 및 국방 분야에서 매우 유용하며 필요한 분야이다. 본 연구에서는 북한의 신문 기사 내용을 활용한 텍스트마이닝 방법으로 북한과 관련한 핵심 단어를 구축하였다. 그리고 본 연구는 김정은 집권 이후 최근의 남북관계의 극적인 관계와 변화들을 기반으로 세 개의 기간을 나누고 이 기간 내에 국내 언론에 나타난 북한과 관련성이 높은 단어들을 시계열적으로 분석한 연구이다. 북한과 관련한 주요 단어들을 세 개의 기간별로 분류하고 당시에 북한의 태도와 동향에 따라 해당 단어와 주제들의 관련성이 어떻게 변화하였는지를 파악하였다. 본 연구는 텍스트마이닝을 이용한 연구가 남북관계 및 북한의 동향을 이해하고 분석하는 방법론으로서 얼마나 유용한 것이지를 파악하는 것이었다. 앞으로 북한의 동향 분석에 대한 연구는 물론 대북관계 및 정책에 대한 방향을 결정하고, 북한의 행위를 사전에 예측하여 대응 할 수 있는 북한 리스크 측정 모델 구축을 위한 연구로 진행 될 것이다.

복합 문서의 의미적 분해를 통한 다중 벡터 문서 임베딩 방법론 (Multi-Vector Document Embedding Using Semantic Decomposition of Complex Documents)

  • 박종인;김남규
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.19-41
    • /
    • 2019
  • 텍스트 데이터에 대한 다양한 분석을 위해 최근 비정형 텍스트 데이터를 구조화하는 방안에 대한 연구가 활발하게 이루어지고 있다. doc2Vec으로 대표되는 기존 문서 임베딩 방법은 문서가 포함한 모든 단어를 사용하여 벡터를 만들기 때문에, 문서 벡터가 핵심 단어뿐 아니라 주변 단어의 영향도 함께 받는다는 한계가 있다. 또한 기존 문서 임베딩 방법은 하나의 문서가 하나의 벡터로 표현되기 때문에, 다양한 주제를 복합적으로 갖는 복합 문서를 정확하게 사상하기 어렵다는 한계를 갖는다. 본 논문에서는 기존의 문서 임베딩이 갖는 이러한 두 가지 한계를 극복하기 위해 다중 벡터 문서 임베딩 방법론을 새롭게 제안한다. 구체적으로 제안 방법론은 전체 단어가 아닌 핵심 단어만 이용하여 문서를 벡터화하고, 문서가 포함하는 다양한 주제를 분해하여 하나의 문서를 여러 벡터의 집합으로 표현한다. KISS에서 수집한 총 3,147개의 논문에 대한 실험을 통해 복합 문서를 단일 벡터로 표현하는 경우의 벡터 왜곡 현상을 확인하였으며, 복합 문서를 의미적으로 분해하여 다중 벡터로 나타내는 제안 방법론에 의해 이러한 왜곡 현상을 보정하고 각 문서를 더욱 정확하게 임베딩할 수 있음을 확인하였다.

BERT 기반 감성분석을 이용한 추천시스템 (Recommender system using BERT sentiment analysis)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.1-15
    • /
    • 2021
  • 추천시스템은 사용자의 기호를 파악하여 물품 구매 결정을 도와주는 역할을 할 뿐만 아니라, 비즈니스 전략의 관점에서도 중요한 역할을 하기에 많은 기업과 기관에서 관심을 갖고 있다. 최근에는 다양한 추천시스템 연구 중에서도 NLP와 딥러닝 등을 결합한 하이브리드 추천시스템 연구가 증가하고 있다. NLP를 이용한 감성분석은 사용자 리뷰 데이터가 증가함에 따라 2000년대 중반부터 활용되기 시작하였지만, 기계학습 기반 텍스트 분류를 통해서는 텍스트의 특성을 완전히 고려하기 어렵기 때문에 리뷰의 정보를 식별하기 어려운 단점을 갖고 있다. 본 연구에서는 기계학습의 단점을 보완하기 위하여 BERT 기반 감성분석을 활용한 추천시스템을 제안하고자 한다. 비교 모형은 Naive-CF(collaborative filtering), SVD(singular value decomposition)-CF, MF(matrix factorization)-CF, BPR-MF(Bayesian personalized ranking matrix factorization)-CF, LSTM, CNN-LSTM, GRU(Gated Recurrent Units)를 기반으로 하는 추천 모형이며, 실제 데이터에 대한 분석 결과, BERT를 기반으로 하는 추천시스템의 성과가 가장 우수한 것으로 나타났다.

경제적, 산업구조적, 문화적 요인을 기반으로 한 주요 국가의 한국 품목별 수입액 예측 모형 개발: 한국의, 한국에 대한 문화적 요인을 중심으로 (Development of the forecasting model for import volume by item of major countries based on economic, industrial structural and cultural factors: Focusing on the cultural factors of Korea)

  • 전승표;서봉군;박도형
    • 지능정보연구
    • /
    • 제27권4호
    • /
    • pp.23-48
    • /
    • 2021
  • 한국경제는 지난 수십년간 정부의 수출전략정책에 힘입어 지속적으로 경제 성장을 이룩해왔으며, 수출의 증가는 경제의 효율성 향상, 고용창출, 기술개발 촉진 등 우리나라의 경제 성장을 견인하는 주도적인 역할을 해왔다. 전통적으로 우리나라 수출에 영향을 미치는 주요 요인은 크게 경제적 요인과 산업구조적 요인이라는 두가지 관점에서 찾아볼 수 있다. 첫번째, 경제적 요인은 환율과 글로벌 경기 변동과 관련된 것으로서, 환율이 우리나라 수출에 미치는 영향은 환율 수준 및 환율 변동성에 따른 영향으로 나누어 살펴볼 수 있으며, 글로벌 경기 변동은 세계 수입 수요에 영향을 미쳐 우리나라 수출을 좌우하는 절대적 요인으로 볼 수 있다. 두 번째, 산업구조적 요인은 국제 분업화의 둔화, 중국의 특정 수입품 자국내 대체 증가, 수출 주력 산업의 해외생산 형태 변화 등 산업이나 제품에 따라 발생한 고유한 특징이다. 가장 최근 글로벌 교류와 관련된 연구들을 살펴보면, 경제적 요인 및 산업구조적 요인과 더불어 문화적인 측면이 중요함을 여러 문헌에서 피력하고 있다. 이에 따라 본 연구에서는 각국의 한국 수입액 예측 모형에 문화적 요인을 함께 반영하여 예측 모형을 개발하고자 하였으며, 구체적으로 문화적 요인이 수입액에 미치는 영향을 PUSH-PULL 프레임워크 관점에서 반영해보고자 하였다. PUSH 관점은 한국이 자신의 브랜드를 개발하고 적극 홍보하는 관점으로 K-POP, K-FOOD, K-CULTURE 등으로 대표되는 한국의 브랜드에 대한 각국의 관심 정도로 정의할 수 있다. 또한, PULL 관점은 각 국가의 국민들의 문화적, 심리적 특징으로 해당 국가의 지배체계, 남성성, 위험 회피성, 시간에 대한 단기/장기 지향성 등으로 대표되는 각 국의 문화 코드로서 한류문화를 얼마나 수용할 성향을 띄고 있는지로 정의할 수 있다. 본 연구에서 제시한 최종 예측 모델의 고유한 특징은 Design Principle에 기반하여 설계한 것인데, 1) 신규로 추가한 데이터 소스를 통해 한국에 대한 관심 및 문화적 특성이 반영될 수 있는 모형으로 구축하였고, 2) 경제적 요인 등의 변화와 품목 및 국가 Code를 입력하면 예측값을 바로 불러올 수 있도록 실용적으로 편의성 있게 설계하였으며, 3) 이론적으로도 의미 있는 결과를 도출하기 위해서 입력과 목표 변수간의 관계를 해석 가능한 알고리즘을 중심으로 설계하였다는 점이다. 본 연구는 기술적 측면, 경제적 측면, 정책적 측면에서 의미 있는 시사점을 제시할 수 있으며, 수입액 예측 모형을 활용하여 중소·중견기업의 수출 지원 전략에 의미 있는 기여를 할 수 있을 것으로 기대된다.

분류 알고리즘 기반 주문 불균형 정보의 단기 주가 예측 성과 (Classification Algorithm-based Prediction Performance of Order Imbalance Information on Short-Term Stock Price)

  • 김선웅
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.157-177
    • /
    • 2022
  • 투자자들은 증권회사가 제공하는 시세표인 Limit Order Book 정보를 통해 국내외 투자자들이 제출하는 주문 정보를 실시간으로 파악하면서 거래에 참여하고 있다. Limit Order Book에 실시간으로 공개되고 있는 주문 정보가 주가 예측에서 유용성이 있을까? 본 연구는 장 중 투자자들의 매수와 매도 주문이 어느 한쪽으로 쏠리면서 주문 불균형이 나타나는 경우 미래 주가 등락의 예측 변수로서 유의성이 있는지를 분석하는 것이다. 분류 알고리즘을 이용하여 주문 불균형 정보의 당일 종가 등락에 대한 예측 정확도를 높이고, 예측 결과를 이용한 데이트레이딩 전략을 제안하며 실증분석을 통해 투자 성과를 분석한다. 자료는 2004년 1월 19일부터 2022년 6월 30일까지의 4,564일 동안의 코스피200 주가지수선물 5 분 봉 주가를 분석하였다. 실증분석 결과는 다음과 같다. 첫째, 총매수 주문량과 총매도 주문량의 불균형 정도로 측정하는 주문 불균형지수와 주가는 유의적 상관성을 보인다. 둘째, 주문 불균형 정보는 당일 종가까지의 미래 주가 등락에 대해서도 유의적인 영향력이 나타났다. 셋째, 주문 불균형 정보를 이용한 당일 종가 등락의 예측 정확도는 Support Vector Machines 알고리즘이 54.1%로 가장 높게 나타났다. 넷째, 하루 중 이른 시점에서 측정한 주문 불균형지수가 늦은 시점에서 측정한 주문 불균형지수보다 예측 정확성이 더 높았다. 다섯째, 종가 등락 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 비교모형의 투자 성과보다 높게 나타났다. 여섯째, 분류 알고리즘을 이용한 투자 성과는 K-Nearest Neighbor 알고리즘을 제외하면 모두 비교모형보다 총수익 평균이 높게 나타났다. 일곱째, Logistic Regression, Random Forest, Support Vector Machines, XGBoost 알고리즘의 예측 결과를 이용한 데이트레이딩 전략의 투자 성과는 수익성과 위험성을 동시에 평가하는 샤프비율에서도 비교모형보다 높은 결과를 보여주었다. 본 연구는 Limit Order Book 정보 중 총매수 주문량과 총매도 주문량 정보의 경제적 가치가 존재함을 밝혔다는 점에서 기존의 연구와 학술적 차별점을 갖는다. 본 연구의 실증분석 결과는 시장 참여자들에게 투자 전략적 측면에서 함의가 있다고 판단된다. 향후 연구에서는 최근 활발히 연구가 진행되고 있는 딥러닝 모형 등으로의 확장을 통해 주가 예측의 정확도를 높임으로써 데이트레이딩 투자전략의 성과를 개선할 필요가 있다.