• 제목/요약/키워드: decision algorithm

검색결과 2,359건 처리시간 0.025초

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

다분류 SVM을 이용한 DEA기반 벤처기업 효율성등급 예측모형 (The Prediction of DEA based Efficiency Rating for Venture Business Using Multi-class SVM)

  • 박지영;홍태호
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.139-155
    • /
    • 2009
  • For the last few decades, many studies have tried to explore and unveil venture companies' success factors and unique features in order to identify the sources of such companies' competitive advantages over their rivals. Such venture companies have shown tendency to give high returns for investors generally making the best use of information technology. For this reason, many venture companies are keen on attracting avid investors' attention. Investors generally make their investment decisions by carefully examining the evaluation criteria of the alternatives. To them, credit rating information provided by international rating agencies, such as Standard and Poor's, Moody's and Fitch is crucial source as to such pivotal concerns as companies stability, growth, and risk status. But these types of information are generated only for the companies issuing corporate bonds, not venture companies. Therefore, this study proposes a method for evaluating venture businesses by presenting our recent empirical results using financial data of Korean venture companies listed on KOSDAQ in Korea exchange. In addition, this paper used multi-class SVM for the prediction of DEA-based efficiency rating for venture businesses, which was derived from our proposed method. Our approach sheds light on ways to locate efficient companies generating high level of profits. Above all, in determining effective ways to evaluate a venture firm's efficiency, it is important to understand the major contributing factors of such efficiency. Therefore, this paper is constructed on the basis of following two ideas to classify which companies are more efficient venture companies: i) making DEA based multi-class rating for sample companies and ii) developing multi-class SVM-based efficiency prediction model for classifying all companies. First, the Data Envelopment Analysis(DEA) is a non-parametric multiple input-output efficiency technique that measures the relative efficiency of decision making units(DMUs) using a linear programming based model. It is non-parametric because it requires no assumption on the shape or parameters of the underlying production function. DEA has been already widely applied for evaluating the relative efficiency of DMUs. Recently, a number of DEA based studies have evaluated the efficiency of various types of companies, such as internet companies and venture companies. It has been also applied to corporate credit ratings. In this study we utilized DEA for sorting venture companies by efficiency based ratings. The Support Vector Machine(SVM), on the other hand, is a popular technique for solving data classification problems. In this paper, we employed SVM to classify the efficiency ratings in IT venture companies according to the results of DEA. The SVM method was first developed by Vapnik (1995). As one of many machine learning techniques, SVM is based on a statistical theory. Thus far, the method has shown good performances especially in generalizing capacity in classification tasks, resulting in numerous applications in many areas of business, SVM is basically the algorithm that finds the maximum margin hyperplane, which is the maximum separation between classes. According to this method, support vectors are the closest to the maximum margin hyperplane. If it is impossible to classify, we can use the kernel function. In the case of nonlinear class boundaries, we can transform the inputs into a high-dimensional feature space, This is the original input space and is mapped into a high-dimensional dot-product space. Many studies applied SVM to the prediction of bankruptcy, the forecast a financial time series, and the problem of estimating credit rating, In this study we employed SVM for developing data mining-based efficiency prediction model. We used the Gaussian radial function as a kernel function of SVM. In multi-class SVM, we adopted one-against-one approach between binary classification method and two all-together methods, proposed by Weston and Watkins(1999) and Crammer and Singer(2000), respectively. In this research, we used corporate information of 154 companies listed on KOSDAQ market in Korea exchange. We obtained companies' financial information of 2005 from the KIS(Korea Information Service, Inc.). Using this data, we made multi-class rating with DEA efficiency and built multi-class prediction model based data mining. Among three manners of multi-classification, the hit ratio of the Weston and Watkins method is the best in the test data set. In multi classification problems as efficiency ratings of venture business, it is very useful for investors to know the class with errors, one class difference, when it is difficult to find out the accurate class in the actual market. So we presented accuracy results within 1-class errors, and the Weston and Watkins method showed 85.7% accuracy in our test samples. We conclude that the DEA based multi-class approach in venture business generates more information than the binary classification problem, notwithstanding its efficiency level. We believe this model can help investors in decision making as it provides a reliably tool to evaluate venture companies in the financial domain. For the future research, we perceive the need to enhance such areas as the variable selection process, the parameter selection of kernel function, the generalization, and the sample size of multi-class.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

SVM을 이용한 VKOSPI 일 중 변화 예측과 실제 옵션 매매에의 적용 (VKOSPI Forecasting and Option Trading Application Using SVM)

  • 라윤선;최흥식;김선웅
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.177-192
    • /
    • 2016
  • 기계학습(Machine Learning)은 인공 지능의 한 분야로, 데이터를 이용하여 기계를 학습시켜 기계 스스로가 데이터 분석 및 예측을 하게 만드는 것과 관련한 컴퓨터 과학의 한 영역을 일컫는다. 그중에서 SVM(Support Vector Machines)은 주로 분류와 회귀 분석을 목적으로 사용되는 모델이다. 어느 두 집단에 속한 데이터들에 대한 정보를 얻었을 때, SVM 모델은 주어진 데이터 집합을 바탕으로 하여 새로운 데이터가 어느 집단에 속할지를 판단해준다. 최근 들어서 많은 금융전문가는 기계학습과 막대한 데이터가 존재하는 금융 분야와의 접목 가능성을 보며 기계학습에 집중하고 있다. 그러면서 각 금융사는 고도화된 알고리즘과 빅데이터를 통해 여러 금융업무 수행이 가능한 로봇(Robot)과 투자전문가(Advisor)의 합성어인 로보어드바이저(Robo-Advisor) 서비스를 발 빠르게 제공하기 시작했다. 따라서 현재의 금융 동향을 고려하여 본 연구에서는 기계학습 방법의 하나인 SVM을 활용하여 매매성과를 올리는 방법에 대해 제안하고자 한다. SVM을 통한 예측대상은 한국형 변동성지수인 VKOSPI이다. VKOSPI는 금융파생상품의 한 종류인 옵션의 가격에 영향을 미친다. VKOSPI는 흔히 말하는 변동성과 같고 VKOSPI 값은 옵션의 종류와 관계없이 옵션 가격과 정비례하는 특성이 있다. 그러므로 VKOSPI의 정확한 예측은 옵션 매매에서의 수익을 낼 수 있는 중요한 요소 중 하나이다. 지금까지 기계학습을 기반으로 한 VKOSPI의 예측을 다룬 연구는 없었다. 본 연구에서는 SVM을 통해 일 중의 VKOSPI를 예측하였고, 예측 내용을 바탕으로 옵션 매매에 대한 적용 가능 여부를 실험하였으며 실제로 향상된 매매 성과가 나타남을 증명하였다.

노후공동주택 세대수증가형 리모델링 사업의 기획단계 사업성평가 모델 개발 (Development of a Feasibility Evaluation Model for Apartment Remodeling with the Number of Households Increasing at the Preliminary Stage)

  • 고원경;윤종식;유일한;신동우;정대운
    • 한국건설관리학회논문집
    • /
    • 제20권4호
    • /
    • pp.22-33
    • /
    • 2019
  • 정부에서는 공동주택 노후화 문제에 대응하여 공동주택 리모델링 활성화를 위한 법과 제도를 꾸준히 개정 발전시켜왔다. 그러나 이러한 노력에도 불구하고 아직까지 세대수증가형 리모델링은 활성화되지 못하고 있다. 그 이유로 다양한 문제점이 있지만, 본 연구에서는 리모델링 사업 초기단계에 합리적인 사업성 분석과 의사결정을 위한 도구가 없다는 문제점에 주목하여 리모델링 사업성평가 모델을 제시하였다. 일반적으로 사업성(수익성) 판단은 리모델링 설계안 도출 이후에 이루어지기 마련인데, 리모델링 사업을 추진하기 위한 의사결정은 초기 추진위 단계에서 결정되기 때문에 기획단계 사업성 분석 모델이 필요하다. 이에 따라 기존의 단지정보와 자문 및 연구를 통해 도출한 리모델링 사업변수들을 이용하여 공사비, 사업비, 금융비, 일반분양수입비를 산출하였고, 이를 활용하여 투자수익률과 조합원 분담금을 개략적으로 산출할 수 있는 알고리즘을 개발하였다. 또한 개발된 초기단계 사업성 분석모델을 3개의 기추진 사례에 적용하여 모델의 적용성을 검증하였다. 비록 3개의 사례에 적용하였으나, 모델의 예측값과 실제 사례값의 오차는 5%이하로 본 모델의 적용성은 상당히 높다고 볼 수 있다. 향후 사례수를 늘려가면서 모델의 적용성을 높여간다면 실무에서 활용 가능한 유용한 tool이 될 수 있을 것으로 판단된다. 본 연구에서 개발된 개략 사업성 평가 모델은 입주민들의 빠른 의사결정을 지원하여 원활한 사업추진이 가능하게 할 것이며, 모델이 지역별로 다양하게 적용된다면 세대수증가형 리모델링사업 가능단지들의 규모를 파악하고 이를 지원하는 지자체의 정책 수립에도 기여할 수 있을 것으로 기대한다.

지형정보 기반 조난자 행동예측을 위한 마코프 의사결정과정 모형 (MDP(Markov Decision Process) Model for Prediction of Survivor Behavior based on Topographic Information)

  • 손진호;김수환
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.101-114
    • /
    • 2023
  • 유사시 종심 깊숙한 곳에서 적을 타격하는 임무를 수행하는 항공기의 경우 격추될 위험에 항시 노출되어 있다. 현대전의 핵심 전투력으로써 최첨단의 무기체계를 운용하는 공중근무 요원은 양성하는데 많은 시간과 노력, 국가 예산이 소요되며 그들이 가진 작전 능력과 군사기밀이 매우 중요하기에 공중근무 요원의 생환은 매우 중요한 문제이다. 따라서, 본 연구에서는 적지에서 비상탈출한 조난자가 장애물을 피해 목표지점까지 도피·탈출을 시행할 경로를 예측하는 경로 문제를 연구하였으며 이를 통해 비상탈출한 조난자의 무사 생환 가능성을 높이고자 하였다. 본 연구 주제와 관련된 기존 연구들은 경로 문제를 네트워크 기반 문제로 접근하여 TSP, VRP, Dijkstra 알고리즘 등으로 문제를 변형하여 최적화 기법으로 접근한 연구가 있었다. 본 연구에서는 동적 환경을 모델링 하기에 적합한 MDP(마코프 의사결정과정)를 적용하여 연구하였다. 또한 GIS를 이용하여 지형정보 데이터를 추출하여 활용함으로써 모형의 객관성을 높였으며, MDP의 보상구조를 설계하는 과정에서 기존 연구 대비 모형이 좀 더 현실성을 가질 수 있도록 보다 상세히 지형정보를 반영하였다. 본 연구에서는 조난자가 지형적 이점을 최대한 이용함과 동시에 최단거리로 이동할 수 있는 경로를 도출하기 위하여 가치 반복법 알고리즘, 결정론적 방법론을 사용하였으며 실제 지형정보와 조난자가 도피·탈출 과정에서 만날 수 있는 장애요소들을 추가하여 모형의 현실성을 더하고자 하였다. 이를 통해 조난자가 조난 상황에서 어떠한 경로를 통해 도피·탈출을 수행할지 예측해 볼 수 있었다. 본 연구에서 제시한 모형은 보상구조의 재설계를 통해 여러 가지 다양한 작전 상황에 응용이 가능하며 실제 상황에서 조난자의 도피·탈출 경로를 예측하고 전투 탐색구조 작전을 진행시키는 데 있어 다양한 요소가 반영된 과학적인 기법에 근거한 의사결정 지원이 가능할 것이다.

상온 상압의 이산화탄소 저장용 탱크를 위한 예냉과정의 비선형 모델링 및 비례-적분 제어 적용 (Nonlinear Modeling and Application of PI Control on Pre-cooling Session of a Carbon Dioxide Storage Tank at Normal Temperature and Pressure)

  • 임유경;이석구;단승규;고민수;이종민
    • Korean Chemical Engineering Research
    • /
    • 제52권5호
    • /
    • pp.574-580
    • /
    • 2014
  • 이산화탄소($CO_2$) 포집 및 지중저장을 위한 $CO_2$ 수송선용 저장탱크는 액체 $CO_2$와 직접적으로 접촉할 경우 발생할 수 있는 물리적/열적 탱크 손상을 방지하기 위해 화물 선적 단계 이전에 예냉과정을 거쳐야 한다. 본 연구에서는 예냉을 위해 주입되는 저온 $CO_2$ 기체의 탱크 유입량을 계산하기 위해 $CO_2$ 저장탱크 예냉과정의 수학적 모델 식을 제안하였다. 또한 비례-적분(proportional-integral: PI) 제어를 통해 공정을 제어하는 동적 모사 결과를 제시하였다. 이 때 제어 변수를 탱크 내 온도 또는 압력으로 선정한 두 가지 사례를 모사하였으며 그러한 결정이 $CO_2$ 저장탱크의 예냉과정에 미치는 영향을 해석하였다. 결과적으로 예냉과정의 PI제어에는 탱크 내 온도를 제어하는 것보다 압력을 제어하는 우회적인 방식을 택할 때 수학적 모델의 비선형성과 특이점 발생으로 인한 불안정성을 피할 수 있으므로 더 안정된 결과가 도출됨을 보였다.

다기관 임상연구를 위한 인공지능 학습 플랫폼 구축 (Construction of Artificial Intelligence Training Platform for Multi-Center Clinical Research)

  • 이충섭;김지언;노시형;김태훈;윤권하;정창원
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제9권10호
    • /
    • pp.239-246
    • /
    • 2020
  • 인공지능 기술을 도입한 의료분야에서 진단 및 예측과 연계한 임상의사결정지원 시스템(CDSS)에 관련된 연구가 활발하게 진행되고 있다. 특히, 인공지능 기술 적용에 가장 많은 이슈를 일으키고 있는 의료영상기반의 질환진단연구가 다양한 제품으로 출시되고 있는 실정이다. 그러나 의료영상 데이터는 일관되지 않은 데이터들로 이루어져 있으며, 그것을 정제하여 연구에 사용하기 위해서는 상당한 시간이 필요한 것이 현실이다. 본 논문은 의료영상 표준인 R_CDM(Radiology Common Data Model)으로 변환하고, 그 데이터를 기반으로 인공지능 알고리즘 개발 연구를 지원하기위한 원스톱 인공지능학습 플랫폼에 대하여 기술한다. 이를 위해 기존 공통데이터모델(CDM : Common Data Model)과 연계에 중점을 두어 DICOM(Digital Imaging and Communications in Medicine) 태그정보를 기반으로 의료영상 표준 모델의 스키마와 다기관 연구를 위한 Report 정보를 포함하여 시스템을 모델링하였다. 이렇게 변환된 데이터 집합을 기반으로 인공지능 학습 플랫폼에서 수행 과정을 결과로 보인다. 제안한 플랫폼을 통해 다양한 영상기반 인공지능 연구에 활용될 것으로 기대하고 있다.

이산 웨이브렛 변환을 이용한 고각성 부정 감성의 GSR 신호 분석 (Analysis of Galvanic Skin Response Signal for High-Arousal Negative Emotion Using Discrete Wavelet Transform)

  • 임현준;유선국;장원석
    • 감성과학
    • /
    • 제20권3호
    • /
    • pp.13-22
    • /
    • 2017
  • 감성은 의사 결정, 지각 등에 직접적으로 영향을 미치며 인간의 삶에서 중요한 역할을 한다. 본 논문에서는 고각성 부정 감성의 편리하고 정확한 인식에 있어서, 생체신호를 이용한 분석 알고리즘을 설계하고자 한다. 이를 위해 본 연구에서는 보통 / 공포 감성 유발 영상을 이용하여 두 감성을 유도한 후, 생체신호 중 간단한 피부전도도 신호를 측정하였다. 측정된 피부전도도에 대해 Tonic 성분과 Phasic 성분으로 분해하고 감성 자극과 관련된 Phasic 성분을 더 상세하게 SCVSR, SCSR로 분해하여 각 성분의 주요한 특징들을 추출함으로써, 정확한 분석을 하기 위해 기존의 사용된 방법이 아닌 우수한 시간-주파수 지역화 특성을 가진 이산 웨이브렛 변환을 사용하였다. 추출된 특징들은 Phasic 성분의 최댓값, Phasic 성분의 진폭, SCVSR의 영교차율, SCSR의 영교차율이다. 분석 결과, 4가지 특징들 모두 고각성 부정 감성의 경우가 저각성 보통 감성의 경우보다 더 높은 값을 나타내고, 기존의 분석 방법보다 통계적으로 두 감정 사이의 더 유의미한 차이를 확인할 수 있었다. 이에 따라 본 연구의 결과는 피부전도도가 고각성 부정 감성 측정에 대해 유용한 지표라는 것을 확인하였으며, 향후 피부전도도를 이용한 실시간 부정 감성 평가 시스템 개발에 기여할 수 있을 것을 나타낸다.

우수관망 노선 결정에 따른 첨두유출량 변화 분석 (A Change of Peak Outflows due to Decision of Flow Path in Storm Sewer Network)

  • 이정호
    • 한국산학기술학회논문지
    • /
    • 제11권12호
    • /
    • pp.5151-5156
    • /
    • 2010
  • 우수관망의 설계에 대한 기존의 연구들에서 관망의 노선은 최소의 건설비용을 목적으로 결정하게 되며, 기존의 연구들에서는 관망의 노선 변경에 따른 관거 내 흐름의 중첩효과는 관망 노선 결정에서 고려되지 않고 있다. 그러나 본 연구에서는 관망의 노선 결정에 있어서 관거 내 흐름의 변화를 고려하였으며, 관망 전체의 흐름을 제어 및 분산시킴으로써 내수침수 위험도를 감소시키고자 하였다. 이것은 관망 구성에 따른 관거 내 흐름의 중첩효과를 제어함으로써 가능하며, 이러한 흐름의 제어를 통하여 우수관망에서의 내수침수 위험도가 저감될 수 있다. 본 연구에서는 우수관망에서의 노선 결정에 따라서 달라지는 관거 내 흐름의 중첩효과와 그 결과로서 나타나는 유출구에서의 첨두 유출량 변화를 분석하였다. 관망의 노선 결정은 유전자알고리즘을 이용하였으며, 이때 목적함수는 유출구에서의 최소첨두유출량이 된다. 가상의 우수관망에 대하여 노선 결정에 따른 첨두유출량 변화를 분석한 결과 10년 빈도의 설계강우량에 대하여 강우지속시간 30분의 경우 관망 노선에 따른 최대 및 최소 첨두유출량 차이는 약 5.6%이며, 초과강우에 대한 내수침수 발생 분석을 위하여 2002년에 발생한 태풍 '루사'에 대한 적용 결과 월류량이 약 31% 감소되는 결과를 나타냈다.