• 제목/요약/키워드: Accuracy of experiments

검색결과 2,653건 처리시간 0.037초

일메나이트광의 유동층 염화반응에 대한 수치적 예측 (Numerical Prediction for Fluidized Bed Chlorination Reaction of Ilmenite Ore)

  • 정동규;정은진;이미선;김진영;송덕용
    • 청정기술
    • /
    • 제25권2호
    • /
    • pp.107-113
    • /
    • 2019
  • 2단 유동층 염화로에서 일메나이트광의 선택염화반응과 이산화티탄의 탄소염화반응의 염화도를 예측하기 위해서 shrinking core 모델과 유출률 및 입자파손을 고려한 수치 모델을 개발하였다. 입자분포를 고려하여 입자별 물질 수지와 염화반응을 반영할 수 있는 유동층 염화 반응 해석이 가능하다. 유동층 염화로의 실험값과 비교하여 약 6% 오차율의 정확성을 보였다. 입자 크기에 따라서는 입자 크기가 작을수록 염화도의 변화가 더 크게 나타났으며 염화도 1의 값에 도달하는 반응시간 차이가 약 100 min 정도로 나타났다. 온도의 변화($800{\sim}1000^{\circ}C$)에 대한 염화도의 변화는 염화도 0.9에 도달하는 반응시간이 약 10 min 차이로 크게 나타나지 않았다. 1단계 선택염화공정에서 일메나이트광의 질량감소율은 180 min 경과 시에 이론값인 0.4735 값에 근접하고, Fe 성분의 염화도는 $FeCl_2$ 또는 $FeCl_3$로 변환되어 180 min 경과 시에는 거의 1의 값을 보인다. 2단계 탄소염화공정에서 $TiO_2$의 염화도는 180 min 경과 시 0.98에 근접하고, 질량분율은 0.02에 도달하여 $TiCl_4$로 변환되는 것으로 나타났다. 1단계 선택염화공정에서 $TiO_2$는 180 min 경과 시에 98%까지 생성되었다가 연속적인 2단계 탄소염화공정에서 추가로 90 min 경과 시(총 경과 시간 270 min)에 99% $TiCl_4$로 전환되는 것으로 나타나고, 질량감소율도 99% 이상 감소하였다.

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

메탄올의 이산화탄소 흡수평형 추산에 대한 PC-SAFT모델식과 Two-model approach 모델식의 비교연구 (Comparative Study on the Estimation of CO2 absorption Equilibrium in Methanol using PC-SAFT equation of state and Two-model approach.)

  • 노재현;박회경;김동선;조정호
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.136-152
    • /
    • 2017
  • 본 연구에서는 $CO_2$ 제거 용매로써 메탄올 수용액을 사용하는 $Rectisol^{(R)}$공정을 모델링하기 위한 열역학 모델식으로는 PC-SAFT(Perturebed-Chain Statistical Associating Fluid Theory) 상태방정식과 액체활동도계수 모델식을 기본으로 조합된 Two-model approach식{NRTL(Non Random Two Liquid) + Henry + Peng-Robinson}을 비교하였다. 또한 PC-SAFT 상태방정식의 이성분계 상호작용 매개변수와 Two-model approach식의 Henry 상수를 새롭게 결정하기 위해서 273.25K과 262.35K에서 $CO_2$와 메탄올 간의 흡수평형실험을 수행하고 회귀분석을 하였다. 그리고 새롭게 결정한 매개변수의 정확성은 실험 데이터의 추산결과를 통해 검증하였다. 이러한 모델식과 검증한 매개변수를 사용하여 $CO_2$ 제거공정을 모델링 하였다. 그 결과 Two-model approach식을 사용한 경우가 PC-SAFT EOS을 사용한 경우에 비해 $CO_2$ 99.00% 제거하기 위해 요구되는 메탄올 용매 유량이 약 43.72% 더 높게 추산되었으며, 증류탑에서의 냉각수 소모량은 39.22%정도, 스팀소모량은 43.09%정도 더 소요됨을 알 수 있었다. 결론적으로 고압에서 운전되는 $Rectisol^{(R)}$ 공정을 Henry관계식의 도움을 받는 액체활동도계수 모델식을 사용하여 모델링을 하는 경우 PC-SAFT 상태방정식을 사용한 경우에 비해서 크게 설계된 다는 것을 알 수 있었다. 이러한 이유는 액상에 대한 용해도가 낮은 가스성분이 일정한 온도에서 액상에 녹아드는 양은 기상의 분압에 비례하여 증가하는 것으로 계산되는 Henry 관계식의 특성 때문에 메탄올에 대해 용해도가 큰 $CO_2$의 경우 메탄올과 $CO_2$간의 흡수특성을 잘 예측하지 못하는 것을 알 수 있었다.

비접근 지역에 대한 SPOT 위성영상의 Pseudo영상 구성 및 센서모델 분석 (Pseudo Image Composition and Sensor Models Analysis of SPOT Satellite Imagery for Inaccessible Area)

  • 방기인;조우석
    • 대한원격탐사학회지
    • /
    • 제17권1호
    • /
    • pp.33-44
    • /
    • 2001
  • 본 논문은 지상기준접의 취득이 어려운 비접근 지역에 대한 위성영상에서 지형정보를 획득하기 위한 방법을 제시하였다. 먼저, 공선조건식을 기반으로 10개의 위성센서모델을 개발하고, 개발된 센서모델의 거동을 부석하기 위하여 Space Resection 및 Space Intersection을 통해 각각의 센서모델에 대한 적합성을 실험하였다. 이를 바탕으로 비접근 지역에 대한 지형정보를 취득하기 위하여 영상을 재구성하거나 Pseudo영상을 제작하고, 이에 대한 센서모델의 거동 및 정확도를 분석.제시하였다. 공선조건식을 이용한 Pushbroom 위성영상의 센서모델은 투영중심의 위치와 회전요소에 대한 6개의 외부표정요소를 영상의 행에 대한 1차, 2차 함수 또는 3차 함수로 구성하였으며, 또한 외부표정요소의 위치요소와 상관도가 높은 회전요소($\omega$, $\Phi$)를 고정된 값으로 사용하는 센서모델을 개발하였다. 비접근 지역을 위한 영상의 재구성은 동일 패스의 지상기준접이 있는 영상과 비접근 지역의 영상을 연결시켜 하나의 영상으로 재구성하거나, 지상기준점이 있는 영상과 비접근 지역의 영상으로부터 Pseudo영상을 임의로 제작하여 패스내에서 중복영역을 갖도록 구성하였다. 본 연구에서 이용한 인공위성 데이터는 서로 다른 패스에서 동일한 지역을 촬영한 SPOT 영상이며, 각각의 패스에서 두장의 연속된 영상을 이용하였다. 개발된 10개의 센서모델과 5가지의 영상 재구성 방법에 따라 비접근 지역에서의 정확도는 다르게 나타났으며, 그 중 투영중심의 위치 및 회전요소 k를 1차 함수로 표현하고 회전요소 $\omega$, $\Phi$를 고정시킨 센서모델과 Pseudo영상을 이용한 방법이 비접근 지역 30km, 60km지점의 검사점에서 각각 최대오차 30m, 60m의 결과를 보였다. 얻어진 극한하중 보다 적은 경향을 나타냈다.aeuntang were higher than the recommended value per meal. Vitamin A, vitamin C, vitamin B$_1$, vitamin B, niacin, calcium, phosphorus and iron were rich in chwotang and minmulgokimaeuntag. Onhuk contains plenty of vitamin C, vitamin B$_1$, vitamin B$_2$and the contents of vitamin A, vitamin B$_1$, and niacin in baekhapapchuk were over the recommended values per meal. The foods contained large percentage of aspartic acid and glutamic acid, and major essential amino acids appeared to be leucine and lysine. On the other hand, major fatty acids were oleic acid, linoleic acid and plamitic acid. Among them the content of oleic acid was the highest in chuotang, ochuk and baekhapchuk, whereas linoleic acid and palmitic acid were the most rich fatty acids in baekhapchuk and dasulgitang respectively.한 있을 것으로 생각된다. 그리고 본 조사는 5월부터 7월중에 실시하였는데, 한국의 경우 계절에 따라 섭취 식품의 종류가 다

실시간 감시를 위한 학습기반 수행 예측모델의 검증 (Verifying Execution Prediction Model based on Learning Algorithm for Real-time Monitoring)

  • 정윤석;김태완;장천현
    • 정보처리학회논문지A
    • /
    • 제11A권4호
    • /
    • pp.243-250
    • /
    • 2004
  • 실시간 시스템은 시스템이 적시성을 보장하는지 파악하기 위해 실시간 감시기법을 이용한다. 일반적으로 실시간 감시는 실시간 시스템의 현재 동작상태를 파악하는데 중점을 두는 기법이다. 그러나 실시간 시스템의 안정적인 수행을 지원하기 위해서는, 현재 상태를 파악하는 것뿐 아니라, 실시간 시스템 및 시스템상에서 동작하는 실시간 프로세스들의 수행도 예측할 수 있어야 한다. 그러나 기존 예측모델을 실시간 감시기법에 적용하기에는 몇 가지 한계가 있다. 첫째, 예측기능은 실시간 프로세스가 종료한 시점에서 정적인 분석을 통해 수행된다. 둘째, 예측을 위해 사전 기초 통계분석이 필요하다. 셋째, 예측을 위한 이전확률 및 클러스터 정보가 현재 시점을 정확하게 반영하지 못한다. 본 논문에서는 이러한 문제점들을 해결하고 실시간 감시기법에 적용할 수 있는 학습 기반의 수행 예측모델을 제안한다. 이 모델은 학습기법을 통해 불필요한 전처리과정을 없애고, 현시점의 데이터를 이용해, 보다 정확한 실시간 프로세스의 수행 예측이 가능하도록 한다. 또한 이 모델은 실시간 프로세스 수행 시간의 증가율 분석을 통해 다단계 예측을 지원하며, 무엇보다 실시간 프로세스가 실행되는 동안 예측이 가능한 동적 예측을 지원하도록 설계하였다. 실험 결과를 통해 훈련집합의 크기가 10 이상이면 80% 이상의 판단 정확도를 보이며, 다단계 예측의 경우, 훈련집합의 크기 이상의 수행 횟수를 넘으면 다단계 예측의 예측 차는 최소화되는 것으로 나타났다. 본 논문에서 제안한 예측모델은 가장 단순한 학습 알고리즘을 적용했다는 점과, CPU, 메모리, 입출력 데이터를 다루는 다차원 자원공간 모델을 고려하지 못한 한계가 있어 향후에 관련 연구가 요구된다. 본 논문에서 제안하는 학습기반 수행 예측모델은 실시간 감시 및 제어를 필요로 하는 분야 및 응용 분야에 적용할 수 있다.

비접근 지역에 대한 SPOT 위성영상의 Pseudo영상 구성 및 센서모델 분석 (Pseudo Image Composition and Sensor Models Analysis of SPOT Satellite Imagery of Non-Accessible Area)

  • 방기인;조우석
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2001년도 춘계 학술대회 논문집 통권 4호 Proceedings of the 2001 KSRS Spring Meeting
    • /
    • pp.140-148
    • /
    • 2001
  • 일반적으로 위성영상의 센서에 대한 모델은 촬영대상지역의 지상기준점을 이용하여 결정하며, 이와 같은 지상기준점은 기존 지형도를 이용하거나 또는 지상측량에 의하여 획득한다. 그러나 지구관측위성에서 얻어진 영상의 촬영지역이 비접근 지역인 경우에는 지상측량에 의하여 지상기준점을 획득하기 어려우며, 또한 대상지역의 지형도가 제작되어 있지 않은 경우에는 실질적으로 위성영상을 이용하여 지형정보를 추출하기 어려운 실정이다. 본 논문은 지상기준점의 취득이 어려운 비접근 지역에 대한 위성영상에서 지형정보를 획득하기 위한 방법을 제시하였다. 먼저, 공선조건식을 기반으로 10개의 위성센서모델을 개발하고, 개발된센서모델의 거동을 분석하기 위하여 Space Resection 및 Space Inetersection을 통해 각각의 센서모델에 대한 적합성을 실험하였다. 이를 바탕으로 비접근 지역에 대한 지형정보를 취득하기 위하여 영상을 재구성하거나 Pseudo 영상을 제작하고, 이에 대한 센서모델의 거동 및 정확도를 분석.제시하였다. 공선조건식을 이용한 Pushbroom 위성영상의 센서모델은 투영 중심의 위치와 회전요소에 대한 6개의 외부표정요소와 상관도가 높은 회전요소($\omega$, $\phi$)를 고정된 값으로 사용하는 센서모델을 개발하였다. 비접근 지역의 영상으로부터 Pseudo 영상을 임의로 제작하여 패스내에서 중복영역을 갖도록 구성하였다. 본 연구에서 이용한 인공위성 데이터는 서로 다른 패스에서 동일한 지역을 촬영한 SPOT 영상이며, 각각의 패스에서 두 장의 연속된 영상을 이용하였다. 개발된 10개의 센서모델과 5가지의 영상 재구성 방법에 따라 비접근 지역에서의 정확도는 다르게 나타났으며, 그 중 투영중심의 위치 및 회전요소 k를 1차 함수로 표현하고 회전요소 $\omega$, $\phi$를 고정시킨 센서모델과 Pseudo 영상을 이용한 방법이 비접근 지역 60km 지점의 검사점에서 최대오차 60m의 결과를 보였다.

  • PDF

U-마켓에서의 사용자 정보보호를 위한 매장 추천방법 (A Store Recommendation Procedure in Ubiquitous Market for User Privacy)

  • 김재경;채경희;구자철
    • Asia pacific journal of information systems
    • /
    • 제18권3호
    • /
    • pp.123-145
    • /
    • 2008
  • Recently, as the information communication technology develops, the discussion regarding the ubiquitous environment is occurring in diverse perspectives. Ubiquitous environment is an environment that could transfer data through networks regardless of the physical space, virtual space, time or location. In order to realize the ubiquitous environment, the Pervasive Sensing technology that enables the recognition of users' data without the border between physical and virtual space is required. In addition, the latest and diversified technologies such as Context-Awareness technology are necessary to construct the context around the user by sharing the data accessed through the Pervasive Sensing technology and linkage technology that is to prevent information loss through the wired, wireless networking and database. Especially, Pervasive Sensing technology is taken as an essential technology that enables user oriented services by recognizing the needs of the users even before the users inquire. There are lots of characteristics of ubiquitous environment through the technologies mentioned above such as ubiquity, abundance of data, mutuality, high information density, individualization and customization. Among them, information density directs the accessible amount and quality of the information and it is stored in bulk with ensured quality through Pervasive Sensing technology. Using this, in the companies, the personalized contents(or information) providing became possible for a target customer. Most of all, there are an increasing number of researches with respect to recommender systems that provide what customers need even when the customers do not explicitly ask something for their needs. Recommender systems are well renowned for its affirmative effect that enlarges the selling opportunities and reduces the searching cost of customers since it finds and provides information according to the customers' traits and preference in advance, in a commerce environment. Recommender systems have proved its usability through several methodologies and experiments conducted upon many different fields from the mid-1990s. Most of the researches related with the recommender systems until now take the products or information of internet or mobile context as its object, but there is not enough research concerned with recommending adequate store to customers in a ubiquitous environment. It is possible to track customers' behaviors in a ubiquitous environment, the same way it is implemented in an online market space even when customers are purchasing in an offline marketplace. Unlike existing internet space, in ubiquitous environment, the interest toward the stores is increasing that provides information according to the traffic line of the customers. In other words, the same product can be purchased in several different stores and the preferred store can be different from the customers by personal preference such as traffic line between stores, location, atmosphere, quality, and price. Krulwich(1997) has developed Lifestyle Finder which recommends a product and a store by using the demographical information and purchasing information generated in the internet commerce. Also, Fano(1998) has created a Shopper's Eye which is an information proving system. The information regarding the closest store from the customers' present location is shown when the customer has sent a to-buy list, Sadeh(2003) developed MyCampus that recommends appropriate information and a store in accordance with the schedule saved in a customers' mobile. Moreover, Keegan and O'Hare(2004) came up with EasiShop that provides the suitable tore information including price, after service, and accessibility after analyzing the to-buy list and the current location of customers. However, Krulwich(1997) does not indicate the characteristics of physical space based on the online commerce context and Keegan and O'Hare(2004) only provides information about store related to a product, while Fano(1998) does not fully consider the relationship between the preference toward the stores and the store itself. The most recent research by Sedah(2003), experimented on campus by suggesting recommender systems that reflect situation and preference information besides the characteristics of the physical space. Yet, there is a potential problem since the researches are based on location and preference information of customers which is connected to the invasion of privacy. The primary beginning point of controversy is an invasion of privacy and individual information in a ubiquitous environment according to researches conducted by Al-Muhtadi(2002), Beresford and Stajano(2003), and Ren(2006). Additionally, individuals want to be left anonymous to protect their own personal information, mentioned in Srivastava(2000). Therefore, in this paper, we suggest a methodology to recommend stores in U-market on the basis of ubiquitous environment not using personal information in order to protect individual information and privacy. The main idea behind our suggested methodology is based on Feature Matrices model (FM model, Shahabi and Banaei-Kashani, 2003) that uses clusters of customers' similar transaction data, which is similar to the Collaborative Filtering. However unlike Collaborative Filtering, this methodology overcomes the problems of personal information and privacy since it is not aware of the customer, exactly who they are, The methodology is compared with single trait model(vector model) such as visitor logs, while looking at the actual improvements of the recommendation when the context information is used. It is not easy to find real U-market data, so we experimented with factual data from a real department store with context information. The recommendation procedure of U-market proposed in this paper is divided into four major phases. First phase is collecting and preprocessing data for analysis of shopping patterns of customers. The traits of shopping patterns are expressed as feature matrices of N dimension. On second phase, the similar shopping patterns are grouped into clusters and the representative pattern of each cluster is derived. The distance between shopping patterns is calculated by Projected Pure Euclidean Distance (Shahabi and Banaei-Kashani, 2003). Third phase finds a representative pattern that is similar to a target customer, and at the same time, the shopping information of the customer is traced and saved dynamically. Fourth, the next store is recommended based on the physical distance between stores of representative patterns and the present location of target customer. In this research, we have evaluated the accuracy of recommendation method based on a factual data derived from a department store. There are technological difficulties of tracking on a real-time basis so we extracted purchasing related information and we added on context information on each transaction. As a result, recommendation based on FM model that applies purchasing and context information is more stable and accurate compared to that of vector model. Additionally, we could find more precise recommendation result as more shopping information is accumulated. Realistically, because of the limitation of ubiquitous environment realization, we were not able to reflect on all different kinds of context but more explicit analysis is expected to be attainable in the future after practical system is embodied.

데이터 마이닝과 텍스트 마이닝의 통합적 접근을 통한 병사 사고예측 모델 개발 (Development of the Accident Prediction Model for Enlisted Men through an Integrated Approach to Datamining and Textmining)

  • 윤승진;김수환;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.1-17
    • /
    • 2015
  • 최근, 군에서 가장 이슈가 되고 있는 문제는 기강 해이, 복무 부적응 등으로 인한 병력 사고이다. 이 같은 사고를 예방하는 데 있어 가장 중요한 것은, 사고의 요인이 될 수 있는 문제를 사전에 식별 관리하는 것이다. 이를 위해서 지휘관들은 병사들과의 면담, 생활관 순찰, 부모님과의 대화 등 나름대로의 노력을 기울이고 있기는 하지만, 지휘관 개개인의 역량에 따라 사고 징후를 식별하는 데 큰 차이가 나는 것이 현실이다. 본 연구에서는 이러한 문제점을 극복하고자 모든 지휘관들이 쉽게 획득 가능한 객관적 데이터를 활용하여 사고를 예측해 보려 한다. 최근에는 병사들의 생활지도기록부 DB화가 잘 되어있을 뿐 아니라 지휘관들이 병사들과 SNS상에서 소통하며 정보를 얻기 때문에 이를 데이터화 하여 잘 활용한다면 병사들의 사고예측 및 예방이 가능하다고 판단하였다. 본 연구는 이러한 병사의 내부데이터(생활지도기록부) 및 외부데이터(SNS)를 활용하여 그들의 관심분야를 파악하고 사고를 예측, 이를 지휘에 활용하는 데이터마이닝 문제를 다루며, 그 방법으로 토픽분석 및 의사결정나무 방법을 제안한다. 연구는 크게 두 흐름으로 진행하였다. 첫 번째는 병사들의 SNS에서 토픽을 분석하고 이를 독립변수화 하였고 두 번째는 병사들의 내부데이터에 이 토픽분석결과를 독립변수로 추가하여 의사결정나무를 수행하였다. 이 때 종속변수는 병사들의 사고유무이다. 분석결과 사고 예측 정확도가 약 92%로 뛰어난 예측력을 보였다. 본 연구를 기반으로 향후 장병들의 사고예측을 과학적으로 분석, 맞춤식으로 관리한다면 군대 내 각종 사고를 미연에 예방하는데 기여할 것으로 기대된다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

군(軍) 보고서 등장 문장과 관련 법령 간 비교 시스템 구축 방안 연구 (A Study on the Establishment of Comparison System between the Statement of Military Reports and Related Laws)

  • 정지인;김민태;김우주
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.109-125
    • /
    • 2020
  • 군(軍)에서 방위력개선사업(이하 방위사업)은 매우 투명하고 효율적으로 이루어져야 함에도, 방위사업 관련 법 및 규정의 과도한 다양화로 많은 실무자들이 원활한 방위사업 추진에 어려움을 겪고 있다. 한편, 방위사업 관련 실무자들이 각종 문서에서 다루는 법령 문장은 문장 내에서 표현 하나만 잘못되더라도 심각한 문제를 유발하는 특징을 가지고 있으나, 이를 실시간으로 바로잡기 위한 문장 비교 시스템 구축에 대한 노력은 미미했다. 따라서 본 논문에서는 Siamese Network 기반의 자연어 처리(NLP) 분야 인공 신경망 모델을 이용하여 군(軍)의 방위사업 관련 문서에서 등장할 가능성이 높은 문장과 이와 관련된 법령 조항의 유사도를 비교하여 위법 위험 여부를 판단·분류하고, 그 결과를 사용자에게 인지시켜 주는 '군(軍) 보고서 등장 문장과 관련 법령 간 비교 시스템' 구축 방안을 제안하려고 한다. 직접 제작한 데이터 셋인 모(母)문장(실제 법령에 등장하는 문장)과 자(子)문장(모(母)문장에서 파생시킨 변형 문장) 3,442쌍을 사용하여 다양한 인공 신경망 모델(Bi-LSTM, Self-Attention, D_Bi-LSTM)을 학습시켰으며 1 : 1 문장 유사도 비교 실험을 통해 성능 평가를 수행한 결과, 상당히 높은 정확도로 자(子)문장의 모(母)문장 대비 위법 위험 여부를 분류할 수 있었다. 또한, 모델 학습에 사용한 자(子)문장 데이터는 법령 문장을 일정 규칙에 따라 변형한 형태이기 때문에 모(母)·자(子)문장 데이터만으로 학습시킨 모델이 실제 군(軍) 보고서에 등장하는 문장을 효과적으로 분류한다고 판단하기에는 제한된다는 단점을 보완하기 위해, 실제 군(軍) 보고서에 등장하는 형태에 보다 더 가깝고 모(母)문장과 연관된 새로운 문장 120문장을 추가로 작성하여 모델의 성능을 평가해본 결과, 모(母)·자(子)문장 데이터만으로 학습시킨 모델로도 일정 수준 이상의 성능을 확인 할 수 있었다. 결과적으로 본 연구를 통해 방위사업 관련 군(軍) 보고서에서 등장하는 여러 특정 문장들이 각각 어느 관련 법령의 어느 조항과 가장 유사한지 살펴보고, 해당 조항과의 유사도 비교를 통해 위법 위험 여부를 판단하는 '실시간 군(軍) 문서와 관련 법령 간 자동화 비교 시스템'의 구축 가능성을 확인할 수 있었다.