• 제목/요약/키워드: test algorithm

검색결과 4,710건 처리시간 0.036초

데이터 크기에 따른 k-NN의 예측력 연구: 삼성전자주가를 사례로 (The Effect of Data Size on the k-NN Predictability: Application to Samsung Electronics Stock Market Prediction)

  • 천세학
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.239-251
    • /
    • 2019
  • 본 논문은 학습데이터의 크기에 따른 사례기반추론기법이 주가예측력에 어떻게 영향을 미치는지 살펴본다. 삼성전자 주가를 대상을 학습데이터를 2000년부터 2017년까지 이용한 경우와 2015년부터 2017년까지 이용한 경우를 비교하였다. 테스트데이터는 두 경우 모두 2018년 1월 1일부터 2018년 8월 31일까지 이용하였다. 시계 열데이터의 경우 과거데이터가 얼마나 유용한지 살펴보는 측면과 유사사례개수의 중요성을 살펴보는 측면에서 연구를 진행하였다. 실험결과 학습데이터가 많은 경우가 그렇지 않은 경우보다 예측력이 높았다. MAPE을 기준으로 비교할 때, 학습데이터가 적은 경우, 유사사례 개수와 상관없이 k-NN이 랜덤워크모델에 비해 좋은 결과를 보여주지 못했다. 그러나 학습데이터가 많은 경우, 일반적으로 k-NN의 예측력이 랜덤워크모델에 비해 좋은 결과를 보여주었다. k-NN을 비롯한 다른 데이터마이닝 방법론들이 주가 예측력 제고를 위해 학습데이터의 크기를 증가시키는 것 이외에, 거시경제변수를 고려한 기간유사사례를 찾아 적용하는 것을 제안한다.

머신러닝 기법을 활용한 터널 설계 시 시추공 내 암반분류에 관한 연구 (A study on the rock mass classification in boreholes for a tunnel design using machine learning algorithms)

  • 이제겸;최원혁;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.469-484
    • /
    • 2021
  • 터널 설계 시 지반조사를 통한 암반분류 결과는 공사기간 및 공사비 산출, 그리고 터널안정성 평가에 지대한 영향을 미친다. 국내에서 지금까지 완공된 3,526개소의 터널들의 설계 및 시공을 통해 관련 기술들은 지속적으로 발전되어 왔지만, 터널 설계 시 암질 및 암반등급을 보다 정확하게 평가하기 위한 방법에 대한 연구는 미미하여 평가자의 경험 및 주관에 따라 결과의 차이가 큰 경우가 적지 않다. 따라서 본 연구에서는 암석샘플에 대한 주관적 평가를 통한 기존의 인력에 의한 암반분류 대신, 최근 지반분야에서도 그 활용도가 급증하고 있는 머신러닝 알고리즘을 이용하여 시추조사에서 획득한 다양한 암석 및 암반정보를 분석하여 보다 신뢰성있는 RMR에 의한 암반분류 모델을 제시하고자 하였다. 국내 13개 터널을 대상으로 11개의 학습 인자(심도, 암종, RQD, 전기비저항, 일축압축강도, 탄성파 P파속도 및 S파 속도, 영률, 단위중량, 포아송비, RMR)를 선정하여 337개의 학습 데이터셋과 60개의 시험 데이터셋을 확보하였으며, 모델의 예측성능을 향상시키기 위해 6개의 머신러닝 알고리즘(DT, SVM, ANN, PCA & ANN, RF, XGBoost)과 각 알고리즘별 다양한 초매개변수(hyperparameter)를 적용하였다. 학습된 모델의 예측성능을 비교한 결과, DT 모델을 제외한 5개의 머신러닝 모델에서 시험데이터에 대한 RMR 평균절대오차 값이 8 미만으로 수렴되었으며, SVM 모델에서 가장 우수한 예측성능을 나타내었다. 본 연구를 통해 암반분류 예측에 대한 머신러닝 기법의 적용 가능성을 확인하였으며, 향후 다양한 데이터를 지속적으로 확보하여 예측모델의 성능을 향상시킨다면 보다 신뢰성 있는 암반 분류에 활용될 수 있을 것으로 기대된다.

오차 계산 방식에 따른 사료용 벼 품종의 품종모수 추정치 불확도 비교 (Comparison between Uncertainties of Cultivar Parameter Estimates Obtained Using Error Calculation Methods for Forage Rice Cultivars)

  • 조영상;현신우;김광수
    • 한국농림기상학회지
    • /
    • 제25권3호
    • /
    • pp.129-141
    • /
    • 2023
  • 작물 모형은 작물의 유전적 특성을 나타내는 품종모수를 요구하며, 품종모수는 작물의 개별 품종별로 추정되어야 한다. 품종모수의 추정에는 고품질의 많은 생육 자료가 요구되지만, 자료의 생산에 상당한 비용이 필요하다. 비교적 낮은 품질의 가용성이 높은 자료를 활용하는 대신, 대량의 랜덤 모수를 생성하고 이를 평가하여 품종모수를 추정할 수 있다. 본 연구에서는 SIMPLE 작물 모델의 불확도를 최소화하기 위해 품종모수 추정 방식을 비교하고, 두 앙상블 방식과 대한 비교를 하였다. 모수 추정을 위한 Metropolis-Hastings (MH) 알고리즘에 대한 목적함수로 로그 가능도(log-likelihood: LL)와 generic composite similarity measure (GCSM)를 사용하였다. 또한 품종모수의 평균값을 사용한 예측(Epm)과 개별 모수들로부터 얻어진 추정값의 평균값(Eem)의 일치도를 분석하여 앙상블 방식에 따른 불확도 변화를 파악하였다. 국내에서 재배되는 사료용 벼 품종인 조우 벼와 영우 벼를 대상으로 품종모수를 추정하였다. 2013년, 2014년, 2016년에 대한 수원, 전주, 나주, 익산에 위치한 실험포장에서 얻은 수량 관측 자료를 사용하였다. 또한 2016년부터 2018년까지 수원에서 보고된 별도의 수량 관측 자료를 사용하였다. 목적함수에 따라 추정된 품종모수의 분포에 차이가 있었다. LL을 통해 얻은 품종모수는 GCSM으로 얻은 품종모수보다 좁은 범위에 분포하였다. 두 가지 앙상블 접근법은 통계적으로 유의한 차이가 나타나지 않음을 확인하였다. GCSM의 상대적으로 높은 불확도는 수용확률을 조정하여 낮출 수 있다고 사료되고, Epm의 결과는 기존과 다른 앙상블 방식을 통해 적은 연산을 통해 불확도를 낮출 수 있음을 보인다.

XGBoost를 활용한 리스크패리티 자산배분 모형에 관한 연구 (A Study on Risk Parity Asset Allocation Model with XGBoos)

  • 김영훈;최흥식;김선웅
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.135-149
    • /
    • 2020
  • 인공지능을 기반으로 한 다양한 연구들이 현대사회에 많은 변화를 불러일으키고 있다. 금융시장 역시 예외는 아니다. 로보어드바이저 개발이 활발하게 진행되고 있으며 전통적 방식의 단점을 보완하고 사람이 분석하기 어려운 부분을 대체하고 있다. 로보어드바이저는 인공지능 알고리즘으로 자동화된 투자 결정을 내려 다양한 자산배분 모형과 함께 활용되고 있다. 자산배분 모형 중 리스크패리티는 대표적인 위험 기반 자산배분 모형의 하나로 큰 자산을 운용하는 데 있어 안정성을 나타내고 현업에서 역시 널리 쓰이고 있다. 그리고 XGBoost 모형은 병렬화된 트리 부스팅 기법으로 제한된 메모리 환경에서도 수십억 가지의 예제로 확장이 가능할 뿐만 아니라 기존의 부스팅에 비해 학습속도가 매우 빨라 많은 분야에서 널리 활용되고 있다. 이에 본 연구에서 리스크패리티와 XGBoost를 장점을 결합한 모형을 제안하고자 한다. 기존에 널리 사용되는 최적화 자산배분 모형은 과거 데이터를 기반으로 투자 비중을 추정하기 때문에 과거와 실투자 기간 사이의 추정 오차가 발생하게 된다. 최적화 자산배분 모형은 추정 오차로 인해 포트폴리오 성과에서 악영향을 받게 된다. 본 연구는 XGBoost를 통해 실투자 기간의 변동성을 예측하여 최적화 자산배분 모형의 추정 오차를 줄여 모형의 안정성과 포트폴리오 성과를 개선하고자 한다. 본 연구에서 제시한 모형의 실증 검증을 위해 한국 주식시장의 10개 업종 지수 데이터를 활용하여 2003년부터 2019년까지 총 17년간 주가 자료를 활용하였으며 in-sample 1,000개, out-of-sample 20개씩 Moving-window 방식으로 예측 결과값을 누적하여 총 154회의 리밸런싱이 이루어진 백테스팅 결과를 도출하였다. 본 연구에서 제안한 자산배분 모형은 기계학습을 사용하지 않은 기존의 리스크패리티와 비교하였을 때 누적수익률 및 추정 오차에서 모두 개선된 성과를 보여주었다. 총 누적수익률은 45.748%로 리스크패리티 대비 약 5% 높은 결과를 보였고 추정오차 역시 10개 업종 중 9개에서 감소한 결과를 보였다. 실험 결과를 통해 최적화 자산배분 모형의 추정 오차를 감소시킴으로써 포트폴리오 성과를 개선하였다. 포트폴리오의 추정 오차를 줄이기 위해 모수 추정 방법에 관한 다양한 연구 사례들이 존재한다. 본 연구는 추정 오차를 줄이기 위한 새로운 추정방법으로 기계학습을 제시하여 최근 빠른 속도로 발전하는 금융시장에 맞는 진보된 인공지능형 자산배분 모형을 제시한 점에서 의의가 있다.

종합 평점과 다기준 평점을 선택적으로 활용하는 협업필터링 기반 하이브리드 추천 시스템 (A Hybrid Recommender System based on Collaborative Filtering with Selective Use of Overall and Multicriteria Ratings)

  • 구민정;안현철
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.85-109
    • /
    • 2018
  • 추천시스템은 사용자의 과거 구매행동을 통해 향후 구매할 것이라고 예상되는 제품을 자동으로 검색하여 추천해준다. 특히 전자상거래 기업의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로 가치가 있다. 하지만, 전통적인 추천시스템, 특히 학계 및 산업계에서 가장 널리 사용되고 있는 전통적인 협업필터링 기법은 단일차원의 '종합 평점'만을 고려하여 추천결과를 생성하도록 설계되어 있어, 사용자들의 정확한 니즈를 이해하고 대응하는데 근본적인 한계가 있다. 최근에는 전자 상거래 기업들도 고객들로부터 보다 다각화된, 다기준 방식으로 피드백을 받고 있다. 특히 다기준 평점은 정량적으로 입력되는 정보이므로 상대적으로 분석 및 처리가 용이하다는 장점이 있다. 그러나 다기준 평점 역시 사전에 정해진 기준에 대해서만 사용자의 피드백이 이루어지기 때문에, 보다 상세하게 사용자의 의견을 이해하여 추천에 반영하는 데에는 한계가 있다. 이에 본 연구는 다기준 평점 정보와 선택적 협업필터링의 서로 다른 접근방법을 통해 도출된 추천결과를 종합하여, 최종적으로 추천 대상리스트를 산출할 수 있는 하이브리드 기술을 제안한다. 본 연구에서 제안한 연구모형의 유용성을 검증하기 위해, 식음료점(식당, 카페 등)에 대한 실제 이용자를 대상으로 온라인 설문을 통해 종합 평점과 다기준 평점을 수집하였으며, 데이터를 학습용과 검증용으로 구분하여 학습시키고 성과를 평가하였다. 이 기법은 결합 함수 기반 접근법과 사용자마다 구매의사결정의 체계가 다르다는 전제하에, 사용자들을 유형화하고, 유형에 따라 정보원을 선택적으로 활용하는 협업필터링 알고리즘을 활용했다. 실험결과, 제안 알고리즘을 통한 추천 방법이 단일 차원을 고려하는 전통적인 협업필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인했다. 아울러, 본 연구가 제안하는 다기준 평점과 선택적 협업필터링 알고리즘을 종합하여 추천하는 방법이, 단순히 다기준 평점을 고려했을 때 보다 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.

3차원 GSO PET/CT 스캐너(Philips GEMINI PET/CT의 특성 평가 (Performance Characteristics of 3D GSO PET/CT Scanner (Philips GEMINI PET/DT))

  • 김진수;이재성;이병일;이동수;정준기;이명철
    • 대한핵의학회지
    • /
    • 제38권4호
    • /
    • pp.318-324
    • /
    • 2004
  • 목적: Philips GEMINI PET/CT 스캐너는 GSO 섬광결정을 사용해 제작된 전신용 PET/CT 스캐너이다. 이 연구에서는 NEMA에서 새롭게 제안한 NEMA NU2-2001에 따라 GEMINI PET/CT 스캐너의 공간분해능, 민감도, 산란분획, NECR 등을 평가하고 그 결과를 BGO, LSO등의 섬광결정의 특성과 비교하였다. 대상 및 방법: GEMINI는 Philips ALLEGRO PET과 MX8000 D multi-slice CT 스캐너를 결합한 PET/CT 스캐너로서 검출기는 GSO 섬광결정 ($4{\times}6{\times}20mm^3$)을 사용하였고 축방향 시야는 18 cm이다. 공간분해능. 민감도, 산란분획, NECR 등을 평가하기 위하여 PET 데이터를 획득하였다(동시계수창: 8 ns, 에너지창: $409{\sim}664$ keV). 공간분해능 측정을 위하여 축횡단면의 중심에서 1 cm, 10 cm 떨어진 지점의 각 3지점((a) x=0, y=1, (b)x=10, y=0, (c)x=0, y=10)에서 영상을 획득한 다음 여과후역투사방법(램프필터 사용)과 3D RAMLA를 이용하여 영상재구성을 하고 FWHM을 구하였다. 민감도 측정을 위하여 선선원(F-18)을 축횡단면의 중심과 중심에서 10 cm 벗어난 지점에서 5개의 알루미늄관을 차례로 씌워 매질감쇠에 따라 달라지는 참계수를 구하고 이 값을 회귀분석하여 감쇠매질이 없는 이상적인 상황에서의 민감도를 측정하였다(랜덤계수가 참계수의 1%이내). 산란분획과 NECR을 측정하기 위하여 F-18 선선원(1110 MBq)을 산란팬텀에 주입하여 7반감기동안 계수를 획득하였다. SSRB을 사용하여 3D 데이터를 재구성한 다음 랜덤계수율이 참계수율이 1% 미만인 영역에서 산란분획을 구하고 각 횡단면의 값을 평균하여 전체 산란분획을 얻었다. 이 값을 기초로 각 프레임, 각 횡단면에 대한 랜덤계수율, 산란계수율, NECR을 구하였다. 결과: 스캐너의 중심에서 1 cm 벗어난 지점에서 횡축방향, 축방향 공간분해능은 (1) 5.3, 6.5 mm (FBP), (2) 5.1, 5.9 mm (3D RAMLA)이었다. 횡단면의 중심에서 10 cm 벗어난 지점에서 횡축반경방향, 횡축접선방향, 축방향 공간분해능은 (1) 5.7, 5.7, 7.0 mm (FBP), (2) 5.4, 5.4, 6.4 mm (3D RAMLA)이었다. 감쇠매질이 없는 이상적인 상황에서의 민감도는 횡단면의 중심에서 3,620 counts/sec/MBq, 횡단면의 중심에서 10 cm 벗어난 지점에서 4,324 counts/sec/MBq이었다. 산란분획은 40.6%, 최대 참계수율과 최대 NECR은 각각 88.9 kcps @ 12.9 kBq/mL, 34.3 kcps @ 8.84 kBq/mL이었다. 결론: 이 실험에서 NEMA NU2-2001을 이용해 GSO 섬광결정을 사용해 제작된 PET/CT에 대한 성능 평가를 실시하였다. 이는 BGO, LSO 섬광결정을 사용해 제작된 PET 스캐너의 특성과 비교할 수 있는 자료를 제공하며 PET 영상 획득 시 객관적 평가와 분석에 유용하였다.

트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법의 성능분석 (Performance analysis of Frequent Itemset Mining Technique based on Transaction Weight Constraints)

  • 윤은일;편광범
    • 인터넷정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.67-74
    • /
    • 2015
  • 최근, 아이템들의 가치를 고려한 빈발 아이템셋 마이닝 방법은 데이터 마이닝 분야에서 가장 중요한 이슈 중 하나로 활발히 연구되어왔다. 아이템들의 가치를 고려한 마이닝 기법들은 적용 방법에 따라 크게 가중화 빈발 아이템셋 마이닝, 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝, 유틸리티 아이템셋 마이닝으로 구분된다. 본 논문에서는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝들에 대해 실증적인 분석을 수행한다. 일반적으로 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법들은 데이터베이스 내 아이템들의 가치를 고려함으로써 트랜잭션 가중치를 계산한다. 또한, 그 기법들은 계산된 각 트랜잭션의 가중치를 바탕으로 가중화 빈발 아이템셋들을 마이닝 한다. 트랜잭션 가중치는 트랜잭션 내에 높은 가치의 아이템이 많이 포함 될수록 높은 값으로 나타나기 때문에 우리는 각 트랜잭션의 가중치의 분석을 통해 그 가치를 파악할 수 있다. 우리는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 기법 중에서 가장 유명한 알고리즘인 WIS와 WIT-FWIs, IT-FWIs-MODIFY, WIT-FWIs-DIFF의 장 단점을 분석하고 각각의 성능을 비교한다. WIS는 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝의 개념과 그 기법이 처음 제안된 알고리즘이며, 전통적인 빈발 아이템셋 마이닝 기법인 Apriori를 기반으로 하고 있다. 또 다른 트랜잭션 가중치 기반의 빈발 아이템셋 마이닝 방법인 WIT-FWIs와 WIT-FWIs-MODIFY, WIT-FWIs-DIFF는 가중화된 빈발 아이템셋 마이닝을 더 효율적으로 수행하기 위해 격자구조(Lattice) 형태의 특별한 저장구조인 WIT-tree를 이용한다. WIT-tree의 각 노드에는 아이템셋 정보와 아이템셋이 포함된 트랜잭션의 ID들이 저장되며, 이 구조를 사용함으로써 아이템셋 마이닝 과정에서 발생되는 다수의 데이터베이스 스캔 과정이 감소된다. 특히, 전통적인 알고리즘들이 수많은 데이터베이스 스캔을 수행하는 반면에, 이 알고리즘들은 WIT-tree를 이용해 데이터베이스를 오직 한번만 읽음으로써 마이닝과정에서 발생 가능한 오버헤드 문제를 해결한다. 또한, 공통적으로 길이 N의 두 아이템셋을 이용해 길이 N+1의 새로운 아이템셋을 생성한다. 먼저, WIT-FWIs는 각 아이템셋이 동시에 발생되는 트랜잭션들의 정보를 활용하는 것이 특징이다. WIT-FWIs-MODIFY는 조합되는 아이템셋의 정보를 이용해 빈도수 계산에 필요한 연산을 줄인 알고리즘이다. WIT-FWIs-DIFF는 두 아이템셋 중 하나만 발생한 트랜잭션의 정보를 이용한다. 우리는 다양한 실험환경에서 각 알고리즘의 성능을 비교분석하기 위해 각 트랜잭션의 형태가 유사한 dense 데이터와 각 트랜잭션의 구성이 서로 다른 sparse 데이터를 이용해 마이닝 시간과 최대 메모리 사용량을 평가한다. 또한, 각 알고리즘의 안정성을 평가하기 위한 확장성 테스트를 수행한다. 결과적으로, dense 데이터에서는 WIT-FWIs와 WIT-FWIs-MODIFY가 다른 알고리즘들보다 좋은 성능을 보이고 sparse 데이터에서는 WIT-FWI-DIFF가 가장 좋은 효율성을 갖는다. WIS는 더 많은 연산을 수행하는 알고리즘을 기반으로 했기 때문에 평균적으로 가장 낮은 성능을 보인다.

연속촬영 전자조사 문 영상을 이용한 오프라인 기반 치료 중 내부 장기 움직임 확인 시스템의 개발 (Development of an Offline Based Internal Organ Motion Verification System during Treatment Using Sequential Cine EPID Images)

  • 주상규;홍채선;허웅;김민규;한영이;신은혁;신정석;김진성;박희철;안성환;임도훈;최두호
    • 한국의학물리학회지:의학물리
    • /
    • 제23권2호
    • /
    • pp.91-98
    • /
    • 2012
  • 방사선치료 중 내부 장기의 움직임을 확인하고 이를 보정하는 것은 움직이는 종양에 정확히 방사선을 조사하는데 매우 중요한 역할을 한다. 실제 치료 중 획득한 연속촬영 전자조사 문(cine EPID) 영상을 이용해 치료 중 내부 장기 움직임을 추적하는 오프라인 기반 분석 시스템(IMVS, Internal-organ Motion Verification System using cine EPID)을 개발하였고 모형을 이용하여 개발된 시스템의 정확도와 유용성을 평가했다. IMVS는 cine EPID영상을 이용한 내부 장기 움직임 추적을 위해 내부 표지자를 이용한 유형 정합 알고리즘을 이용했다. 시스템의 성능평가를 위해 폐와 폐 종양을 묘사한 인체 모형과 이를 상하(SI, superior-inferior)방향으로 직선 운동시키는 구동 장치와 제어 프로그램을 고안했다. 모형을 4초 주기로 2 cm 직선 운동 시키면서 10 MV X선으로 3.3 fps, 6.6 fps속도로 cine EPID 영상($1,024{\times}768$ 해상도)를 획득했다. 획득된 cine EPID 영상은 IMVS를 이용하여 표적의 움직임을 추적하고 기존 외부 표지자를 이용한 비디오 영상 기반 추적시스템(RPM, Real-time Position Management, Varian, USA)으로부터 얻은 결과와 비교했다. 정량적 평가를 위해 두 시스템으로부터 움직임의 평균 주기(Peak-To-Peak), 진폭과 패턴(RMS, Root Mean Square)을 측정하여 비교했다. RPM과 IMVS로 측정한 폐 종양 모형의 움직임 주기는 각각 $3.95{\pm}0.02$ (RPM), $3.98{\pm}0.11$ (IMVS 3.3 fps), $4.005{\pm}0.001$ (IMVS 6.6 fps) 초로 실제움직임 주기인 4초와 잘 일치했다. IMVS로 획득한 모형 내부장기의 평균 움직임 진폭은 3.3 fps에서 $1.85{\pm}0.02$ cm, 6.6 fps에서 $1.94{\pm}0.02$ cm으로 실제 진폭 2 cm에 비해 각각 0.15 cm (오차 7.5%) 및 0.06 cm (오차 3%)의 차를 보였다. 움직임 신호의 일치성 평가를 위해 측정한 RMS는 0.1044 (IMVS 3.3 fps), 0.0480 (IMVS 6.6 fps)로 계획된 신호와 잘 일치 했다. cine EPID 영상을 이용하여 내부 표지자의 움직임을 추적하는 IMVS는 모형 실험에서 내부 장기의 움직임을 3% 오차 내에서 확인 가능했다. IMVS는 치료 중 내부장기 움직임을 측정하고 이를 사차원 방사선 치료계획과 비교하여 오차를 보정하는데 기여할 것으로 생각된다.

공공 서비스 수출 플랫폼을 위한 온톨로지 모형 (An Ontology Model for Public Service Export Platform)

  • 이광원;박세권;류승완;신동천
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.149-161
    • /
    • 2014
  • 공공 서비스의 수출의 경우 수출 절차와 대상 선정에 따른 다양한 문제가 발생하며, 공공 서비스 수출 플랫폼은 이러한 문제점들을 해결하기 위하여 사용자 중심의 유연하고, 개방형 구조의 디지털 생태계를 조성할 수 있도록 구현되어야 한다. 또한 공공서비스의 수출은 다수의 이해당사자가 참여하고 여러 단계의 과정을 거쳐야 하므로 사용자의 이해 종류와 탐색 컨설팅 협상 계약 등 수출 프로세스 단계별로 맞춤형 플랫폼 서비스 제공이 필수적이다. 이를 위해서 플랫폼 구조는 도메인과 정보의 정의 및 공유는 물론 지식화를 지원할 수 있어야 한다. 본 논문에서는 공공서비스 수출을 지원하는 플랫폼을 위한 온톨로지 모형을 제안한다. 서비스 플랫폼의 핵심 엔진은 시뮬레이터 모듈이며 시뮬레이터 모듈에서는 온톨로지를 사용하여 수출 비즈니스의 여러 컨텍스트들을 파악하고 정의하여 다른 모듈들과 공유하게 된다. 온톨로지는 공유 어휘를 통하여 개념들과 그들 간의 관계를 표현할 수 있으므로 특정 영역에서 구조적인 틀을 개발하기 위한 메타 정보를 구성하는 효과적인 도구로 잘 알려져 있다. 공공서비스 수출 플랫폼을 위한 온톨로지는 서비스, 요구사항, 환경, 기업, 국가 등 5가지 카테고리로 구성되며 각각의 온톨로지는 요구분석과 사례 분석을 통하여 용어를 추출하고 온톨로지의 식별과 개념적 특성을 반영하는 구조로 설계한다. 서비스 온톨로지는 목적효과, 요구조건, 활동, 서비스 분류 등으로 구성되며, 요구사항 온톨로지는 비즈니스, 기술, 제약으로 구성 된다. 환경 온톨로지는 사용자, 요구조건, 활동으로, 기업 온톨로지는 활동, 조직, 전략, 마케팅, 시간으로 구성되며, 국가 온톨로지는 경제, 사회기반시설, 법, 제도, 관습, 인프라, 인구, 위치, 국가전략 등으로 구성된다. 수출 대상 서비스와 국가의 우선순위 리스트가 생성되면 갭(gap) 분석과 매칭 알고리즘 등의 시뮬레이터를 통하여 수출기업과 수출지원 프로그램과의 시스템적 연계가 이루어진다. 제안하는 온톨로지 모형 기반의 공공서비스 수출지원 플랫폼이 구현되면 이해당사자 모두에게 도움이 되며 특히 정보 인프라와 수출경험이 부족한 중소기업에게 상대적으로 더 큰 도움이 될 것이다. 또한 개방형 디지털 생태계를 통하여 이해당사자들이 정보교환, 협업, 신사업 기획 등의 기회를 만들 수 있을 것으로 기대한다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.