• 제목/요약/키워드: Rule mining

검색결과 479건 처리시간 0.023초

재가노인 사례관리의 욕구사정 정확도 향상을 위한 욕구추출 알고리즘 개발 - 데이터 마이닝 분석기법을 활용하여 - (Development of Needs Extraction Algorithm Fitting for Individuals in Care Management for the Elderly in Home)

  • 김영숙;정국인;박소라
    • 한국사회복지학
    • /
    • 제60권1호
    • /
    • pp.187-209
    • /
    • 2008
  • 본 연구자들은 재가노인의 사례관리 과정에서 가장 핵심적인 요소가 되는 욕구 중심의 통합적 사정을 위한 28개의 욕구가 포함된 사정도구를 개발하였으며, 그 후속 연구로 개발된 욕구사정도구를 활용해 전국 노인복지관 협회 산하 120개 기관의 재가 노인 676명의 사정 데이터를 수집하고 데이터마이닝의 의사결정 나무분석 기법을 활용하여 욕구에 적합한 사회복지 서비스를 제공하기 위한 욕구추출 알고리즘을 개발하였다. 본 연구를 통해 재가노인의 욕구 28개에 대한 욕구추출 알고리즘은 <표3>에 요약하였다. 욕구 8번 "외출 시 도움을 원한다."의 의사결정모형을 예로 들면, 호소 23번을 주요 변인으로 외부이동 도움을 요청할 경우 80.3%와 요청하지 않을 경우 11.4%로 구분되었다. 이용자가 외부 이동에 대한 호소가 있고, 수발자가 있는 경우 87.9%로 욕구가 증가하였지만, 수발자가 없는 이용자의 경우 47.4%로 감소하였다. 노인이 외부이동 지원에 대한 요청과 수발자가 있으며, 청소하기의 완전도움이 필요한 경우, 외부이동 도움에 대한 욕구는 94.2%로 나타났다. 그러나 이용자가 외부이동의 도움을 요청하지 않더라도, ADL의 목욕하기에 완전도움으로 응답한 경우 외출도움의 욕구는 11.4%에서 80.0%로 급격히 증가하는 것을 확인할 수 있다. 그러나 ADL 목욕하기의 기능이 부분도움 또는 완전자립의 경우 외출도움이 필요하다고 분류될 가능성은 7.7%로 낮게 나타났다. 위와 같은 의사결정모형은 최대 나무 깊이는 5수준을 정지규칙으로 하여, 부모마디와 자식마디의 사례 수를 각각 50과 25로 지정하였다. 이를 통해 "외출 시 도움을 원한다"라는 욕구의 경우 182.13%의 효과적인 의사결정을 하고 있다. 본 연구의 결과로 제시한 알고리즘은 재가노인의 욕구를 추출함에 있어서 체계적이고 과학적인 기초자료로 활용될 수 있다.

  • PDF

다중모형조합기법을 이용한 상품추천시스템 (Product Recommender Systems using Multi-Model Ensemble Techniques)

  • 이연정;김경재
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.39-54
    • /
    • 2013
  • 전자상거래의 폭발적 증가는 소비자에게 더 유리한 많은 구매 선택의 기회를 제공한다. 이러한 상황에서 자신의 구매의사결정에 대한 확신이 부족한 소비자들은 의사결정 절차를 간소화하고 효과적인 의사결정을 위해 추천을 받아들인다. 온라인 상점의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로써의 가치를 인정받고 있다. 그러나 사용자의 기호를 제대로 반영하지 못하는 추천시스템은 사용자의 실망과 시간낭비를 발생시킨다. 본 연구에서는 정확한 사용자의 기호 반영을 통한 추천기법의 정교화를 위해 데이터마이닝과 다중모형조합기법을 이용한 상품추천시스템 모형을 제안하고자 한다. 본 연구에서 제안하는 모형은 크게 두 개의 단계로 이루어져 있으며, 첫 번째 단계에서는 상품군 별 우량고객 선정 규칙을 도출하기 위해서 로지스틱 회귀분석 모형, 의사결정나무 모형, 인공신경망 모형을 구축한 후 다중모형조합기법인 Bagging과 Bumping의 개념을 이용하여 세 가지 모형의 결과를 조합한다. 두 번째 단계에서는 상품군 별 연관관계에 관한 규칙을 추출하기 위하여 장바구니분석을 활용한다. 상기의 두 단계를 통하여 상품군 별로 구매가능성이 높은 우량고객을 선정하여 그 고객에게 관심을 가질만한 같은 상품군 또는 다른 상품군 내의 다른 상품을 추천하게 된다. 제안하는 상품추천시스템은 실제 운영 중인 온라인 상점인 'I아트샵'의 데이터를 이용하여 프로토타입을 구축하였고 실제 소비자에 대한 적용가능성을 확인하였다. 제안하는 모형의 유용성을 검증하기 위하여 제안 상품추천시스템의 추천과 임의 추천을 통한 추천의 결과를 사용자에게 제시하고 제안된 추천에 대한 만족도를 조사한 후 대응표본 T검정을 수행하였으며, 그 결과 사용자의 만족도를 유의하게 향상시키는 것으로 나타났다.

경영분석지표와 의사결정나무기법을 이용한 유상증자 예측모형 개발 (Development of Predictive Models for Rights Issues Using Financial Analysis Indices and Decision Tree Technique)

  • 김명균;조윤호
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.59-77
    • /
    • 2012
  • 기업의 성장성, 수익성, 안정성, 활동성, 생산성 등에 대한 다양한 분석이 은행, 신용평가기관, 투자자 등 많은 이해관계자에 의해 실시되고 있고, 이에 대한 다양한 경영분석 지표들 또한 정기적으로 발표되고 있다. 본 연구에서는 이러한 경영분석 지표를 이용하여 어떤 기업이 가까운 미래에 유상증자를 실시하는지를 데이터마이닝을 통해 예측하고자 한다. 본 연구를 통해 어떠한 지표가 유상증자 여부를 예측하는데 도움이 되는가를 살펴 볼 것이며, 그 지표들을 이용하여 예측할 경우 그 예측의 정확도가 어느 정도인지를 분석하고자 한다. 특히 1997년 IMF 금융위기 전후로 유상증자를 결정하는 변수들이 변화하는지, 그리고 예측의 정확성에 분명한 차이가 존재하는지 분석한다. 또한 유상증자 실시 시기를 경영분석 지표 발표 후 1년 내, 1~2년 내, 2~3년 내로 나누어 예측 시기에 따라 예측의 정확성과 결정 변수들의 차이가 존재하는지도 분석한다. 658개의 유가증권상장법인의 경영분석 데이터를 이용하여 실증 분석한 결과, IMF 이후의 유상증자 예측모형이 IMF 이전의 예측모형에 비해 예측 정확도가 높았고, 학습용 데이터의 예측 정확도와 검증용 데이터의 예측 정확도 차이도 IMF 이후가 낮게 나타났다. 이러한 결과는 IMF 이후 재무자료의 정확도가 높아졌고, 기업에게 유상증자의 목적이 더욱 명확해졌다고 해석될 수 있다. 또한 예측기간이 단기인 경우 경영분석 지표 중 안전성에 관련된 지표들의 중요성이 부각되었고, 장기인 경우에는 수익성과 안전성뿐만 아니라 활동성과 생산성 관련지표도 유상증자를 예측하는 데 중요한 것으로 파악되었다. 그리고 모든 예측모형에서 산업코드가 유상증자를 예측하는 중요변수로 포함되었는데 이는 산업별로 서로 다른 유상증자 유형이 존재한다는 점을 시사한다. 본 연구는 투자자나 재무담당자가 유상증자 여부를 장단기 시점에서 예측하고자 할 때 어떠한 경영분석지표를 고려하여 분석하는 것이 바람직한지에 대한 지침을 제공하는데 그 의의가 있다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

모바일 러닝에서의 신규 융합서비스 도출을 위한 분석: 사회연결망 분석과 연관성 분석 사례 (An Analysis for Deriving New Convergent Service of Mobile Learning: The Case of Social Network Analysis and Association Rule)

  • 백헌;김진화;김용진
    • 경영정보학연구
    • /
    • 제15권3호
    • /
    • pp.1-37
    • /
    • 2013
  • 본 연구는 모바일 러닝의 활성화를 위한 서비스 융합의 가능성을 보고자 하였다. 이를 위해 모바일 러닝의 유형 및 특성을 분석 하였다. 먼저 현재 모바일 러닝 서비스는 어떤 서비스를 중심으로 활성화되고 있으며, 이러한 서비스를 중심으로 사용자의 활용도가 높은 서비스는 무엇인지 알아 보았다. 두 번째로는 모바일에서 주로 이뤄지고 있는 서비스와 이러닝에서 주로 이뤄지고 있는 서비스의 복합적 융합가능성을 살펴 보았다. 세 번째로는 모바일에서의 서비스와 이러닝에서의 공통된 서비스를 중심으로 앞으로 융합이 활성화 될 가능성을 살펴보았다. 분석을 위하여 포털 사이트에서 관련 웹페이지를 통하여 변수를 추출하였으며, 사회 네트워크 분석과 연관성 분석을 사용하였다. 이는 웹페이지마다 변수의 종류와 수가 다르기 때문에 전체적인 웹 상에서 각각의 변수들의 위치와 네트워크상에서의 복잡한 연결 정도를 살펴보기 힘들다. 이러한 문제점을 해결하기 위해 사회 네트워크 분석을 하였으며, 변수들 간의 연관규칙을 발견하고자 연관성 분석을 하였다. 규칙의 해석을 위해서는 사회 네트워크 분석 결과와 연관규칙을 함께 고려하여 살펴보았다. 분석 결과, 모바일에서 제공되는 서비스와 이러닝에서 제공되고 있는 공통된 서비스 중에서 빈도수가 높은 서비스로는 게임과 SNS로 나타났으며, 이외 결제, 광고, 메일, 이벤트, 동영상, 클라우드, 전자책, 증강현실, 취업 등으로 발견되었다. 이러한 서비스를 중심으로 이러닝의 다양한 서비스와 융합하여 이뤄지고 있음을 알 수 있었다. 공통된 서비스와 함께 모바일에서는 검색, 뉴스, GPS 등의 서비스가 활성화 되고 있으며, 이러닝에서는 시뮬레이션, 교양, 공교육 등의 서비스가 활성화 되고 있음을 알 수 있었다. 모바일과 이러닝의 공통된 변수를 기반으로 각각의 서비스의 융합이 높게 나타난 변수로는 모바일에서는 게임과 SNS, 게임과 스포츠, SNS와 광고, 게임과 이벤트, SNS와 전자책, 게임과 커뮤니티가 융합이 높게 나타났으며, 이러닝에서는 게임, 동영상, 상담, 전자책을 전항으로 하여 시뮬레이션, 말하기, 공교육, 출결관리 등의 서비스의 융합정도가 높게 나타난 것을 알 수 있었다. 다음으로 모바일서비스와 이러닝서비스의 공통된 서비스중에서, 모바일 러닝 서비스에서 활성화가 높은 서비스와 사용자를 기반한 모바일 러닝 서비스의 활성화가 높은 서비스인 게임, SNS, 전자책을 기준으로 서비스 융합 활성화 가능성을 예측했다. 본 연구결과를 통해 모바일을 활용한 이러닝 서비스의 관련 서비스 융합으로, 모바일 러닝의 활성화에 대한 전략적 방향성을 제안할 수 있을 것이다.

  • PDF

집단지성을 이용한 한글 감성어 사전 구축 (Building a Korean Sentiment Lexicon Using Collective Intelligence)

  • 안정국;김희웅
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.49-67
    • /
    • 2015
  • 최근 다양한 분야에서 빅데이터의 활용과 분석에 대한 중요성이 대두됨에 따라, 뉴스기사와 댓글과 같은 비정형 데이터의 자연어 처리 기술에 기반한 감성 분석에 대한 관심이 높아지고 있다. 하지만, 한국어는 영어와는 달리 자연어 처리가 어려운 교착어로써 정보화나 정보시스템에의 활용이 미흡한 실정이다. 이에 본 연구는 감성 분석에 활용이 가능한 감성어 사전을 집단지성으로 구축하였고, 누구나 연구와 실무에 사용하도록 API서비스 플랫폼을 개방하였다(www.openhangul.com). 집단지성의 활용을 위해 국내 최대 대학생 소셜네트워크 사이트에서 대학생들을 대상으로 단어마다 긍정, 중립, 부정에 대한 투표를 진행하였다. 그리고 집단지성의 효율성을 높이기 위해 감성을 '정의'가 아닌 '분류'하는 방식인 폭소노미의 '사람들에 의한 분류법'이라는 개념을 적용하였다. 총 517,178(+)의 국어사전 단어 중 불용어 형태를 제외한 후 감성 표현이 가능한 명사, 형용사, 동사, 부사를 우선 순위로 하여, 현재까지 총 35,000(+)번의 단어에 대한 투표를 진행하였다. 본 연구의 감성어 사전은 집단지성의 참여자가 누적됨에 따라 신뢰도가 높아지도록 설계하여, 시간을 축으로 사람들이 단어에 대해 인지하는 감성의 변화도 섬세하게 반영하는 장점이 있다. 따라서 본 연구는 앞으로도 감성어 사전 구축을 위한 투표를 계속 진행할 예정이며, 현재 제공하고 있는 감성어 사전, 기본형 추출, 카테고리 추출 외에도 다양한 자연어 처리에 응용이 가능한 API들도 제공할 계획이다. 기존의 연구들이 감성 분석이나 감성어 사전의 구축과 활용에 대한 방안을 제안하는 것에만 한정되어 있는 것과는 달리, 본 연구는 집단지성을 실제로 활용하여 연구와 실무에 활용이 가능한 자원을 구축하여 개방하여 공유한다는 차별성을 가지고 있다. 더 나아가, 집단지성과 폭소노미의 특성을 결합하여 한글 감성어 사전을 구축한 새로운 시도가 향후 한글 자연어 처리의 발전에 있어 다양한 분야들의 융합적인 연구와 실무적인 참여를 이끌어 개방적 협업의 새로운 방향과 시사점을 제시 할 수 있을 것이라 기대한다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

SVM을 이용한 시스템트레이딩전략의 선택모형 (Selection Model of System Trading Strategies using SVM)

  • 박성철;김선웅;최흥식
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.59-71
    • /
    • 2014
  • KOSPI200 선물 트레이딩을 위해 업계에서는 여러 전략으로 포트폴리오를 구성해서 운용한다. 동일한 전략 모음을 갖고 있더라도 포트폴리오를 어떻게 구성하느냐에 따라 수익은 크게 차이가 난다. 시장 상황에 맞는 전략들로 포트폴리오를 구성하는 것은 오랜 경험과 탁월한 노하우가 있어야하는 어려운 작업이다. 본 논문에서는 SVM을 활용하여 쉽고 빠르게 적절한 전략 포트폴리오를 구성하는 방법을 제시하였다. 본 논문에서 제안한 시스템의 성과는 벤치마킹의 성과와 비교하여 2배 이상의 수익을 내는 것을 확인하였다. 1990.01.03~2011.11.04 동안의 KOSPI200 데이터 중 이전 80%의 데이터로 학습을 하고 최근 20%의 데이터로 성능을 시험하였다. 각 전략별로 선택여부를 판별하는 SVM모델을 만들고 그 결과를 바탕으로 포트폴리오를 구성하였다. 벤치마킹을 위해 KOSPI200 선물을 2계약 매수한 경우의 수익, 시험 시작 직전 30일간 최고 수익을 낸 2개 전략의 수익, 실제 최고 수익을 낸 전략 2개를 보유했을 때의 수익과 비교하였다. 매매 비용을 반영하지 않을 때는 벤치마킹은 132.2~510.37pt의 수익을 냈고, 본 시스템은 1072.36~1140.91pt의 수익을 보여주었다. 그리고 거래비용을 감안하면 벤치마킹은 130.44~502.41pt의 수익을 냈고, 본 시스템은 706.22pt~768.95pt의 수익을 나타내었다. 본 논문은 기계학습을 통한 전략 포트폴리오를 구성하는 방안이 유의미하며 실전에 활용할 수 있음을 보여주었다. 이를 바탕으로 여러 전략과 다양한 시장에 적용해서 안정성을 검증하면 견고한 상용 솔루션으로 발전시킬 수 있을 것이다. 그리고 자금관리 기법을 더 반영한다면 수익을 더욱 크게 향상시킬 수 있을 것이다.

데이터마이닝을 활용한 소프트웨어 개발인력의 업무 지속수행의도 결정요인 분석 (A Study of Factors Associated with Software Developers Job Turnover)

  • 전인호;박선웅;박윤주
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.191-204
    • /
    • 2015
  • 국내 소프트웨어(SW) 개발인력의 미충원율은 매우 높으며, 특히 2년 이상의 현장경력이 있는 고급 개발자의 부족문제는 심각하다. 최근 정부도 이를 인식하고, 정책적으로 SW개발 신규인력 양성에 힘을 기울이고 있다. 그러나, 이러한 노력은 초급개발자의 수급문제를 해결하는데 효과적일 수 있지만, 업계에서 요구하는 고급 개발자의 부족현상을 해결하는 근본적인 대책으로 인식되지는 못하고 있다. SW 전문개발자를 양성하기 위해서는 초급개발자들이 지속적으로 직무를 수행하여 풍부한 업무경험을 갖춘 고급 개발자로 성장해야 하기 때문이다. 이에, 본 연구는 국내 SW업체에서 근무하고 있는 개발관련 인력들의 업무 지속수행 의도를 조사하고, 이에 영향을 주는 주요요인들을 분석하였다. 이를 위해, 2014년 9월부터 10월까지 국내 SW업체에 근무하고 있는 현직 개발자 총 130명을 대상으로 설문조사를 수행하였으며, 이를 기반으로 SW개발업무 지속수행의도 및 이에 영향을 주는 요인들을 개발자의 특성, 직무환경, 그리고 SW개발자에 대한 사회적 인식 및 산업전망 등의 측면에서 분석하였다. 분석에는 데이터마이닝 기법들 중에서, 분석과정에서의 설명능력이 있는 회귀분석과 의사결정나무가 사용되었다. 회귀분석 결과, SW개발자가 스스로 인식하는 근무 가능한 연령이 높을수록, 내성적인 성향을 가질수록, 또한 적성에 맞아서 직무를 선택한 경우, 지속적 직무 수행 의도가 높은 것으로 나타났다. 이와 더불어, 선형회귀분석에서는 유의하지 않았으나, 규칙기반의 의사결정나무 분석에서 파악된 추가적 요인으로, 새로운 기술에 대한 학습능력 및 SW산업에 대한 전망이 직무 지속수행의도에 영향을 미치는 것으로 나타났다. 이러한 연구결과는 기업의 인적자원관리 및 고급 SW인력 양성정책에 활용될 수 있을 것으로 생각되며, 궁극적으로 SW개발인력의 직무 지속성을 증진시키는 데 기여할 수 있을 것으로 기대된다.