• 제목/요약/키워드: 연관분석 모델

검색결과 648건 처리시간 0.028초

다중상황의 군집분석과 연관규칙을 이용한 지식추론 모델 (Knowledge Reasoning Model using Association Rules and Clustering Analysis of Multi-Context)

  • 신동훈;김민정;오상엽;정경용
    • 한국융합학회논문지
    • /
    • 제10권9호
    • /
    • pp.11-16
    • /
    • 2019
  • 사람들은 바쁜 현대사회 속에서 시간적 제재를 받고 있다. 이에 따라 사람들은 건강에 나쁜 영향을 미치는 간편한 인스턴트 식품을 섭취하고 간단한 운동조차하기 어려운 상황에 놓여있다. 또한 불필요한 정보과부화 현상으로 인해 개인의 특성에 적합하고 정확한 추론을 하는 것에 대한 중요성이 커지고 있다. 따라서 본 논문에서는 다중상황의 군집분석과 연관규칙을 이용한 지식추론 모델을 제안한다. 제안하는 방법은 상황정보에 따른 군집을 기반으로 연관규칙을 생성함으로써 사용자들에게 개인화된 헬스케어 방법을 제공한다. 이를 통해 각 질병에 대한 위험도를 추론함으로써 해당 질병에 대한 발병률을 낮출 수 있다. 또한 성능 평가를 통해 제안하는 모델이 비교 모델보다 수치상으로 F-measure 값이 0.027 더 높게 나타나며, 비교 모델 보다 우수하게 평가된다.

실시간 CRM을 위한 분류 기법과 연관성 규칙의 통합적 활용;신용카드 고객 이탈 예측에 활용

  • 이지영;김종우
    • 한국경영정보학회:학술대회논문집
    • /
    • 한국경영정보학회 2007년도 International Conference
    • /
    • pp.135-140
    • /
    • 2007
  • 이탈 고객 예측은 데이터 마이닝에서 다루는 주요한 문제 중에 하나이다. 이탈 고객 예측은 일종의 분류(classification) 문제로 의사결정나무추론, 로지스틱 회귀분석, 인공신경망 등의 기법이 많이 활용되어왔다. 일반적으로 이탈 고객 예측을 위한 모델은 고객의 인구통계학적 정보와 계약이나 거래 정보를 입력변수로 하여 이탈 여부를 목표변수로 보는 형태로 분류 모델을 생성하게 된다. 본 연구에서는 고객과의 지속적인 접촉으로 발생되는 추가적인 사건 정보를 활용하여 연관성 규칙을 생성하고 이 결과를 기존의 방식으로 생성된 분류 모델과 결합하는 이탈 고객 예측 방법을 제시한다. 제시한 방법의 유용성을 확인하기 위해서 특정 국내 신용카드사의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 제시된 방법이 기존의 전통적인 분류 모델에 비해서 향상된 성능을 보이는 것을 확인할 수 있었다. 제시된 예측 방법의 장점은 기존의 이탈 예측을 위한 입력 변수들 이외에 고객과 회사간의 접촉을 통해서 생성된 동적 정보들을 통합적으로 활용하여 예측 정확도를 높이고 실시간으로 이탈 확률을 갱신할 수 있다는 점이다.

  • PDF

잠수함 교전 시뮬레이션의 사후분석을 위한 객체와 소나 표적간의 연관 기법 (Association between Object and Sonar Target for Post Analysis of Submarine Engaged Warfare Simulation)

  • 김준형;배건성
    • 한국시뮬레이션학회논문지
    • /
    • 제26권3호
    • /
    • pp.65-72
    • /
    • 2017
  • 함정 전투실험의 사후분석에서는 객체에 대한 자함의 표적 탐지능력와 무장 교전능력을 분석한다. 따라서 사후분석을 위해서는 전장 환경의 위협 객체와 센서에서 탐지한 표적간 연관 맺을 수 있는 정보가 필요하다. 기존의 공학급 교전 시뮬레이터는 이러한 객체-표적 연관정보를 제공하였다. 그러나 사용된 시뮬레이터의 잠수함모델에는 실제 소나시스템의 신호처리 알고리즘이 탑재되어있다. 소나신호처리 과정을 통해 얻은 표적정보에서는 실제 객체정보가 무엇인지 연관지을 수 없으며, 사용된 시뮬레이터도 그러한 정보를 제공하지 않고 있다. 따라서 본 연구에서는 객체정보와 소나신호처리에서 얻은 표적의 방위각, 거리, 속도 등의 기동정보를 이용하여 객체-표적 연관정보를 생성하였다. 객체-표적 연관정보를 생성하는 방법을 제안하고, 제안한 방법의 타당성을 실험을 통해 검증하였다.

그래프 마이닝을 이용한 뉴스 데이터 분석 기법 (News Data Analysis Technique using Graph Mining)

  • 이창주;박기성;한용구;이영구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.730-733
    • /
    • 2015
  • 대용량의 인터넷 뉴스 데이터로부터 유용한 정보를 찾기 위해 연관 키워드, 핫 키워드 분석과 같은 다양한 분석 기술들이 연구되고 있다. 기존의 토픽 모델 기반의 기법은 키워드들간의 연관성을 제대로 표현하지 못하여 마이닝한 연관 키워드와 핫 키워드의 정확도가 낮은 문제점이 있다. 최근, 뉴스 데이터를 뉴스 내의 단어를 버텍스로, 같은 문장내의 단어들을 에지로 연결하는 그래프 기반의 모델링기법이 연구되었다. 이러한 뉴스 그래프 DB에서 그래프 마이닝 기술을 적용하면 연관 키워드, 핫 키워드를 마이닝 할 수 있다. 본 논문은 그래프 마이닝 기술 기반의 효과적인 뉴스 데이터 분석 기술을 제안한다. 실제 뉴스 데이터를 통해 마이닝한 유용한 뉴스 그래프 패턴들을 보이고 뉴스 데이터 분석에 효과적으로 활용될 수 있음을 보인다.

연관 규칙 분석 알고리즘을 활용한 영작문 형태.통사 오류 자동 발견 (Automatic Error Detection of Morpho-syntactic Errors of English Writing Using Association Rule Analysis Algorithm)

  • 김동성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2010
  • 본 연구에서는 일련의 연구에서 수집된 영작문 오류 유형의 정제된 자료를 토대로 연관 규칙을 생성하고, 학습을 통해서 효용성이 검증된 연관 규칙을 활용해서 영작문 데이터의 형태 통사 오류를 자동으로 탐지한다. 영작문 데이터에서 형태 통사 오류를 찾아내는 작업은 많은 시간과 자원이 소요되는 작업이므로 자동화가 필수적이다. 기존의 연구들이 통계적 모델을 활용한 어휘적 오류에 치중하거나 언어 이론적 틀에 근거한 통사 처리에 집중하는 반면에, 본 연구는 데이터 마이닝을 통해서 정제된 데이터에서 연관 규칙을 생성하고 이를 검증한 후 형태 통사 오류를 감지한다. 이전 연구들에서는 이론적 틀에 맞추어진 규칙 생성이나 언어 모델 생성을 위한 대량의 코퍼스 데이터와 같은 다량의 지식 베이스 생성이 필수적인데, 본 연구는 적은 양의 정제된 데이터를 활용한다. 영작문 오류 유형의 형태 통사 연관 규칙을 생성하기 위해서 Apriori 알고리즘을 활용하였다. 알고리즘을 통해서 생성된 연관 규칙 중 잘못된 규칙이 생성될 가능성이 있으므로, 상관성 검정, 코사인 유사도와 같은 규칙 효용성의 통계적 검증을 활용해서 타당한 규칙만을 학습하였다. 이를 통해서 축적된 연관 규칙들을 영작문 오류를 자동으로 탐지하는 실험에 활용하였다.

  • PDF

전 방향 참조 경로 탐사 패턴을 이용한 웹 문서 예측 (Web document prediction using forward reference path traversal patterns)

  • 김양규;손기락
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.112-114
    • /
    • 2004
  • 오늘날 웹을 이용하는 사용자들의 웹 검색 형태를 저장한 웹 로그 데이터들은 데이터 마이닝을 위한 중요한 자료가 되고 있다. 이들 웹 로그들로부터 사용자의 현재 행동을 기반으로 사용자가 다음에 요청할 요구를 예측할 수 있는 예측 모델을 만들 수 있다. 하지만 이들 웹 로그들은 크기가 매우 크고 분석하기가 어렵다. 이런 문제를 해결하기 위해 이미 않은 방법이 제안되었다. 그 중에서 효과적으로 예측할 수 있도록 제안된 순차적 분류 기반에 연관법칙을 적용한 예측 기법이 있다. 본 논문에서는 전방향 참조 경로 탐사 패턴 알고리즘을 적용하여 연관규칙에 기반 한 웹 문서 예측 기법을 향상시키는 모델을 제안한다.

  • PDF

분석과 설계 단계에서의 초기 소프트웨어 신뢰도 모델 (An Early Software Reliability Prediction Model based on Analysis and Design Phase)

  • 류연호;백두권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.376-378
    • /
    • 2003
  • 소프트웨어 개발 중 분석과 설계 단계에서 만들어진 산출물을 이용하여 개발될 소프트웨어의 신뢰도를 예측하는 초기 소프트웨어 신뢰도 모델은 소프트웨어의 품질을 보증하는 유용한 도구로써 사용될 수 있다. 기존의 소프트웨어 신뢰도 모델은 개발될 소프트웨어의 품질에 한정하여 신뢰도를 예측함으로써 기존 시스템과 연계된 신뢰도를 예측하는데 한계가 있다는 단점과 개발자의 개발 능력이 개발될 소프트웨어 신뢰도에 미칠 영향을 고려하는데 한계가 있다는 단점이 있었다. 그러므로, 본 논문은 기존 시스템과의 연관성을 고려한 초기 소프트웨어 신뢰도 모델을 기준으로 개발자의 개발 능력을 고려한 종합적인 초기 신뢰도 모델을 제시하였다.

  • PDF

도로 위험 탐지를 위한 데이터 편향성 최적화 기반 연관 추론 모델 (Data Bias Optimization based Association Reasoning Model for Road Risk Detection)

  • 류성은;김현진;구병국;권혜정;박찬홍;정경용
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.1-6
    • /
    • 2020
  • 본 연구에서는 도로 위험 탐지를 위한 데이터 편향성 최적화 기반 연관 추론 모델을 제안한다. 이는 사용자의 개인적 특성과 주변 환경 데이터를 수집하고 교통사고 방지 서비스를 제공하기 위한 연관분석 기반의 마이닝 모델이다. 이는 다양한 상황 변수들로 구성된 트랜잭션 데이터를 생성한다. 생성된 정보를 바탕으로 연관 패턴 분석을 통해 각 트랜잭션 내 변수들의 유의미한 연관관계를 도출한다. 분류된 범주형 데이터의 편향성을 고려하여 최적화된 지지도 및 신뢰도 값으로 가지치기를 진행한다. 추출된 상위 연관규칙을 바탕으로 사용자에게 개인 특성과 주행 도로 상황에 대한 위험 탐지모델을 제공한다. 이는 데이터 편향성 문제를 극복하고 데이터간 연관성을 고려하여 잠재적인 도로 사고를 예방하는 교통 서비스가 가능하다. 성능 평가는 제안하는 방법이 정확도에서 0.778, Kappa 계수에서 0.743로 우수하게 평가된다.

네트워크 플로우의 연관성 모델을 이용한 트래픽 분류 방법 (A Traffic-Classification Method Using the Correlation of the Network Flow)

  • 구영훈;심규석;이성호;;김명섭
    • 정보과학회 논문지
    • /
    • 제44권4호
    • /
    • pp.433-438
    • /
    • 2017
  • 오늘날의 네트워크는 고속화와 유비쿼터스 환경으로 인해 다양한 응용이 급속도로 생성되고 있으며 네트워크 트래픽도 매우 복잡해지고 있다. 이에 효율적인 네트워크 운용 및 관리를 위한 구체적인 단위의 트래픽 분류가 필수적이다. 다양한 트래픽 분류 방법이 연구되고 있는 가운데 아직 트래픽을 완벽하게 분류해내는 방법론은 개발되지 않은 실정이다. 이에 본 논문에서는 네트워크 플로우의 연관성 모델을 정의하고 이를 기반으로 트래픽을 분류하는 방법을 제안한다. 트래픽 분류를 위한 네트워크 플로우의 연관성 모델은 크게 유사성 모델과 연결성 모델로 이루어진다. 제안하는 방법론을 효과적으로 적용하기 위한 방안을 제시하며 실험을 통해 본 분류 방법론이 높은 정확도와 분석률의 방법론이라는 것을 증명한다.

해상교통혼잡도와 IWRAP Mk2 기반의 항로 위험도 연관성 분석에 관한 연구 (Analysis of Correlation between Marine Traffic Congestion and Waterway Risk based on IWRAP Mk2)

  • 이의종;이윤석
    • 해양환경안전학회지
    • /
    • 제25권5호
    • /
    • pp.527-534
    • /
    • 2019
  • 항로에서의 위험도 평가 모델은 해상 교통량을 기초로 다양한 형태의 수학적 분석 방법 등이 응용되고 있다. 국내 해상교통안전진단에서는 항로를 통항하는 선박 규모를 표준화시킨 해상교통혼잡도 모델을 활용하고 있으며, 해상교통혼잡도가 높으면 충돌과 같은 위험상황이 발생할 개연성이 높다고 해석하고 있다. 그러나 항로의 특정 지점에서 관측된 해상 교통량의 밀도 변화가 항로의 위험도를 표현할 수 있는지 보다 면밀한 과학적 검토가 필요하다고 판단된다. 본 연구에서는 항로에서의 충돌 및 좌초 등의 위험도를 확률적 기법으로 평가하는 IWRAP Mk2(IALA 공식 추천 평가모델) 모델로 항로 위험도를 체계적으로 평가하고, 동일 해역에서 해상교통혼잡도 모델로 해상교통혼잡도를 평가하여 항로 위험도와 해상교통혼잡도의 연관성을 분석하였다. 분석 결과, $R^2$이 0.943인 선형함수가 도출되었으며, 유의수준에서도 유의성이 있는 것으로 분석되었다. 또한 Pearson 상관계수가 0.971로 높게 나타나 강한 정적 상관관계를 보였다. 이처럼 각각의 수학모델의 공통적인 입력 변수의 영향으로 항로 위험도와 해상교통혼잡도는 강한 연관성을 가지는 것으로 확인되었다. 이러한 연구 결과를 기반으로 항로 위험도를 예측할 수 있는 평가 기법이 고도화될 수 있는 모델 개발을 위한 응용 자료로 활용되기를 기대한다.