• 제목/요약/키워드: 연관성 의사 결정 함수

검색결과 5건 처리시간 0.023초

조건부 확률증분비를 이용한 연관성 순위 결정 함수 (Association rule ranking function using conditional probability increment ratio)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.709-717
    • /
    • 2010
  • 연관성 규칙 마이닝은 각 항목들 간의 관련성을 찾아내는 데 활용되며, 지지도, 신뢰도, 향상도 등의 연관성 측도를 기반으로 두 항목간의 관계를 수치화함으로써 의미 있는 규칙을 찾아낸다. 본 논문에서는 조건부 확률 증분비를 이용한 연관성 순위 결정 함수를 제안하고자 한다. 특히 항목 집합간의 고유한 연관성 정도를 제대로 반영하기 위해 조건부 확률 증분비를 이용하여 연관성 순위 결정 함수를 제안하여 3개의 연관기준값들 중 어느 하나라도 기준 이상이 되는 규칙의 순위를 매겨 필요한 연관성 규칙만을 생성할 수 있도록 한다. 모의실험을 해본 결과, 본 논문에서 제안한 함수는 기존의 함수와는 달리 특정 연관 기준값의 영향을 받지 않으며, 최저 연관성 기준값들의 범위와는 관계없이 항상 -1과 1 사이의 값을 가진다는 사실을 확인할 수 있었다. 또한 조건부 확률 증분비를 이용한 연관순위결정 함수는 대체적으로 연관성 측도들과 최저 연관기준값들간의 차이를 잘 반영하고 있는 것으로 나타났다.

향상도 영향 감소화에 의한 연관성 순위결정함수 (Association rule ranking function by decreased lift influence)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.397-405
    • /
    • 2010
  • 데이터 마이닝은 대규모의 데이터베이스에 내재되어 있는 유용한 정보를 찾아내는 과정이며, 중요한 목표 중의 하나는 여러 변수들 간의 관계를 발견하고 결정하는 것이다. 이를 위해 필요한 기법인 연관성 규칙 마이닝은 각 항목들 간의 관련성을 찾아내는 데 활용되며, 지지도, 신뢰도, 향상도 등의 연관성 측도를 기반으로 두 항목간의 관계를 수치화함으로써 의미 있는 규칙을 찾아낸다. 본 논문에서는 3개의 연관기준값들 중 어느 하나라도 기준 이상이 되는 규칙의 순위를 매겨 필요한 연관성 규칙만을 생성할 수 있는 연관성 순위 결정 함수를 개발하는데 기존의 연구 결과를 개선하기 위해 특정 연관 기준값의 영향을 더 많이 받지 않도록 3개 연관기준값의 범위를 조정한 연관성 순위 결정 함수를 제안하고자 한다. 모의실험을 해본 결과, 대체적으로 본 논문에서 제안한 함수는 연관성 측도들과 최저 연관기준값들간의 차이를 잘 반영하고 있으며, 최저 연관성 기준값들의 범위와는 관계없이 항상 -1과 1 사이의 값을 가지며, 최저 연관기준값을 모두 충족하게 되면 1의 값을 가지며, 3개 모두 충족되지 않으면 -1의 값을 갖게 된다는 사실을 알 수 있었다.

생체 신호의 특징 추출 및 SVM을 이용한 분류 (Feature Extraction and Classification using SVM for Biomedical Signal)

  • 김만선;이상용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.181-183
    • /
    • 2003
  • 최근 대용량의 데이터베이스로부터 유용한 정보를 발견하고 데이터간에 존재하는 연관성을 탐색하고 분석하는 데이터 마이닝에 관한 많은 연구들이 진행되고 있다. 다양한 생체 신호를 분석하기 위하여 데이터 마이닝 기법을 이용할 수 있다. 본 논문에서는 심전도 신호의 패턴을 분류하기 위하여 신경망 기법을 적용하였다. 최근 패턴분류에 있어서 각광을 받고 있는 SVM 모델은 학습과정에서 얻어진 확률분포를 이용하여 의사결정함수를 추정한 후 이 함수에 따라 새로운 데이터를 이원분류 하는 것으로 분류 문제에 있어서 일반화 기능이 매우 높다. 기존에 많이 이용되던 BP 모델과 비교평가 하였다.

  • PDF

포렌식에서 디지털 증거의 우선순위 스케쥴링 (Priority Scheduling of Digital Evidence in Forensic)

  • 이종찬;박상준
    • 한국정보통신학회논문지
    • /
    • 제17권9호
    • /
    • pp.2055-2062
    • /
    • 2013
  • 범죄 증거의 새로운 형태인 디지털 증거는 기존의 증거와 기능 및 역할에 있어서 거의 차이점이 없으며, 증거로서의 법적 인정 및 역할이 점차 증가할 것으로 예상된다. 포렌식 수사관은 다수의 증거 보유 장치(예, 컴퓨터 시스템, 저장 매체 등)에 저장되어 있는 막대한 양의 데이터로부터, 사건과 관련된 실마리를 찾기 위하여 많은 시간을 소모해야 한다. 따라서 조사 시간을 단축하기 위해서는 잠재적인 관련 증거의 중요성에 근거하여 순서화 및 순위화가 필요하다. 본 연구에서는 포렌식 조사 시에, 정확한 증거를 선정하게 함으로서 증거 분석 우선순위를 결정하는 방법을 제안한다. 제안된 방식은 증거 조사 소요시간, 증거의 가치, 증거간의 연관성 그리고 사건과 시간과의 연관성과 같은 다수의 부정확한 요소가 퍼지 집합 함수를 사용한 의사 결정에 사용되는 다기준 의사 결정에 근거한다.

연관성 방향을 고려한 부호 헬링거 측도의 제안 (Signed Hellinger measure for directional association)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권2호
    • /
    • pp.353-362
    • /
    • 2016
  • 데이터 마이닝은 빅 데이터에 내재되어 있는 새로운 법칙이나 잠재되어 있는 지식을 탐색한 후, 이를 근거로 하여 의사결정에 활용하고자 하는 것이다. 위키 백과사전에 의하면 데이터 마이닝 기법 중의 하나인 연관성 규칙은 연관성 평가 기준에 의해 관심 있는 항목들 간에 관련성을 찾아내는 기법으로 많은 연구자들에 의해 연관성 평가를 위한 흥미도 측도들이 개발되어 왔다. 이들 중에서 헬링거 측도는 여러 가지 흥미도 측도들에 비해 많은 장점이 있으나 연관성의 방향을 판단하기가 곤란한 문제를 내포하고 있다. 이 문제를 해결하기 위해 본 논문에서는 부호를 가지는 헬링거 측도를 제안하고 몇 가지 예제를 통하여 유용성을 고찰하였다. 그 결과, 본 논문에서 제안하는 부호 헬링거 측도는 양의 연관성을 가지는 경우에는 양의 값으로 나타나고 음의 연관성을 가지는 경우에는 음의 값을 갖는 것으로 나타났다. 또한 동시발생빈도, 동시 비 발생빈도, 그리고 불일치 빈도가 증가함에 따라 기본적인 연관성 평가 기준들과 부호 헬링거 측도는 증감 여부가 동일한 것을 알 수 있었다.