• 제목/요약/키워드: 연관규칙분석

검색결과 346건 처리시간 0.029초

단어 빈도와 α-cut에 의한 연관 웹문서 분류를 이용한 추천 시스템 (Recommendation System using Associative Web Document Classification by Word Frequency and α-Cut)

  • 정경용;하원식
    • 한국콘텐츠학회논문지
    • /
    • 제8권1호
    • /
    • pp.282-289
    • /
    • 2008
  • 협력적 필터링을 개선하기 위하여 많은 기술들이 개발되고 실용화되었으나 아이템의 연관 관계를 정확하게 반영하지는 못한다. 본 논문에서는 협력적 필터링의 문제점을 보완하기 위하여 단어 빈도와 ${\alpha}$-cut에 의한 연관 웹문서 분류를 이용한 추천 시스템을 제안한다. 제안된 방법은 형태소 분석을 통한 웹문서에서 단어를 추출하고 빈도 가중치를 계산한다. 추출된 단어를 Apriori 알고리즘을 이용해서 연관 규칙을 생성하고 신뢰도에 단어 빈도 가중치를 적용한다. 그리고 연관 규칙 하이퍼그래프 분할을 이용하여 연관 단어간의 유사도를 계산한다. 마지막으로 유사 클래스를 기반으로 연관 웹문서를 ${\alpha}$-cut을 이용하여 분류하고 개선된 코사인 유사도를 이용하여 유사도를 계산한다. 실험 결과 제안한 방법이 기존의 방법들보다 우수함을 확인하였다.

연관성 규칙에서 활용 가능한 대칭적 기여 순수 신뢰도의 개발 (The development of symmetrically and attributably pure confidence in association rule mining)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권3호
    • /
    • pp.601-609
    • /
    • 2014
  • 빅 데이터 분석을 위한 데이터마이닝 기법 중의 하나인 연관성 규칙은 지지도, 신뢰도, 향상도 등의 여러 가지 연관성 평가기준을 기반으로 하여 항목집합들 간의 관련성을 찾아내는 데 활용되고 있다. 기본적인 연관성 평가기준들 중에서 가장 많이 활용되고 있는 신뢰도는 연관성의 방향 (음 또는 양)을 알 수가 없다는 단점을 가지고 있다. 이를 보완하기 위한 측도로 순수 신뢰도 기여 순수 신뢰도가 제안되었으나, 이는 전항과 후항이 바뀌면 그 값이 달라지는 문제점이 있다. 본 논문에서는 기존의 신뢰도와 순수 신뢰도, 그리고 기여 순수 신뢰도의 단점을 보완한 연관성 평가 기준으로 네 가지의 대칭적 기여 순수 신뢰도를 제안하였다. 또한 신뢰도와 기여 순수 신뢰도, 그리고 네 가지의 대칭적 기여 순수 신뢰도를 예제를 통하여 비교 분석하였다. 그 결과, 대칭적 기여 순수 신뢰도는 그 부호에 의해 연관성 규칙의 방향을 파악할 수 있는 동시에 전항과 후항이 바뀌어도 그 값이 변하지 않으므로 연관성 규칙을 생성하는 데 매우 유익한 평가 기준이라는 사실을 확인할 수 있었다. 이들 네 가지 대칭적 기여 순수 신뢰도 중에서는 두 종류의 기여 순수 신뢰도의 분자의 합과 분모의 합의 비로 나타나는 측도가 가장 바람직한 것으로 예제를 통하여 확인하였다.

학술DB에서 SNA(Social Network Analysis) 기법을 이용한 연관검색어 제공방안 연구 (A Study on Providing Relative Keyword using The Social Network Analysis Technique in Academic Database)

  • 김경용;서정연;선충녕
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-82
    • /
    • 2011
  • 본 논문은 다양한 주제 분야의 연구 성과물을 제공하는 학술DB에서 주제어(Keyword) 정보를 바탕으로 SNA(Social Network Analysis)기법을 적용해 검색어와 연관도가 높은 연관검색어를 제공하는 것을 그 목적으로 한다. 이를 위해 주제어들 간의 가중치(Weight)를 계산한 뒤 Ego Network 분석을 통해 검색어와 연관된 연관주제어를 추출하고 이를 기존 학술DB에서 제공한 연관검색어와 비교 정리하였다. 그리고 정리된 결과를 연관규칙 마이닝기법, 유사계수를 적용해 연관도측면에서 비교 평가하였다.

  • PDF

연관상품 추천을 위한 회귀분석모형 기반 연관 규칙 척도 결합기법 (A Regression-Model-based Method for Combining Interestingness Measures of Association Rule Mining)

  • 이동원
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.127-141
    • /
    • 2017
  • 인터넷과 모바일 관련 기술의 발전과 기기의 보급은 물리적 공간의 제약을 극복하게 하고, 다양한 상품과 서비스를 소비자에게 제공함으로써, 소비자에게 선택의 폭을 넓히는 기회를 제공하는 반면, 많은 시간과 노력을 기울이고도 소비자가 자신의 기호에 적합한 품목을 선택하기 힘들어지는 부작용을 낳았다. 이에 따라, 기업은 추천 시스템을 활용하여 소비자가 원하는 품목을 더 쉽게 찾는 수단을 제공하고 있다. 상품 간의 연관성을 통계적으로 분석하는 연관 규칙 마이닝 기법은 직관적인 형태의 척도를 규칙과 함께 제공함으로써, 이로부터 도출된 규칙에 포함된 품목 간의 관계를 이해하고, 이를 추천에 적용하기 쉽다는 강점을 갖는다. 그러나, 서로 다른 규칙의 척도가 일관되게 어느 한 쪽의 규칙이 더 우위에 있음을 알려주지 못한다면, 수많은 품목 중 추천에 적합한 품목을 적절히 선별해내기 힘든 상황이 발생한다. 본 연구에서는 추천 상품의 순위를 결정할 수 있도록 연관 규칙 마이닝 기법에 회귀분석모형을 보완적으로 적용하는 방안을 제시하고자 수행되었다. 연관 규칙 마이닝에서 보편적으로 사용되고 있는 지지도, 신뢰도, 향상도를 활용하여 모형을 구현함으로써, 직관적으로 이해하기 쉬울 뿐만 아니라, 실무에서도 활용하기 쉬운 방안을 제시하고자 하였다. 국내 최대규모의 온라인 쇼핑몰의 주문 데이터를 활용한 실험을 통해, 제안된 모형으로부터 얻어진 추천 점수를 기반으로 추천상품을 결정하고, 이를 추천에 적용함으로써 추천 적중률을 향상시킬 수 있음을 보였다. 특히, 최근 모바일 상거래가 빠르게 확산됨에 따라, 제한된 화면에 한정된 수의 추천 품목을 제시해야 하는 상황에서 적합한 추천 기법임을 확인할 수 있었다.

선물시장에서 거래확률 조정을 통한 자산운용 투자전략 모델에 관한 연구 (A study on asset management investment strategy model by trade probability control on futures market)

  • 이석준;김지현;정석재
    • 경영과정보연구
    • /
    • 제31권3호
    • /
    • pp.21-46
    • /
    • 2012
  • 최근 국내 기관 투자자들을 중심으로 전통적 투자대상으로부터의 수익이 하락추세에 있어 기관 투자자들이 적극적 자산운용을 기피할 경우, 장기적으로 안정적 수익보장을 유지하기 어렵다는 우려가 제기되었다. 이에 보유자산 구성을 조정한 수익성 개선전략의 요구가 증대되고 있으며, 일부 기관 투자자들은 헤지펀드를 기존 포트폴리오에 편입시킴으로써 운용수익률을 제고하려는 움직임을 보이고 있다. 본 연구에서는 시스템트레이딩을 이용하여 선물시장에서 거래확률 조정을 통한 헤지펀드 투자전략을 제시하고자 한다. 선물시장에서 사용되는 다양한 기술적 지표를 이용하여 연관성 규칙(association rule)을 생성하고 이를 거래규칙(trading rule)으로 전환하여 투자전략으로 활용한다. 한편 연관성 규칙은 기술적 지표의 개수와 개별 지표들의 구간값의 조합으로 생성되며, 조합에 따라 거래확률을 조정함으로써 위험관리가 가능한 투자전략을 수립하는데 사용된다. 제시된 전략의 우수성을 입증하기 위해 KOSPI 200 연결선물데이터를 이용하여 수익성 분석을 수행하였으며, 분석결과 제시된 투자전략이 투자위험관리에 효과적임을 보였다.

  • PDF

최적 연관 속성 규칙을 이용한 비명시적 단백질 상호작용의 예측 (Prediction of Implicit Protein - Protein Interaction Using Optimal Associative Feature Rule)

  • 엄재홍;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권4호
    • /
    • pp.365-377
    • /
    • 2006
  • 단백질들은 서로 다른 단백질들과 상호작용 하거나 복합물을 형성함으로써 생물학적으로 중요한 기능을 한다고 알려져 있다. 때문에 대부분의 세포작용에 있어 중요한 역할을 하는 단백질 상호작용의 분석 및 예측에 대한 연구는 여러 연구그룹으로부터 풍부한 데이타가 산출되고 있는 현(現) 게놈시대에서 또 하나의 중요한 이슈가 되고 있다. 본 논문에서는 효모(Saccharomyces cerevisiae)에 대해 공개되어있는 단백질 상호작용 데이타들에서 속성들 간의 연관을 통해 유추 가능한 잠재적 단백질 상호작용들을 예측하기 위한 연관속성 마이닝 방법을 제시한다. 단백질의 속성들 중 연속값을 가지는 속성값들은 최대상호 의존성에 기반을 두어 이산화 하였으며, 정보이론기반 속성선택 알고리즘을 사용하여 단백질들 간의 상호작용 예측을 위해 고려되는 단백질의 속성(attribute) 수 증가에 따른 속성차원문제를 극복하도록 하였다. 속성들 간의 연관성 발견은 데이타마이닝 분야에서 사용되는 연관규칙 발견(association rule discovery) 방법을 사용하였다 논문에서 제안한 방법은 발견된 연관규칙을 통한 단백질 상호작용 예측문제에 있어 최대 약 96.5%의 예측 정확도를 보였으며 속성필터링을 통하여 속성필터링을 하지 않는 기존의 방법에 비해 최대 약 29.4% 연관규칙 발견속도 향상을 보였다.

구조화된 연관맵을 이용한 연구개발 전략 수립 (A R&D strategies for development using structured association map)

  • 송원호;이준석;박상성
    • 한국지능시스템학회논문지
    • /
    • 제26권3호
    • /
    • pp.190-195
    • /
    • 2016
  • 급변하는 글로벌 시장 환경에서 기술은 계속해서 급속히 발전하고 있다. 이러한 급변하고 있는 환경을 반영한 연구개발은 기업에 있어서 필수가 되었다. 즉, 기업의 경쟁력 향상을 위해서는 자사가 보유한 기술에 대한 체계적인 분석이 필요하다. 최근에는 객관적이며 정량화된 기술분류를 위하여 특허문서의 IPC 코드를 이용하여 기술분류를 수행하고 있다. 국제특허분류인 IPC 코드는 국제적으로 규격화된 기술분류 코드이기 때문에, 이를 활용하면 객관적이고 정량화된 기술분석 수행이 가능하다. 본 논문에서는 C사의(社) 특허에 대하여 전수조사를 실시하고, IPC 코드기반 분석 Matrix를 구축한 후 해당특허들을 신뢰도 기반의 연관규칙 마이닝을 실시하며 구조화된 연관맵을 생성한다. 연관맵을 이용하면 해당회사의 특허 현황 파악에 유용하게 활용된다. 또한, 구조화된 연관맵을 이용하면 상호 연관있는 기술에 대하여 군집화를 가능하게 하기 때문에, 본 논문에서 제시한 C사(社)의 기술을 파악할 수 있으며 이를 기반으로 기술 흐름과 향후 기술 전략 수립을 가능하게 한다.

국민건강영양조사 자료를 활용한 라이프스타일 위험요인과 다중이환간의 연관관계분석 (Assoication Rule Analysis between lifestyle risk behaviors and multimorbidity: Findings from KHANES)

  • 이현주;명성민
    • 한국학교ㆍ지역보건교육학회지
    • /
    • 제25권1호
    • /
    • pp.29-41
    • /
    • 2024
  • 목적: 본 논문에서는 대한민국 성인의 라이프스타일 위험요인과 복합만성질환간의 연관성 규칙을 탐색하여 보건교육프로그램에 필요한 방향성과 기초정보를 제공하는데 목적을 둔다. 방법: 제8기 국민건강영양조사 중 2019년부터 2020년까지 만 19세 이상 성인 7,609명을 대상으로 하였으며, 6개의 라이프스타일 위험요인과 11가지 이환질환에 대하여 R과 R 스튜디오를 이용하여 연관규칙마이닝을 수행하였다. 결과: 본 연구 결과를 통하여 연관규칙마이닝과 같은 데이터마이닝 기법을 통해 생활 습관 위험 요인의 중요성과 여러 만성 질환의 역할을 보여줬다는 점에서 의미가 있다. 결론: 상기 결과를 통하여 신체 활동 부족을 해결하기 위한 운동 프로그램, 부적절한 체중을 해결하기 위한 식이 중재, 부적절한 수면을 해결하기 위한 정신건강 교육프로그램과 같은 선택적이고 집중적인 건강교육 프로그램에 대한 개발의 필요성이 요구된다.

Java 코드 분석기법을 이용한 UML 클래스 다이어그램 생성 방법 (Building a UML class diagram using Java code analysis techniques)

  • 한무희;김경수;김현수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.133-135
    • /
    • 2003
  • 본 연구에서는 자바 코드로부터 UML 클래스 다이어그램을 추출하는 역공학방법을 제시하였다. 파서를 이용하여 자바 코드로부터 AST를 생성하고 이를 순회하면서 클래스다이어그램 생성에 필요한 정보를 추출하였다. 이를 위해 구조정보와 관계정보를 정의하였는데, 구조정보에서는 클래스 몸체를 구성하는 정보를 표현하였다. 관계정보에서는 클래스들 간의 연관관계를 결정하기 위해 필요한 정보를 표현하였으며, 얻어진 관계정보를 통해 연관관계를 유추하는 방법을 제시하였다. 특히 클래스들간의 연관관계를 추출하기 위한 규칙들을 정의하고, 이를 통해 얻어진 관계정보를 이용하여 연관관계를 유출하는 과정을 설명하였다.

  • PDF

연관 마이닝 기법을 이용한 침입 탐지 생성 알고리즘 연구 (A Study on the Generation Algorithm of Intrusion Detection using Association Mining Technique)

  • 양동수;전태건;김창수;정동호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 추계학술발표논문집
    • /
    • pp.502-505
    • /
    • 2000
  • 본 논문에서는 상태 전이 분석과 연관 마이닝 기법을 이용하여 새로운 침입 탐지 알고리즘인 침입 시나리오 자동 생성 알고리즘(Automatic Generation Algorithm of the Penetration Scenarios : AGAPS)을 개발하고자 한다. 침입을 탐지하기 위하여, 먼저 상태 전이 기법을 이용하여 네트워크를 통해 전달된 명령어들에 대한 상태 테이블을 생성한다. 그리고 연관 마이닝 기법을 이용하여 명령어들의 연관 규칙을발견한 후, 이러한 명령어들이 불법 침입과 관련된 명령어들인지를 판별함으로서 불법 침입 여부를 판단한다.

  • PDF