• 제목/요약/키워드: 연관규칙 마이닝

검색결과 287건 처리시간 0.035초

데이터 스트림 마이닝 기법을 적용한 개인/커뮤니티 맞춤형 Digital TV 시스템 (Customized Digital TV System for Individuals/Communities based on Data Stream Mining)

  • 신세정;이원석
    • 정보처리학회논문지D
    • /
    • 제17D권6호
    • /
    • pp.453-462
    • /
    • 2010
  • 국내외 TV방송의 디지털 전환 프로젝트가 본격적으로 진행되고 있다. 디지털 방송 서비스는 다매체, 다채널을 통한 방송 프로그램의 증가와 양방향 TV방송 서비스로 인해 사용자에게 다양한 방송 프로그램의 선택과 개인/커뮤니티별 맞춤형 시청 기회를 제공함으로써 새로운 방송서비스 환경을 필요로 한다. 본 논문에서는 TV-Anytime 영상 메타데이터에 대한 데이터 스트림 마이닝 기법을 이용하여 사용자의 시청 상황을 포함한 시청 패턴을 분석함으로써 개인/커뮤니티 시청 패턴 프로파일 및 시청 선호도 연관규칙 생성 기법을 적용한 개인/커뮤니티 맞춤형 Digital TV 시스템 을 제안한다. 또한, 임베디드 시스템 기반의 사용자 인터페이스를 구현하여 개인/커뮤니티 사용자들에게 적절한 추천 프로그램을 제공하고, 시청 프로그램 정보에 따른 시청 상황을 자동으로 제어하는 기능을 포함한다. 또한, 스마트폰 기반의 채널 추천 시스템을 구현하여 프로파일의 활용도를 증가시켰으며, 실험을 통하여 본 논문에서 제안하는 방법의 효율성을 검증한다.

다차원 데이터 큐브 모델을 이용한 구제역의 위기 대응 방안 분석 (Crisis Management Analysis of Foot-and-Mouth Disease Using Multi-dimensional Data Cube)

  • 노병준;이종욱;박대희;정용화
    • 한국콘텐츠학회논문지
    • /
    • 제17권5호
    • /
    • pp.565-573
    • /
    • 2017
  • 재난 재해 발생 시, 정부의 위기 대응방식에 대한 사후 평가는 향후 유사한 위기 상황이 발생할 경우를 대비하고 국가의 장기적인 위기관리의 초석이 되는 필수적인 단계이다. 본 논문에서는 국내에서 발생한 구제역에 관하여 정부에서 어떠한 대응 전략을 펼쳤는지를 언론에 보도된 기사 내용을 통해 분석한 연구로써, 먼저 온라인 뉴스 기사로부터 구제역에 관한 키워드들을 추출하여 데이터 큐브를 구성한 후, OLAP 연산과 연관규칙 분석을 수행함으로써 시간 축에 따른 정부의 위기상황 대응행동 및 그에 따른 사회적 파급 효과들을 분석한다. 구제역이 가장 심각했던 2010년 11월부터 2011년 12월까지 국내에서 발생한 구제역에 관한 정부의 위기 상황 대응 방법을 사례분석을 통해 분석하였다.

CPC 코드 기반 사물인터넷(IoT) 특허의 기술 연관성 규칙 분석 (Analysis of Technology Association Rules Between CPC Codes of the 'Internet of Things(IoT)' Patent)

  • 심재륜
    • 한국정보전자통신기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.493-498
    • /
    • 2019
  • 본 연구는 4차 산업혁명 ICT 기반기술의 핵심인 사물인터넷 특허의 CPC 코드 기반 기술 연관성 규칙 분석에 관한 것이다. 데이터 마이닝을 위한 오픈 소스인 R을 이용하여 CPC 코드간 기술 연관성 규칙을 도출하였다. 이를 위해 2019년 7월까지 특허청에 출원된 사물인터넷(Internet of Things) 관련 특허 605건 중 복합 CPC 코드를 가지는 369건을 대상으로 서브클래스(Subclass) 수준까지 분석하였다. 기술 연관성 규칙 분석 결과 지지도가 높은 CPC 코드는 [H04W ${\rightarrow}$ H04L](18.2%), [H04L ${\rightarrow}$ H04W](18.2%), [G06Q ${\rightarrow}$ H04L](17.3%), [H04L ${\rightarrow}$ G06Q](17.3%), [H04W ${\rightarrow}$ G06Q](9.8%), [G06Q ${\rightarrow}$ H04W](9.8%), [G06F ${\rightarrow}$ H04L](7.9%), [H04L ${\rightarrow}$ G06F](7.9%), [G06F ${\rightarrow}$ G06Q](6.2%), [G06Q ${\rightarrow}$ G06F](6.2%), [G06F ${\rightarrow}$ G06Q](6.2%) 순이고, CPC 코드간 상호 연결망을 분석한 결과 기술 연관성 관련 핵심 CPC 코드는 G06Q와 H04L이다. 본 연구 결과를 활용하면 앞으로의 특허 경향을 예상해 볼 수 있다.

웹 캐스트와 텍스트 마이닝을 이용한 축구 경기의 심층 분석 (In-depth Analysis of Soccer Game via Webcast and Text Mining)

  • 정호석;이종욱;유재학;이한성;박대희
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.59-68
    • /
    • 2011
  • 축구 경기를 분석하고 이를 팀 전략 수립에 활용하는 축구 분석관의 역할이 강조됨에 따라, 방송용 축구 경기에서 주요 이벤트의 탐지와 같은 절차적 기능 이상의 고수준의 해석 방법들이 요구되고 있다. 본 논문에서는 인터넷 기반의 텍스트 방송인 축구 웹 캐스트에서 실시간으로 제공하는 텍스트 정보를 기반으로 텍스트 마이닝을 이용한 축구 경기의 전략 수립이 가능한 고수준의 해석 기법을 제안한다. 제안하는 해석기법은 축구 웹 캐스트의 텍스트 정보와 도메인 지식을 기반으로 축구 경기의 다양한 속성, 동작 그리고 이벤트 등 메타데이터를 추출하고, 인덱싱하고, 텍스트 마이닝의 다양한 해석 기법인 연관 규칙 마이닝, 성장도 분석, 그리고 패스파인더 네트워크 분석 기법 등을 사용함으로써 유용한 지식을 추출한다. 실제 2010년 월드컵의 스페인 팀 경기들을 중계한 웹 캐스트의 텍스트 정보를 대상으로 제안된 기법의 타당성을 실험적으로 검증한다.

스마트 홈에서 마이닝을 이용한 행동 순차 패턴 발견 (Discovery of Behavior Sequence Pattern using Mining in Smart Home)

  • 정경용;김종훈;강운구;임기욱;이정현
    • 한국콘텐츠학회논문지
    • /
    • 제8권9호
    • /
    • pp.19-26
    • /
    • 2008
  • 유비쿼터스 컴퓨팅의 발전에 따라 일대일 개인화 서비스를 위한 인프라스트럭처가 구축되면서, 사용자의 상황과 환경, 즉 상황인식 기반 서비스의 중요성이 부각되고 있다. 스마트 홈은 현실공간과 가상공간을 연결하여 가상공간에서 현실의 상황을 정보화하고 이를 활용하여 사용자 중심의 지능화된 서비스를 제공하는 기술이다. 본 논문에서는 스마트 홈에서 마이닝을 이용한 행동 순차 패턴 발견을 제안하였다. 마이닝을 이용하여 위치 트랜잭션에서 발생하는 위치간의 연관 규칙에 시간의 변이를 추가하여 행동 순차 패턴을 발견하였다. 인식된 시간 순서에 따라 사용자가 이동한 경로의 파악 및 행동 방향을 예측하고 그에 따른 서비스가 가능하다. 마이닝을 이용한 행동 순차 패턴의 성능 평가를 하기 위해 대응표본 t검정을 실시하여 유용성을 검증하였다. 평가 결과, 서비스에 대한 만족도의 차이가 통계적으로 의미가 있음을 증명하였고 높은 만족도를 보임을 확인하였다. 따라서 본 연구 결과를 활용하면 시장성 증대와 고부가 가치를 창출할 수 있을 것으로 기대하며 다양한 응용 분야에 활용이 가능하다.

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.

도로 위험 탐지를 위한 데이터 편향성 최적화 기반 연관 추론 모델 (Data Bias Optimization based Association Reasoning Model for Road Risk Detection)

  • 류성은;김현진;구병국;권혜정;박찬홍;정경용
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.1-6
    • /
    • 2020
  • 본 연구에서는 도로 위험 탐지를 위한 데이터 편향성 최적화 기반 연관 추론 모델을 제안한다. 이는 사용자의 개인적 특성과 주변 환경 데이터를 수집하고 교통사고 방지 서비스를 제공하기 위한 연관분석 기반의 마이닝 모델이다. 이는 다양한 상황 변수들로 구성된 트랜잭션 데이터를 생성한다. 생성된 정보를 바탕으로 연관 패턴 분석을 통해 각 트랜잭션 내 변수들의 유의미한 연관관계를 도출한다. 분류된 범주형 데이터의 편향성을 고려하여 최적화된 지지도 및 신뢰도 값으로 가지치기를 진행한다. 추출된 상위 연관규칙을 바탕으로 사용자에게 개인 특성과 주행 도로 상황에 대한 위험 탐지모델을 제공한다. 이는 데이터 편향성 문제를 극복하고 데이터간 연관성을 고려하여 잠재적인 도로 사고를 예방하는 교통 서비스가 가능하다. 성능 평가는 제안하는 방법이 정확도에서 0.778, Kappa 계수에서 0.743로 우수하게 평가된다.

사용자 질의패턴 기반 에이전트에 의한 맞춤형 질의추천 (Customized Query Recommendation by Agent Based on User's Query Pattern)

  • 임요한;박건우;이상훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.200-204
    • /
    • 2008
  • 검색엔진을 사용해 질의를 입력 후 사용자가 원하는 정보를 얻을 때까지의 검색 결과정보의 탐색 범위에 대해 설문한 연구 보고서에 검색 결과정보의 첫 페이지만 보는 사용자가 설문인원의 41%를 차지했고, 상위 3페이지만 사용하는 사용자는 88%에 달한다고 하였다. 따라서 검색결과의 상위순위는 사용자의 정보 존재여부를 판단하는 중요한 척도가 된다. 또한 인터넷의 방대한 정보로 인해 정보 홍수에 빠진 사람들은 정보에 대한 까다로운 요구를 하고 있다. 이를 테면 개인화 또는 맞춤화된 정보를 제공 받기를 원하고 있다. 정보검색시 대다수의 사용자들은 질의의 길이를 2단어 이하의 키워드를 사용하여 질의가 특정한 토픽을 지향하도록 하고 있다. 본 논문에서는 데이터 마이닝의 연관규칙을 적용 사용자 프로파일 DB내 질의에 대한 사용자 질의패턴을 분석하여 '분석 Agent' 통한 연관 질의 리스트를 생성하고 '추천 Agent'는 사용자들의 취향변화 즉 시간에 따라 변하는 관심영역 또는 사용자 질의 변화에 대해서 날짜별 가중치를 부여하여 사용자와 상호교류를 통해 사용자에게 맞춤형 질의를 추천하는 방안을 제시하고자 한다.

  • PDF

문단 분석을 통한 문서 내의 감정 예측 (Emotion Prediction of Document using Paragraph Analysis)

  • 김진수
    • 디지털융복합연구
    • /
    • 제12권12호
    • /
    • pp.249-255
    • /
    • 2014
  • 최근 트위터, 페이스북 등과 같은 소셜 네트워크 서비스(Social Network Service, SNS)의 확산과 더불어 정보의 생성 및 공유가 활발히 이루어지고 있다. 이러한 SNS 매체들을 통해 생산하는 많은 데이터를 활용하기 위해 축적된 데이터로부터 의미 있는 정보를 추출해 내는 기술의 필요성이 대두되고 있으며, 데이터 마이닝 기법을 이용하여 의미있는 지식을 찾아낸다. 특히, 다양한 형태의 방대한 자료들로부터 표출되는 의견, 정책, 성향, 감정 등 대중의 집단지성에 나타난 일반적인 감정분석이 활용되고 있다. 본 논문에서는 대중들이 SNS를 통해 작성한 사용자들의 짧은 문장에 함축된 단어와 단어들 간의 연관성을 이용하여 문장 내 감정 상태를 예측하고 사용자의 감정에 따른 적절한 답변이나 추출한 감정과 유사한 트윗글이나 영화 등을 추천하는데 사용될 수 있는 방법을 제안한다.

연관규칙을 이용한 의료데이터 마이닝 (Mining Association Rules From Medical Records)

  • 임준호;조태원;강재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.193-196
    • /
    • 2010
  • 정보화 시대를 거치면서 모든 산업분야에서 대량의 데이터가 생성되고 관리되고 있다. 최근에는 비즈니스 환경의 변화로 인하여 의사결정을 지원할 수 있는 고급 정보에 대한 필요성이 대두되었으며 IT 기술의 발전과 더불어 데이터마이닝에 대한 많은 연구가 활발히 이루어졌다. 데이터마이닝은 금융, 정부, 제조, 유통 등 다양한 분야에서 활용되고 있다. 한편 의료데이터는 다른 산업분야의 데이터와 구별되는 특징이 있는데, 데이터의 이질성과 복잡성, 부정확성과 오류가능성, 불완전성과 윤리 및 법적인 문제, 개인정보보호, 특징 선택의 제한, 모델의 투명성과 설명력에 대한 높은 요구도 등이 그것이다. 이와 같은 이유로 의료데이터에 대한 접근은 제한적일 수 밖에 없다. 그럼에도 병원 전산화를 통해 발생하는 의료데이터의 양은 기하급수적으로 증가하고 있으며, 임상정보를 포함하는 의료데이터는 데이터 자체로도 가치가 매우 크다. 이에 본 논문은 국내 제 3차 의료기관의 2년간 내원환자에 대한 진단데이터를 사용하여 데이터마이닝의 연관법칙을 이용, 상병간의 관계를 연구하고자 하였다. 이를 통해 잠재고객에게는 객관화된 의료지표를 제공하고, 의료기관은 예측 가능한 정보를 종합의료시스템에 활용하여 고객만족도를 높이는 효과를 볼 수 있을 것으로 사료된다.