• 제목/요약/키워드: 고객 데이터베이스

검색결과 276건 처리시간 0.028초

빈발 패턴 네트워크에서 아이템 클러스터링을 통한 연관규칙 발견 (Discovering Association Rules using Item Clustering on Frequent Pattern Network)

  • 오경진;정진국;하인애;조근식
    • 지능정보연구
    • /
    • 제14권1호
    • /
    • pp.1-17
    • /
    • 2008
  • 데이터 마이닝은 대용량의 데이터에 숨겨진 의미있고 유용한 패턴과 상관관계를 추출하여 의사결정에 활용하는 작업이다. 그 중에서도 고객 트랜잭션의 데이터베이스에서 아이템(item) 사이에 존재하는 연관규칙을 찾는 것은 중요한 일이 되었다. Apriori 알고리즘 이후 연관규칙을 찾기 위해 대용량의 데이터베이스로부터 압축된 의미있는 정보를 저장하기 위한 데이터 구조와 알고리즘들이 많이 제안되어 왔다. 연관규칙을 발견하기 위한 기존의 연구들은 모든 규칙을 찾아내지만, 사람이 분석하기에 너무 많은 규칙이 생성되기 때문에 규칙을 분석하기 위한 일 또한 많은 과정을 거쳐야 한다. 본 논문에서는 빈발 패턴 네트워크(Frequent Pattern Network)라 부르는 자료 구조를 제안하고 이를 활용하였다. 네트워크는 정점과 간선으로 구성되며 정점은 아이템을 표현하고, 간선은 두 아이템 집합을 표현한다. 아이템의 빈도수를 이용하여 빈발 패턴 네트워크를 구성하고, 아이템 사이의 유사도를 측정한다. 그리고 클러스터 내의 아이템과는 유사도가 높고, 다른 클러스터의 아이템과는 유사도가 낮도록 클러스터를 생성한다. 클러스터를 이용해 연관규칙을 생성하고 실험을 통해 Apriori와 FP Growth 알고리즘과의 성능을 비교를 하였다. 그 결과 빈발 패턴 네트워크에서 신뢰도 유사도를 이용하는 것이 클러스터의 정확성을 높여줌을 볼 수 있었다. 그리고 전통적인 방법과 비교를 통해 빈발 패턴 네트워크를 이용하는 것이 최소지지도에 유연성을 가짐을 알 수 있었다.

  • PDF

지하수의 플랫폼 동시성과 Digital Twin의 개념과 적용 (Concept and Application of Groundwater's Platform Concurrency and Digital Twin)

  • 최두형;김병우;권이재;김화영;기철서
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.13-13
    • /
    • 2023
  • 디지털 기술은 오늘날 플랫폼과 디지털 트윈의 기술도입을 통해 현실 세계를 네트워크와 가상세계와의 연결이 통합되어진 가상 현실 세계의 입문 도약이다. 현실에서 가상현실의 사이의 디지털 전환(digital transformation)에는 디지털 기술과 솔루션을 비즈니스의 모든 영역에 통합하는 것이 포함된다. 이러한 디지털 전환의 핵심은 데이터에 관한 것이며, 데이터를 활용하여 가치를 창출하고 고객경험과 비즈니스 영역을 극대화하는 방식을 제공한다. 최적의 데이터를 제공하기 위한 플랫폼과 가상 현실세계 구현을 위한 디지털 트윈의 상호연계 관한 기본 개념은 데이터 수집, 데이터 분석, 데이터 시각화 및 데이터 보고와 같은 데이터 비즈니스이다. 현장 데이터는 디지털 양식을 통해 수집, 기록, 저장된다. 현장 IoT 기반 데이터(사진 및 비디오 매체 등)는 지속적으로 수집되고 종종 다른 데이터베이스에 저장되지만 지리 공간적 위치에 연결되지 않는다. 모든 디지털 발전을 조화시키고 지하수 데이터에서 더 빠른 이해를 도출하기 위해서는 디지털 트윈이 시작되어야 한다. 단일 지하수플랫폼에서 현장 조건을 시각화하고 실시간 데이터를 스트리밍하며, 과거 3D 데이터와 상호작용하여지질 또는 지화학 데이터를 선택적 사용을 위해 지하수 플랫폼과 디지털 트윈이 연계되어야 한다. 데이터를 디지털 정보모델과 연결하면 디지털 트윈에 생명을 불어넣을 수 있지만 디지털 트윈의 가치를 극대화하려면 여전히 데이터 플랫폼 서비스와 전달 방식을 선택해야 한다. 지하수 플랫폼동시성을 갖는 디지털 트윈은 정적 및 동적 데이터를 저장하는 데이터베이스 또는 크라우드 서비스에서 데이터를 가져오는 API(애플리케이션 프로그래밍 인터레이스), 디지털 트윈을 위한 호스팅 공간, 디지털 대상을 구축하는 소프트웨어, 구성 요소 간 읽기/쓰기를 위한 스크립트, chatGPT 및 API를 활용할 수 있다. 이를 통해 수집된 데이터의 실시간 양방향 통신기술인 지하수 플랫폼 기술을 활용하여 디지털 트윈을 적용하고 완성할 수 있고, 이를 지하수 분야에도 그대로 적용할 수 있다. 지하수 분야의 디지털 트윈 기술의 근간은 지하수 모니터링을 위한 관측장치와 이를 활용한 지하수 플랫폼의 구축 및 양방향 자료전송을 통한 분석 및 예측기술이다. 특히 낙동강과 같이 유역면적이 넓고 유역 내 지자체가 많아 이해관계가 다양하며, 가뭄과 홍수/태풍 등 기후위기에 따른 극한 기상이변가 자주 발생하고, 또한 보 및 하굿둑 개방 등 정부정책 이행에 따른 민원이 다수 발생하는 지역의 경우 하천과 유역에 대한 지하수 플랫폼과 디지털 트윈의 동시성 기술적용 시 지하수 데이터에 대한 고려가 반드시 수반되어야 한다.

  • PDF

음의 연관성 규칙 생성을 위한 음의 기여 순수 신뢰도의 제안 (Negatively attributable and pure confidence for generation of negative association rules)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권5호
    • /
    • pp.939-948
    • /
    • 2012
  • 데이터 마이닝 기법들 중에서 가장 많이 활용되고 있는 연관성 규칙은 방대한 데이터베이스에서 항목간의 관계를 흥미도 측도에 의해 명확히 수치화함으로써 그들간의 관련성을 표시해주는 기법이다. 양의 연관성 규칙 마이닝이 임의의 한 항목이 발생하면 다른 항목도 발생한다는 규칙을 생성하기 위한 기법인 반면에, 음의 연관성 규칙은 어느 항목이 발생하면 다른 항목은 발생하지 않는다는 규칙을 찾아내는 기법이다. 음의 연관성 규칙은 양의 연관성 규칙의 활용과 마찬가지로 고객의 구매 경향 및 마케팅 정책을 제시할 수 있고 교차판매와 매장 진열 등과 같이 타겟 마케팅에 활용 가능하다. 양의 연관성 규칙에 음의 연관성 규칙을 추가하게 되면 어떤 제품을 판매하기 위해서는 그 제품만 마케팅 하는 것뿐만 아니라 더 나아가 그 제품이 아닌 어느 제품을 마케팅 하는것이 필요한지를 판단할 수 있다. 본 논문에서는 기존의 음의 신뢰도의 단점을 보완할 수 있는 음의 기여 순수 신뢰도를 제안한 후, 이에 대해 흥미도 측도가 가져야 할 조건들을 조사하였으며, 예제 데이터를 활용하여 음의 기여 순수 신뢰도의 유용성을 고찰하였다.

우리나라 미용 정보화에 대한 분석과 개선에 관한 연구 (A Study on Improvement and Analysis of Beauty Information in KOREA)

  • 박대우;강남순
    • 한국컴퓨터정보학회논문지
    • /
    • 제9권3호
    • /
    • pp.13-25
    • /
    • 2004
  • 본 논문에서는 2004년 7월 31일 우리나라의 미용정보화 실태에 대해 조사 분석한다. 미용의 3대 주체에 대한 웹 서비스 조사에서, 교육기관 363개 중 정규교육기관은 100%, 사설 직업교육기관은 15.5%, 재료상 767개 중 8.74 %, 미용실 77,546개 중 0.38% 이었다. 소프트웨어는 12개의 미용고객관리 프로그램업체와 3개의 헤어기술 프로그램이 있었다. 미용기술을 보유한 전임교수의 부족으로 미용기술 정보화 자료 및 부가가치의 창출은 낮았다. 따라서 미용장협회와 보건복지부가 미용정보화 협의체를 구성하여, 미용주체별로 홈페이지를 연결하고 미용기술 자료의 웹 데이터베이스를 만든다. 미용정보 시스템의 통합화 및 공유화는 우리나라 미용에 대해 시너지 효과를 나타낼 것이다.

  • PDF

역 연관규칙을 이용한 타겟 마케팅 (Target Marketing using Inverse Association Rule)

  • 황준현;김재련
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.195-209
    • /
    • 2003
  • 데이터마이닝의 목적은 알려지지 않은 유용한 정보를 얻어 경영에 활용하려는 것이다. 데이터마이닝의 한 기법인 연관규칙도 마찬가지의 목적을 가지고 있다. 하지만 연관규칙 기법으로 생성된 결과는 모두 같기 때문에 타겟 마케팅에 적용 시 그 마케팅 전략은 같을 수밖에 없다. 본 논문에서는 연관규칙을 이용하여 타겟 마케팅에 적용 시에 데이터마이닝의 목적에 부합하는 새로운 규칙을 제안한다. 새로운 규칙이란 연관규칙과 같이 고객이 구매한 항목에 대해 관심을 가져 구매 항목간의 규칙을 생성하는 것뿐만 아니라 구매하지 않은 항목에 대해서도 관심을 가짐으로써 구매하지 않은 항목간의 규칙을 생성하여 타겟 마케팅에 필요한 정보를 생성하는 것을 말한다. 이러한 정보를 이용하면 타겟 항목을 바로 마케팅 하는 전략뿐만 아니라 타겟 항목을 판매하기 위하여 다른 항목을 마케팅 하는 전략도 가능하게 된다. 그 이유는 새로운 규칙 에 의해 생성된 다른 항목의 마케팅이 타겟 항목의 판매를 촉진시키기 때문이다. 본 논문에서는 타겟 마케팅에 적용하기 위한 새로운 규칙과 전략을 설명하고 예제를 통하여 실제 데이터베이스에서 기존 전략 외에 새로운 전략을 생성시키는 과정을 설명한다.

  • PDF

SUSHI 기반 학술정보 이용통계 수집 모델 연구 (A Study on the Acquisition of Usage Statistics based on SUSHI Project)

  • 김선태;임석종
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.35-39
    • /
    • 2007
  • 최근 이용통계는 온라인 정보제공자로부터 폭넓게 제공받고 있다. 그러나 그 통계는 여전히 일치된 데이터 수집기로 이용할 수 없으며, 개별 정보제공자들의 관리 비용도 높은 상황이다. 표준화된 이용통계 수집을 주도하는 SUSHI는 정보제공사에서 제공한 이용통계를 도서관에 전자적으로 저장하기 위해 COUNTER 프로젝트를 실행할 자동화된 질의 응답 프로토콜을 개발하고 있다. SUSHI는 도서관들이 COUNTER 프로젝트의 통계를 활용함으로써 관리상의 업무부하 절감과 함께 의사결정을 지원할 것이다. 전자자원에 대한 이용통계의 기록과 교환에 있어서 출판사들이 COUNTER의 실무 규칙을 준수함으로써 최초로 저널과 데이터베이스들에 적용된다. 업체들은 COUNTER의 표준을 이용하여 엑셀이나 CSV 파일로 도서관 고객에게 제공할 수 있다. 그 결과 다양한 학술출판사와 정보서비스 기관에서 생성되고 있는 이용통계 데이터를 일관성, 신뢰성, 용이성을 확보할 수 있게 되는 것이다. 이에 본 연구에서는, 해외 전자저널 공동구매 컨소시엄인 KESLI의 전자저널 이용통계 수집 및 처리 절차를 분석하여, SUSHI에 기반한 전자저널 이용통계 수집 모델을 제안하고자 한다.

  • PDF

다중 테이블을 활용한 챗봇의 중복 응답 감소 연구 (A Study on Reducing Duplication Responses of Chatbot Based on Multiple Tables)

  • 권혁무;서영석
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권10호
    • /
    • pp.397-404
    • /
    • 2018
  • 현재 스마트폰에서는 사용자의 요구에 맞는 다양한 앱(App)들이 활용되고 있는데, 특히 많은 기업들에서 비즈니스 마케팅, 상업적인 홍보 등을 위해 모바일 메신저 형태의 대화형 시스템을 연구 개발하여 고객들에게 다양한 서비스를 제공하고 있다. 이러한 대화형 시스템을 우리는 '챗봇(Chatbot)'이라고 부른다. 이러한 챗봇의 경우 사용자와 대화시 중복 응답이 자주 발생할 수 있는데, 이러한 중복응답의 경우 특정 서비스에 대한 사용자의 흥미와 관심도를 떨어뜨린다. 따라서 본 논문에서는 이러한 챗봇 개발시 사용자로부터 입력된 발화(utterance)에 따른 챗봇의 중복 응답을 정의하고 이를 감소시킬 수 있는 기법을 제안한다. 이를 위해 데이터베이스 내 다중 테이블을 구축하고 테이블별로 사용자 입력에 따른 챗봇의 응답 조합을 구성하여 새로운 중복 회피 알고리즘을 통해 챗봇의 중복 응답을 감소시킬 수 있도록 한다. 이렇게 제안한 기법의 검증을 위해 자동화된 챗봇을 구현하였고, 본 연구에서 제시한 기법과 기존 응답 방식 연구를 분석해본 결과, 본 연구에서 제안한 기법을 통해 평균 70% 정도의 중복 감소 효과를 확인할 수 있었다.

텍스트마이닝을 활용한 연구동향 분석: 소셜네트워크서비스를 중심으로 (Research Trends Investigation Using Text Mining Techniques: Focusing on Social Network Services)

  • 윤혜진;김창식;곽기영
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권3호
    • /
    • pp.513-519
    • /
    • 2018
  • 본 연구의 목적은 소셜네트워크서비스 주제에 관한 연구동향을 조사하는 것이다. 연구의 목적을 달성하기 위해서 웹오브사이언스 데이터베이스에서 제목에 'Social Network Service(SNS)'를 포함하는 1994년부터 2016년까지 출판된 논문 초록 308편을 분석 하였다. 본 연구에서는 텍스트마이닝 기법 중에서 최근 많이 적용되는 토픽모델링기법을 활용하였다. 토픽모델링 분석결과 20개의 토픽(신뢰, 지지, 만족 모델, 조직 지배구조, 모바일 시스템, 인터넷 마케팅, 대학생 효과, 의견 확산, 고객, 정보보호, 건강관리, 웹 협업, 방법, 학습 효과, 지식, 개인 이론, 아동 지지, 알고리즘, 미디어 참여, 문맥 시스템)이 도출되었다. 또한 시계열회귀분석 결과 모든 토픽은 상승 추세로 나타났다.

인과적 연관성 규칙 평가 기준의 제안 (Proposition of causal association rule thresholds)

  • 박희창
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1189-1197
    • /
    • 2013
  • 연관성 규칙 마이닝은 지지도, 신뢰도, 향상도 등의 흥미도 측도를 기반으로 하여 대용량 데이터베이스를 구성하고 있는 항목들 간의 관련성을 찾아내는 기법이다. 이 기법은 기업의 의사결정 문제, 유통업에서의 교차판매, 고객관리 등 현업에서 많이 활용되고는 있으나, 이러한 기본적인 연관성 평가기준만으로는 두 항목 간의 인과관계를 설명할 수 없다. 본 논문에서는 이러한 문제를 해결하기 위해 인과적 연관성 규칙을 제안하는 동시에, 고려하는 평가 기준들이 흥미도 측도의 조건을 충족하는지의 여부를 점검하였다. 본 논문에서 제안한 인과적 향상도는 세 가지 조건 모두를 만족하는 것으로 입증되었다. 인과적 지지도와 인과적 신뢰도는 동시 발생 확률의 값에 따라 단조 증가하는 조건과 각 항목의 주변 확률의 값에 따라 단조 감소하는 조건은 만족하였다. 반면에 두 항목이 독립이면 연관성 평가기준의 값이 1이 되는 조건에 대해서는 기존의 지지도와 신뢰도와 같이 이 조건이 충족되지 않았다. 또한 예제를 통해 기존의 연관성 평가 기준과 인과적 연관성 평가 기준을 비교해 본 결과, 기존의 평가측도인 지지도와 신뢰도를 기준으로 연관성 규칙 생성 여부를 판단했을 때 탈락되는 규칙도 인과적 평가 기준인 인과적 지지도와 인과적 신뢰도를 이용하여 판단하게 되면 연관성 규칙으로 채택할 수 있다는 사실을 발견하였다.

데일리 렌즈 데이터를 사용한 데이터마이닝 기법 비교 (Comparison of data mining methods with daily lens data)

  • 석경하;이태우
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1341-1348
    • /
    • 2013
  • 데이터베이스 마케팅과 시장예측 등의 분야에서 분류문제를 해결하기 위해 다양한 데이터마이닝 기법들이 적용되고 있다. 본 연구에서는 데일리 렌즈 고객들의 거래 데이터를 기반으로 의사결정나무, 로지스틱 회귀모형과 같은 기존의 통계적 분류기법과 최근에 개발된 배깅, 부스팅, 라소, 랜덤 포리스트 그리고 지지벡터기계의 분류 성능을 비교하고자 한다. 비교 실험을 위해 데이터 정제, 탐색, 파생변수 생성, 그리고 변수 선택과정을 거쳤다. 실험결과 정분류율 측면에서는 지지벡터기계가 다른 모형보다 근소하게 높았지만 표준편차가 크게 나왔다. 정분류율과 표준편차의 관점에서는 랜덤 포리스트가 가장 좋은 결과를 보였다. 그러나 모형의 해석, 간명성 그리고 학습에 걸리는 시간을 고려하였을 때 라소모형이 적합하다는 결론을 내렸다.