• 제목/요약/키워드: 가중치 마이닝

검색결과 116건 처리시간 0.026초

텍스트 마이닝으로 OTT 인터랙티브 콘텐츠 다시보기 (Analyzing OTT Interactive Content Using Text Mining Method)

  • 이석창
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.859-865
    • /
    • 2023
  • OTT 시장의 과열로 서비스 사업자들이 콘텐츠 개발에 주력하는 상황에서 시청자들의 능동적인 참여를 독려하는 인터랙티브 콘텐츠가 주목받고 있다. 그에 따라 인터랙티브 콘텐츠에 관한 연구 역시 활발히 이루어지고 있다. 본 연구는 온라인상의 비정형 데이터를 중심으로 텍스트 마이닝을 통해 인터랙티브 콘텐츠에 관한 분석을 목적으로 한다. 가중치에 따른 키워드 특징 도출, OTT와 인터랙티브 콘텐츠의 관계, 그리고 인터랙티브 콘텐츠의 트렌드 변화를 객관적인 데이터에 근거하여 '워드클라우드', '관계도 분석', 그리고 '키워드 트렌드'라는 세부 기법을 활용하여 연구 결과 및 함의점을 도출하였다.

항목집합의 트랜잭션 유틸리티를 이용한 높은 유틸리티 항목집합 마이닝 (High Utility Itemset Mining Using Transaction Utility of Itemsets)

  • 이세린;박종수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권11호
    • /
    • pp.499-508
    • /
    • 2015
  • 높은 유틸리티 항목집합 마이닝은 트랜잭션 데이터베이스에서 사용자가 지정한 최솟값 이상의 유틸리티를 갖는 항목집합들을 항목의 수량과 가중치값을 동시에 고려하여 찾아내는 것이다. 최근에 연구된 유틸리티-리스트 기반의 높은 유틸리티 항목집합 마이닝 알고리즘은 많은 후보 항목집합들을 피하기 위해 제안되었으며 비용이 높은 조인 연산을 수행한다. 본 논문은 유틸리티-리스트 구조에 항목집합의 트랜잭션 유틸리티와 공통 유틸리티 속성을 추가한 새로운 알고리즘을 제안한다. 이 새로운 알고리즘은 조인 연산의 수를 줄이고 탐색 공간을 효과적으로 가지치기한다. 생성 데이터와 실 환경 데이터상의 실험 결과를 통해 제안된 알고리즘이 다른 최근 알고리즘들에 비해 실행 시간 면에서 아주 우수하고, 특히 데이터가 조밀하거나 항목집합의 길이가 긴 경우에 더 효율적이라는 것을 보여준다.

스마트 홈 환경에서 데이터 마이닝 기법을 이용한 지능형 서비스 추론 모델 (Intelligent Service Reasoning Model Using Data Mining In Smart Home Environments)

  • 강명석;김학배
    • 한국통신학회논문지
    • /
    • 제32권12B호
    • /
    • pp.767-778
    • /
    • 2007
  • 본 논문에서는 스마트 홈 환경에서 데이터 마이닝 기법을 이용하여 사용자에게 상황에 적합한 서비스를 추론하는 모델을 제안한다. 의사결정트리 알고리즘들 중에 하나인 C4.5 알고리즘을 기반으로 서비스 추론에 쓰이는 서비스 트리를 생성하고, 정량적 특성 규칙과 정량적 판별 규칙을 이용하는 정량적 가중치 산정 알고리즘을 통해 사용자에게 제공될 서비스를 추론한다. 또한 시뮬레이션을 통해 그 성능을 검증하였다.

연관마이닝에 의한 데이터베이스캐시 설계 (Design of Database Cache by Association Mining Method)

  • 사재학;남인길
    • 한국산업정보학회논문지
    • /
    • 제7권2호
    • /
    • pp.16-32
    • /
    • 2002
  • 효율적인 데이타마트 정보의 축척과 질의 정보 추출을 위한 연관 마이닝 방법을 적용하여 검색 속도를 빠르게 할 수 있도록 테이블을 생성하고 고객의 속성별 가중치와 선호기준을 입력받아 선호 점수를 계산하여 점수가 높은 과목을 우선적으로 검색할 수 있도록 기존 연관 알고리즘에서 사용한 단일 항목 입력 데이터 구조를 확장하여 다중 항목 연관 알고리즘(Multiple Item Association Mining : MIAM)을 이용하여 생성된 연관 검색 유형 테이블을 데이터베이스캐시화를 설계하였다. 동일한 알고리즘에서도 데이터베이스캐시 시스템을 적용한 시스템의 질의 처리 수행속도가 우수성을 이용하여 설계함으로써 효율적인 웹 서버 기능을 수행할 수 있음과 동시에 데이터베이스 캐싱의 주요 이점인 효율성 증대, 속도 향상, 비용절감의 효과를 얻을 수 있으므로 연구 설계하였다.

  • PDF

데이타마이닝 기법을 이용한 문서 자동 분류 모델 (An Automatic Text Classification Model using Association Rules)

  • 김영인;이진용;문현정;우용태
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.101-108
    • /
    • 2000
  • 기업에서 보유한 전문 지식 정보가 급속도로 증가함에 따라 대량의 문서에 저장된 지식 정보를 효과적으로 탐색하여 기업 경영에 활용하기 위한 지식경영시스템 도입이 확산되고 있다. 이러한 지식경영시스템에서 핵심적인 구성 요소는 전문 분야의 지식 정보를 체계적으로 분류하고 효율적으로 검색하기 위한 지식 탐사 기법이다. 본 논문에서는 데이타마이닝 기법을 이용하여 문서를 자동적으로 분류하기 위한 새로운 모델을 제안하였다. 연관 규칙 탐사 알고리즘을 이용하여 학습용 문서 집합으로부터 세부 분야를 대표하는 색인어 집합을 구성하였다. 세부 분야별 색인어 집합에 대하여 전체 문서에 대한 비중에 따라 가중치 배열을 구성하여 문서를 자동으로 분류하기 위한 기준으로 삼았다. 임의의 문서를 자동적으로 분류하는 실험을 통하여 제안된 방법의 효율성을 검정하였다.

  • PDF

데이타마이닝을 이용한 전문 검색엔진의 설계 및 구현 (A Design and Implementation of Expert Search Engine Using DataMining)

  • 황보윤;김병찬;김영지;문현정;우용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.43-46
    • /
    • 2001
  • 본 논문에서는 데이타마이닝 기법을 이용하여 지능형 전문 검색엔진을 설계하고 사용자 인터페이스를 구현하였다. 먼저, 컴퓨터 분야의 전문 용어에 대하여 연관 규칙 탐사 알고리즘을 이용하여 의미적으로 연관된 용어들끼리 클러스터로 구성하였다. 전문 용어별로 구성된 클러스터는 본 논문에서 제안한 지식베이스 테이블에 저장하여 의미적으로 연관된 용어를 포함하는 웹 문서를 검색하는 과정에서 이용하였다. 검색과정에서는 사용자가 제시한 키워드와 관련된 전문 용어들간의 연관정도를 가중치로 부여하여 연관 정도가 높은 웹 문서순으로 출력하였다. 제안된 방법을 통하여 사용자가 제시한 키워드와 의미적으로 연관된 웹 문서를 효과적으로 검색할 수 있었다.

  • PDF

텍스트 마이닝 기법을 활용한 ECDIS 사고보고서 분석 (Text Mining Analysis Technique on ECDIS Accident Report)

  • 이정석;이보경;조익순
    • 해양환경안전학회지
    • /
    • 제25권4호
    • /
    • pp.405-412
    • /
    • 2019
  • SOLAS에서는 국제 항해에 종사하는 총톤수 500톤 이상의 선박에 대하여 2018년 7월 1일 이후 도래하는 최초 검사까지 ECDIS를 설치해야 한다고 규정하고 있다. 새로운 주요 항해 장비로 ECDIS가 탑재되면서 ECDIS 사용에 관련한 다양한 사고가 발생하고 있다. MAIB, BSU, BEAmer, DMAIB, DSB에서 발행한 12가지의 사고보고서에는 항해사의 운용 미숙과 ECDS 시스템의 사고 원인으로 분석하였고, 사고 원인과 관련된 단어들을 정량적으로 분석하기 위해 R-프로그램을 사용하여 텍스트를 분석하였다. 도출 빈도에 따른 단어의 중요도를 나타내기 위해 텍스트 마이닝 기법인 단어 구름, 단어 연관성, 단어 가중치의 방법을 사용하였다. 단어 구름은 사용된 단어들의 빈도수를 구름 형태로 나타내는 방법으로써 N-gram 모델을 적용하였다. N-gram 모델 중 Uni-gram 분석 결과 ECDIS 단어, Bi-gram 분석 결과는 Safety Contour 단어의 사용 빈도가 가장 많았다. Bi-gram 분석을 기반으로 사고 원인 단어를 항해사와 ECDIS 시스템으로 구분하고, 연관된 단어들을 단어 연관성으로 나타내었다. 마지막으로 항해사와 ECDIS 시스템에 연관된 단어들을 단어 말뭉치로 구성한 후 단어 가중치를 적용하여 연도별 말뭉치 빈도 변화를 분석하였다. 추세선 그래프로 말뭉치 변화 경향을 분석한 결과, 항해사 말뭉치는 최근으로 올수록 감소하였으며 반대로 ECDIS 시스템 말뭉치는 점점 증가함을 나타내었다.

웹 도큐먼트 기반 연관 지식 추출 기법 : 생명정보분야에의 적용 (Web Document-based Associate Knowledge Extraction Method : Applying to Bioinformatics)

  • 문현정;김교정
    • 인터넷정보학회논문지
    • /
    • 제2권5호
    • /
    • pp.9-19
    • /
    • 2001
  • 본 논문에서는 웹 도큐먼트로부터 사용자의 관심과 선호도를 반영하는 지식을 자동으로 확장 탐색하고 추출하기 위한 연관지식 추출 기법을 제시한다. 사용자의 학습의도를 내포한 중심어와 연관된 정보를 예제 도큐먼트로부터 탐색 추출하기 위하여 연관 규칙 탐색 데이터 마이닝 기법을 웹 도큐먼트상의 연관 객체 추출에 적용한다. 또한 추출된 연관 정보들의 가중치 부여를 위하여 연관 태그 블록 기반 가중치 기법을 제시한다. 본 논문에서 제시된 연관 지식 추출 기법을 생명정보학 분야에 적용하여 의미적으로 연관성 있는 지식 추출 실험을 수행한 결과 매우 높은 정확성을 보이는 것으로 나타났다.

  • PDF

특성정보를 이용한 영상기반 인터넷 동영상 검색 시스템의 구현 (An Implementation of a Image-based Internet Video Search System using Feature Information)

  • 손정식;이원석
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 춘계학술발표논문집
    • /
    • pp.62-65
    • /
    • 2001
  • 본 논문에서는 인터넷 동영상 정보들을 보다 효율적이고 정확하게 검색할 수 있는 시스템을 구현하기 위해, 특성 정보에 기반한 영상기반 검색과 예제를 통한 질의를 사용한 시스템을 제안한다. 기존의 검색 시스템과는 달리 본 시스템에서는 사용자가 진의로 제출한 통영상의 특성정보를 추출하여 데이타마이닝하여 프로파일로 만들고, 인터넷에서 검색된 동영상의 특성정보와 비교하는 기법을 사용한다. 또한 진의 동영상 프로파일들을 통합하고, 특징 영역 세그먼트들의 중요도를 저장해 둠으로써 사용자의 질의를 하나의 척도로 처리하며, 작성된 프로파일과 비교 할 동영상의 특성정보를 영역별로 가중치를 주어 보정함으로 검색을 원하는 동영상의 특징을 강조한 진의가 가능하도록 한다. 끝으로 가중치를 주는 방법의 변화에 따른 시스템이 출력하는 검색 결과의 변화를 관찰하여 보정 방법의 성능을 평가한다.

  • PDF

거리 기반 가중치를 이용한 의사결정나무 방법 (A decision tree method using distance-based weighted)

  • 윤태복;이지형;주문원;최영미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.510-511
    • /
    • 2010
  • IT기술의 발달과 함께 다양한 분야에서 사용자에게 지능적이고 적응된 서비스를 제공하기 위한 연구가 활발하다. 특히, 데이터 마이닝은 이와 같은 서비스를 위한 방법으로 유용하게 사용되며, 수집된 데이터로부터 숨겨진 패턴을 찾는데 빈번하게 이용된다. 하지만, 수집된 데이터에 예상하지 못한 정보가 섞여 있다면 분석이 어렵고, 분석 결과 또한 신뢰하기 어려울 것이다. 기존에는 수집 데이터에서 의미 없는 데이터를 선별하여 제거하는데 주로 연구 되었으나, 유용한 데이터도 함께 제거될 수 있다는 문제를 가지고 있다. 본 논문은 수집 데이터를 의미 정도에 따라 가중치를 부여하고, 의사결정나무 생성에 반영하였고, 실험을 통하여 유효성을 확인하였다.