• Title/Summary/Keyword: 시간 마이닝

Search Result 401, Processing Time 0.024 seconds

Personalized Apparel Coordi System using Multiple Hybrid-Filtering on Semantic Web (시맨틱 웹에서 다중 혼합필터링을 이용한 개인화된 의상 코디 시스템)

  • Eun, Chae-Soo;Song, Chang-Woo;Lee, Seung-Geun;Lee, Jung-Hyun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.178-182
    • /
    • 2006
  • 인터넷과 웹이 일상생활의 일부가 되면서 온라인상에는 방대한 양의 정보가 쌓이게 되었다. 이러한 흐름 속에서 정보의 양은 급속도로 늘어나는 현상을 보이며, ‘개인화’ 를 통해 수많은 데이터들 사이에서 원하는 정보를 자동으로 찾아내는 기술의 중요성이 부각되고 있다. 이를 ‘추천시스템’ 이라 부르며, 내용기반 필터링과 협력적 필터링 등의 연구가 활발히 이루어지고 있다. 그러나 사용자에게 가장 중요한 영향을 미치는 또래의 선호도, 지역, 시대 등의 복합적인 환경을 반영하는데 아직까지 어려움을 지니고 있다. 따라서 본 논문에서는 기존의 필터링들을 조합하고 좀더 편리하게 정보를 공유하고 학습할 수 있는 시맨틱 웹에서 연관 이웃 마이닝 기법을 통해 개인화된 추천 시스템을 설계한다. 생활에서 흔히 접할 수 있는 의상을 다양한 사용자에게 특화되어 코디해주는 시스템을 웹에서 제공한 결과 불필요한 검색시간이 줄어들고 사용자의 피드백을 통해 점차 만족도가 향상됨을 알 수 있었다.

  • PDF

A fast feature selection technique for microarray data (마이크로어레이 데이터 분석을 위한 선형 특징 선별 기법)

  • Lee, Jae-Seong;Kim, Dae-Won
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.188-189
    • /
    • 2008
  • 마이크로어레이 데이터는 대량의 유전자들을 짧은 시간에 테스트 하여 얻은 대량의 데이터로 구성되어 있다. 그러나 이렇게 얻은 대량의 데이터에서 특징으로 표현되는 유전자의 수가 매우 많고, 각각의 유전자는 서로에 대해 독립적이지 않기 때문에 전통적인 데이터 마이닝 기법을 적용하여 바이오마커를 찾아내는 작업이 용이하지 않다. 마이크로어레이 데이터에서 나타나는 이러한 특성과 여기에서 파생되는 문제점들을 극복하기 위해 다양한 특징 선별 방법론들이 등장하였으나 다소의 문제점을 가지고 있어 실제 세계의 문제에 적용하기 어렵다. 본 논문에서는 코사인 내적 행렬과 행렬식을 이용하여 직교하지 않는 특징들을 제거하는 방법에 대해 소개하고, 그 결과를 분석하였다.

  • PDF

Data Mining for Road Traffic Accident Type Classification (데이터 마이닝을 이용한 교통사고 심각도 분류분석)

  • 손소영;신형원
    • Journal of Korean Society of Transportation
    • /
    • v.16 no.4
    • /
    • pp.187-194
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도 변화에 영향력 있는 변수 선택을 위하여 독립성 검정을 위한 $x^2$ test와 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 Decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합한 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

Data Mining for Road Traffic Accident Type Classification (데이터 마이닝을 이용한 교통사고 심각도 분류분석)

  • 손소영
    • Proceedings of the KOR-KST Conference
    • /
    • 1998.10a
    • /
    • pp.373-381
    • /
    • 1998
  • 본 연구는 교통사고 심각도와 관련된 중요변수를 찾고 이들 변수를 바탕으로 신경망, Decision Tree, 로지스틱 회귀분석을 이용하여 사고 심각도 분류 예측모형을 추정하였다. 다수의 범주형 변수로 이루어진 교통사고 통계원표상의 설명변수 들로부터 사고 심각도변화에 영향력 있는 변수선택을 위하여 $X^2$ 독립성 검정과 Decision Tree를 이용하였고, 선택된 변수들은 신경망과 로지스틱 회귀분석의 기초로 이용되었다. 분석결과 세가지기법간에 분류정확도에는 유의한 차이가 없는 것으로 나타났다. 그러나 decision Tree가 설명변수 선택능력과 분석수행시간, 사고 심각도 결정요인 식별의 용이함 측면에서 범주형 종속변수인 사고 심각도의 분석에 적합합 것으로 보이며 사고 심각도에는 보호장구가 가장 큰 영향을 미치는 것으로 재입증되었다.

  • PDF

Performance Comparison of Patent Classification Using Machine Learning Models (기계학습을 이용한 특허 분류의 성능 비교에 대한 연구)

  • Lee, Juhyun;Kang, Jiho;Park, Ahram;Park, Sangsung;Jang, Dongsik
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.540-541
    • /
    • 2018
  • 최근 특허분석의 중요성이 부각되고 있다. 특허분석을 위해 검색된 특허 중 노이즈 특허를 분류하는 작업은 많은 시간과 비용을 요구한다. 본 논문에서는 효율적인 특허분석을 위한 노이즈 특허 분류 성능의 비교를 진행한다. 그리고 비교한 결과를 통해 노이즈 특허 분류에 최적의 모형을 찾는 것을 목표로 한다. 듀얼 카메라 특허 603건을 이용하여 실제 실험을 실시한 결과, 나이브 베이지안 분류 모형의 분류 성능이 가장 우수하였다.

  • PDF

Subtree Mining to extract Association rules from Tree Data (트리 데이터에서 연관규칙 추출을 위한 서브트리 마이닝)

  • Kang, Woo-Jun;Shin, Jun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.317-320
    • /
    • 2006
  • XML 트리 데이터들로부터 빈번 서브 트리들을 추출하는 기존 방법들은 복잡하고 다수의 입력데이터 스캐닝을 필요로 할 뿐만 아니라 빈번 서브 트리를 구하기 위해 에지 하나하나의 조인 작업을 필요로 하였다. 이는 결과적으로 많은 수행 시간을 요한다. 본 논문에서는 트리데이터를 레벨 별로 나누고 이를 마치 채로 거르듯이 필터링하여 특정 수치 이상의 출현 횟수를 가지는 노드들만을 남겨 빠르게 빈번한 서브 트리를 찾고, 이를 이용하여 XML 연관규칙들을 생성하는 방법을 제시한다. 제시된 방법을 위해서 PairSet 이라는 새로운 자료구조를 도입하였으며, 이를 이용하는 크로스필터링 알고리즘을 개발하여 제시하였다.

  • PDF

Analyzing review of company's job process through opinion mining (오피니언 마이닝을 활용한 기업 채용 프로세스 후기 분석)

  • Choi, Jong-Tae;Yoon, Jae-Yeol;Lim, Ji-Yeon;Kim, Ung-Mo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.189-191
    • /
    • 2012
  • 갈수록 심해지는 취업난과 대학생들의 취업에 대한 갈증은 해소되지 않고 있다. 취업에 있어서 다양한 경험과 본인의 지식 등도 물론 중요하겠지만 취업에 대한 정보 또한 간과할 수 없다. 취업 준비생들은 가고 싶은 기업의 채용 후기들을 찾아다니고 읽는데 에 많은 시간과 노력을 들인다. 더군다나 이러한 취업 후기들은 그 양이 너무나 방대하기 때문에 여간 수고로운 일이 아닐 수 없다. 그래서 본 논문에서는 인터넷 사이트, 카페, 블로그 등에서 얻을 수 있는 수많은 후기들을 수집하고 분석하여 자료들을 수치화하고 도표화할 것이다. 이를 통해 취업준비생들이 기업의 채용 프로세스 후기에 대한 평가를 한눈에 알아볼 수 있으며 효율적으로 정보를 얻을 수 있게 될 것이라 기대한다.

Designing issue prediction system using web media data (웹 미디어 데이터를 이용한 이슈 예측 시스템 설계)

  • Yun, Hyun-Noh;Moon, Nammeee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.501-503
    • /
    • 2019
  • IT 기술의 발달에 따라 다양한 웹 미디어의 데이터가 기하급수적으로 증가하고 있으며 이는 비정형 형태의 빅 데이터로 활용도가 매우 높다. 그 중 인터넷 뉴스나 SNS 등은 시간의 흐름에 따라 다양한 이슈들이 서로 영향을 주며 발생, 결합, 분화, 소멸된다. 본 논문에서는 인터넷상에서 발생하는 비정형 데이터들을 수집하여 텍스트 마이닝을 통해 글의 주요이슈 키워드, 카테고리, 날짜 등을 추출한다. 추출한 데이터를 일정 기간별로 나누어 이슈 매핑을 통해 이슈간의 상관관계를 분석한다. 나아가 LSTM 또는 GRU를 이용한 딥러닝을 통해 앞으로의 이슈를 예측하는 시스템 설계를 제안한다.

Min-Max Hash for Similarity Measurement based on Multiset (Min-Max Hash를 활용한 다중 집합 기반의 유사도 측정)

  • Yoon, Jin-Uk;Kim, Byoungwook
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.36-39
    • /
    • 2019
  • 데이터 마이닝에서 클러스터링은 서로 유사한 특징을 갖는 데이터들을 동일한 클래스로 분류하는 방법이다. 클러스터링에는 다양한 방법이 존재하지만 대표적으로 집합으로 표현된 데이터들의 유사도를 측정하기 위해서는 자카드 유사도(Jaccard Similarity)를 이용한다. 자카드 유사도는 서로 다른 집합 간의 공통된 부분을 상대적으로 평가하여 유사도를 측정하는 방법이다. 그러나 최근에는 데이터를 저장할 수 있는 기술과 매체의 발전으로 표현할 수 있는 데이터의 영역과 범위는 발전되고 있기 때문에 많은 연산과 시간의 비용이 발생하게 된다. 이를 해결하기 위해서 두 데이터의 표본의 유사도를 통해 실제 데이터들의 유사도를 추정할 수 있는 Min-Hash 가 제안되었다. 본 논문에서는 이를 활용하여 집합의 영역을 다중 집합(Multiset)으로 확장하여 중복되는 값을 가질 수 있는 두 데이터 간의 유사도를 효율적으로 추정할 수 있는 Min-Max Hash 를 제안한다.

Cosmetics Recommendation System using Data Mining (데이터 마이닝을 이용한 화장품 추천 시스템)

  • Jang, Min-Hye;Heo, Yun-Hee;Lee, Jong-Ho;Park, Doo-Soon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1339-1341
    • /
    • 2012
  • 최근 전자상거래 시장은 시간과 장소의 제약이 없어 무한히 증가되고 있는 추세이다. 화장품은 눈으로 봐서 자신에게 맞는 상품을 선택하기가 어렵다. 본 논문에서는 사용자의 연령, 관심사, 사용자가 마이 페이지에 추가한 위시리스트 등의 세 가지 정보에 가중치를 부여하여 사용자와 비슷한 유사도를 보인 회원에게 화장품을 추천하는 시스템이다. 또한, 기존 사용자들의 관심도를 보여주기 위하여 블러그 정보를 제공한다.