• 제목/요약/키워드: 군집 선호도

검색결과 211건 처리시간 0.022초

연관 사용자 군집과 베이지안 분류를 이용한 사용자 선호도 예측 방법 (User Preference Prediction Method Using Associative User Clustering and Bayesian Classification)

  • 정경용;김진현;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.109-111
    • /
    • 2001
  • 기존의 협력적 필터링 기술을 이용한 사용자 선호도 예측 방법에서는 아이템에 대한 사용자의 선호도를 기반으로 이웃 선정 방법(Nearest-Neighborhood Method)을 사용하고, 피어슨 상관 계수에 의해 사용자의 유사도를 구하므로 아이템에 대한 내용을 반영하지 못할 뿐만 아니라 희박성 문제를 해결하지 못하였다. 본 논문에서는 기존의 사용자 선호도 예측 방법의 문제점을 보완하기 위하여 연관 사용자 군집과 베이지안 분류를 이음한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서의 희박성(Sparsity)문제를 해결하기 위하여 ARHP 알고리즘을 사용하여 사용자를 장르별로 군집하며 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도출 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 기존의 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게 하여 예측의 정확도를 높일 수 있다. 제안된 방법의 성능을 평가하기 위해서 기존의 협력적 필터링 기술과 비교 평가하였다.

  • PDF

사용자-상품 행렬의 최적화와 협력적 사용자 프로파일을 이용한 그룹의 대표 선호도 추출 (Extracting Typical Group Preferences through User-Item Optimization and User Profiles in Collaborative Filtering System)

  • 고수정
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권7호
    • /
    • pp.581-591
    • /
    • 2005
  • 협력적 여과 시스템은 희박성과 단지 두 고객만의 선호도에 따른 상관 관계로 추천을 제공한다는 문제점과 군집내의 가장 유사한 두 사용자만의 상관 관계에 의하여 추천을 한다는 단점이 있다. 또한, 상품의 내용을 기반으로 하지 않고 선호도만을 기반으로 하므로 추천의 정확도가 사용자에 의해 평가한 자료에만 의존한다는 문제점도 있다. 이와 같이 평가된 자료를 추천에 이용할 경우, 모든 사용자가 모든 상품에 대해 성의 있게 평가할 수는 없으므로 추천의 정확도가 낮아지는 결과를 가져온다. 따라서 본 논문에서는 엔트로피을 사용하여 사용자가 상품에 대하여 평가한 자료를 기반으로 검증되지 않은 사용자를 제외시키고, 다음으로 사용자 프로파일을 생성한 후 사용자를 군집시키며, 마지막으로 그룹의 대표 선호도를 추출하는 방법을 제안한다. 기존의 사용자 군집을 이용한 방법은 군집내의 사용자만을 대상으로 유사한 사용자를 찾으므로 희박성은 해결할 수 있으나 그 외의 단점을 해결하지 못하였다. 제안한 방법에서는 상품에 대해 평가한 선호도 뿐만 아니라 상품에 대한 정보를 반영하기 위하여 연관 단어 마이닝의 방법에 의해 협력적 사용자의 프로파일을 생성하고, 이를 기반으로 벡터 공간 모델과 K-means 알고리즘에 의해 사용자를 군집시킨다. 군집된 사용자를 대상으로 상품의 선호도와 사용자의 엔트로피를 병합함으로써 최종적으로 그룹의 대표 선호도를 추출한다. 대표 선호도를 이용한 추천 시스템은 한 사용자의 부정확한 선호도를 기반으로 추천을 하는 경우에 나타나는 추천의 부정확도 문제를 해결하며, 군집내의 가장 유사한 두 사용자만의 상관 관계에 의하여 추천을 하는 단점을 보완하고, 또한 그룹 내에 가장 유사한 사용자를 찾는 데 소요되는 시간을 절약할 수 있다는 장점을 갖는다.

군집분석을 통한 지하철 표지 여백에 대한 특성 (Characteristics of the Subway Sign Blank through Cluster Analysis)

  • 홍수정;오흥운
    • 대한토목학회논문집
    • /
    • 제39권4호
    • /
    • pp.513-521
    • /
    • 2019
  • 본 연구의 목적은 지하철 이용자의 지하철 표지 여백에 대한 특성의 군집그룹별 선호도를 파악하는 것이다. 세부적으로 성별, 연령 등의 특성에 따라 지하철 표지 여백에 대한 특성을 다양하게 디자인하는 개념을 도입하는 것을 목적으로 한다. 본 연구는 지하철 표지 여백에 대한 특성의 선호도를 조사하고 전체그룹과 군집그룹별 선호도를 분석하였다. 선호도 조사를 위해 설문조사를 실시하였으며, 선호도 분석을 위해 군집분석을 실시하고 전체그룹과 군집그룹의 인구통계학적 분석과 컨조인트 분석을 실시하였다. 선호도 조사를 위한 지하철 표지 여백에 대한 특성의 속성은 상하여백, 측여백, 테두리선 여백, 화살표 두께, '역명'과 '호선번호' 순서로 설정하였다. 선호도 분석 결과는 다음과 같다. 전체그룹에서 속성의 중요도는 테두리선 여백, '역명'과 '호선번호' 순서, 측여백, 상하여백, 화살표 두께 순으로 나타났다. 군집그룹은 총 3개의 그룹으로, 1군집은 지하철을 거의 매일, 일주일에 3~4회 이용하는 여성으로, 글자의 1/2 측여백을 선호하는 것으로 나타났다. 2군집은 60대 이상의 지하철 표지를 불편하다고 생각하는 이용자로, 테두리가 없는 것과 '역명'+'호선번호' 순서를 선호하는 것으로 나타났다. 3군집은 20대와 30대의 남성으로, 글자의 1/5 테두리선 여백과 얇은 화살표 두께를 선호하는 것으로 나타났다. 결론은 다음과 같다. 첫째, 지하철 표지 여백에 대한 특성을 일관성 있게 디자인 해야하지만, 특정지역 혹은 노선에 대해서 성별, 연령별, 지하철 이용횟수에 따라 다양하게 고려할 필요성이 제시되었다. 둘째, 특정지역 혹은 노선에 따라서는 지하철 표지 여백에 대한 특성의 표지를 표준화된 한 가지 유형이 아닌 두 가지 이상의 유형의 디자인이 가능함을 보여주었다.

사용자 선호도를 사용한 군집 기반 추천 시스템 (Clustering-Based Recommendation Using Users' Preference)

  • 김영현;신원용
    • 한국정보통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.277-284
    • /
    • 2017
  • 사용자가 좋아할만한 콘텐츠를 정확하게 추천하는 것은 추천 시스템에서 매우 중요한 요소 중 하나이다. 원치 않는 콘텐츠를 추천하거나, 원하는 것을 추천하지 않는 것은 사용자 만족도 측면에서 안 좋은 영향을 끼친다. 본 연구에서는 콘텐츠의 정확한 추천을 위해 사용자 군집 기반 추천 시스템을 제안한다. 제안하는 알고리즘에서 사용자들의 실제 선호도 점수와 피어슨 상관 계수를 기반으로 사용자들을 여러 군집으로 나눈다. 이 후, 특정 사용자에게 어떤 콘텐츠의 추천 여부 결정은, 같은 군집 내에 있는 다른 사용자들의 해당 콘텐츠의 실제 선호도 점수를 근거로 정한다. 제안하는 알고리즘은 군집화를 사용하지 않는 아이템 기반 협력 필터링 알고리즘보다 정밀도, 재현율, F1 스코어와 같은 추천 정확도에 있어서 의미 있는 성능 향상을 보인다.

공동주택 주차장 분리분양제의 선호 및 분양 할인율에 대한 선택 확률 추정 -서울시 공동주택 입주민을 대상으로- (The estimation of selection probability on the preference of unbundled parking system and sales discount rate -targeted for the public apartment residents in Seoul-)

  • 정상운;노정현
    • 한국산학기술학회논문지
    • /
    • 제18권5호
    • /
    • pp.587-595
    • /
    • 2017
  • 최근 불완전한 주택 시장 극복 및 효율적인 주차장 운영, 교통수요관리 등의 목적으로 주차장 분리분양제(Unbundled Parking System)가 주목을 받고 있다. 주차장 분리분양제는 주거공간과 주차공간을 독립적으로 분리하여 분양함으로써 기존 분양가 보다 낮은 분양가로 공급이 가능하다는 장점이 있어 미국, 프랑스 등 일부 국가에서는 이미 시행되고 있으며, 그 효과가 검증된 제도이다. 본 연구는 주차장 분리분양제 도입을 위해 초석을 다지는 연구로 서울시 공동주택 매매가를 기준으로 3개의 군집으로 분류하여 각 군집당 100인을 대상으로 주차장 분리분양제에 대한 선호도 조사를 실시하고, 분양할인율에 대한 선택확률을 추정하고자 하였다. 주차장 분리분양제에 대한 선호조사 결과 3개의 모든 군집에서 유사한 수준(1군집: 68%. 2군집: 62%, 3군집 65%)으로 나타났다. 젊은 층에서 보다 긍정적인 면을 보이는 것으로 나타났으며, 차량을 소유하지 않은 미소유집단의 선호가 더욱 높게 나타났다. 주차장 분리분양제도의 선택 효용 및 확률을 추정한 결과 차량의 미소유집단에서 주차장 분리분양제의 선호에 대해 효용값이 가장 높게 나타났으며, 1군집의 경우 할인율 14%(평균 매매가 적용시 평당 637만원 할인), 주차요금 10만원/월일 경우 69%가 주차장 분리분양제를 선택하는 것으로 나타났으며, 2군집의 경우(평균 매매가 적용시 평당 393만원 할인) 77%, 3군집의 경우(평당 매매가 적용시 227만원 할인) 62%가 주차장 분리분양제를 선택하는 것으로 나타났다.

영화 데이터를 위한 쌍별 규합 접근방식의 군집화 기법 (Pairwise fusion approach to cluster analysis with applications to movie data)

  • 김희진;박세영
    • 응용통계연구
    • /
    • 제35권2호
    • /
    • pp.265-283
    • /
    • 2022
  • 사용자들의 영화정보를 기록한 MovieLens 데이터는 추천 시스템 연구에서 아이디어를 탐색하고 검증하는데 상당한 가치가 있는 데이터로, 기존 데이터 분할 및 군집화 알고리즘을 사용하여 사용자 평점 데이터를 기반으로 항목 집합을 분할하는 연구 등에 사용되는 데이터이다. 본 논문에서는 기존 연구에서 대표적으로 사용되었던 영화 평점 데이터와 영화 장르 데이터를 통해 사용자의 장르 선호도를 예측하여 선호도 패턴을 기반으로 사용자를 군집화(clustering)하고, 유의미한 정보를 얻는 연구를 진행하였다. MovieLens 데이터는 영화의 전체 개수에 비해 사용자별 평균 영화 평점 수가 낮아 결측 비율이 높다. 이러한 이유로 기존의 군집화 방법을 적용하는 데 한계가 존재한다. 본 논문에서는 MovieLens 데이터 특성에 모티브를 얻어 쌍별 규합 벌점함수(pairwise fused penalty)를 활용한 볼록 군집화(convex clustering) 기반의 방법을 제안한다. 특히 결측치 대체(missing imputation)도 동시에 해결하는 최적화 문제를 통해 기존의 군집화 분석과 차별화하였다. 군집화는 반복 알고리즘인 ADMM을 통해 제안하는 최적화 문제를 풀어 진행한다. 또한 시뮬레이션과 MovieLens 데이터 적용을 통해 제안하는 군집화 방법이 기존의 방법보다 노이즈 및 이상치에 상대적으로 민감하지 않은 것으로 보인다.

선호도 재계산을 위한 연관 사용자 군집 분석과 Representative Attribute -Neighborhood를 이용한 협력적 필터링 시스템의 성능향상 (Performance Improvement of Collaborative Filtering System Using Associative User′s Clustering Analysis for the Recalculation of Preference and Representative Attribute-Neighborhood)

  • 정경용;김진수;김태용;이정현
    • 정보처리학회논문지B
    • /
    • 제10B권3호
    • /
    • pp.287-296
    • /
    • 2003
  • 추천 시스템에 있어서 협력적 필터링 기술은 많은 연구가 되고 있다. 그러나 협력적 필터링 기술을 이용한 추천 시스템은 초기 평가 문제와 희박성 문제가 발생한다. 이를 해결하기 위해서 본 논문에서는 선호도 재 계산을 위한 연관 사용자 군집과 베이지안 추정치를 이용한 사용자 선호도 예측 방법을 제안한다. 제안한 방법에서는 협력적 필터링 시스템에서 아이템의 속성을 고려하지 않는 단점을 보완하기 위해서 선호도에 가장 크게 영향을 미치는 대표 장르를 추출하여 유사한 이웃을 찾아 낼 때 예측에 이용하는 Representative Attribute-Neighborhood 방법을 사용한다. 협력적 필터링의 알고리즘에 군집 아이템 백터 내의 특정 아이템의 선호도를 재계산 하기 위한 연관 사용자 군집 분석을 적용하여 성능 향상을 하였다. 또 초기 평가 문제와 희박성 문제를 해결하기 위하여 Association Rule Hypergraph Partitioning 알고리즘을 사용하여 사용자를 장르별로 군집한다. 새로운 사용자는 Naive Bayes 분류자에 의해 이들 장르 중 하나로 분류된다. 또한, 분류된 장르 내에 속한 사용자들과 새로운 사용자의 유사도를 구하기 위해 Naive Bayes 학습을 통해 사용자가 평가한 아이템에 추정치를 달리 부여한다. 추정치가 부여된 선호도를 피어슨 상관 관계에 적용할 경우 결측치(Missing Value)로 인한 예측의 오류를 적게하여 예측의 정확도를 높일 수 있다. 제안된 방법은 기존의 방법보다 높은 성능을 나타냄을 보인다.

개인화 추천 시스템에서 속성 정보를 이용한 연관 사용자 군집 방법 (Associative User Group Method using Attribute Information in Personalized Recommendation System)

  • 한경수;조동주;정경용
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.169-173
    • /
    • 2006
  • 유비쿼터스 상거래에서 사용자가 정보를 효율적으로 이용할 수 있도록 제어하고 필터링하는 일을 도와주는 개인화된 추천 시스템이 등장하였다. 더 나아가서는 사용자가 원하는 아이템을 예측하고 추천해주며, 이를 위해 협력적 필터링 기술을 적용하고 있다. 이는 사용자의 성향에 맞는 아이템을 예측하고 추천하기 위하여 비슷한 선호도를 가지는 사용자들 간의 유사도 가중치를 계산한다. 본 논문에서는 속성정보에 대한 사용자의 선호도를 고려하지 않은 문제점을 개선하기 위해서 속성정보를 이용한 연관 사용자의 선호도를 협력적 필터링 기술에 반영함으로써 추천의 정확도를 높이고자 한다. 그리고 협력적 필터링의 {연관 사용자-아이템} 행렬에서 사용자들 간의 연관 관계를 유지하면서 차원 수를 감소시키기 위해 ARHP 알고리즘을 이용하여 연관 사용자 군집을 한다. 제안된 방법의 성능 평가를 하기 위해 사용자가 아이템에 대해서 평가한 MovieLens 데이터 집합을 대상으로 평가되었으며, 기존의 Nearest Neighbor Model과 K-Means 군집보다 그 성능이 우수함을 보인다.

  • PDF

추천 시스템의 예측 정확도 향상을 위한 전처리 방법 (Preprocessing Methods for Improving Prediction Accuracy in Recommender Systems)

  • 박석인;김택헌;류영석;양성봉
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.247-249
    • /
    • 2002
  • 협력적 여과(collaborative filtering) 방법을 사용하는 추천 시스템에서 예측 정확도를 높이는 방법들 중 하나는 군집화(clustering)방법이 있다. 군집화 방법은 선호도가 유사한 사용자들을 미리 같은 군집으로 만들고, 군집 내에 속한 사용자들을 이웃으로 선정하여 예측을 수행하기 때문에 군집화의 결과가 예측의 정확도에 직접적인 영향을 주게 된다. 본 연구에서는 군집화 결과의 향상을 위해 데이터를 전 처리하는 두 가지 방법과 군집화의 특성을 이용한 새로운 예측식을 제안하고, 기존 연구 방법과의 비교 실험을 통해 실험결과를 분석한다.

  • PDF

성격유형이 정보원선택에 미치는 영향에 관한 연구 - 금융상품정보를 중심으로 -

  • 강용혁;조남재;김희연
    • 한국디지털정책학회:학술대회논문집
    • /
    • 한국디지털정책학회 2005년도 추계학술대회
    • /
    • pp.163-173
    • /
    • 2005
  • 금융기관들은 개인들의 다양한 욕구를 충족시키기 위해서 경쟁적으로 수많은 금융상품을 개발하여 판매하기 시작하였으며, 이러한 상품들은 나름대로 독특한 특성을 지니게 되어, 개인들은 이에 대한 수많은 정보를 수집하고 분석할 필요성을 가지게 되었다. 금융상품정보의 정보원 선택 선호요인으로는 정보원 자체의 특정 이외에도 개인이 가지는 성격적 특징과 환경적 요인들을 들 수 있다. 따라서 개인의 성격유형에 따라 선호하는 정보원의 유사점과 차이점을 알아보았다. 본 연구에서는 금융상품정보를 취득하는 정보원에 대한 선호요인인 개인의 성격유형을 파악하기 위하여 MBTI(Myers Briggs Type Indicator)를 근거로 작성된 성격특성평정척도(Personality Trait Ration Scales: PTRS)를 이용하여 파악된 성격유형들이 금융상품 정보원 선택에 미치는 영향을 분석하였다. 성격유형변수를 4개의 군집으로 집단화하고 성격요인과 차이분석을 실시한 결과 감정 직관적인 성격이 강한 주관적 감정형, 외향 직관적인 성격이 강한 사교적활동형, 내향 사고적인 성격이 강한 수동적개인형, 인식 판단적인 성격이 강한 합리적이성형의 4개 군집으로 나누어졌다. 8개의 성격요인 중 감각을 제외한 7개 성격요인 모두가 p<. 05에서 4개의 성격유형군집과 유의적인 차이가 있는 것으로 나타났다. 사교적활동형은 여러 정보원 중 'TV'를, 합리적이성형은 '잡지', '금융상품팜플렛', '재테크서적'을, 주관적감정형은 '은행창구직원', '친구나친지'를 선호하였다. 그러나 수동적개인형은 어떠한 금융상품정보원도 선호하지 않았다. 특히, 합리적이성형은 전문금융정보를 원하는 것으로 나타났고, 주관적감정형은 인간적인 면을 더 선호하는 것으로 나타났다. 본 연구가 가지는 의의는 각 성격유형별로 선호하는 금융상품정보원의 차이를 분석함으로써 개인의 정보욕구를 보다 더 만족시킬 수 있는 하나의 요인으로 성격요인과 정보원의 차이에 관한 정보를 제공하며, 금융정보를 제공하는 주체들에게 각 정보원에 적합하도록 정보의 성격에 관한 특성요인과 고객선호정보원을 살펴볼 수 있는 정보취득방안에 대한 연구의 필요성을 제시하는데 있다.

  • PDF