• 제목/요약/키워드: 최근접 이웃

검색결과 187건 처리시간 0.026초

Personalized Size Recommender System for Online Apparel Shopping: A Collaborative Filtering Approach

  • Dongwon Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권8호
    • /
    • pp.39-48
    • /
    • 2023
  • 본 연구는 의류의 디자인 간 치수의 불일치와 비표준화로 인해 온라인 구매 시 발생하는 치수 선택의 오류 문제를 해결할 수 있는 방안을 제시하기 위해 수행되었다. 본 논문은 구매자에게 개인화된 치수를 제시할 수 있는 기계 학습 기반 추천 시스템의 구현 방안을 다루고 있다. 온라인 상거래로부터 발생된 구매 데이터를 사용하여 비음수 행렬 분해(NMF), 특이값 행렬 분해(SVD), k-최근접 이웃(KNN), 공동 클러스터링(Co-Clustering) 등 여러 검증된 협업 필터링 알고리즘을 훈련하였고, 이들 간에 성능을 비교하였다. 연구 결과, 비음수 행렬 분해 (NMF) 알고리즘이 다른 알고리즘들보다 뛰어난 성능을 보임을 확인할 수 있었다. 동일한 계정을 사용하는 여러 구매자가 포함되는 구매 데이터의 특성에도 불구하고, 제안 모형은 충분한 정확도를 보였다. 본 연구의 결과는 치수 선택의 오류로 인한 반품률을 감소하고 전자상거래 플랫폼에서의 고객 경험을 향상시키는 데 기여할 것으로 기대된다.

다년 가뭄 대비 보령댐 용수공급 조정기준의 적응형 운영방안 (Adaptive Operation of Boryeong Dam Water Supply Adjustment Standards against Multi-year Droughts)

  • 김기주;이재황;이주형;김영오
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.373-373
    • /
    • 2022
  • 전세계적으로 기후변화로 인해 3년 이상의 기간동안 지속되는 다년 가뭄의 빈도와 심도가 증가하고 있으며, 이로 인한 피해도 증가하고 있다. 본 연구에서는 이를 반영하여 전국 다목적댐 및 용수댐에서 모두 주요 가뭄 대응 대책으로 사용되고 있는 현행 용수공급 조정기준을 개선하는 방안을 제안하고자 한다. 가장 먼저, 장기 기억 반영이 가능한 시계열 모형인 ARFIMA(Autoregressive Fractional Integrated Moving Average) 모델을 사용하여 다양한 강도의 장기 기억을 가지고 있는 연간 유입량을 생성하였다. 이후, 연간 유입량을 k-최근접 이웃 방법 기반의 배분 도구를 사용하여 10일 단위 유입량으로 분배하였으며 이를 대체 용수공급 조정기준을 생성하기 위한 입력 변수로 사용하였다. 새로운 용수공급 조정기준은 매 시점마다 새롭게 업데이트되는 정보를 통해 현행 기준과 함께 적응형으로 저수지 운영에 사용되었다. 다년 가뭄이 반영된 유입량으로 적응형으로 저수지 운영을 관측 유입량 하에서 빈도와 크기의 측면에서 분석을 시행하였다. 그 결과, 심각한 실패(물 부족 비율 30% 이상)의 빈도의 경우 현행 기준 운영 시 6.14%에서 적응형 운영 시행 시 2.99%로 개선되었지만, 전체 기간 동안의 신뢰도는 적응형 운영보다(26.42%) 현행 운영 하에서 더욱 나은 결과를 보였다(41.19%). 위와 같은 분석 결과는 심각한 실패의 빈도와 크기를 줄이는 용수공급 조정기준을 시행하는 원론적인 목적과 일치하기에, 본 연구에서 제안하는 다년 가뭄에 대비한 적응형 운영 방안은 향후 길게 지속되는 가뭄 조건에서 저수지 운영 정책으로 활용될 수 있음을 확인하였다.

  • PDF

Tei Index를 이용한 경도의 좌심실 이완 기능 장애 분류 모델 평가 (Evaluation of Classification Models of Mild Left Ventricular Diastolic Dysfunction by Tei Index)

  • 김수민;예수영
    • 한국방사선학회논문지
    • /
    • 제17권5호
    • /
    • pp.761-766
    • /
    • 2023
  • 본 논문에는 경도의 좌심실 이완 기능 장애 유무를 분류하기 위해 TI을 측정하였다. 분류에 사용된 기계 학습 모델은 SVM과 KNN을 이용하였다. 총 306개의 데이터 중에서 206개는 트레이닝 데이터, 100개는 테스트 데이터로 사용하였다. 그 결과, SVM이 KNN에 비하여 비교적 높은 정확도를 보여 좌심실 이완 기능 장애 유무 진단에 더 유용함을 확인했다. 향후 연구에서 TI 뿐만 아니라 심장의 기능을 평가하는 다양한 지표들을 추가하고 더 많은 데이터를 확보한다면 분류 성능을 더 높일 수 있을 것으로 기대된다. 나아가, 타 질환의 예측 및 분류, 증가하는 검사 건수에 비해 부족한 의료 인력 문제를 해결하는데 기초 자료로 활용될 것으로 기대된다.

학위논문 분석을 통한 미국 도서관학 및 정보과학 최근 연구 동향에 관한 연구 (A Study on Research Trends of Library Science and Information Science Through Analyzing Subject Headings of Doctoral Dissertations Recently Published in the U.S.)

  • 김현정
    • 정보관리학회지
    • /
    • 제35권3호
    • /
    • pp.11-39
    • /
    • 2018
  • 본 연구는 2014년부터 2018년까지 최근 5년간 미국에서 발표된 도서관학 및 정보과학 분야 학위논문의 연구동향을 파악하기 위해 PQDT Global 데이터베이스에 수록된 1,016편의 박사학위 논문을 수집하여 각 논문의 관련 학문 분야를 나타내는 분야명들을 추출하고 네트워크 분석을 통해 분야명 간의 관계와 네트워크 전반에 걸쳐 다른 분야들과 관계가 있는 전역중심성이 높은 분야명을 파악하는 것과 동시에 군집분석을 통해 연관성 높은 분야명들이 어떠한 군집을 형성하는지, 각 군집 안에서 지역중심성이 높은 분야명들은 어떤 것들인지 살펴보았다. 103개 핵심 분야명 키워드를 이용한 네트워크 분석 결과 최근 5년간 미국의 도서관학 및 정보과학 분야 박사학위 논문의 관련 학문분야로는 컴퓨터 관련 분야, 교육 관련 분야, 커뮤니케이션 관련 분야 외에도 다양한 이용자 집단에 관한 연구와 정보시스템 관련 분야 등을 포함하여 26개의 군집을 형성하는 것으로 나타났다. 26개 군집들 중 정보과학을 중심으로 하는 군집에는 컴퓨터 관련 학문 분야명들이 다수 포함되었고, 도서관학을 중심으로 하는 군집에는 대부분 교육 관련 분야명들이 포함되었으며, 그 외에도 이용자 연구와 관련하여 특정 이용자 그룹과 관련된 젠더연구분야나 정보시스템과 관련하여 경영학, 지리학, 의공학 등 다양한 학문 분야와 연관되어 있음을 알 수 있다.

데이터마이닝을 이용한 세분화된 고객집단의 프로모션 고객반응 예측 (Predicting the Response of Segmented Customers for the Promotion Using Data Mining)

  • 홍태호;김은미
    • 경영정보학연구
    • /
    • 제12권2호
    • /
    • pp.75-88
    • /
    • 2010
  • 정보기술의 발전과 더불어 기업과 고객간의 대부분의 정보가 축적되면서 기업은 거래고객의 자세한 정보를 활용하여 차별화된 마케팅을 제공할 수 있다. 본 연구는 기업이 제공하는 마케팅 전략을 보다 효과적으로 실행하기 위해 고객을 세분화하고, 세분화된 고객집단별 마케팅 프로모션에 대한 반응을 예측하는 모형을 제시하였다. 고객세분화에는 데이터마이닝 기법 중 SOM(Self-organizing Map)을 적용하였으며, 세분화된 집단별 프로모션 반응예측에는 로짓모형, 신경망 등의 단일모형과 k-최근접이웃법을 이용한 단일모형들의 통합모형을 적용하였다. 제시된 방법론으로 기업은 프로모션에 대한 고객반응을 예측할 뿐만 아니라 프로모션에 대한 반응을 쉽게 예측할 수 있는 고객집단과 반응예측이 어려운 고객집단으로 구분하여 프로모션의 효과를 극대화하고 각 집단에 맞는 프로모션 전략을 수립할 수 있다.

Genetic Algorithm과 다중부스팅 Classifier를 이용한 암진단 시스템 (Cancer Diagnosis System using Genetic Algorithm and Multi-boosting Classifier)

  • 온승엽;지승도
    • 한국시뮬레이션학회논문지
    • /
    • 제20권2호
    • /
    • pp.77-85
    • /
    • 2011
  • 생물 및 의학계에서는 생물정보학(bioinformatics)의 데이터 중 혈청 단백질(proteome)에서 추출한 데이터가 질병의 진단에 관련된 정보를 가지고 있고, 이 데이터를 분류 분석함으로 질병을 조기에 진단 할 수 있다고 믿고 있다. 본 논문에서는 혈청 단백질(2-D PAGE: Two-dimensional polyacrylamide gel electrophoresis)로부터 암과 정상을 판별하는 새로운 복합분류기를 제안한다. 새로운 복합 분류기에서는 support vector machine(SVM)와 다층 퍼셉트론(multi-layer perceptron: MLP)와 k-최근 접 이웃(k-nearest neighbor: k-NN)분류기를 앙상블(ensemble) 방법으로 통합하는 동시에 다중 부스팅(boosting) 방법으로 각 분류기를 확장하여 부분류기(subclassifier)의 배열(array)으로서 복합분류기를 구성하였다. 각 부분류기에서는 최적 특성 집합 (feature set)을 탐색하기 위하여 유전 알고리즘(genetic algorithm: GA)를 적용하였다. 복합분류기의 성능을 측정하기 위하여 암연구에서 얻어진 임상 데이터를 복합분류기에 적용하였고 결과로서 단일 분류기 보다 높은 분류 정확도와 안정성을 보여 주었다.

적응형 k-NN 기법을 이용한 UTIS 속도정보 결측값 보정처리에 관한 연구 (A study on the imputation solution for missing speed data on UTIS by using adaptive k-NN algorithm)

  • 김은정;배광수;안계형;기용걸;안용주
    • 한국ITS학회 논문지
    • /
    • 제13권3호
    • /
    • pp.66-77
    • /
    • 2014
  • UTIS(Urban Traffic Information System)는 프로브차량을 활용하여 도시지역의 구간통행시간 정보를 직접 수집하는 방식으로 타 검지체계에 비해 상대적으로 정확한 링크 속도정보를 산출할 수 있다. 하지만, 현재 UTIS에서는 프로브차량(Probe Vehicle) 및 노변기지국(RSE)의 부족, 시스템 오류 등 다양한 요인에 의해 링크 속도정보의 수집이 누락되는 결측 구간이 발생되고 있다. 본 연구에서는 보다 정확한 여행시간 정보를 제공하기 위한 방안으로 k-NN 알고리즘을 기반으로 결측속도 정보를 효율적으로 보정할 수 있는 새로운 보정모형을 제안하였다. 제안 모형은 각 후보개체(이력 시계열 데이터)의 분포 특성에 따라 최근접이웃 개수를 탄력적으로 조정하는 적응형 k-NN 모형이다. 모형 평가 결과, 제안 모형이 결측정보를 효과적으로 보정 처리할 수 있는 동시에 ARIMA 등 타 모형에 비해 보정 오차를 크게 감소시킬 수 있는 것으로 분석되었다. 본 연구에서 제안된 결측 보정 모형은 UTIS 중앙교통정보센터에 직접 적용하여 교통정보 서비스 품질을 향상시키데 활용될 계획이다.

P2P 대부 우수 대출자 예측을 위한 합성 소수집단 오버샘플링 기법 성과에 관한 탐색적 연구 (Exploring the Performance of Synthetic Minority Over-sampling Technique (SMOTE) to Predict Good Borrowers in P2P Lending)

  • 프란시스 조셉 코스텔로;이건창
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.71-78
    • /
    • 2019
  • 본 연구는 P2P 대부 플랫폼에서 우수 대출자를 예측시 유용한 합성 소수집단 오버샘플링 기법을 제안하고 그 성과를 실증적으로 검증하고자 한다. P2P 대부 관련 우수 대출자를 추정할 때 일어나는 문제점중의 하나는 클래스 간 불균형이 심하여 이를 해결하지 않고서는 우수 대출자 예측이 쉽지 않다는 점이다. 이러한 문제를 해결하기 위하여 본 연구에서는 SMOTE, 즉 합성 소수집단 오버샘플링 기법을 제안하고 LendingClub 데이터셋에 적용하여 성과를 검증하였다. 검증결과 SMOTE 방법은 서포트 벡터머신, k-최근접이웃, 로지스틱 회귀, 랜덤 포레스트, 그리고 딥 뉴럴네트워크 분류기와 비교하여 통계적으로 우수한 성과를 보였다.

장애인복지연구의 동향에 관한 주제어 연결망 분석 (Key Word Network Analysis to Identify the Trends of Research in Social Welfare for Disabled People)

  • 감정기;오봉희
    • 재활복지
    • /
    • 제21권1호
    • /
    • pp.1-26
    • /
    • 2017
  • 본 연구는 국내 장애인복지 연구의 동향을 주제어 연결망 분석의 방법으로 접근함으로써 기존의 기술적 분석 위주의 연구가 지니는 한계를 보완하는 대안적 분석을 시도한 연구이다. 이를 위해 1996년부터 2015년까지의 20년간 박사학위논문, "한국사회복지학", "재활복지" 등을 통해 발표된 관련 연구 1,034편의 논문 주제어를 분석의 자료로 삼았으며, 주제어와 함께 연구방법의 동향도 함께 살펴보았다. 이러한 연구를 통해 연구방법의 경향과 흐름, 관심의 대상이 된 장애유형과 인구집단 및 쟁점 등의 우선순위, 주어진 기간 동안의 장애인복지 연구의 지적 구조 등을 밝혀 보았다. 지적 구조는 개별 주제어의 국지적 중심성 지수인 최근접이웃중심성, 전역 중심성 지수의 하나인 평균프로파일연관성 값의 비교, 군집분석 결과의 검토, 연결망의 시각화 등을 통하여 규명해 보았다. 이렇게 하여 발견 혹은 확인된 점들에 비추어 향후 연구에서 고려할 필요가 있는 연구방법, 연구관점, 연구대상, 연구주제 등의 방향에 관하여 논의하였다.

협업필터링 기법을 이용한 모바일 광고 추천 시스템 (Using collaborative filtering techniques Mobile ad recommendation system)

  • 김은숙;윤성대
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.3-6
    • /
    • 2012
  • 최근 모바일 시장이 급속도로 성장함에 따라, 현대인들은 컴퓨터가 가지는 여러가지 제약들을 극복하여 원하는 정보를 빠르게 얻을 수 있는 수단으로 모바일 컨텐츠 사용이 늘고 있다. 그러나 광범위한 콘텐츠의 추천으로 콘텐츠의 선택에 있어 많은 시간이 소요된다. 이러한 문제점을 해결하기 위해 사용자가 원하는 콘텐츠를 예측하여 정확하게 추천해 줄 수 있는 시스템이 필요하다. 본 논문에서는 이러한 사용자들의 요구에 맞추어 원하는 컨텐츠를 제공하기 위하여 협업필터링을 이용하여 추천의 선택 횟수를 높일 수 있는 방법을 제시한다. 첫번째 단계에서 대분류로 카테고리를 구분하여 목표고객과 사용자간의 유사도를 구하고, 최근접 이웃을 구성하여 대분류 카테고리간 선호도 예측값을 구하여 가장 높은 대분류 카테고리를 목표고객에게 추천한다. 두 번째 단계에서 소분류 카테고리 간 선호도 예측값을 구하여 가장 높은 소분류 카테고리를 목표고객에게 추천한다. 실험에서 대분류 카테고리 기반 협업필터링으로 모바일 컨텐츠를 추천하고, 소분류 카테고리 기반 협업필터링으로 모바일 컨텐츠를 추천해 두 가지 방법의 결과를 비교하여 소분류 카테고리 기반 협업필터링의 방법이 선택 횟수가 높다는 것을 검증하였다.

  • PDF