• 제목/요약/키워드: 점수화 기법

검색결과 118건 처리시간 0.024초

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

선체부착생물관리와 수중제거기술 (Ship's Hull Fouling Management and In-Water Cleaning Techniques)

  • 현봉길;장풍국;신경순;강정훈;장민철
    • 해양환경안전학회지
    • /
    • 제24권6호
    • /
    • pp.785-795
    • /
    • 2018
  • 국제해사기구는 선체부착생물의 위험성을 인식해서 2011년 '선체부착생물에 의한 외래위해종 이동 저감을 위한 관리 및 제어 가이드라인'을 공표하였고, 향후 이를 강제화하기 위한 국제 협약을 계획하고 있다. 본 연구에서는 향후 강제화 될 국제협약에 효과적으로 대응하기 위해 선체부착생물관리 관련 선도국 사례를 소개하고 수중제거에 대한 환경 위해성 평가 기법에 대해서도 알아보았다. 선체부착생물관리 관련해서 선도국인 호주와 뉴질랜드는 수중제거 시나리오 의거해 수행한 생물 및 화학 위해성 평가를 근간으로 선체부착생물관리규제안을 마련하였다. 자국 정부의 특별한 규정이 없는 대부분의 유럽 국가들은 국제해사기구의 선체부착생물 규정에 따라 수중제거를 수행하는 것으로 확인되었다. 우리나라인 경우 선체부착생물에 대한 국내법은 존재하지 않고, 해양 생태계법에 의거해서 약 17종의 해양생태게교란생물만 지정해서 관리하고 있다. 선박 선체에 대한 수중제거는 외래생물 확산 및 수생 환경으로의 화학 물질 방출을 수반하므로, 생물학적 위해성평가와 화학적 위해성평가를 별개로 수행한 후 이 둘의 평가를 종합하여 수중제거 수용 여부를 판단하였다. 생물학적 위해성평가는 수중제거과정에서 외래생물 유입에 영향을 미치는 핵심요소를 기반으로 40 code의 수중제거 시나리오 작성하고 위해성우선순위(Risk Priority Number, RPN) 점수를 산정하였다. 화학적 위해성평가는 수중제거 시 용출되는 구리(Copper) 농도를 기준으로 MAMPEC(Marine Antifoulant Model to Predict Environmental Concentrations) 모델 프로그램을 사용하여 PEC(Predict Environmental Concentration) 값과 PNEC(Predict No Effect Concentration) 값을 산출하였다. 최종적으로 PEC/PNEC 비의 값이 1 이상이면 화학적 위해성이 높음을 의미한다. R/V 이어호가 부산감천항에서 수중제거를 수행한다는 가정하에 위해성평가를 시범 실시한 결과, 생물학적 위해성은 RPN이 <10,000 이어서 저위험으로 판단되었으나, PEC/PNEC 비의 값이 1 이상으로 화학적 위해성이 높아 최종적으로 수중제거가 불가능한 것으로 평가되었다. 따라서 우리나라도 선도국 사례를 참조해서 수중제거기술을 개발하고 또한 국내 항만 현실에 맞는 선체부착생물규제 국내법을 제정해야 할 필요가 있을 것이다.

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

온라인 리뷰 분석을 통한 상품 평가 기준 추출: LDA 및 k-최근접 이웃 접근법을 활용하여 (Product Evaluation Criteria Extraction through Online Review Analysis: Using LDA and k-Nearest Neighbor Approach)

  • 이지현;정상형;김준호;민은주;여운영;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.97-117
    • /
    • 2020
  • 상품 평가 기준은 상품에 대한 속성, 가치 등을 표현한 지표로써 사용자나 기업이 상품을 측정하고 파악할 수 있게 한다. 기업이 자사 제품에 대한 객관적인 평가와 비교를 수행하기 위해서는 적절한 기준을 선정하는 것이 필수적이다. 이때, 평가 기준은 소비자들이 제품을 실제로 구매 및 사용 후 평가할 때 고려하는 제품의 특징을 반영하여야 한다. 그러나 기존에 사용되던 평가 기준은 제품마다 상이한 소비자의 의견을 반영하지 못하고 있다. 기존 연구에서는 소비자 의견이 반영된 온라인 리뷰를 통해 상품의 특징, 주제를 추출하고 이를 평가기준으로 사용했다. 하지만 여전히 상품과 연관성이 낮은 평가 기준이 추출되거나 부적절한 단어가 정제되지 않는 한계가 있다. 본 연구에서는 이를 극복하기 위해 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA) 기법으로 리뷰로부터 평가 기준 후보군을 추출하고 이를 k-최근접 이웃 접근법(k-Nearest Neighbor Approach, k-NN)을 이용해 정제하는 모델을 개발하고 검증했다. 제시하는 방법은 준비 단계와 추출 단계로 이루어진다. 준비 단계에서는 워드임베딩(Word Embedding) 모델과 평가 기준 후보군을 정제하기 위한 k-NN 분류기를 생성한다. 추출 단계에서는 k-NN 분류기와 언급 비율을 이용해 평가 기준 후보군을 정제하고 최종 결과를 도출한다. 제안 모델의 성능 평가를 위해 명사 빈도 추출 모델, LDA 빈도 추출 모델, 실제 전자상거래 사이트가 제공하는 평가 기준을 세 비교 모델로 선정했다. 세 모델과의 비교를 위해 설문을 진행하고 점수화하여 결과를 검정했다. 30번의 검정 결과 26번의 결과에서 제안 모델이 우수함을 확인했다. 본 연구의 제안 모델은 전자상거래 사이트에서 리뷰 특성을 반영한 상품군 별 차원을 도출하는데 활용될 수 있고 이를 기초로 인사이트 발굴을 위한 리뷰 분석 및 활용에 크게 기여할 것이다.

QPS 프로그램에서 Myocardial extract 적용에 따른 임상적 유용성 평가 (The Evaluation of Clinical Usefulness on Application of Myocardial Extract in Quantitative Perfusion SPECT)

  • 윤종준;임영현;이무석;송현석;정지욱;박세윤;김재환;김정욱
    • 핵의학기술
    • /
    • 제15권2호
    • /
    • pp.88-93
    • /
    • 2011
  • 게이트 심근관류 SPECT의 정량적 평가를 위해 사용되는 자동화된 정량화 소프트웨어(AutoQUANT)는 획득 자료 처리과정에 따라 측정치 오차가 발생할 것으로 예상된다. 동일한 환자를 대상으로 다른 조건의 변화 없이 QPS (Quantitative Perfusion SPECT) 프로그램에서 Myocardial extract 전후에 따른 정량적 지표를 구하여 평가하고자 한다. 2010년 6월부터 2010년 12월까지 부산대학교병원 핵의학과에서 Tc-99m MIBI 게이트 심근관류 SPECT를 시행한 환자 중 51명(남:여=34:17, 평균나이 $66.45{\pm}9.92$)을 대상으로 하였다. 심근의 단축단면상을 이용하여 원형 관심영역은 배후영역을 제외한 심근영역에서 설정한 자료를 획득하였다. AutoQUANT를 이용한 QPS 프로그램에서 일과성허혈확장(Transient Ischemic Dilation, TID), 부하기 관류결손 범위율의 합(Extent of Stress Defect, ESD)과 부하기 관류점수 합(Summed Stress Score, SSS)을 구하여 비교 분석하였다. QPS 프로그램에서 Myocardial extract 적용 전과 적용 후 정량적 지표의 상관계수는 TID (r=0.98), ESD (r=0.99), SSS (r=0.99) 모두 좋은 상관관계를 보였다. 95% 신뢰수준에서 TID (p=0.78), ESD (p=0.31), SSS (p=0.19) 모두 통계적으로 유의한 차이가 없었다. 육안분석에서는 판독에 영향을 줄 수 있을 만한 영상의 차이는 발견할 수 없었다. QPS 프로그램에서 Myocardial extract 적용 전과 적용 후 정량적 지표(TID, ESD, SSS)는 모두 좋은 상관관계가 있다는 것을 확인할 수 있었고, 통계적으로 유의한 차이를 보이지 않았다. Myocardial extract 영상처리기법이 비교적 간단하여 심근관류 SPECT 영상의 질을 올릴 수 있을 것으로 사료된다.

  • PDF

품질기능전개(Quality Function Deployment) 방법을 적용한 고추장 소스 콘셉트 개발: 미국과 중국 시장을 중심으로 (Development of Sauces Made from Gochujang Using the Quality Function Deployment Method: Focused on U.S. and Chinese Markets)

  • 이슬기;김아영;홍상필;이승제;이민아
    • 한국식품영양과학회지
    • /
    • 제44권9호
    • /
    • pp.1388-1398
    • /
    • 2015
  • 본 연구의 목적은 고추장 소스의 제품 개발을 위해 소비자 요구에 기반을 둔 Quality Function Deployment(QFD) 모델을 적용하고자 하였다. QFD는 고객의 요구 사항이 제품이나 서비스 개발의 각 단계에 반영될 수 있도록 하는 강력한 품질 경영 도구이다. 고추장 소스 제품 개발에 QFD 기법을 적용하기 위해 먼저 소비자로부터 요구 사항을 도출하고 소비자의 중요도, 수행도 분석을 위해 소비자 설문조사를 실시하였다. 다음으로 전문가 인터뷰를 통해 기술특성을 도출하고 품질표 및 상관관계를 정의하였다. 최종적으로 각 단계에서 수집되고 해석된 데이터를 이용하여 고추장 소스 제품 개발을 위한 품질의 집을 완성하였다. 그 결과 고객인지도 비교에서는 고추장 소스의 신선한 풍미를 가장 중요하게 생각하였으며, 음식 풍미 향상, 음식 활용도 높음의 순으로 높게 나타났다. 고추장 소스의 품질에 대한 요구도와 개선비를 모두 고려하여 우선순위로 연결해 본 결과 신선한 풍미, 음식 풍미 향상, 음식 활용도 높음, 활용 가능한 레시피 제공 등이 높게 분석되었다. 이를 통해 소비자들은 고추장 소스 제품의 외관적인 측면보다는 풍미와 관련된 제품 품질을 더 중요하게 생각하는 것으로 나타났다. 기술특성의 난이도는 구매용이성, 브랜드 개발, 현지 식재료 사용, 독특한 콘셉트가 높게 나타난 반면, 순한 매운맛, 선명하고 탁한 붉은색, 끈적끈적하게 천천히 흐르는 점도에 대해서는 난이도 점수 및 순위가 낮게 나타났다. 기술특성 값을 중심으로 실행 난이도와 기술특성 간의 상호관계를 고려하여 기술특성 우선순위를 매겨 본 결과 용도 다양화에 대한 속성이 가장 높은 우선순위를 차지하고 있는 것을 알 수 있었다. 다음으로 무료 샘플 및 시식, 독특한 콘셉트, 브랜드 개발, 고추장 소스의 입자 보이지 않음 순으로 우선순위가 높게 나타났다. 이를 통해 고추장 소스의 개발과 이의 소비 확대를 위해서는 현지 소비자가 쉽게 접할 수 있는 레시피 개발과 동반 음식을 함께 제안하는 것이 필요할 것으로 사료된다. 고추장은 매운 맛을 내는 소스 중에서 발효라는 공정을 거쳐 제조되므로 이러한 이미지를 부각시켜 기존의 매운 소스와의 차별성을 둔 현지인 맞춤형 포지셔닝 전략이 필요할 것이다. 한편으로는 제품 콘셉트 도출 단계에서부터 소비자가 직접 참여하는 프로슈머 마케팅을 잘 활용하면 그들의 요구사항을 반영한 맞춤 상품을 공급할 수 있을 것이다. 이는 고객 만족도를 높이는 것뿐만 아니라 브랜드에 대한 로열티를 높일 수 있으므로 고추장 소스 콘셉트 개발 시에도 이러한 방법을 이용한다면 소비자의 니즈를 충족시킬 수 있는 차별화된 제품을 개발할 수 있을 것이라 판단된다. 그러나 본 연구는 편의추출법에 의해 설문 대상자를 선정하였고, 미국의 뉴욕 맨해튼과 중국의 베이징이라는 지역적 제한점을 갖고 있어 미국과 중국 대부분의 소비자 니즈를 반영했다고 보기에는 어려움이 있다. 이에 따라 향후 외적 타당도의 저해 요인들을 감소시킬 수 있는 소비자 계층에 따른 샘플링, 지역적 범위를 확장시킨 조사 설계 연구가 필요할 것으로 사료된다.

사용자 리뷰 마이닝을 결합한 협업 필터링 시스템: 스마트폰 앱 추천에의 응용 (A Collaborative Filtering System Combined with Users' Review Mining : Application to the Recommendation of Smartphone Apps)

  • 전병국;안현철
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.1-18
    • /
    • 2015
  • 협업 필터링은 학계나 산업계에서 우수한 성능으로 인해 많이 사용되는 추천기법이지만, 정량적 정보인 사용자들의 평가점수에만 국한하여 추천결과를 생성하므로 간혹 정확도가 떨어지는 문제가 발생한다. 이에 새로운 정보를 추가로 고려하여, 협업 필터링의 성능을 개선하려는 연구들이 지금까지 다양하게 시도되어 왔다. 본 연구는 최근 Web 2.0 시대의 도래로 인해 사용자들이 구입한 상품에 대한 솔직한 의견을 인터넷 상에 자유롭게 표현한다는 점에 착안하여, 사용자가 직접 작성한 리뷰를 참고하여 협업 필터링의 성능을 개선하는 새로운 추천 알고리즘을 제안하고, 이를 스마트폰 앱 추천 시스템에 적용하였다. 정성 정보인 사용자 리뷰를 정량화하기 위해 본 연구에서는 텍스트 마이닝을 활용하였다. 구체적으로 본 연구의 추천시스템은 사용자간 유사도를 산출할 때, 사용자 리뷰의 유사도를 추가로 반영하여 보다 정밀하게 사용자간 유사도를 산출할 수 있도록 하였다. 이 때, 사용자 리뷰의 유사도를 산출하는 접근법으로 중복 사용된 색인어의 빈도로 산출하는 방안과 TF-IDF(Term Frequency - Inverse Document Frequency) 가중치 합으로 산출하는 2가지 방안을 제시한 뒤 그 성능을 비교해 보았다. 실험결과, 제안 알고리즘을 통한 추천, 즉 사용자 리뷰의 유사도를 추가로 반영하는 알고리즘이 평점만을 고려하는 전통적인 협업 필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인할 수 있었다. 아울러, 중복 사용 단어의 TF-IDF 가중치의 합을 고려했을 때, 단순히 중복 사용 단어의 빈도만을 고려했을 때 보다 조금 더 나은 예측정확도를 얻을 수 있음도 함께 확인할 수 있었다.

평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구 (How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores)

  • 현지연;유상이;이상용
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.219-239
    • /
    • 2019
  • 개인에게 맞춤형 서비스를 제공하는 것이 중요해지면서 개인화 추천 시스템 관련 연구들이 끊임없이 이루어지고 있다. 추천 시스템 중 협업 필터링은 학계 및 산업계에서 가장 많이 사용되고 있다. 다만 사용자들의 평점 혹은 사용 여부와 같은 정량적인 정보에 국한하여 추천이 이루어져 정확도가 떨어진다는 문제가 제기되고 있다. 이와 같은 문제를 해결하기 위해 현재까지 많은 연구에서 정량적 정보 외에 다른 정보들을 활용하여 추천 시스템의 성능을 개선하려는 시도가 활발하게 이루어지고 있다. 리뷰를 이용한 감성 분석이 대표적이지만, 기존의 연구에서는 감성 분석의 결과를 추천 시스템에 직접적으로 반영하지 못한다는 한계가 있다. 이에 본 연구는 리뷰에 나타난 감성을 수치화하여 평점에 반영하는 것을 목표로 한다. 즉, 사용자가 직접 작성한 리뷰를 감성 수치화하여 정량적인 정보로 변환해 추천 시스템에 직접 반영할 수 있는 새로운 알고리즘을 제안한다. 이를 위해서는 정성적인 정보인 사용자들의 리뷰를 정량화 시켜야 하므로, 본 연구에서는 텍스트 마이닝의 감성 분석 기법을 통해 감성 수치를 산출하였다. 데이터는 영화 리뷰를 대상으로 하여 도메인 맞춤형 감성 사전을 구축하고, 이를 기반으로 리뷰의 감성점수를 산출한다. 본 논문에서 사용자 리뷰의 감성 수치를 반영한 협업 필터링이 평점만을 고려하는 전통적인 방식의 협업 필터링과 비교하여 우수한 정확도를 나타내는 것을 확인하였다. 이후 제안된 모델이 더 개선된 방식이라고 할 근거를 확보하기 위해 paired t-test 검증을 시도했고, 제안된 모델이 더 우수하다는 결론을 도출하였다. 본 연구에서는 평점만으로 사용자의 감성을 판단한 기존의 선행연구들이 가지는 한계를 극복하고자 리뷰를 수치화하여 기존의 평점 시스템보다 사용자의 의견을 더 정교하게 추천 시스템에 반영시켜 정확도를 향상시켰다. 이를 기반으로 추가적으로 다양한 분석을 시행한다면 추천의 정확도가 더 높아질 것으로 기대된다.