• 제목/요약/키워드: 희소성

검색결과 274건 처리시간 0.022초

Jaccard Index Reflecting Time-Context for User-based Collaborative Filtering

  • Soojung Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.163-170
    • /
    • 2023
  • 추천 시스템의 구현 방식들 중 하나인 사용자 기반의 협력 필터링 기법은 유사한 평가 이력을 가진 이웃 사용자들의 산출을 기반으로 하여, 이들의 선호 항목들을 추천한다. 그러나 공통된 평가 이력이 적을 경우에 추천의 질이 현저히 저하되는 데이터 희소성 문제를 근본적으로 갖고 있다. 이러한 문제의 해결을 위하여 많은 기존 연구에서 자카드 계수를 유사도 척도와 접목하는 다양한 방법들을 제안해 왔다. 본 연구에서는 자카드 계수에 시간 인지 개념을 도입하여 공통 항목의 평가 시간에 따라 다른 비중으로 가중합하는 방안을 제시한다. 다양한 성능 척도와 시간 주기를 활용하여 실험을 수행한 결과, 제안 방법이 대부분의 척도에서 원래의 자카드 계수에 비해 가장 우수한 성능을 보였으며, 최적의 시간 주기는 성능 척도의 종류에 따라 다름을 확인하였다.

컨벌루션 신경망 모델의 적대적 공격에 따른 성능과 개체군 희소 지표의 상관성에 관한 경험적 연구 (Empirical Study on Correlation between Performance and PSI According to Adversarial Attacks for Convolutional Neural Networks)

  • 이영석
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권2호
    • /
    • pp.113-120
    • /
    • 2024
  • 개체군 희소 지표는 인공 신경망을 구성하고 있는 내부 레이어의 동작을 뉴런의 관점에서 관찰할 수 있기 때문에 블랙박스로 불리는 인공 신경망 내부의 동작을 설명하기 위하여 활용될 수 있다. 최근의 연구에서는 개체군 희소 지표를 두 종류의 컨벌루션 신경망 모델 분석에 적용하여, 레이어의 층이 깊어질수록 지표 값이 비례하여 증가하는 것이 관찰되었음을 보고하였다. 또한, 영상 분류를 위한 컨벌루션 신경망 모델에서 개체군 희소성 지표와 성능이 양의 상관성을 보인다는 연구도 있다. 본 연구에서는 적대적 예제가 컨벌루션 신경망에 적용되었을 때 신경망 내부에서 어떠한 동작이 수행되는지에 대하여 관찰하였다. 이를 위하여 적대적 예제를 입력으로 하는 컨벌루션 신경망의 개체군 희소 지표를 구한 다음, 컨벌루션 신경망의 성능과의 상관성을 비교하였다. 실험의 결과로부터 사전에 5%의 정확도를 갖도록 변형된 적대적 예제들에 대하여 온건한 데이터를 적용한 경우와 유사한 패턴의 양의 상관성을 갖는 것을 확인할 수 있었다. 이 실험결과는 적대적 예제와 온건한 데이터에 대한 각각의 개체군 희소성 지표 값들이 거시적인 관점에서 차이가 없다는 것을 의미하며 적대적 예제가 뉴런의 활성화 측면에서부터 적대적으로 동작한다는 것을 의미한다.

중립도 기반 선택적 단어 제거를 통한 유용 리뷰 분류 정확도 향상 방안 (Increasing Accuracy of Classifying Useful Reviews by Removing Neutral Terms)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.129-142
    • /
    • 2016
  • 전자상거래에서 소비자들의 구매 의사결정에 판매 제품을 이미 구매하여 사용한 고객의 리뷰가 중요한 영향을 미치고 있다. 전자상거래 업체들은 고객들이 제품 리뷰를 남기도록 유도하고 있으며, 구매고객들도 적극적으로 자신의 경험을 공유하고 있다. 한 제품에 대한 고객 리뷰가 너무 많아져서 구매하려는 제품의 모든 리뷰를 읽고 제품의 장단점을 파악하는 것은 무척 힘든 일이 되었다. 전자상거래 업체들과 연구자들은 텍스트 마이닝을 활용하여 리뷰들 중에서 유용한 리뷰들의 속성을 파악하거나 유용한 리뷰와 유용하지 않은 리뷰를 미리 분류하는 노력을 수행하고 있다. 고객들에게 유용한 리뷰를 필터링하여 전달하는 방안이다. 본 연구에서는 문서-단어 매트릭스에서 단어의 제거 기준으로 온라인 고객 리뷰가 유용한 지, 그렇지 않은지를 구분하는 문제에서 단어들이 유용 리뷰 집합과 유용하지 않은 리뷰집합에 중복하여 등장하는 정도를 측정한 중립도를 제시한다. 제시한 중립도를 희소성과 함께 분석에 활용하여 제거할 단어를 선정한 후에 각 분류 알고리즘의 성과를 비교하였다. 최적의 성과를 보이는 중립도를 찾았으며, 희소성과 중립도에 따라 단어를 선택적으로 제거하였다. 실험은 Amazon.com의 'Cellphones & Accessories', 'Movies & TV program', 'Automotive', 'CDs & Vinyl', 'Clothing, Shoes & Jewelry' 제품 분야 고객 리뷰와 사용자들의 리뷰에 대한 평가를 활용하였다. 전체 득표의 수가 4개 이상인 리뷰 중에서 제품 카테고리 별로 유용하다고 판단되는 1,500개의 리뷰와 유용하지 않다고 판단되는 1,500개의 리뷰를 무작위로 추출하여 연구에 사용하였다. 데이터 집합에 따라 정확도 개선 정도가 상이하며, F-measure 기준으로는 두 알고리즘에서 모두 희소성과 중립도에 기반하여 단어를 제거하는 방안이 더 성과가 높았다. 하지만 Information Gain 알고리즘에서는 Recall 기준으로는 5개 제품 카테고리 데이터에서 언제나 희소성만을 기준으로 단어를 제거하는 방안의 성과가 높았으며, SVM에서는 전체 단어를 활용하는 방안이 Precision 기준으로 성과가 더 높았다. 따라서, 활용하는 알고리즘과 분석 목적에 따라서 단어 제거 방안을 고려하는 것이 필요하다.

언론의 개방담론 논증구조 분석: 스크린쿼터제 관련 의견보도에 대한 Toulmin의 논증모델과 Stock Issue의 적용 (Rhetorical Analysis of News Editorials on 'Screen Quota' Arguments: An Application of Toulmin's Argumentation Model)

  • 박성희
    • 한국언론정보학보
    • /
    • 제36권
    • /
    • pp.399-422
    • /
    • 2006
  • 언론의 의견보도는 우리 사회의 주의 주장을 증폭시키는가, 아니면 대화와 토론을 유도하는가. 다양한 이해관계가 얽힌 현대 사회에서 정책과 관련된 건전한 공론의 조성은 언론의 마땅한 몫이자 사명이기도 하다. 본 논문은 한미자유무역협정과 관련된 개방담론이 언론의 의견보도 영역에서 어떻게 이루어지는지 검토하기 위해 스크린쿼터제 관련 사설 및 칼럼을 대상으로 논증학자 툴민(Toulmin)의 논증모델(Argumentation Model)과, 정책 논쟁 이슈모델(stock issues model)을 적용, 수사 분석을 시도했다. 분석결과 스크린쿼터 축소에 찬성하는 의견과 반대하는 의견이 각기 다른 논쟁공동체(argument fields)를 구성하고 있음을 나타냈다. 서로 다른 논리와 전제를 가진 논쟁공동체는 이슈의 선택과 증거의 사용에서 상호 반박이나 대화가 어려운 구조를 갖고 있다. 국내 언론의 의견보도는 찬성과 반대와 중립이 비슷한 비율로 나타난 가운데 반대쪽 의견의 비율이 다소 높았으나 논리의 밀도 구성 면에서는 찬성 측이 반대 측에 비해 현 상태(status quo)의 문제구성에서 대안의 합리성 지적에 이르는 다양한 논리를 구비하고 있었다. 이는 증거 제시의 부담을 지닌 쪽이 밀도 높은 논증을 한다는 추정(presumption)의 개념에 어긋난 것으로, 정부가 주도하는 권위적인 논증모델에 기인한 것으로 보인다. 본 연구결과는 스크린쿼터제라는 논제를 둘러싼 우리 사회의 다양한 이슈들을 발굴해 보도함으로써 논점을 이슈화하고 상호 토론을 유도하는 기제로서의 언론이 찬-반 상호 접점의 모색이나 증거의 수집, 논리의 개발이라는 측면에서 보완해야 할 점을 시사한다.을 전략적으로 활용해야 함을 암시한다.송을 신화적 공론장으로 귀결시킨다. TV선거 공론장의 역설(paradox)은 미디어 선거 시대에 유권자의 탈정치화, 정치의 픽션화 그리고 그에 따른 선거의 무관심을 고조시킴으로써 미디어와 정치의 위기를 더욱 심화시키고 있다. 따라서 정치적 인간 주체를 회복하기 위해서는 국가 중심의 제도체계를 벗어나 시민들이 TV선거 공론장의 주체적 참여자가 되도록 개방해야 할 필요가 있다.해야 함을 강조하고 있다.연구할 필요가 있다. 덧붙여 한국의 대중문화가 이러한 욕구에 잘 부합되고 있는지, 새로운 무엇을 만들어 내고 있지는 않은지 연구할 필요성을 절실히 느낀다.해 측정하였다. 실험은 4개의 집단으로 나누어져 실시하였는데 한 집단은 지각된 위험과 희소성 메시지에 동시에 노출되도록 하였고 두 번째 집단과 세 번째 집단은 각각의 두 요인 중 하나의 요인에만 노출되도록 하였다. 그리고 나머지 한 집단은 통제집단으로 지각된 위험이나 희소성 메시지를 모두 처치하지 않은 프로그램을 시청하게 하였다. 연구결과 흥미로운 사실들이 발견되었는데 이용경험에 상관없이 모든 이용자들은 지각된 위험에 부정적인 반응을 보였으며 특히 이용경험이 풍부한 홈쇼핑이용자들인 경우 이용경험이 적은 소비자에 비해 지각된 위험에 더욱 민감하게 반응함을 알 수 있었다. 또한 희소성 메시지에 대해서는 통계적으로는 유의미하지 않았지만 이용경험이 높은 소비자가 이용경험이 적은 소비자들 보다 오히려 부정적인 반응을 보임을 알 수 있었다. 또한 지각된 위험과 희소성 메시지의 상호작용효과의 경우 이용경험이 높은 집단의 소비자가 특히 제품에 대한 태도반응에서 매우 부정적인 반응을 보임을 알 수

  • PDF

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.

국내 무선기기 산업 및 주파수 사용현황 조사 (A Survey on the Domestic Radio Devices Industry and Spectrum Usage Status)

  • 장재혁;안춘모;김태한;성기훈
    • 전자통신동향분석
    • /
    • 제24권3호
    • /
    • pp.139-146
    • /
    • 2009
  • 최근 국가의 무형자산인 전파자원에 대한 수요가 급증하면서 전파자원의 희소성과 경제적 가치가 점점 높아지고 있다. 이에 미국, 유럽, 일본 등 해외 선진국은 정기적으로 전파이용자의 활용 현황을 조사하고 있으며, 그 결과를 전파정책 수립을 위한 기초자료로 활용하고 있다. 이에 본 조사는 국내 전파이용 기업들을 대상으로 무선기기 산업 현황 및 주파수 활용 실태를 파악하고, 그동안 부진했던 무선기기 제품의 활성화 및 전파이용에 대한 제도개선과 지원방안을 모색하고자 시행하였으며, 이를 통해 전파산업육성에 있어서 중요한 지표가 될 수 있는 아이템의 체계적인 발굴 및 전략적 시사점을 제시하였다.

신경망 기반 추천 모델의 성능향상을 위한 정보의 융합 (Data Fusion for performance Enhancement of Neural Network Based Recommendation Models)

  • 김호종;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.422-424
    • /
    • 2003
  • 협력적 추천은 데이터의 범위성, 초기 사용자, 희소성, 회색양의 문제를 안고 있다. 이를 해결하기 위해 기존 연구는 내용기반 추천이나 인구통계학적 추천을 협력적 추천과 통합하려는 연구가 진행되어 왔다. 본 논문에서는 추천 시스템의 성능 향상을 위해 이질적인 데이터의 통합에 효과적인 신경망을 사용하여 다양한 종류의 정보 융합을 제안한다 신경망을 사용한 추천 모델은 사용자들 또는 항목들 간의 선호관계를 학습할 수 있고, 이질적인 데이터의 통합이 용이한 신경망의 장점을 이용하면 항목들에 대한 내용과 사용자들의 인구통계학적인 정보, 그리고 그 외적인 관련정보를 쉽게 융합할 수 있다. 또한, 데이터 융합을 통하여 희소 데이터 문제와 초기 사용자 문제를 해결할 수 있다.

  • PDF

주파수 경매제 현황 및 정책적 시사점

  • 여재현
    • 한국전자파학회지:전자파기술
    • /
    • 제19권2호
    • /
    • pp.3-15
    • /
    • 2008
  • 주파수는 무선 통신 및 방송 등 무선 서비스 제공에 필수적인 매개체로서, 국가에 의해 관리되는 자원이다. 이동 통신을 중심으로 무선 서비스가 지속적으로 발전하고 경제에 미치는 효과가 커짐에 따라 주파수에 대한 수요가 급증하면서 경제적으로 희소성을 띄게 되었다. 이에 흔신 관리에 치중했던 기존의 전파 관리 체계에서 점점 경제적 가치를 고려한 시장 기반의 전파 관리 체계로의 전환에 대한 관심이 높아지고 있다. 시장 기반의 전파 관리 체계에서 주파수 이용자를 선정하는 할당 방식으로 많이 이용되고 있는 것이 주파수 경매제(auction)이다. 주파수 경매제는 주파수 수요자들의 입찰을 통해 주파수의 가격 및 이용자가 결정되는 방식으로 아직 우리나라에서는 시행되지 않고 있으나, 미국, 영국, 독일, 호주 등이 시행하고 었으며, 현재 우리나라도 도입을 검토하고 있는 단계이다. 이에 본 논문에서는 주파수 경매제의 개념 및 장단점, 이론적 배경 등에 대해 살 펴보고 주요국의 경매 정책 및 최근 경매 동향에 대 해 살펴본 후 국내 적용을 위한 시사점을 도출한다.

딥러닝 모형 기반 한국어 개체명 연결 (Named Entity Linking Based on Deep Learning Model)

  • 손대능;이동주;이용훈;정유진;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.90-95
    • /
    • 2016
  • 개체명 연결이란 문장 내 어떤 단어를 특정 사물이나 사람, 장소, 개념 등으로 연결하는 작업이다. 과거에는 주로 연결 대상 단어 주변 문맥에서 자질 공학을 거쳐 입력을 만들고, 이를 이용해 SVM이나 Logistic Regression 혹은 유사도 계산, 그래프 기반 방법론 등으로 지도/비지도 학습하여 문제를 풀어왔다. 보통 개체명 연결 문제의 출력 부류(class)가 사물이나 사람 수만큼이나 매우 커서, 자질 희소성 문제를 겪을 수 있다. 본 논문에서는 이 문제에 구조적으로 더 적합하며 모형화 능력이 더 뛰어나다 여겨지는 딥러닝 기법을 적용하고자 한다. 다양한 딥러닝 모형을 이용한 실험 결과 LSTM과 Attention기법을 같이 사용했을 때 가장 좋은 품질을 보였다.

  • PDF

도서관 정보시스템을 위한 협업 필터링 기반 개인화 추천서비스 (Personalized Recommendation Service based on Collaborative Filtering for Library Information Systems)

  • 정희정;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.251-254
    • /
    • 2011
  • 본 논문에서는 도서관 정보시스템에서 보다 개인화된 추천 서비스를 제공하기 위하여, 사용자 기반 협업 필터링의 희소성 문제를 해결하기 위한 방안을 제시한다. 이를 위하여 아이템을 메타데이터 속성인 주제분류번호를 이용하여 동일 주제의 자료끼리 군집화하고 주제군집에 대한 선호도 점수를 추출하여 이를 사용자 유사도 계산에 사용하였다. 실험을 위하여 실제 연세대학교 도서관에서 동양서를 대출한 35,238명의 총 659,792건 대출/반납건수 데이터를 사용하였으며, 제안된 방법의 성능을 평가하기 위하여 기존의 사용자 기반 협업 필터링과 비교한 결과, 정확도에서는 큰 차이가 없었으나 Coverage가 크게 향상되었음을 확인하였다.