• 제목/요약/키워드: 문서 추천

검색결과 123건 처리시간 0.03초

동시출현 자질과 집단 지성을 이용한 지식검색 문서 사용자 명성 평가 (User Reputation Evaluation Using Co-occurrence Feature and Collective Intelligence)

  • 이현우;한요섭;김래현;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 2008
  • 많은 사용자들의 참여로 구축된 집단 지성을 이용한 지식 검색 서비스에서 사용자가 원하는 답변을 빨리 찾고자 하는 요구가 증가하고 있다. 기존의 연구에서 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보가 답변을 평가하는데 좋은 자질임이 증명되었고, 신뢰도를 추정할 수 있는 여러 종류의 단어 사전을 이용하여 답변의 좋고 나쁨을 평가할 수 있는 연구도 진행되었다. 하지만, 조회 수, 추천 수, 답변 수와 같은 비텍스트 정보는 사용자 조작이 간단하여 지속적으로 관리를 해야 하며, 신뢰도를 추정할 수 있는 단어는 지속적으로 보강되어야 한다. 본 논문에서는 이러한 문제점을 해결하고자 동시출현 자질을 이용한 질문과 답변의 유사성을 활용하여 집단 지성에서 사용자의 활동을 분석하여 사용자의 명성을 평가하는 방법을 제안한다. 사용자의 명성을 계산할 수 있다면 조회 수와 추천 수가 많지 않은 답변의 신뢰도도 비교적 정확하게 추정할 수 있다. 이를 위해 우리는 PageRank 알고리즘을 수정하여 사용자 명성을 계산한다. 네이버 지식iN의 문서로 실험한 결과, 기존 정답 선택률을 보완할 수 있는 결과를 보였다.

  • PDF

토픽 모델을 이용한 모바일 앱 설명 노이즈 제거 (Noise Elimination in Mobile App Descriptions Based on Topic Model)

  • 윤희근;김솔;박성배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.64-69
    • /
    • 2013
  • 스마트폰의 대중화로 인하여 앱 마켓 시장이 급속도로 성장하였다. 이로 인하여 하루에도 수십개의 새로운 앱들이 출시되고 있다. 이러한 앱 마켓 시장의 급격한 성장으로 인해 사용자들은 자신이 흥미를 가질만한 앱들을 선택하는데 큰 어려움을 겪고 있어 앱 추천 방법에 대한 연구에 많은 관심이 집중되고 있다. 기존 연구에서 협력 필터링 기반의 추천 방법들을 제안하였으나 이는 콜드 스타트 문제를 지니고 있다. 이와는 달리 컨텐츠 기반 필터링 방식은 콜드 스타트 문제를 효율적으로 해소할 수 있는 방법이지만 앱설명에는 광고, 공지사항등 실질적으로 앱의 특징과는 무관한 노이즈들이 다수 존재하고 이들은 앱 사이의 유사관계를 파악하는데 방해가 된다. 본 논문에서는 이런 문제를 해결하기 위하여 앱 설명에서 노이즈에 해당하는 설명들을 자동으로 제거할 수 있는 모델을 제안한다. 제안하는 모델은 모바일 앱 설명을 구성하고 있는 각 문단을 LDA로 학습된 토픽들의 비율로 나타내고 이들을 분류문제에서 우수한 성능을 보이는 SVM을 이용하여 분류한다. 실험 결과에 따르면 본 논문에서 제안한 방법은 기존에 문서 분류에 많이 사용되는 Bag-of-Word 표현법에 기반한 문서 표현 방식보다 더 나은 분류 성능을 보였다.

  • PDF

딥러닝 기반의 문서요약기법을 활용한 뉴스 추천 (News Recommendation Exploiting Document Summarization based on Deep Learning)

  • 허지욱
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.23-28
    • /
    • 2022
  • 최근 스마트폰 또는 타블렛 PC와 같은 스마트기기가 정보의 창구 역할을 하게 되면서 다수의 사용자가 웹포털을 통해 웹 뉴스를 소비하는 것이 더욱 중요해졌다. 하지만 인터넷 상에 생성되는 뉴스의 양을 사용자들이 따라가기 힘들며 중복되고 반복되는 폭발하는 뉴스 기사에 오히려 혼란을 야기 시킬 수도 있다. 본 논문에서는 뉴스 포털에서 사용자의 질의로부터 검색된 뉴스후보들 중 KoBART 기반의 문서요약 기술을 활용한 뉴스 추천 시스템을 제안한다. 실험을 통해서 새롭게 수집된 뉴스 데이터를 기반으로 학습한 KoBART의 성능이 사전훈련보다 더욱 우수한 결과를 보여주었으며 KoBART로부터 생성된 요약문을 환용하여 사용자에게 효과적으로 뉴스를 추천하였다.

부정적 피드백과 강화학습을 이용한 사용자 프로파일 학습 (Learning for User Profile Based on Negative Feedback and Reinforcement Learning)

  • 손기준;임수연;이상조
    • 한국지능시스템학회논문지
    • /
    • 제17권6호
    • /
    • pp.754-759
    • /
    • 2007
  • 정보추천은 동적인 사용자의 정보요구를 기준으로 문서들을 선별하여 제시한다. 사용자의 정보요구는 하나 이상의 단어들로 구성된 프로파일로 표현이 되며, 문서의 추천 과정 동안에 발생하는 사용자의 관련성 평가를 통해 구체적인 내용으로 변할 수 있다. 기존 연구의 경우 사용자는 자신이 직접 관련성 평가에 참여하여 평가 정보를 입력하고, 사용자가 평가한 긍정적 피드백 정보를 이용하여 사용자 프로파일을 학습한다. 본 연구는 사용자가 평가한 긍정적 피드백, 부정적 피드백 정보와 강화학습을 이용한 사용자 프로파일의 학습 방법을 제안한다. 제안된 방법과 기존의 긍정적 평가 정보만을 이용한 방법의 성능을 측정하기 위해 동일한 토픽에 대한 추천 성능을 비교 실험하였다. 실험한 결과 제안된 방식에 의한 추천성능이 긍정적 평가 정보만을 이용한 피드백 방법보다 나은 성능을 보였다.

퍼지연상기억장치에 기반한 협력 추천 방법 (A Collaborative Recommendation Method based on Fuzzy Associative Memory)

  • 이동섭;고일주;김계영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1054-1061
    • /
    • 2004
  • 최근 인터넷의 발전으로 정보의 접근이 용이할 뿐 아니라 그 양 또한 기하급수적으로 증가하고 있다. 정보의 홍수 속에서 원하는 정보만을 자동으로 추출할 수 있는 기술은 정보검색에 소요되는 시간과 노력을 절약할 수 있는 매우 중요한 연구이다. 본 논문에서는 관심 범위가 유사한 사용자에게 양질의 정보를 자동으로 추천하기 위하여 협력적 여과방법에 관하여 제안한다. 제안하는 방법의 기본적인 배경은 사용자는 선택항목의 선호도를 입력하고, 여과 장치는 이 선호도에 근거하여 추천집합을 자동으로 생성하는 것이다. 선호도로부터 추천집합을 추론하기 위하여 본 논문에서 퍼지 연상기억장치에 기반한 방법을 제안한다. 제안된 방법은 웹 서버상에서 기술문서 특히, 정보기술문서를 검색하는 분야에 대하여 구현하였으며 그 결과를 보인다.

협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘 (Effective User Clustering Algorithm for Collaborative Filtering System)

  • 고수정;임기욱;이정현
    • 정보처리학회논문지B
    • /
    • 제8B권2호
    • /
    • pp.144-154
    • /
    • 2001
  • 협력적 여과 시스템은 사용자가 검색하고 읽었던 웹문서를 기반으로 사용자 군집을 생성하여 웹문서의 정확한 추천을 가능하게 한다. 이러한 목적으로 설계된 다양한 알고리즘이 있으나 속도가 느리거나 정확도가 낮다는 등의 단점이 있다. 본 논문에서는 이러한 단점을 보완하기 위하여 협력적 여과 시스템을 위한 효과적인 사용자 군집 알고리즘인 CUG알고리즘은 사용자 군집을 생성하기 위해 Apriori 알고리즘, Native Bayes 알고리즘을 이용한다. Apriori 알고리즘은 연관 단어 지식 베이스를 구축하고, Native Bayes 알고리즘은 구축된 연관 단어 지식 베이스에 가중치를 추가하며, 사용자가 검색하여 읽은 웹문서를 클래스별로 분류한다. CUG 알고리즘은 분류된 웹문서를 기반으로 하여 사용자 군집을 만든다. 이러한 방법으로 설계된 CUG 알고리즘은 사용자들이 사용할 문서를 미리 검색하여 저장함에 의해 정보검색의 효율성을 향상시키는데 사용될 수 있다. 본 논문에서 설계한 CUG 알고리즘의 선능을 평가하기 위하여 기존의 K-means 방법과 Gibbs샘플링 방법에 의한 군집과 비교한다.

  • PDF

퍼지 개념 네트워크를 이용한 링크기반 검색엔진의 개인화 (Personalization of Link-based Search Engine by Fuzzy Concept Network)

  • 김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.316-318
    • /
    • 2001
  • 링크 기반 검색엔진은 사용자의 질의어와 관련된 웹문서들에 대해 링크 정보를 이용하여 순위를 생성한다. 링크 정보는 문서들간의 추천을 나타내므로 중요한 문서를 찾는데 이용할 수 있다. 링크 정보를 이용한 검색은 일반적인 텍스트 기반 검색엔진에 비해 좋은 결과를 낸다고 알려져 있다. 링크 정보를 이용한 검색엔진의 대표적인 예로는 Google과 Clever Search가 있다. 본 논문에서는 링크 정보를 이용한 검색엔진을 개발하고 퍼지 개념 네트워크를 이용하여 개인화를 수행한다. 퍼지 개념 네트워크는 퍼지 문서 추 2654; 시스템을 위한 지식베이스로 이용된다. 사용자 프로파일을 이용하여 사용자별로 퍼지 개념 네트워크를 생성하고 링크 기반 검색 결과를 개인화한다. 3명의 사용자에 대해 실험을 수행하여, 개인화가 주는 효과에 대해 평가한다. 검색결과는 중요한 웹 문서를 찾아 주었으며, 개인화 과정을 통해 사용자가 원하는 순서대로 정렬해 주는 것을 알 수 있었다.다.

  • PDF

GML 문서의 통합 지리 정보 검색을 위한 XQuery의 확장 (A Extension of XQuery for Integrated Geographic Information Retrieval of GML)

  • 안영수;박순영;정원일;배해영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (A)
    • /
    • pp.617-619
    • /
    • 2003
  • GML(Geography Markup Language)은 XML(extensible Markup Language)의 장점을 이용하여 지리 데이터의 저장과 전송을 위해 OGC(Open GIS Consortium)에서 제안되었다 이러한 GML은 웹 환경의 발전에 따라 지리 정보 통합을 위해 널리 이용되고 있으나. GML 문서에 대한 지리 데이터 검색 기술은 미흡하다. 최근 W3C(World Wide Web Consortium)에서는 XML 문서로부터 데이터를 추출하기 위한 표준 질의어로 XQuery를 추천하기 위한 작업 초안(working draft) 상태에 있다. 그러나 이러한 XML 질의어는 지리 정보의 추출에 대한 고려는 하고 있지 않다. 따라서 본 논문에서는 지리 정보를 포함하고 있는 GML 문서를 기반으로 지리 정보를 검색. 추출할 수 있는 GML Query language인 GQuery를 제안하고자 한다. 본 논문의 GQuery는 서로 이질적인 공간 데이터베이스의 데이터를 통할하여. 통합된 문서내의 지리정보를 추출하기 위한 사용자 인터페이스로 이용할 수 있다.

  • PDF

내용 기반 협력적 여과 시스템에서 사용자 프로파일을 이용한 자동 선호도 평가 (Automatic Preference Rating using User Profile in Content-based Collaborative Filtering System)

  • 고수정;최성용;임기욱;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권8호
    • /
    • pp.1062-1072
    • /
    • 2004
  • 협력적 여과 시스템은 {사용자-문서}의 행렬을 기반으로 사용자에게 웹 문서를 추천하는 데 있어서 효율적인 시스템이다. 그러나 협력적 여과 시스템은 초기 평가 문제와 희박성으로 인하여 추천의 정확도가 저하된다는 단점을 갖는다. 본 논문에서는 협력적 여과 시스템의 희박성과 초기 평가 문제를 해결하기 위하여 사용자 프로파일을 생성시킴으로써 자동으로 선호도를 평가하는 방법을 제안한다. 본 논문에서 사용하는 프로파일은 협력적 여과 시스템에서의 {사용자-문서} 행렬을 기반으로 생성된 사용자 프로파일에 내용 기반 여과 시스템에서 연관 피드백을 이용하여 생성한 사용자 프로파일을 상호정보의 방법에 의해 병합함으로써 생성한 내용 기반 협력적 사용자 프로파일이다. 생성한 내용 기반 협력적 사용자 프로파일을 정규화시키고, 정규화한 프로파일을 협력적 여과 시스템의 {사용자-문서} 행렬에 반영함으로써 자동으로 선호도를 평가한다. 제안된 방법은 사용자가 웹 문서에 대해서 선호도를 평가한 데이터베이스에서 평가되었으며, 기존의 방법보다 보다 효율적임을 증명한다.

텍스트 신뢰도 자질 기반 지식 질의응답 문서 품질 평가 모델 (Text-Confidence Feature Based Quality Evaluation Model for Knowledge Q&A Documents)

  • 이정태;송영인;박소영;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권10호
    • /
    • pp.608-615
    • /
    • 2008
  • 불특정 다수 사용자가 정보를 생성하는 지식 질의응답 서비스에서는 문서의 품질이 검색결과 만족도에 중요한 요소 중 하나이다. 지식 질의응답 문서의 품질 평가에 관한 기존 연구는 조회 수와 추천 수 등의 비텍스트 정보를 이용하여 문서의 품질을 평가하고, 이를 검색 모형에 반영하여 검색 성능을 높이는데 집중하였다. 이러한 비텍스트 정보는 그 유용성이 실험을 통해 증명되었다. 그러나 비텍스트 정보를 이용하여 새로 작성된 문서의 품질을 평가할 경우 심각한 자료 부족 문제가 발생할 수 있다는 단점이 있다. 본 논문에서는 이러한 비텍스트 정보의 자료 부족 문제를 완화할 수 있는 새로운 문서 품질 평가자질로서 문서 내용 자체에 대한 신뢰성을 반영하는 신뢰도 자질을 제안한다. 제안하는 자질은 문서의 내용으로부터 직접 추출되며, 따라서 추천 수나 조회 수 등 서비스 사용자의 참여를 간접적으로 필요로 하는 비텍스트 자질보다 자료 부족 문제에 견고하다는 장점이 있다. 또한 제안하는 신뢰도 자질은 문서 품질 평가에 유용하다고 알려진 비텍스트 자질과 유사하거나 향상된 성능을 실제 지식 질의응답 문서를 대상으로 한 실험에서 보였으며, 추후 효과적인 품질 평가 자질로서 지식 질의응답 서비스의 성능향상에 기여를 할 수 있을 것으로 기대된다.