• 제목/요약/키워드: 주제 기반

검색결과 1,752건 처리시간 0.031초

토픽모델링과 주성분 분석을 활용한 온라인 쇼핑 검색 질의 유형 분류 (A Study on the Types of Online Shopping Queries using Topic Modeling and Principal Components Analysis)

  • 강현아;임희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.765-768
    • /
    • 2020
  • 검색 질의 연구 분야의 대부분 선행 연구는 검색 질의 주제 분류에 집중되어 있으며 질의 자체에 대한 연구자의 정성적인 판단으로 분석되었다. 이는 검색 이후 클릭 된 문서를 고려하지 않고 진행되었다는 점과 분석 주제 및 활용 데이터가 제한적이라는 것에 한계가 있다. 이에 본 연구는 국내 대형 온라인쇼핑몰의 1년간의 검색로그를 활용하여 검색 질의와 검색 이후 조회한 문서명 정보를 기반으로 토픽모델링을 수행하여 검색 질의 주제를 정의하였다. 또한 검색 행동특성에 따른 주제별 성격을 정의하기 위하여 주성분 분석을 통해 주요 변수 추출 후 각 주제별 검색 행동특성을 분석하였다. 본 연구 결과는 효과적인 검색 서비스 구축 및 검색 시스템 개발에 기여 할 것으로 기대된다. 향후 연구로는 텍스트 분류기 모델링 실험을 통해 자동 분류 시스템을 구현할 수 있을 것이다.

제로 레스 디지털콘텐츠 세미나

  • 권경희
    • 디지털콘텐츠
    • /
    • 10호통권137호
    • /
    • pp.82-83
    • /
    • 2004
  • 모바일을 기반으로 한 애니메이션 서비스를 주제로 세미나가 열렸다. 한국소프트웨어진흥원은 1분영상제 사무국과 공동으로 지난달 17일 종로구 동숭동 제로원디자인센터에서‘제로 레스(Zero Res) 디지털콘텐츠 세미나’를 개최했다. 모바일 애니메이션을 주제로 한 이 세미나에서는 모바일상에서의 애니메이션 제작에 관련된 기획과 기술, 다양한 사례연구를 다뤘다.

  • PDF

컴퓨터 보안 훈련을 위한 웹 기반 교수 시스템 (Web-based ITS fort Training Computer Security)

  • 최진우;우종우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.703-705
    • /
    • 2002
  • 최근 컴퓨터 해킹이 커다란 사회적 문제로 대두되고 있다. 물론 시스템 보호를 위한 많은 상용 제품들이 존재하지만, 침입피해 상황에서는 대부분의 경우, 시스템 관리자의 현장 경험에 의존하는 실정이다. 따라서 시스템 관리자는 기존의 침입에 관한 해결방법 뿐만 아니라, 새로운 위협들에 대한 대처방안을 항상 준비 하여야 한다. 이러한 침입상황을 시스템 관리자들에게 교육하기 위하여, 본 논문에서는 모의 훈련환경을 설계하고 구현하였다. 본 시스템의 특징은 우선, 지식베이스로부터 동적으로 생성되는 학습 주제들로 이루어진 교과 과정을 학습자에게 제시한다. 학습자에 의해 선택된 학습 주제는 학습목표로 간주되고, 이 주제는 교수 계획에 의해 다수의 임무(mission)들을 생성한다. 학습자는 각 임무에서 주어진 상황을 가상의 UNIX명령어들을 직접 사용하여 모의 실험해 봄으로써 임무 완수에 필요한 지식을 숙지할 수 있게 된다. 시스템은 임무 완수에 요구되는 해 경로(solution paths)를 유지함으로써, 학습자의 문제 해결 과정을 감독할 수 있고, 도움을 요구하거나 실수를 할 때 적절한 힌트를 제공한다. 시스템은 웹 기반의 클라이언트/서버 구조로 설계되어, 학습자는 브라우저만으로도 학습이 가능하고, 자바 애플릿으로 이루어진 가상 운영체제 하에서 직접 침입대처 상황을 학습 할 수 있다.

  • PDF

문서의 의미특징을 이용한 주제 기반의 다중문서 요약 (Topic-Based Multi-Document Summarization using Semantic Features of Documents)

  • 박선;안동언;김철원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.715-716
    • /
    • 2009
  • 인터넷의 발전은 대량의 정보를 양산하였고, 이러한 대량의 정보 집합 내에서는 비슷한 정보가 재활용 되거나 반복되는 정보중복문제를 가지고 있다. 중복되는 정보들로부터 사용자에게 원하는 정보를 신속히 검색할 수 있도록 하는 정보 요약에 대한 필요성은 점차 증가하고 있다. 본 논문은 비음수 행렬 인수분해(NMF, non-negative matrix factorization)에 의한 문서의 의미특징을 이용하여 주제기반의 다중문서를 요약하는 새로운 방법을 제안한다. 본 논문에서는 다중문서가 포함하고 있는 문서들 간의 고유구조를 문서요약에 이용하여서 요약의 질을 높일 수 있고, 주제와 문장 간의 유사성과 다양성 고려하여서 쉽게 과잉정보를 제거하여 문장을 요약할 수 있는 장점을 갖는다.

대학도서관의 주제전문사서제 운영방안 연구 - 3개 대학도서관의 서비스 사례 분석을 중심으로 - (A Study on Operational Plan of Subject Specialist Librarian at Academic Libraries : Focus on Case Analysis of Three Academic Libraries)

  • 정재영
    • 한국도서관정보학회지
    • /
    • 제40권3호
    • /
    • pp.119-136
    • /
    • 2009
  • 대학이 학문적 주제를 기반으로 하기 때문에 대학도서관의 서비스도 주제를 기초로 이루어지는 것이 바람직하다. 이에 따라, 최근 몇몇 대학도서관을 중심으로 주제전문사서제가 도입되고 적용 사례가 소개되고 있지만, 제공서비스에 대한 충분한 장 단점 분석과 도입에 따른 방향성이 점검되고 있지는 못한 실정이다. 따라서, 본 연구는 주제전문사서제를 도입한 3개 대학도서관에 대한 사례 분석을 통해 적용을 위한 선결과제와 효과적인 운영방안을 제시하고자 하였다. 분석결과, 주제전문사서제를 도입한 3개 대학도서관은 역할, 인사, 평가 등에서 도입초기에 따른 다양한 문제를 보이고 있는 것으로 나타나 향후 이에 대한 보완이 시급한 것으로 조사되었다. 또한, 주제전문사서제의 도입을 위해서는 도서관내부의 합의과정과 교내 구성원에 대한 홍보가 필수적이며, 지속적인 주제전문사서 충원 및 평가, 보상체계의 마련과 함께, 장기적으로는 서비스의 지속성과 효과를 담보할 수 있는 주제전문사서 및 서비스 제공대학 간 협력체계가 필요한 것으로 조사되었다.

  • PDF

대체자료 선정을 위한 이용자 참여형 도서 추천 큐레이션 플랫폼 설계 (Design of the Curation Platform for User-participated Book Recommendation System of Selecting on Alternative Material for the Disabled)

  • 조현양
    • 한국문헌정보학회지
    • /
    • 제54권3호
    • /
    • pp.41-69
    • /
    • 2020
  • 이 연구의 목적은 이용자 선호도 및 관심분야 정보 수집을 위한 웹 기반의 프로파일링 모델을 활용하여 이용자 선호도 기반의 대체자료 추천 시스템의 개발과 정보 추천 모델의 핵심이 되는 도서자동분류엔진을 설계하고 시범 구축하는 것이다. 이용자 선호도 기반의 대체자료 선정 방법론을 개발하기 위해 국가대체자료공유시스템인 DREAM의 이용자 대체자료 이용 내역을 분석하여 KDC의 10개 주제 분야별 대체자료에 대한 이용자 선호도를 조사하였다. 이용 내역 데이터의 표제 정보를 분석하여 주제 분야별로 그리고 조사대상 기간별로 관심 키워드를 도출하였으며, 도출된 키워드를 주제 분야별로 순위화하였다. 주제별과 기간별로 순위화된 키워드는 이용자 선호도를 나타내는 것으로 출판된 도서 가운데 대체자료 제작 대상을 선정하는데 활용할 수 있다. 또한 이용자 선호도 기반의 대체자료 선정을 위하여 국립장애인도서관의 내부 데이터뿐만 아니라 타 도서관이나 다양한 유관 기관의 서비스 및 이용 내역을 반영하기 위한 연계방안을 제안하였다.

장르와 주제 범주간 용어 편차정보를 이용한 디지털 문서의 장르기반 분류 (A Genre-based Classification of Digital Documents by using Deviation Statistic of Genre-revealing Term and Subject-revealing Term)

  • 이용배;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1062-1071
    • /
    • 2003
  • 장르기반 분류는 문서를 내용이나 주제가 아닌 문서의 형식 또는 스타일에 의해 분류하는 것을 의미한다. 현재 장르분류 방법은 기존의 주제기반 분류방법에 사용되었던 알고리즘을 그대로 이용하거나 자질선택 방법에 있어서도 효과적이지 못하고 비교적 단순하여 분류 정확률 또한 상대적으로 낮았다. 본 연구에서는 장르기반으로 문서를 자동 분류할 수 있는 새로운 방법론을 제시한다. 장르분류 방법은 크게 두 가지 정보를 이용하여 학습과 분류를 하는데 장르 간 용어의 편차정보와 장르 내에 분포되어 있는 주제 범주 간 용어의 편차정보를 이용한다. 제안된 방법의 성능을 측정하기 위해 인터넷상에서 정제되지 않은 문서를 수집하였으며 이를 대상으로 실험한 결과 기존의 카이제곱 자질선택 방법 및 베이지안 분류 알고리즘과 비교하여 약 30% 정도 우수한 정확도를 나타내었다.

web 데이터베이스의 디렉토리 설계를 위한 분류체계 연구 (A Study on the classification scheme for the design of Directory Search Engine on the web)

  • 이명희
    • 한국비블리아학회지
    • /
    • 제10권1호
    • /
    • pp.243-268
    • /
    • 1999
  • 이 연구는 인터넷 기반 분류체계를 제공하는 주제별 디렉토리인 Yahoo Korea와 Argus Clearinghouse, DDC의 분류체계, ERIC시소러스의 분류체계, KEDI교육 시소러스의 분류체계를 비교. 분석하여 봄으로써 웹 주제별 디렉토리의 교육학 학술정보의 분류체계의 모형을 구축하기 위해 시도되었다. 이들의 분류체계는 주제범위의 포괄성, 분류체계의 논리성, 주제 용어의 정확성 탐색의 효율성의 4가지 척도를 가지고 분석되었다. 새로운 교육학 학술정보를 위한 검색엔진의 분류체계 모형은 학술적인 면과 실용적인 면을 고려하여 주제영역의 내용, 정보자료의 형태, 이용자의 탐색의 효율성을 고려하여 16개의 대구분 주제항목과 47개의 중구분 주제항목으로 전개되어 구축되었다.

  • PDF

주제어 가중치 기법에 의한 효율적인 블로그 검색 시스템 (Efficient Blog Retrieval System by Topic-based Weighting)

  • 신현일;윤은일;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.1-9
    • /
    • 2010
  • Web 2.0으로 불리는 새로운 세대의 웹에서, 블로그를 통하여 누구나 손쉽게 정보나 의견을 세상에 알릴 수 있게 되었고 이러한 블로그를 효과적으로 검색하기 위해서 블로그의 특성을 고려한 검색 알고리즘들이 새롭게 제안이 되고 있다. 그러나 실제 블로그 검색 시스템에 적용된 키워드 기반 검색이나 블로그간의 링크 분석을 통한 랭킹만으로는 사용자가 기대하는 성능을 발휘하지 못한다. 본 논문에서는 검색 결과를 향상시키기 위해 블로그 글과 검색어와의 연관성을 고려한 주제어 가중치 기반의 블로그검색 시스템을 제안한다. 제안된 시스템은 블로그 글 마다 주제어(Topic)를 추출하여 색인어보다 더 높은 가중치를 부여한다. 기존 시스템과의 비교에서 제안된 방법이 실제 검색 결과에서 재현율이 향상됨을 알 수 있었다.

텍스트 마이닝을 이용한 한국정보통신학회 논문지의 주제 분석 (Topic Analysis of Papers of JKIICE Using Text Mining)

  • 우영운;조경원;이광의
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 추계학술대회
    • /
    • pp.74-75
    • /
    • 2017
  • 이 논문에서는 2007년부터 2016년까지 한국정보통신학회 논문지(JKIICE)에 게재된 3,668편의 논문들의 연구 주제 분야를 파악하기 위해 텍스트 마이닝 기법을 이용하여 논문들을 분석하였다. 자료수집을 위하여 Python 기반의 웹 스크랩핑 프로그램을 사용하였으며, 자료 분석을 위해서는 R 언어로 구현된 LDA 알고리즘 기반의 토픽 모델링 기법들을 활용하였다. 연구 결과, 2016년까지 JKIICE의 투고 분야는 19개였으나 실제 최근 10년 동안 게재된 전체 논문들의 연구 주제는 크게 9가지로 대표됨을 알 수 있었다.

  • PDF