• Title/Summary/Keyword: 문서 추천

Search Result 123, Processing Time 0.024 seconds

WWW Information Retrieval Using a Genetic Algorithm (유전자 알고리즘을 이용한 WWW 정보검색)

  • 서영우;장병탁
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 1998.03a
    • /
    • pp.89-92
    • /
    • 1998
  • 최근 웹 상에서 여러 가지 정보에 대한 접근이 용이하여 많은 사람들이 다양한 검색 시스템을 이용하여 원하는 정보를 얻고 있다. 그러나 웹의 크기가 점점 커지고 그에 따른 사용량 또한 증가함에 딸 원하는 시간 안에 원하는 수준의 정보를 얻기가 매우 어렵다. 본 논문에서는 유전자 알고리즘을 이용하여 사용자의 요구수준에 보다 가까운 저오를 검색하는 학습방법에 대해 고찰한다. 검색 엔진의 초기 검색 결과로부터 만들어진 색인어들이 하나의 염색체로 구성한다. 염색체를 구성하고 있는 각 유전자는 사용자의 기호에 맞는 URL을 추천하기 위해 검색된 문서들과 연관성 값을 비교하여 유전 연산자에 의해 변형된다. 제시된 저오 검색 방식은 기존의 검색 엔진으로부터 반환되는 검색 결과로부터 사용자가 원하는 장보에 연관된 하나 이상의 색인어를 생성한 다음 재검색하여 연관성이 높은 소수의 정보만을 사용자에게 제공한다. 제안된 학습 방식과 기존 검색 엔진으로 검색된 결과를 초기의 사용자 정보 요구와의 연관성에 있어서 비교 분석하였다.

  • PDF

Stocks Recommending System through Classifying News Articles by Positive or Negative Decision (주식 관련 기사 분류 및 긍정 부정 판단을 통한 종목 추천 시스템)

  • Lee, Yoojun;Park, Jungwoo;Jeon, Minjae;Choi, Joonsoo;Hahn, Kwangsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.107-109
    • /
    • 2013
  • 주식 시장에서 거래되고 있는 증권은 MACD(Moving Average Convergence Divergence), Stochastic 등의 보조 지표를 이용하는 기술적 분석을 통하여 매수/매도 시점을 결정한다. 주식 시장의 객관적인 자료를 통하여 분석하는 기술적 분석 방법은 주식 시장 외적인 요소를 반영하는데 있어 한계점이 존재한다. 본 논문에서는 기술적 분석 방법에 기사를 종목별로 분류하고 기사의 긍정 및 부정을 판별하는 문서 분류 기법을 적용하여 주식 외적인 요소를 반영하는 시스템을 제안한다.

  • PDF

A Design of Social Tagging Services for Prevention of Manipulation of Ranking (순위 조작 방지를 위한 소설 태깅 서비스 설계)

  • Jung, Han-Young;Choi, Okkyung;Yeh, Hongjin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.101-104
    • /
    • 2012
  • 최근 소설 네트워크 서비스(Social Netwrok Services)를 활용한 소설 태깅 서비스에 대한 연구가 활발하게 진행 중이다. 특히 태그 기술을 이용한 협력적 태깅 시스템(collaborative tagging system)은 북마크, 문서, 사진, 동영상과 같은 웹 자원을 조직화하고 공유할 수 있는 수단으로 제공하고 있다. 그러나 광고 홍보 목적을 가진 스패머들은 콘텐츠와 관련 없는 태그를 달아 놓아 검색 키워드와 무관한 결과 값이 검색되어 웹 검색 서비스를 이용하는 사용자들에게 불편을 주고 있다. 따라서 본 연구에서는 콘텐츠와 태그의 연관성을 높이기 위해 태그에 일반 사용자가 유사도를 입력할 수 있는 추천 시스템을 적용하여 순위 조작 방지방법을 제안하였다.

  • PDF

A Study on Design and Implement of S&T Information Personalization Service (과학기술정보 개인화 서비스 설계 및 구현)

  • Han, Heejun;Choi, Sungpil
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.206-207
    • /
    • 2018
  • 방대한 정보를 사용자에게 제공하기 위해 검색 엔진은 다양한 알고리즘을 통해 사용자마다의 최적화된 정보를 구성한다. 과제, 논문, 특허, 연구보고서 등 과학기술정보를 서비스 하는 주체 역시 나름의 검색 알고리즘으로 정보를 제공하지만, 질의어와 문서간의 적합도만을 측정하여 검색 결과를 제시할 뿐 사용자의 관심 분야나 요구를 반영하지 않고 있다. 특히 관심 분야에 적합한 과학기술정보를 사용자가 접근하기 쉽게 제공하는 것은 매우 중요하다. 본 논문에서는 사용자 관심분야를 서비스 이용행태로부터 결정하여 이를 과학기술정보 개인화에 반영하는 서비스에 대해 제안하였다. 이를 위해 실시간 관심분야 추적, 관심 태그 클라우드 제공, 관심분야 기반 추천정보 제공, 검색 결과 개인화 네 가지 기능으로 구성된 과학기술정보 개인화 서비스를 설계하고 구현하였다.

A Method on Associated Document Recommendation with Word Correlation Weights (단어 연관성 가중치를 적용한 연관 문서 추천 방법)

  • Kim, Seonmi;Na, InSeop;Shin, Juhyun
    • Journal of Korea Multimedia Society
    • /
    • v.22 no.2
    • /
    • pp.250-259
    • /
    • 2019
  • Big data processing technology and artificial intelligence (AI) are increasingly attracting attention. Natural language processing is an important research area of artificial intelligence. In this paper, we use Korean news articles to extract topic distributions in documents and word distribution vectors in topics through LDA-based Topic Modeling. Then, we use Word2vec to vector words, and generate a weight matrix to derive the relevance SCORE considering the semantic relationship between the words. We propose a way to recommend documents in order of high score.

KMSS: Korean Media Script Dataset for Dialogue Summarization (대화 요약 생성을 위한 한국어 방송 대본 데이터셋 )

  • Bong-Su Kim;Hye-Jin Jun;Hyun-Kyu Jeon;Hye-in Jung;Jung-Hoon Jang
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.198-204
    • /
    • 2022
  • 대화 요약은 다중 발화자와 발화문으로 이루어진 멀티턴 형식의 문서에 대해 핵심내용을 추출하거나 생성하는 태스크이다. 대화 요약 모델은 추천, 대화 시스템 등에 콘텐츠, 서비스 기록에 대한 분석을 제공하는 데 유용하다. 하지만 모델 구축에 필요한 한국어 대화 요약 데이터셋에 대한 연구는 부족한 실정이다. 본 논문에서는 생성 기반 대화 요약을 위한 데이터셋을 제안한다. 이를 위해 국내 방송사의 대용량 콘텐츠로 부터 원천 데이터를 수집하고, 주석자가 수작업으로 레이블링 하였다. 구축된 데이터셋 규모는 6개 카테고리에 대해 약 100K이며, 요약문은 단문장, 세문장, 2할문장으로 구분되어 레이블링 되었다. 또한 본 논문에서는 데이터의 특성을 내재화하고 통제할 수 있도록 대화 요약 레이블링 가이드를 제안한다. 이를 기준으로 모델 적합성 검증에 사용될 디코딩 모델 구조를 선정한다. 실험을 통해 구축된 데이터의 몇가지 특성을 조명하고, 후속 연구를 위한 벤치마크 성능을 제시한다. 데이터와 모델은 aihub.or.kr에 배포 되었다.

  • PDF

A recommender of academic papers using the citation analysis (인용논문 분석을 통한 학술 문서 추천 시스템)

  • Park, Sang-Jin;Kim, Yoon-Hyun;Lee, Ji-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.04a
    • /
    • pp.279-282
    • /
    • 2011
  • 인터넷의 급속한 보급으로 사용자가 정보와 지식의 접근이 용이 해진 반면, 방대한 정보의 과 부화로 인하여 데이터의 신뢰성이 문제시 되고 있다. 특히, 기존의 학술 연구와 관련된 논문 데이터 검색에 있어서, 사용자의 요구 사항에 정확히 부합하는 결과물을 제공하는 데는 많은 한계를 가진다. 본 연구는 기존의 단순 키워드 매칭 검색의 한계를 넘어서, 레퍼런스와 인용 논문을 활용한 내용 기반 검색 방법론을 제안 한다.

Software for Korean Rap Songwriting based on Deep Learning (딥러닝 기반 한국어 랩 작사 소프트웨어)

  • Choi, Kwanghee;Park, Sojin;Kwon, Taeguk;Koo, Myoung-Wan
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.287-289
    • /
    • 2021
  • 해당 소프트웨어는 딥러닝 기반의 언어 모델을 이용하여 한국어 랩을 더 효과적으로 작성할 수 있도록 돕는다. 이 소프트웨어는 단순히 가사를 생성하는 데에 그치지 않고, 라임을 맞추고자 하는 대상 단어와 앞뒤 문맥이 주어졌을 때, 라임과 맥락에 맞는 단어 목록을 추천한다. 작사가는 사용자 친화적인 문서 편집 인터페이스를 통하여 언어 모델과 적극적으로 상호작용을 해 나가며 효율적으로 가사를 만들어나갈 수 있다.

  • PDF

A Method of Mining Visualization Rules from Open Online Text for Situation Aware Business Chart Recommendation (상황인식형 비즈니스 차트 추천기 개발을 위한 개방형 온라인 텍스트로부터의 시각화 규칙 추출 방법 연구)

  • Zhang, Qingxuan;Kwon, Ohbyung
    • The Journal of Society for e-Business Studies
    • /
    • v.25 no.1
    • /
    • pp.83-107
    • /
    • 2020
  • Selecting business charts based on the nature of the data and the purpose of the visualization is useful in business analysis. However, current visualization tools lack the ability to help choose the right business chart for the context. Also, soliciting expert help about visualization methods for every analysis is inefficient. Therefore, the purpose of this study is to propose an accessible method to improve business chart productivity by creating rules for selecting business charts from online published documents. To this end, Korean, English, and Chinese unstructured data describing business charts were collected from the Internet, and the relationships between the contexts and the business charts were calculated using TF-IDF. We also used a Galois lattice to create rules for business chart selection. In order to evaluate the adequacy of the rules generated by the proposed method, experiments were conducted on experimental and control groups. The results confirmed that meaningful rules were extracted by the proposed method. To the best of our knowledge, this is the first study to recommend customizing business charts through open unstructured data analysis and to propose a method that enables efficient selection of business charts for office workers without expert assistance. This method should be useful for staff training by recommending business charts based on the document that he/she is working on.

QualityRank : Measuring Authority of Answer in Q&A Community using Social Network Analysis (QualityRank : 소셜 네트워크 분석을 통한 Q&A 커뮤니티에서 답변의 신뢰 수준 측정)

  • Kim, Deok-Ju;Park, Gun-Woo;Lee, Sang-Hoon
    • Journal of KIISE:Databases
    • /
    • v.37 no.6
    • /
    • pp.343-350
    • /
    • 2010
  • We can get answers we want to know via questioning in Knowledge Search Service (KSS) based on Q&A Community. However, it is getting more difficult to find credible documents in enormous documents, since many anonymous users regardless of credibility are participate in answering on the question. In previous works in KSS, researchers evaluated the quality of documents based on textual information, e.g. recommendation count, click count and non-textual information, e.g. answer length, attached data, conjunction count. Then, the evaluation results are used for enhancing search performance. However, the non-textual information has a problem that it is difficult to get enough information by users in the early stage of Q&A. The textual information also has a limitation for evaluating quality because of judgement by partial factors such as answer length, conjunction counts. In this paper, we propose the QualityRank algorithm to improve the problem by textual and non-textual information. This algorithm ranks the relevant and credible answers by considering textual/non-textual information and user centrality based on Social Network Analysis(SNA). Based on experimental validation we can confirm that the results by our algorithm is improved than those of textual/non-textual in terms of ranking performance.