• Title/Summary/Keyword: 키워드-기반 시스템

Search Result 517, Processing Time 0.028 seconds

A Term Cluster Query Expansion Model Based on Classification Information of Retrieval Documents (검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델)

  • Kang, Hyun-Su;Kang, Hyun-Kyu;Park, Se-Young;Lee, Yong-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.7-12
    • /
    • 1999
  • 정보 검색 시스템은 사용자 질의의 키워드들과 문서들의 유사성(similarity)을 기준으로 관련 문서들을 순서화하여 사용자에게 제공한다. 그렇지만 인터넷 검색에 사용되는 질의는 일반적으로 짧기 때문에 보다 유용한 질의를 만들고자 하는 노력이 지금까지 계속되고 있다. 그러나 키워드에 포함된 정보가 제한적이기 때문에 이에 대한 보완책으로 사용자의 적합성 피드백을 이용하는 방법을 널리 사용하고 있다. 본 논문에서는 일반적인 적합성 피드백의 가장 큰 단점인 빈번한 사용자 참여는 지양하고, 시스템에 기반한 적합성 피드백에서 배제한 사용자 참여를 유도하는 검색 문서의 분류 정보에 기반한 용어 클러스터 질의 확장 모델(Term Cluster Query Expansion Model)을 제안한다. 이 방법은 검색 시스템에 의해 검색된 상위 n개의 문서에 대하여 분류기를 이용하여 각각의 문서에 분류 정보를 부여하고, 문서에 부여된 분류 정보를 이용하여 분류 정보의 수(m)만큼으로 문서들을 그룹을 짓는다. 적합성 피드백 알고리즘을 이용하여 m개의 그룹으로부터 각각의 용어 클러스터(Term Cluster)를 생성한다. 이 클러스터가 사용자에게 문서 대신에 피드백의 자료로 제공된다. 실험 결과, 적합성 알고리즘 중 Rocchio방법을 이용할 때 초기 질의보다 나은 성능을 보였지만, 다른 연구에서 보여준 성능 향상은 나타내지 못했다. 그 이유는 분류기의 오류와 문서의 특성상 한 영역으로 규정짓기 어려운 문서가 존재하기 때문이다. 그러나 검색하고자 하는 사용자의 관심 분야나 찾고자 하는 성향이 다르더라도 시스템에 종속되지 않고 유연하게 대처하며 검색 성능(retrieval effectiveness)을 향상시킬 수 있다.사용되고 있어 적응에 문제점을 가지기도 하였다. 본 연구에서는 그 동안 계속되어 온 한글과 한잔의 사용에 관한 논쟁을 언어심리학적인 연구 방법을 통해 조사하였다. 즉, 글을 읽는 속도, 글의 의미를 얼마나 정확하게 이해했는지, 어느 것이 더 기억에 오래 남는지를 측정하여 어느 쪽의 입장이 옮은 지를 판단하는 것이다. 실험 결과는 문장을 읽는 시간에서는 한글 전용문인 경우에 월등히 빨랐다. 그러나. 내용에 대한 기억 검사에서는 국한 혼용 조건에서 더 우수하였다. 반면에, 이해력 검사에서는 천장 효과(Ceiling effect)로 두 조건간에 차이가 없었다. 따라서, 본 실험 결과에 따르면, 글의 읽기 속도가 중요한 문서에서는 한글 전용이 좋은 반면에 글의 내용 기억이 강조되는 경우에는 한자를 혼용하는 것이 더 효율적이다.이 높은 활성을 보였다. 7. 이상을 종합하여 볼 때 고구마 끝순에는 페놀화합물이 다량 함유되어 있어 높은 항산화 활성을 가지며, 아질산염소거능 및 ACE저해활성과 같은 생리적 효과도 높아 기능성 채소로 이용하기에 충분한 가치가 있다고 판단된다.등의 관련 질환의 예방, 치료용 의약품 개발과 기능성 식품에 효과적으로 이용될 수 있음을 시사한다.tall fescue 23%, Kentucky bluegrass 6%, perennial ryegrass 8%) 및 white clover 23%를 유지하였다. 이상의 결과를 종합할 때, 초종과 파종비율에 따른 혼파초지의 건물수량과 사료가치의 차이를 확인할 수 있었으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract

  • PDF

A Study on the Optimization of Semantic Relation of Author Keywords in Humanities, Social Sciences, and Art and Sport of the Korea Citation Index (KCI) (한국학술지인용색인(KCI)의 인문학, 사회과학, 예술체육 분야 저자키워드의 의미적 관계 유형 최적화 연구)

  • Ko, Young Man;Song, Min-Sun;Lee, Seung-Jun
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.49 no.1
    • /
    • pp.45-67
    • /
    • 2015
  • The purpose of this study is to analyse the semantic relations of terms in STNet, a structured terminology dictionary based on author keywords of humanities, social sciences, and art and sport in the Korea Citation Index (KCI) and to describe the procedure for optimizing the relation types and specifying the name of relationships. The results indicate that four logical criteria, such as creating new names for relationships or limitation of typing the relationship by the appearance frequency of same type, consideration of direction of relationship, reflection to accept the existing name of relationships, are required for the optimization of the typing and naming the relationships. We applied these criteria to the relationships in the class "real person" of STNet and the result shows that 1,135 out of 1,743 uncertain relationships such as RT, RT_X or RT_Y are specified and clarified. This rate of optimization with ca. 65% represents the usefulness of the criteria applicable to the cases of database construction and retrieval.

Retrieval Model using Subject Classification Table, User Profile, and LSI (전공분류표, 사용자 프로파일, LSI를 이용한 검색 모델)

  • Woo Seon-Mi
    • The KIPS Transactions:PartD
    • /
    • v.12D no.5 s.101
    • /
    • pp.789-796
    • /
    • 2005
  • Because existing information retrieval systems, in particular library retrieval systems, use 'exact keyword matching' with user's query, they present user with massive results including irrelevant information. So, a user spends extra effort and time to get the relevant information from the results. Thus, this paper will propose SULRM a Retrieval Model using Subject Classification Table, User profile, and LSI(Latent Semantic Indexing), to provide more relevant results. SULRM uses document filtering technique for classified data and document ranking technique for non-classified data in the results of keyword-based retrieval. Filtering technique uses Subject Classification Table, and ranking technique uses user profile and LSI. And, we have performed experiments on the performance of filtering technique, user profile updating method, and document ranking technique using the results of information retrieval system of our university' digital library system. In case that many documents are retrieved proposed techniques are able to provide user with filtered data and ranked data according to user's subject and preference.

A Study on Social Perception of Young Children with Disabilities through Social Media Big Data Analysis (소셜 미디어 빅데이터 분석을 통한 장애 유아에 대한 사회적 인식 연구)

  • Kim, Kyoung-Min
    • Journal of the Korea Convergence Society
    • /
    • v.13 no.2
    • /
    • pp.1-12
    • /
    • 2022
  • The purpose of this study is to identify the social perception characteristics of young children with disabilities over the past decade. For this purpose, Textom, an Internet-based big data analysis system was used to collect data related to young children with disabilities posted on social media. 50 keywords were selected in the order of high frequency through the data cleaning process. For semantic network analysis, centrality analysis and CONCOR analysis were performed with UCINET6, and the analyzed data were visualized using NetDraw. As a result, the keywords such as 'education, needs, parents, and inclusion' ranked high in frequency, degree, and eigenvector centrality. In addition, the keywords of 'parent, teacher, problem, program, and counseling' ranked high in betweenness centrality. In CONCOR analysis, four clusters were formed centered on the keywords of 'disabilities, young child, diagnosis, and programs'. Based on these research results, the topics on social perception of young children with disabilities were investigated, and implications for each topic were discussed.

A Model of Natural Language Information Retrieval Using Main Keywords and Sub-keywords (주 키워드와 부 키워드를 이용한 자연언어 정보 검색 모델)

  • Kang, Hyun-Kyu;Park, Se-Young
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.12
    • /
    • pp.3052-3062
    • /
    • 1997
  • An Information Retrieval (IR) is to retrieve relevant information that satisfies user's information needs. However a major role of IR systems is not just the generation of sets of relevant documents, but to help determine which documents are most likely to be relevant to the given requirements. Various attempts have been made in the recent past to use syntactic analysis methods for the generation of complex construction that are essential for content identification in various automatic text analysis systems. Unfortunately, it is known that methods based on syntactic understanding alone are not sufficiently powerful to Produce complete analyses of arbitrary text samples. In this paper, we present a document ranking method based on two-level ranking. The first level is used to retrieve the documents, and the second level to reorder the retrieved documents. The main keywords used in the first level can be defined as nouns and/or compound nouns that possess good document discrimination powers. The sub-keywords used in the second level can be also defined as adjectives, adverbs, and/or verbs that are not main keywords, and function words. An empirical study was conducted from a Korean encyclopedia with 23,113 entries and 161 Korean natural language queries collected by end users. 850% of the natural language queries contained sub-keywords. The two-level document ranking methods provides significant improvement in retrieval effectiveness over traditional ranking methods.

  • PDF

Sentiment Prediction using Emotion and Context Information in Unstructured Documents (비정형 문서에서 감정과 상황 정보를 이용한 감성 예측)

  • Kim, Jin-Su
    • Journal of Convergence for Information Technology
    • /
    • v.10 no.10
    • /
    • pp.40-46
    • /
    • 2020
  • With the development of the Internet, users share their experiences and opinions. Since related keywords are used witho0ut considering information such as the general emotion or genre of an unstructured document such as a movie review, the sensitivity accuracy according to the appropriate emotional situation is impaired. Therefore, we propose a system that predicts emotions based on information such as the genre to which the unstructured document created by users belongs or overall emotions. First, representative keyword related to emotion sets such as Joy, Anger, Fear, and Sadness are extracted from the unstructured document, and the normalized weights of the emotional feature words and information of the unstructured document are trained in a system that combines CNN and LSTM as a training set. Finally, by testing the refined words extracted through movie information, morpheme analyzer and n-gram, emoticons, and emojis, it was shown that the accuracy of emotion prediction using emotions and F-measure were improved. The proposed prediction system can predict sentiment appropriately according to the situation by avoiding the error of judging negative due to the use of sad words in sad movies and scary words in horror movies.

The Path Inverted Index Technique for XML Document Retrieval (XML 문서 검색을 위한 경로 역 색인 기법)

  • Moon, Kyung-Won;Hwang, Byung-Yeon
    • The KIPS Transactions:PartD
    • /
    • v.17D no.2
    • /
    • pp.103-110
    • /
    • 2010
  • Recently, many XML document management systems using the advantage of RDBMS have been actively developed for the storage, processing and retrieval of XML documents. However, fractional pattern-matching query such as the LIKE operations cannot take the advantage of the index of RDBMS because these operations have deteriorated retrieval performance through its inefficient comparison processing. The hierarchical XML storage technique which stores XML documents in RDBMS efficiently, and the path inverted index technique are proposed in this paper. It regards the element of an XML document as a keyword, and focuses on organizing a posting file with path identifiers and sequences to reduce the retrieval time of path based query. Through simulations, our methods have shown about 60% better performance than the conventional method using RDBMS in searching.

Adaptive Video Browsing Service Using User Profile (사용자 프로파일을 이용한 적응력 있는 비디오 브라우징 서비스)

  • 고경철;신성윤;임정훈;이양원
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2001.11a
    • /
    • pp.308-313
    • /
    • 2001
  • 최근 인터넷의 급속한 성장과 빠른 보급, 정보통신 분야의 기술퓨전 현상들은 인터넷을 이용한 다양한 컨텐츠의 개발을 가속화시키고 있다. 특히 멀티미디어 스트리밍 기술은 일반 사용자들에게 동영상은 물론 풍부한 멀티미디어 데이터 전송을 통하여 능동적인 대화형 서비스를 제공할 수 있는 장점들을 가지고 있다. 본 논문에서는 사용자의 접속 횟수 및 접속시간 등의 빈도수에 따른 사용자 개인 가중치를 이용하여 사용자에게 보다 친숙하고 흥미를 유발할 수 있는 비디오 데이터 서비스를 제공하고자 하였으며, 카테고리 기반 및 키워드 기반에 따른 사용자 접근 정보를 이용하여 비디오 데이터를 분류하고 선별한 검색 서비스를 제공하고자 하였다. 또한 비디오 브라우징 시스템을 이용하여 사용자가 원하는 항목에 대한 비디오 검색을 장면 검색에서 샷 검색까지 프레임단위로 동영상을 이용하여 브라우징 할 수 있도록 하였으며, 해당 영역의 텍스트 및 관련 정보를 보다 세밀하고 정확하게 브라우징 할 수 있도록 정보를 제공하고자 하였다.

  • PDF

A Metadata-based Effective Browsing Method for PVR System (PVR 시스템에서 메타데이터 기반의 효과적인 브라우징 방법)

  • Kim, Jae-Mok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.589-591
    • /
    • 2005
  • 디지털 기술이 나날이 발전함에 따라 정지영상 압축 기술의 대표적이라 찰 수 있는 JPEG이 탄생하면서 디지털 임상은 급격한 발전을 거듭해 왔다. 이에 동영상 압축 기술 MPEG이 탄생하였고, MPEG은 1, 2, 4 를 비롯하여 7, 21로 발전을 거듭하고 있다. PVR은 방송을 디지털로 저장하는 기기로써 시청자가 원하는 시간에 원하는 방송을 시청할 수 있게 해 준다. PVR이 많은 컨텐츠를 저장할 수 있게 되자, 사용자는 컨텐츠에 대한 효과적인 검색 및 브라우징을 필요로 하고 있다. 본 논문에서는 컨텐츠를 기술하는 메타데이터를 이용한 의미기반 브라우징 방법을 제안한다. 제안하는 방법에서는 메타데이터에 있는 키워드와 인물정보, 장르, MPEG-7의 color descriptor를 이용한다.

  • PDF

Study on Service type of Wireless GIS in Public sector (공공분야 무선 GIS 서비스 유형에 관한 연구)

  • 김은형;박준구
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.147-166
    • /
    • 2004
  • 최근 정보기술의 동향을 살펴보면 공통적인 키워드를 발견할 수 있는데, 그것은 바로 모바일(Mobile)이다. 이에 GIS 분야에서도 무선환경에서의 GIS 활용을 위한 기술이 확산되고 있으며, 대표적인 기술로 LBS(Location Based Service)와 모바일 GIS(Mobile GIS)가 있다. 이러한 배경하에 선진국가에서는 고도화된 전자정부 구현을 위해 무선 GIS 기술적용이 추진되고 있으며, 국내에서도 모바일 전자정부 추진계획이 수립되었다. 이에 본 논문에서는 공공분야에서 효율적인 무선 GIS 기술도입을 위해 공공분야의 무선 GIS라는 개념을 제시하고, 무선 GIS 서비스 구현의 기반이 되는 서비스 유형을 제시하였다. 공공분야의 무선 GIS 서비스 유형은 LBS와 모바일 GIS를 기반으로 적용 가능한 업무유형과 무선 GIS 특성에 따른 서비스 구조로 구분하여 고찰하였으며, 두 내용을 종합하여 공공분야의 무선 GIS 서비스유형을 제시하였다. 제시된 무선 GTS 서비스 유형은 향후 모바일 전자정부 및 공공분야에서의 모바일 관련 GIS 서비스 구현시 참조할 수 있을 것이라 예상된다.

  • PDF