• 제목/요약/키워드: Topic category

검색결과 93건 처리시간 0.025초

Building Topic Hierarchy of e-Documents using Text Mining Technology

  • Kim, Han-Joon
    • 한국전자거래학회:학술대회논문집
    • /
    • 한국전자거래학회 2004년도 e-Biz World Conference
    • /
    • pp.294-301
    • /
    • 2004
  • ·Text-mining approach to e-documents organization based on topic hierarchy - Machine-Learning & information Theory-based ㆍ 'Category(topic) discovery' problem → document bundle-based user-constraint document clustering ㆍ 'Automatic categorization' problem → Accelerated EM with CU-based active learning → 'Hierarchy Construction' problem → Unsupervised learning of category subsumption relation

  • PDF

Analysis of Similarity of Twitter Topic Categories among Regions

  • Yun, Hong-Won
    • Journal of information and communication convergence engineering
    • /
    • 제10권1호
    • /
    • pp.27-32
    • /
    • 2012
  • Twitter can spread and share all kinds of information such as facts, opinions, and ideas in real time. In this paper, we empirically compare and analyze the topic categories in Twitter with all top 100 users in each of geographic region. We mainly consider the relationships among regions and selected four regions: Global, Seoul, Tokyo, and Beijing. Each of the top 100 users in Twitter is classified into a specific category and then statistical analysis is conducted. Among eight topic categories, the "Arts" category is the largest and the second is "Life". The correlation between global and Seoul groups has the lowest value among the six pairs of relationships between regional groups, and this difference is statistically significant. We find that the Seoul, Tokyo, and Beijing regional Twitter groups, all in East Asia, have high topical similarity. Based on the correlation analysis, Seoul and Tokyo saliently show a sticky trend. The correlation coefficient presents very a strong positive correlation between Seoul and Tokyo. The correlation between the global group and the East Asian groups is relatively lower than that among the East Asian groups.

대조주제의 주제성과 초점성 (Topicality and Focality of Contrastive Topic)

  • 위혜경
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.47-70
    • /
    • 2010
  • This study investigates the semantic and prosodic properties of the so-called contrastive topic. We posit two informational primitives, namely, topical feature [+-T] and focal feature [+-F], from which four different informational categories, i.e., [+T, +F], [+T, -F], [-T, +F], and [-T, -F], are yielded. It is proposed that the informational category of contrastive topic has focal property [+F] as well as topical property [+T]. Based on the semantic approach that regards the function of [+F] as identificational predication and that of [+T] as forming a semantic conditional clause, it is shown that the semantic function of contrastive topic, which is specified as [+T, +F], is the combination of these two functions, i.e., identificational predication in a semantic conditional clause. This is supported by a scrutinized exploration of the prosodic pattern of English contrastive topic.

  • PDF

Exploratory Study of Developing a Synchronization-Based Approach for Multi-step Discovery of Knowledge Structures

  • Yu, So Young
    • Journal of Information Science Theory and Practice
    • /
    • 제2권2호
    • /
    • pp.16-32
    • /
    • 2014
  • As Topic Modeling has been applied in increasingly various domains, the difficulty in naming and characterizing topics also has been recognized more. This study, therefore, explores an approach of combining text mining with network analysis in a multi-step approach. The concept of synchronization was applied to re-assign the top author keywords in more than one topic category, in order to improve the visibility of the topic-author keyword network, and to increase the topical cohesion in each topic. The suggested approach was applied using 16,548 articles with 2,881 unique author keywords in construction and building engineering indexed by KSCI. As a result, it was revealed that the combined approach could improve both the visibility of the topic-author keyword map and topical cohesion in most of the detected topic categories. There should be more cases of applying the approach in various domains for generalization and advancement of the approach. Also, more sophisticated evaluation methods should also be necessary to develop the suggested approach.

Major concerns regarding food services based on news media reports during the COVID-19 outbreak using the topic modeling approach

  • Yoon, Hyejin;Kim, Taejin;Kim, Chang-Sik;Kim, Namgyu
    • Nutrition Research and Practice
    • /
    • 제15권sup1호
    • /
    • pp.110-121
    • /
    • 2021
  • BACKGROUND/OBJECTIVES: Coronavirus disease 2019 (COVID-19) cases were first reported in December 2019, in China, and an increasing number of cases have since been detected all over the world. The purpose of this study was to collect significant news media reports on food services during the COVID-19 crisis and identify public communication and significant concerns regarding COVID-19 for suggesting future directions for the food industry and services. SUBJECTS/METHODS: News articles pertaining to food services were extracted from the home pages of major news media websites such as BBC, CNN, and Fox News between March 2020 and February 2021. The retrieved data was sorted and analyzed using Python software. RESULTS: The results of text analytics were presented in the format of the topic label and category for individual topics. The food and health category presented the effects of the COVID-19 pandemic on food and health, such as an increase in delivery services. The policy category was indicative of a change in government policy. The lifestyle change category addressed topics such as an increase in social media usage. CONCLUSIONS: This study is the first to analyze major news media (i.e., BBC, CNN, and Fox News) data related to food services in the context of the COVID-19 pandemic. Text analytics research on the food services domain revealed different categories such as food and health, policy, and lifestyle change. Therefore, this study contributes to the body of knowledge on food services research, through the use of text analytics to elicit findings from media sources.

LDA를 사용한 COVID-19 관련 국내 논문의 연구 토픽 분석 (Research Topic Analysis of the Domestic Papers Related to COVID-19 Using LDA)

  • 김은회;서유화
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.423-432
    • /
    • 2022
  • 본 논문은 학술연구자들이 COVID-19 관련 논문의 전체적인 연구 동향을 파악할 수 있도록 한다. KCI 사이트에서 수집한 2020년 1월부터 2022년 7월까지 총 10,599편의 COVID-19 관련 논문 정보를 LDA 토픽 모델링으로 분석한 결과를 제시한다. 또한 학술연구자들이 자신의 관심 연구분야의 토픽을 쉽게 파악할 수 있도록 LDA 토픽 모델링의 결과를 주요 연구 카테고리별로 분석하고, 토픽별로 연구가 많이 이루어지는 세부 연구 카테고리 정보를 분석한다. 학술연구자들이 시간의 흐름에 따른 연구 토픽의 추세(trend)를 파악하는 것은 연구 동향을 파악하는데 매우 중요하다. 따라서 이를 위해 본 논문에서는 시계열 분해를 사용하여 토픽들의 추세(trend)를 분석하여 제시한다.

단일 카테고리 문서의 다중 카테고리 자동확장 방법론 (A Methodology for Automatic Multi-Categorization of Single-Categorized Documents)

  • 홍진성;김남규;이상원
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.77-92
    • /
    • 2014
  • 텍스트에 대한 사용자의 접근성을 향상시키기 위해, 이들 문서는 정해진 기준에 따라 카테고리로 분류되어 제공되고 있다. 과거에는 카테고리 분류 작업이 수작업으로 수행되었지만, 문서 작성자에게 분류를 맡기는 경우 분류 정확성을 보장할 수 없고 관리자가 모든 분류를 담당하는 경우 많은 시간과 비용이 소요된다는 어려움이 있었다. 이러한 한계를 극복하기 위해 카테고리를 자동으로 식별할 수 있는 문서 분류 기법에 대한 연구가 활발하게 수행되었다. 하지만 대부분의 문서 분류 기법은 각 문서가 하나의 카테고리에만 속하는 경우를 가정하고 있기 때문에, 하나의 문서가 다양한 주제를 갖는 실제 상황과 부합하지 않는다는 한계를 갖는다. 이를 보완하기 위해 최근 문서의 다중 카테고리 식별을 위한 연구가 일부 수행되었으나, 이들 연구는 대부분 이미 다중 카테고리가 부여되어 있는 문서에 대한 학습을 통해 분류 규칙을 생성하므로 단일 카테고리만 부여되어 있는 기존 문서의 다중 카테고리 식별에는 적용할 수 없다는 제약을 갖는다. 따라서 본 연구에서는 이러한 제약을 극복하기 위해, 카테고리, 토픽, 문서간 관계 분석을 통해 단일 카테고리를 갖는 문서로부터 추가 주제를 발굴하여 이를 다중 카테고리로 자동 확장시킬 수 있는 방법론을 제안하였다. 실험 결과 원 카테고리가 식별된 총 24,000건의 문서 중 23,089건에 대해 카테고리를 확장시킬 수 있었다. 또한 정확도 분석에서 카테고리의 특성에 따라 카테고리 분류 정확도가 상이하게 나타나는 현상을 발견하였다. 본 연구는 단일 카테고리로 분류된 문서에 대해 다중 카테고리를 추가로 식별하여 부여함으로써, 규칙 학습 과정에서 다중 카테고리가 부여된 문서를 필요로 하는 기존 다중 카테고리 문서 분류 알고리즘의 활용성을 매우 향상시킬 수 있을 것으로 기대한다.

문단 단위 가중치 함수와 문단 타입을 이용한 문서 범주화 (Automatic Text Categorization Using Passage-based Weight Function and Passage Type)

  • 주원균;김진숙;최기석
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.703-714
    • /
    • 2005
  • 문서 범주화 분야에 대한 연구들은 전체 문서 단위에 한정되어 왔으나, 오늘날 대부분의 전문들이 주요 주제를을 표현하기 위해서 조직화 된 특정 구조로 기술되고 있어, 텍스트 범주화에 대한 새로운 인식이 필요하게 되었다. 이러한 구조는 부주제(Sub-topic)의 텍스트 블록이나 문단(Passage) 단위의 나열로서 표현되는데, 이러한 구조 문서에 대한 부주제 구조를 반영하기 위해서 문단 단위(Passage-based) 문서 범주화 모델을 제안한다. 제안한 모델에서는 문서를 문단들로 분리하여 각각의 문단에 범주(Category)를 할당하고, 각 문단의 범주를 전체 문서의 범주로 병합하는 방법을 사용한다. 전형적인 문서 범주화와 비교할 때, 두 가지 부가적인 절차가 필요한데, 문단 분리와 문단 병합이 그것이다. 로이터(Reuter)의 4가지 하위 집합과 수십에서 수백 KB에 이르는 전문 테스트 컬렉션(KISTl-Theses)을 이용하여 실험하였는데, 다양한 문단 타입들의 효과와 범주 병합 과정에서의 문단 위치의 중요성에 초점을 맞추었다 실험한 결과 산술적(Window) 문단이 모든 테스트 컬렉션에 대해서 가장 좋은 성능을 보였다. 또한 문단은 문서 안의 위치에 따라 주요 주제에 기여하는 바가 다른 것으로 나타났다.

식품영양 분야 연구동향: 지난 21년간 한국식생활문화학회지에 발표된 논문을 중심으로 (A Study on the Trend of Research in Food Science and Nutrition: Published in Journal of the Korean Society of Food Culture for last 21 years)

  • 이윤경;이경원;김유리
    • 한국식생활문화학회지
    • /
    • 제37권5호
    • /
    • pp.385-409
    • /
    • 2022
  • This study investigated the trend of research on 'Food science and Nutrition' in previously published papers in the Journal of Korean Society of Food Culture (JKSFC) from 2000 to 2021. Total number of published papers in this category in the JKSFC was 693 which we classified into 7 main categories and 40 subcategories. Of these, 256 articles were on 'experimental cooking' which was the most studied field among 7 main categories. There was a total of 19 published papers under the category of 'microbiology and fermentation'. A total of 133 articles were published on 'functional foods' and provided essential data for discovering new materials under the theme of various physiological active functions of food materials. Furthermore, 107 articles were included in 'food processing and storage', which provided integrated knowledge of economy, stability and practicality based on various technologies. A total of 144 articles was included in the category of 'nutrition'. Under the category of 'nutrition', the most actively studied topic was 'eating behaviors and dietary habits,' and the trending topic was 'use of healthcare big data.' In conclusion, this review would provide trends of various categories of food science and nutrition area for recent 21 years and suggest directions for future research.

환경 관련 체험학습이 초등학생의 환경소양과 과학적 태도에 미치는 효과 (The Effects of Experiential Learning Involving Co-activities on Elementary School Students' Environmental Literacy and Scientific Attitude)

  • 하병건;김용권
    • 대한지구과학교육학회지
    • /
    • 제8권2호
    • /
    • pp.206-217
    • /
    • 2015
  • The purpose on this study is to identify how effectively experiential learning involving eco-activities make changes in environmental literacy and scientific attitude of elementary students by categorizing those activities into 5 fields of "marine", "rivers", "ecosystem", "climate" and "recycling" and applying those scheme specifically to 5th graders in a elementary school. The conclusion of this study is following. Firstly, after scientific attitude are applied to subjects, a significant disparity was found between experiment group and control group throughout all parts of environmental literacy. In the cognitive category, each specialist concerning his or her own topic was invited to educate the students, and subsequently a positive impact was detected in the category of environmental issue knowledge. In behavioral category, having eco-activities made a significant disparity in all sub-categories of environmental function, active participation, saving activities, recycling activities and so forth. Secondly, experiential learning involving eco-activities made a significant disparity between the two groups in terms of Scientific Attitude, showing effectiveness in all sub-categories except curiosity.