• 제목/요약/키워드: Topic Feature

검색결과 108건 처리시간 0.02초

An Active Co-Training Algorithm for Biomedical Named-Entity Recognition

  • Munkhdalai, Tsendsuren;Li, Meijing;Yun, Unil;Namsrai, Oyun-Erdene;Ryu, Keun Ho
    • Journal of Information Processing Systems
    • /
    • 제8권4호
    • /
    • pp.575-588
    • /
    • 2012
  • Exploiting unlabeled text data with a relatively small labeled corpus has been an active and challenging research topic in text mining, due to the recent growth of the amount of biomedical literature. Biomedical named-entity recognition is an essential prerequisite task before effective text mining of biomedical literature can begin. This paper proposes an Active Co-Training (ACT) algorithm for biomedical named-entity recognition. ACT is a semi-supervised learning method in which two classifiers based on two different feature sets iteratively learn from informative examples that have been queried from the unlabeled data. We design a new classification problem to measure the informativeness of an example in unlabeled data. In this classification problem, the examples are classified based on a joint view of a feature set to be informative/non-informative to both classifiers. To form the training data for the classification problem, we adopt a query-by-committee method. Therefore, in the ACT, both classifiers are considered to be one committee, which is used on the labeled data to give the informativeness label to each example. The ACT method outperforms the traditional co-training algorithm in terms of f-measure as well as the number of training iterations performed to build a good classification model. The proposed method tends to efficiently exploit a large amount of unlabeled data by selecting a small number of examples having not only useful information but also a comprehensive pattern.

Classifying Social Media Users' Stance: Exploring Diverse Feature Sets Using Machine Learning Algorithms

  • Kashif Ayyub;Muhammad Wasif Nisar;Ehsan Ullah Munir;Muhammad Ramzan
    • International Journal of Computer Science & Network Security
    • /
    • 제24권2호
    • /
    • pp.79-88
    • /
    • 2024
  • The use of the social media has become part of our daily life activities. The social web channels provide the content generation facility to its users who can share their views, opinions and experiences towards certain topics. The researchers are using the social media content for various research areas. Sentiment analysis, one of the most active research areas in last decade, is the process to extract reviews, opinions and sentiments of people. Sentiment analysis is applied in diverse sub-areas such as subjectivity analysis, polarity detection, and emotion detection. Stance classification has emerged as a new and interesting research area as it aims to determine whether the content writer is in favor, against or neutral towards the target topic or issue. Stance classification is significant as it has many research applications like rumor stance classifications, stance classification towards public forums, claim stance classification, neural attention stance classification, online debate stance classification, dialogic properties stance classification etc. This research study explores different feature sets such as lexical, sentiment-specific, dialog-based which have been extracted using the standard datasets in the relevant area. Supervised learning approaches of generative algorithms such as Naïve Bayes and discriminative machine learning algorithms such as Support Vector Machine, Naïve Bayes, Decision Tree and k-Nearest Neighbor have been applied and then ensemble-based algorithms like Random Forest and AdaBoost have been applied. The empirical based results have been evaluated using the standard performance measures of Accuracy, Precision, Recall, and F-measures.

주식시장관리제도와 소셜 미디어의 역할 - 개인 투자자 집단 유형과 토픽 분석 - (The Role of stock market management and social media - Analyzing the types of individual investor and topic -)

  • 김정수;이석준
    • 경영과정보연구
    • /
    • 제34권5호
    • /
    • pp.23-47
    • /
    • 2015
  • 국내 주식시장 내 개인 투자자들은 주식거래를 장기적인 투자방안보다 단기 매매차익 실현 수단으로 인식하고 있어 시장의 투명성과 건전성을 강화하기 위한 주식 시장관리제도의 역할이 중요하다. 특히, 개인 투자자들은 금융정책에 의한 시장조치로 불확실한 상황에 직면하여 투자환경에 따라 동태적 의사결정에 영향을 받게 되므로 투자자 보호를 위한 시장조치의 실효성 여부를 투자자들의 반응과 행동변화를 통해 접근할 필요가 있다. 본 연구는 시장관리 조치(상장적격성 실질심사) 전후로 개인 투자자 집단의 유형 및 반응의 변화추이를 분석하고자 하였다. 분석을 위해, 상장적격성 실질심사 대상기업 중 텍스트 분석이 가능한 9개의 기업을 선정(2009년~2014년)한 후, 국내 주식 관련 소셜 미디어(종목 토론실)로부터 웹 크롤링을 통해 개인들의 메시지를 수집하였다. 사건 발생에 따른 개인 투자자들의 관심사(토픽)와 변화추이는 텍스트 클러스터링과 토픽모델링 방법을 활용하여 개인 투자자 유형을 투자자와 비투자자 집단으로 분류하여 분석하였다. 분석결과, 특정 주식 종목 내 다양한 이해관계자 형태가 존재하며, 실질심사 대상 선정 전후로 비투자자 유형은 감소하고, 투자자는 시장 참여 유형에 따른 비중변화가 나타나는 현상을 발견하였다. 이러한 결과를 토대로 시장 조치에 따른 주식시장 내 제도의 영향을 시간(사건)경과에 따라 개인 투자자들의 반응변화를 통해 파악한 데 본 연구의 의의가 있다.

  • PDF

다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축 (Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents)

  • 장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.595-604
    • /
    • 2004
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어 이상의 개념 수준에서의 문서간 비교를 가능케 한다. 본 논문에서는 다중요인모델에 기반 하여 텍스트 문서로부터 토픽들을 추출하고 이로부터 의미 커널(semantic kernel)을 구축하여 문서간 유사도를 측정하는 방안을 제시한다. 텍스트 문서는 내재된 토픽들의 다양한 결합에 의해 생성된다고 가정하며 하나의 토픽은 공통 주제에 관련되거나 적어도 자주 같이 나타나는 단어들의 집합으로 정의한다. 다중요인모델은 은닉층을 갖는 하나의 네트워크 형태로 표현되며, 토픽을 표현하는 단어 집합은 은닉노드로부터의 가중치가 높은 단어들로 구성된다. 일반적으로 이러한 다중요인 네트워크에서의 학습과 추론과정을 용이하게 하기 위해서는 근사적 확률 추정 기법이 요구되는데, 본 논문에서는 헬름홀츠 머신에 의한 방법을 활용한다. TDT-2 문서 집합에 대한 실험에서 토픽별로 관련 있는 단어 집합들을 추출할 수 있었으며, 4개의 텍스트 집합에 대한문서 검색 실험에서는 다중요인모델의 분석결과에 기반 한 의미 커널을 사용함으로써 기본 벡터공간 모델에 비해 평균정확도 면에서 통계적으로 유의한 수준의 성능 향상을 얻을 수 있었다.

공저자 네트워크 및 토픽 모델링 기반 여가레크리에이션 학술 연구 특징 분석 (The Research Features Analysis of Leisure and Recreation based on Co-authors Network and Topic Model)

  • 박성건;박광원;강현욱
    • 한국체육학회지인문사회과학편
    • /
    • 제57권2호
    • /
    • pp.279-289
    • /
    • 2018
  • 본 연구의 목적은 워드 클라우드와 LDA 토픽 모델링을 이용하여 공저자 네트워크 및 토픽 모델링 기반 여가레크리에이션 학술 연구의 특징을 분석하는 것이다. 웹 크롤러로 수집된 논문은 2008년 1월~2017년 3월 최근 10년 간 한국체육학회 홈페이지에 게재된 총 2,697편이며, 분석 대상은 여가레크리에이션 관련 문헌 369편이다. 분석 결과, 여가레크리에이션 분야 연구자들의 주요 관심사는 참가자와의 관계와 관련된 요인 분석, 다른 변인 간의 관계, 집단별 효과 차이 검증, 운동 참여, 스포츠 참여형태에 관한 연구로 나타났다. 연구자 네트워크에 링크된 수는 451개이며, 연구자들은 평균 1.52회의 관계를 맺고 있고, 연구자 간 평균 거리는 2.33로 나타났다. 대표저자의 연결정도 중심성에서 Lee. K. M., Hwang. S. H., Lee. C. S. 순으로 높게 나타났고, 근접 중심성은 Seo. K. B., Han. J. H., Kim. K. J. 순으로 나타났다. 마지막으로 매개 중심성은 Lee. C. W., Seo. K. B. 순으로 높게 나타나 여가레크리에이션과 관련된 학술 논문의 연구자들 사이를 연결해주는 역할을 가장 활발히 하는 것으로 나타났다. 향후 연구에서는 미래 여가 연구의 추이와 방향성에 관련하여 학자들 간의 논의가 필요하다.

An Adaptive Smart Grid Management Scheme Based on the Coopetition Game Model

  • Kim, Sungwook
    • ETRI Journal
    • /
    • 제36권1호
    • /
    • pp.80-88
    • /
    • 2014
  • Recently, the idea of the smart grid has been gaining significant attention and has become a hot research topic. The purpose of this paper is to present a novel smart grid management scheme that uses game theory principles. In our proposed scheme, power appliances in the smart grid adaptively form groups according to the non-cooperative hedonic game model. By exploiting multi-appliance diversity, appliances in each group are dynamically scheduled in a cooperative manner. For efficient smart grid management, the proposed coopetition game approach is dynamic and flexible to adaptively respond to current system conditions. The main feature is to maximize the overall system performance while satisfying the requirements of individual appliances. Simulation results indicate that our proposed scheme achieves higher energy efficiency and better system performance than other existing schemes.

Socialization and Teen Magazines: What are the Messages?

  • Kim, K.P. Johnson;Mun, Jung-Mee;Ju, Hae-Won;Kang, Ju-Young M.;Kim, Hye-Young;Wu, Juanjuan
    • International Journal of Costume and Fashion
    • /
    • 제11권2호
    • /
    • pp.1-12
    • /
    • 2011
  • As fashion magazines are important socialization influences, our purpose was to examine the content of articles in two teen magazines: one with a long publication history (Seventeen) and one relatively new market entry (Teen Vogue). We addressed the following questions: (1) What are the patterns of content of the feature articles? (2) How frequently is this content related to appearance management or fashion consumption? and (3) What, if any, differences exist in contents between the traditional teen magazine and the new market entry? A content analysis of 1,191 articles published during 2008 and 2009 revealed the largest percentage of content in both magazines was fashion. Other than the topic of fashion, Seventeen concentrated on teen life issues whereas Teen Vogue focused on celebrities. Understanding these are fashion publications, we suggest there are opportunities for both magazines to allocate further attention to other issues in the lives of teens in addition to beauty and consumption.

일면지지식 Extradosed교의 계획 및 설계 (Plan IE Design Of Extradosed Bridge Supported by Single Plane Cables)

  • 이종대;이두화;권소진;김종수;손준상
    • 한국콘크리트학회:학술대회논문집
    • /
    • 한국콘크리트학회 2001년도 가을 학술발표회 논문집
    • /
    • pp.615-620
    • /
    • 2001
  • The aim of this paper is to open up a relatively new type in bridge engineering by introducing plan and design of extradosed bridge which is implemented in Sungnam-Janghowon T/K project. The topic encompasses parametric study including the behavior of the bridge relevant to the cable layout, the distance from pier table to the first cable's location, the height of pylon, the stiffness of cross section and wind vibration to ascertain sectional type of bridge and span length. For the purpose of the knowledge base presented here, the important feature of design is recommended such as modeling method, camber control, finite element analysis and heat hydration of pier table. We can verify the issue related to the characteristics of extradosed bridge as a result of study and design endeavor.

  • PDF

NFC 태그 정보를 이용한 검색 정보의 군집 시스템 모델 (Clustering System Model of Intormation Retrieval using NFC Tag Information)

  • 박선;김형균;심수정
    • 스마트미디어저널
    • /
    • 제2권3호
    • /
    • pp.17-22
    • /
    • 2013
  • NFC 스마트폰의 보급 증가는 앱과 연계하여 다양한 서비스를 제공하고 있으며, 단순한 인터넷 서비스를 개인화 서비스로 변화 시킬 것으로 예상되고 있다. 본 논문은 정보 접근을 위한 NFC 태그의 정보를 이용하여 유사정보를 활용할 수 있도록 검색 정보를 군집하는 시스템 모델을 제안한다. 제안된 모델을 NFC 태그에서 제공하는 정보를 이용하여 유사 정보를 검색할 수 있다. 또한 검색된 유사정보를 사용자가 활용할 수 있도록 주제별 군집할 수 있다.

  • PDF

출입 이벤트 인식 (Event recognition of entering and exiting)

  • 취야오환;이창우
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제38차 하계학술발표논문집 16권1호
    • /
    • pp.199-204
    • /
    • 2008
  • Visual surveillance is an active topic recently in Computer Vision. Event detection and recognition is one important and useful application of visual surveillance system. In this paper, we propose a new method to recognize the entering and exiting events based on the human's movement feature and the door's state. Without sensors, the proposed approach is based on novel and simple vision method as a combination of edge detection, motion history image and geometrical characteristic of the human shape. The proposed method includes several applications such as access control in visual surveillance and computer vision fields.

  • PDF