• 제목/요약/키워드: Topic Change Detection

검색결과 10건 처리시간 0.029초

인스턴트 메시징에서의 대화 주제 및 주제 전환 탐지 (Topic and Topic Change Detection in Instance Messaging)

  • 최윤정;신욱현;정윤재;맹성현;한경수
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권7호
    • /
    • pp.59-66
    • /
    • 2008
  • 본 논문에서는 인스턴트 메시징(Instant Messaging), 채팅과 같은 텍스트 기반의 대화에서 현재 발화를 기준으로 대화의 주제를 파악하고, 대화 주제 전환 여부를 판단하는 기법에 대해 기술한다. 대화는 다른 종류의 글과 다르게 길이가 매우 짧아 적은 수의 단어를 사용하고, 두 사람 이상이 참여를 하며, 대화의 이력(History)이 현재의 발화에 영향을 미친다. 이러한 특성에 따라 본 논문에서는 사용자 발화 뿐 아니라 대화 상대자의 발화에서 추출한 키워드 기반으로 주제 탐지를 하며, 대화의 이력도 고려하여 대화 주제 탐지의 정확도를 높힌 연구 결과를 기술한다. 대화주제 전환 탐지는 이전 발화와 현재 발화에서 탐지된 주제의 유사성을 계산하여, 유사성이 낮은 경우에 전환 탐지가 이루어졌다고 판단하였다. 본 논문의 실험에서 대화 주제 탐지는 88.20%. 대화 주제 전환 탐지는 87.36%의 정확도를 얻었다.

  • PDF

A Comparison of Scene Change Localization Methods over the Open Video Scene Detection Dataset

  • Panchenko, Taras;Bieda, Igor
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.1-6
    • /
    • 2022
  • Scene change detection is an important topic because of the wide and growing range of its applications. Streaming services from many providers are increasing their capacity which causes the industry growth. The method for the scene change detection is described here and compared with the State-of-the-Art methods over the Open Video Scene Detection (OVSD) - an open dataset of Creative Commons licensed videos freely available for download and use to evaluate video scene detection algorithms. The proposed method is based on scene analysis using threshold values and smooth scene changes. A comparison of the presented method was conducted in this research. The obtained results demonstrated the high efficiency of the scene cut localization method proposed by authors, because its efficiency measured in terms of precision, recall, accuracy, and F-metrics score exceeds the best previously known results.

Statistical Properties of News Coverage Data

  • Lim, Eunju;Hahn, Kyu S.;Lim, Johan;Kim, Myungsuk;Park, Jeongyeon;Yoon, Jihee
    • Communications for Statistical Applications and Methods
    • /
    • 제19권6호
    • /
    • pp.771-780
    • /
    • 2012
  • In the current analysis, we examine news coverage data widely used in media studies. News coverage data is usually time series data to capture the volume or the tone of the news media's coverage of a topic. We first describe the distributional properties of autoregressive conditionally heteroscadestic(ARCH) effects and compare two major American newspaper's coverage of U.S.-North Korea relations. Subsequently, we propose a change point detection model and apply it to the detection of major change points in the tone of American newspaper coverage of U.S.-North Korea relations.

자동 트렌드 탐지를 위한 속성의 정의 및 트렌드 순위 결정 방법 (Trend Properties and a Ranking Method for Automatic Trend Analysis)

  • 오흥선;최윤정;신욱현;정윤재;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권3호
    • /
    • pp.236-243
    • /
    • 2009
  • 특허, 뉴스, 블로그와 같이 시간 정보가 있는 문서들로부터의 자동적인 트렌드 분석(trend analysis)은 토픽탐지 및 추적 기술(TDT: Topic Detection and Tracking)과 더불어 중요한 연구 분야로 대두되고 있다. 과거 연구들은 대부분 트렌드과 관련된 단어의 출현 빈도 정보를 이용하여 주어진 개념의 중요도를 측정하고 이 개념의 시간에 따른 트렌드 라인을 보여주는 것에 초점을 맞췄다. 신출 트렌드 (emerging trend)를 탐지하기 위해서는 주어진 개념의 출현 빈도수 변화와 같은 간단한 방법이나 학습 데이타와 비교하여 차이를 탐지하여 제시하는 방법이 사용되었다. 그러나 여러 트렌드 중에서 특징적인 트렌드를 찾아서 사용자에게 제공하기 위해서는 트렌드 순위 결정 함수가 필요하다. 본 논문은 트렌드의 다양한 측면을 정량화하기 위하여 출현 빈도로 구성된 트렌드 곡선으로부터 네 가지 속성 (변동성, 지속성, 안정성, 누적량) 을 정의하고 이를 활용한 트렌드 순위 결정 방법을 제안한다. 일련의 실험을 통하여 각 속성의 유용성을 검증하고 속성들의 조합이 순위 결정에 어떤 영향을 미치는지 분석하였다. 실험결과로부터 네 가지 속성을 모두 조합할 경우 특징적인 트렌드 탐지에 더욱 기여하는 것을 알 수 있다.

Research on Brand Value Dimensions of Employers: Based on Online Reviews by the Employees

  • XU, Meng
    • The Journal of Asian Finance, Economics and Business
    • /
    • 제9권10호
    • /
    • pp.215-225
    • /
    • 2022
  • This study investigates employees' online reviews, conducts in-depth text topic mining, effectively summarizes the dimensions of employer brand value, and seeks effective ways to build employer brands from a multi-dimensional perspective. This study employs samples of employer reviews, filter keywords according to word frequency-inverse document frequency, builds a review network containing the same keywords, explore the community and summarize the theme dimensions. Simultaneously, it makes a dynamic comparison and analysis of the employer brand value dimension of different industries and enterprises. The study shows that the community exploration theme can be summarized into 11 dimensions of employer brand value, and the dimensions of employer brand value are significantly different across industries and among different enterprises within the industry. The attention to the employer brand value dimension has a significant time change. Various industries pay increasing attention to the dimension of work intensity and career development, while employers pay steady attention to the dimension of welfare benefits. The findings of this study suggest that seeking the heterogeneity of employer brand resources from the multi-dimensional differences and changes is an effective way to improve the competitiveness of enterprises in the human capital market.

Graphene Coated Optical Fiber SPR Biosensor

  • Kim, Jang Ah;Hwang, Taehyun;Dugasani, Sreekantha Reddy;Kulkarni, Atul;Park, Sung Ha;Kim, Taesung
    • 한국진공학회:학술대회논문집
    • /
    • 한국진공학회 2014년도 제46회 동계 정기학술대회 초록집
    • /
    • pp.401-401
    • /
    • 2014
  • In this study, graphene, the most attractive material today, has been applied to the wavelength-modulated surface plasmon resonance (SPR) sensor. The optical fiber sensor technology is the most fascinating topic because of its several benefits. In addition to this, the SPR phenomenon enables the detection of biomaterials to be label-free, highly sensitive, and accurate. Therefore, the optical fiber SPR sensor has powerful advantages to detect biomaterials. Meanwhile, Graphene shows superior mechanical, electrical, and optical characteristics, so that it has tremendous potential to be applied to any applications. Especially, grapheme has tighter confinement plasmon and relatively long propagation distances, so that it can enhance the light-matter interactions (F. H. L. Koppens, et al., Nano Lett., 2011). Accordingly, we coated graphene on the optical fiber probe which we fabricated to compose the wavelength-modulated SPR sensor (Figure 1.). The graphene film was synthesized via thermal chemical vapor deposition (CVD) process. Synthesized graphene was transferred on the core exposed region of fiber optic by lift-off method. Detected analytes were biotinylated double cross-over DNA structure (DXB) and Streptavidin (SA) as the ligand-receptor binding model. The preliminary results showed the SPR signal shifts for the DXB and SA binding rather than the concentration change.

  • PDF

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

Epidemiology Characteristics and Trends of Incidence and Morphology of Stomach Cancer in Iran

  • Almasi, Zeinab;Rafiemanesh, Hosein;Salehiniya, Hamid
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제16권7호
    • /
    • pp.2757-2761
    • /
    • 2015
  • Background: Stomach cancer is the fourth most common cancer and the second leading cause of cancer-related death through the world. It is predicted that the number of new cancer cases will be more than 15 million cases by 2020. Regarding the lack of studies on this topic in the country, we have thoroughly examined the patho-epidemiology of stomach cancer in Iran. Materials and Methods: In this cross- sectional study data were collected retrospectively reviewing all new stomach cancer patients in Cancer Registry Center report of health deputy for Iran during a 6-year period (2003-2008). The study also examined the morphology of common stomach cancers. Trends in incidence and morphology underwent joinpoint regression analysis. Results: During the six-year period, a total of 35,171 cases of stomach cancer were registered. Average age standardized rate for females and males were equal to 7.1 and 15.1 per 100,000 persons, respectively. Most common histological type was adenocarcinoma, NOS with 21,980 cases (62.50%). The annual percentage change (APC) in age-standardized incidence rate (per 100,000) was increase in both females and males at 11.1 (CI: 4.3 to 18.3) and 9.2 (CI: 5.2 to 13.4), respectively. Conclusions: According to our results, the incidence of gastric cancer is increasing in Iran, so further epidemiological studies into the etiology and early detection are essential.

트위터(twitter)에서의 파라벤(parabens) 관련 대중의 인식 변화와 치약내 파라벤에 대한 연구 현황 (Changes in public recognition of parabens on twitter and the research status of parabens related to toothpaste)

  • 오효정;전재규
    • Journal of Korean Academy of Oral Health
    • /
    • 제41권2호
    • /
    • pp.154-161
    • /
    • 2017
  • Objectives: The purpose of this study was to investigate changes in public recognition of parabens on Twitter and the research status of parabens related to toothpaste. Methods: Tweet information between 2010 and October 2016 was collected by an automatic web crawler and examined according to tweet frequency, key words (2012-October 2016), and issue tweet detection analyses to reveal changes in public recognition of parabens on Twitter. To investigate the research status of parabens related to toothpaste, queries such as "paraben," "paraben and toxicity," "paraben and (toothpastes or dentifrices)," and "paraben and (toothpastes or dentifrices) and toxicity" were used. Results: The number of tweets concerning parabens sharply increased when parabens in toothpaste emerged as a social issue (October 2014), and decreased from 2015 onward. However, toothpaste and its related terms were continuously included in the core key words extracted from tweets from 2015. They were not included in key words before 2014, indicating that the emergence of parabens in toothpaste as a social issue plays an important role in public recognition of parabens in toothpaste. The issue tweet analysis also confirmed the change in public recognition of parabens in toothpaste. Despite the expansion of public recognition of parabens in toothpaste, there are only seven research articles on the topic in PubMed. Conclusions: The general public clearly recognized parabens in toothpaste after emergence of parabens in toothpaste as a social issue. Nevertheless, the scientific information on parabens in toothpaste is very limited, suggesting that the efforts of dental scientists are required to expand scientific knowledge related to parabens in oral hygiene measures.

스토리텔링 콘텐츠의 효과적인 관리를 위한 영화 스토리 발단부의 자동 경계 추출 (Extracting Beginning Boundaries for Efficient Management of Movie Storytelling Contents)

  • 박승보;유은순;정재은
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.279-292
    • /
    • 2011
  • 영화는 스토리를 전달하는 대표적인 매체 중의 하나이며 영화 속 스토리는 인물, 사건, 배경의 유기적인 연결을 통해 진행된다. 소설과 같이 스토리를 지닌 다른 매체와 마찬가지로 영화 역시 서사 구조를 갖고 있다. 즉 등장인물 간의 갈등과 해결이 인과 관계에 따라 전개된다. 영화의 서사구조는 아리스토텔레스의 3막 구조를 가지며 6단계로 세분화 될 수 있다. 전통적인 3막 구조는 발단부, 중반부, 결말부로 구성된다. 발단부는 영화에 등장하는 인물이나 배경을 소개하고 사건의 실마리와 갈등을 암시하는 장치들을 제시한다. 중반부는 내외적인 요인들에 의해 사건이 발전하고 갈등과 긴장을 고조시키는 부분이다. 결말부에서는 사건이 해결되면서 스토리의 주제 및 작가의 메시지가 전달된다. 특히 발단부는 스토리 진행을 위해 등장인물의 성격을 설정하고 배경을 지시하는 등의 다양한 정보가 노출되는 부분이기 때문에 영화의 축약이나 등장인물들의 중요한 정보를 추출할 수 있는 중요한 부분이다. 따라서 영화의 스토리를 추출할 경우 서사구조에 따라 가중치를 다르게 부여할 필요가 있다. 본 논문에서는 등장인물 수를 누적한 그래프를 이용하여 발단부와 중반부의 경계를 추출하는 방법을 제시한다. 발단부에서는 주요 등장인물이 소개되고 이들 간의 갈등이 암시되거나 사건의 실마리가 제시된다. 따라서 주요 등장인물의 등장이 마무리되는 장면에서 일정 장면이 진행된 이후의 장면이 발단부와 중반부의 경계가 된다. 주요 등장인물은 주인공과 적대자, 그리고 주인공과 적대자를 보조해 주는 각각의 보조자(조연)로 구성되기 때문에 등장인물 수 누적 그래프에서 주요 등장인물의 등장이 마무리되는 장면을 찾기 위해서는 단역을 제거하여야 한다. 또한 주요 등장인물이 더 이상 등장하지 않는 변곡점을 찾는 방법이 필요하다. 이를 위해 본 논문에서는 단역이 제거된 등장인물 수 누적 그래프를 그린 후 변곡점을 찾는 방법을 제안한다. 실제 발단부와 중반부의 경계는 주요 등장인물의 출현이 마무리 된 후 갈등과 사건의 실마리가 암시되는 추가적인 장면이 진행된 후에 나타난다. 따라서 다수의 영화를 통해 추가적인 장면의 개수를 설정하는 실험을 진행할 것이다.