• Title/Summary/Keyword: 주제와 연관성

Search Result 247, Processing Time 0.024 seconds

Issue summarization scheme based on real-time SNS trend analysis (실시간 SNS 트렌드 분석에 기반한 이슈 요약 기법)

  • Kim, Daeyong;Kim, Daehoon;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.1096-1097
    • /
    • 2013
  • 최근 Twitter를 비롯한 소셜 네트워크 서비스의 급속한 확산으로 인해, 많은 수의 SNS 메시지가 실시간으로 생성되고 있다. 이러한 SNS 상의 모든 글을 읽어보는 것은 현실적으로 불가능하며, 여러 포탈 사이트에서 제공되는 실시간 검색어 순위만으로는 상세 내용을 직관적으로 파악하기 어렵다. 따라서, 이러한 SNS상의 글을 실시간으로 분석하여 최신의 트렌드를 찾고 이와 연관된 내용을 분류 및 요약할 수 있다면, 사용자에게 유용한 최신 정보를 생성하여 제공할 수 있다. 본 논문에서는 Tweet 들을 분석하여 얻은 트렌드 키워드를 기반으로 관련된 Tweet 들을 주제 별로 분류한 후, 각 주제 별로 세부 내용을 요약해서 제공하는 기법을 제안한다. 제안하는 기법은 실시간으로 생성되는 Tweet 내에서 최근 화제가 된 트렌드 및 연관 키워드를 추출해낸다. 그 후, 해당 키워드가 출현한 Tweet 내에서 핵심 키워드를 찾고, 이를 기반으로 Tweet 들을 각각의 주제별로 분류하고 각 주제를 '이슈'로 정의한다. 마지막으로, 특정한 이슈에 해당되는 Tweet들을 분석하여 각 이슈 별로 키워드 리스트 및 단문 형식으로 요약된 줄거리를 생성한다. 제안된 기법을 바탕으로 프로토타입 시스템을 구현하고, 다양한 실험을 통하여 이슈 검출 기법의 유용성 면에서 성능을 평가한다.

Relation Analysis Among Academic Research Areas Using Subject Terms of Domestic Journal Papers (국내 학술지 논문의 주제어를 통한 학술연구분야 관계분석)

  • Lee, Hye-Young;Kwak, Seung-Jin
    • Journal of the Korean BIBLIA Society for library and Information Science
    • /
    • v.22 no.3
    • /
    • pp.353-371
    • /
    • 2011
  • The purpose of this paper is to analyze the interrelation among research areas based on domestic journal papers, achievements of korea researchers. Generally, the content of papers is appeared through abstracts, subjects, full-text and so on. This paper is focused on subject terms of Domestic journal papers. The experimental data are 80 domestic journals, 7,616 papers and 58,143 subject terms and papers published in 2009. As the result, it was different to use subject terms on each research area: Engineering, Agriculture & Oceanography, Interdisciplinary Science, Social Science, Arts & Physical Education, Medicine & Pharmacology, Humanities and Natural Science. Subject terms of Engineering have used the most in the other research areas in aspect of term co-occurrence. The 8 research areas were grouped in 3 clusters: C1(Engineering, Natural Science, Social Science, Interdisciplinary Science, Humanities), C2(Medicine & Pharmacology, Arts & Physical Education), and C3(Agriculture & Oceanography).

A Language Model based Knowledge Network for Analyzing Disaster Safety related Social Interest (재난안전 사회관심 분석을 위한 언어모델 활용 정보 네트워크 구축)

  • Choi, Dong-Jin;Han, So-Hee;Kim, Kyung-Jun;Bae, Eun-Sol
    • Proceedings of the Korean Society of Disaster Information Conference
    • /
    • 2022.10a
    • /
    • pp.145-147
    • /
    • 2022
  • 본 논문은 대규모 텍스트 데이터에서 이슈를 발굴할 때 사용되는 기존의 정보 네트워크 또는 지식 그래프 구축 방법의 한계점을 지적하고, 문장 단위로 정보 네트워크를 구축하는 새로운 방법에 대해서 제안한다. 먼저 문장을 구성하는 단어와 캐릭터수의 분포를 측정하며 의성어와 같은 노이즈를 제거하기 위한 역치값을 설정하였다. 다음으로 BERT 기반 언어모델을 이용하여 모든 문장을 벡터화하고, 코사인 유사도를 이용하여 두 문장벡터에 대한 유사성을 측정하였다. 오분류된 유사도 결과를 최소화하기 위하여 명사형 단어의 의미적 연관성을 비교하는 알고리즘을 개발하였다. 제안된 유사문장 비교 알고리즘의 결과를 검토해 보면, 두 문장은 서술되는 형태가 다르지만 동일한 주제와 내용을 다루고 있는 것을 확인할 수 있었다. 본 논문에서 제안하는 방법은 단어 단위 지식 그래프 해석의 어려움을 극복할 수 있는 새로운 방법이다. 향후 이슈 및 트랜드 분석과 같은 미래연구 분야에 적용하면, 데이터 기반으로 특정 주제에 대한 사회적 관심을 수렴하고, 수요를 반영한 정책적 제언을 도출하는데 기여할 수 있을 것이다

  • PDF

Exploring the Research Topic Networks in the Technology Management Field Using Association Rule-based Co-word Analysis (연관규칙 기반 동시출현단어 분석을 활용한 기술경영 연구 주제 네트워크 분석)

  • Jeon, Ikjin;Lee, Hakyeon
    • Journal of Technology Innovation
    • /
    • v.24 no.4
    • /
    • pp.101-126
    • /
    • 2016
  • This paper identifies core research topics and their relationships by deriving the research topic networks in the technology management field using co-word analysis. Contrary to the conventional approach in which undirected networks are constructed based on normalized co-occurrence frequency, this study analyzes directed networks of keywords by employing the confidence index of association rule mining for pairs of keywords. Author keywords included in 2,456 articles published in nine international journals of technology management in 2011~2014 are extracted and categorized into three types: THEME, METHOD, and FIELD. One-mode networks for each type of keywords are constructed to identify core research keywords and their interrelationships with each type. We then derive the two-mode networks composed of different two types of keywords, THEME-METHOD and THEME-FIELD, to explore which methods or fields are frequently employed or studied for each theme. The findings of this study are expected to be fruitfully referred for researchers in the field of technology management to grasp research trends and set the future research directions.

Trend of Research and Industry-Related Analysis in Data Quality Using Time Series Network Analysis (시계열 네트워크분석을 통한 데이터품질 연구경향 및 산업연관 분석)

  • Jang, Kyoung-Ae;Lee, Kwang-Suk;Kim, Woo-Je
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.5 no.6
    • /
    • pp.295-306
    • /
    • 2016
  • The purpose of this paper is both to analyze research trends and to predict industrial flows using the meta-data from the previous studies on data quality. There have been many attempts to analyze the research trends in various fields till lately. However, analysis of previous studies on data quality has produced poor results because of its vast scope and data. Therefore, in this paper, we used a text mining, social network analysis for time series network analysis to analyze the vast scope and data of data quality collected from a Web of Science index database of papers published in the international data quality-field journals for 10 years. The analysis results are as follows: Decreases in Mathematical & Computational Biology, Chemistry, Health Care Sciences & Services, Biochemistry & Molecular Biology, Biochemistry & Molecular Biology, and Medical Information Science. Increases, on the contrary, in Environmental Sciences, Water Resources, Geology, and Instruments & Instrumentation. In addition, the social network analysis results show that the subjects which have the high centrality are analysis, algorithm, and network, and also, image, model, sensor, and optimization are increasing subjects in the data quality field. Furthermore, the industrial connection analysis result on data quality shows that there is high correlation between technique, industry, health, infrastructure, and customer service. And it predicted that the Environmental Sciences, Biotechnology, and Health Industry will be continuously developed. This paper will be useful for people, not only who are in the data quality industry field, but also the researchers who analyze research patterns and find out the industry connection on data quality.

Recruiting Ranking Techniques Based on Hybrid Using Clustering (군집화를 이용한 하이브리드 기반 채용검색 랭킹 기법)

  • Cho, Bo-Yun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1587-1590
    • /
    • 2012
  • 인터넷의 활용이 보편화 됨에 따라 정보의 양은 급격히 늘어나고 있다. 이에 취업을 희망하는 구직자의 경우 IR 로부터 원하는 정보를 검색하기 위해 과거보다 더 많은 시간과 노력이 필요하게 되었다. 이에 본 논문에서는 TF(Term Frequency)기법을 통해 문서를 추출하고 추출된 문서의 Doc_ID 빈도수를 기준으로 한 내용기반과 군집기법을 혼합한 하이브리드 검색 시스템을 제안한다. 구직자들이 클릭한 취업정보들의 링크번호들을 K-means 알고리즘을 이용하여 군집화를 한다. 생성된 군집들은 각기 하나의 문서로 가정하고, 기존 문서과 더불어 검색 주제와 연관성을 갖고 있는 문서들을 동적비율로 검색 랭킹 하는 방식이다. 기존의 IR 기술과의 비교 실험을 통해 성능을 평가하였다. 실험결과 본 논문에서 제안한 방법이 기존의 방법보다 우수함을 확인할 수 있었다

Sustainability Report Analysis Using Transformer-Based Topic Modeling (Transformer 기반의 토픽 모델링을 이용한 지속가능경영보고서 분석)

  • Lee, Hanwool;Lee, Jihyun;Lee, Junheui
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.464-467
    • /
    • 2022
  • 기업의 사회적 책임에 대한 요구가 높아짐에 따라 기업의 지속 가능 경영 보고서 발간은 증가 추세를 보이고 있다. 그러나 이전까지의 연구는 지속가능성 및 기업의 재무적, 비재무적 연관성에 초점이 맞춰져 있었으며, 전통적인 토픽 모델링 기법만을 제한적으로 사용한다는 한계를 보였다. 본 연구에서는 Transformer 기반의 맥락을 고려한 토픽 모델링 기법을 도입하여 다양한 이해관계자 측면에서 이용 가능한 25 개의 주제를 도출하였다. 또한 동적 토픽 모델링(Dynamic Topic Modeling)을 통해 주제의 변화를 시계열적으로 파악했다.

A Study on the Analysis of Intellectual Structure of Korean Veterinary Sciences (국내 수의과학 분야의 지적 구조 분석에 관한 연구)

  • Cho, Hyun-Yang
    • Journal of Information Management
    • /
    • v.43 no.2
    • /
    • pp.43-66
    • /
    • 2012
  • The purpose of this study is to see the intellectual structure in the field of veterinary sciences in Korea, using author profiling analysis(APA), a bibliometric approach. Three journals are selected on the basis of citation data, exchanging most citations with Korean Journal of Veterinary. And then, 50 authors who published most articles at selected journals during the given period of time were chosen. The analysis of similarity and dissimilarity among authors by comparing co-word appearance patterns from article title, abstracts, and keywords was made. Authors can be grouped 11 minor clusters under 4 major clusters, depending on their interests in the area of veterinary sciences in Korea. The subjects for each cluster at the veterinary sciences are decided by the matching the keyword, representing author's research interest. As a result, it is possible to figure out the current research trends and the researcher network in the field of veterinary sciences.

서울인쇄센터, 인쇄경영자반 교육

  • Korean Printers Association
    • 프린팅코리아
    • /
    • v.7 no.8
    • /
    • pp.70-75
    • /
    • 2008
  • 서울인쇄센터(이사장 조정석)는 인쇄업계 경영자를 대상으로 새로운 인쇄 환경의 변화와 신기술을 접할 수 있도록 '새로운 인쇄기술 환경과 경영전략'이란 주제로 7월 한 달간 교육을 실시했다. 인쇄산업과 연관성이 있는 다양한 분야의 전문가들을 초빙하여 이루어진 이번 교육을 통해 전문지식 함양은 물론 공동 관심사에 대한 정보 교류의 장이 되었다는 평가다. 이번 교육은 인쇄정보센터 2층 교육장에서 매주 월.수.금 오전 7시부터 8시 30분까지 1시간 30분씩 진행됐다. 교육 첫날인 7월 2일에는 한국 하이델베르그(주) 김범식 사장이 '세계 인쇄시장 및 기자재의 최신 동향'이란 내용으로 교육이 진행됐다. 다음은 김범식 사장의 강연 내용을 요약한 것이다.

  • PDF

A Study of Visualization by Page Connection of Web Sites (웹 사이트의 페이지 연관성에 관한 시각화 연구)

  • Kim, Young-Jin;Lee, Kyung-Won
    • 한국HCI학회:학술대회논문집
    • /
    • 2008.02b
    • /
    • pp.358-363
    • /
    • 2008
  • 인터넷 웹사이트의 규모가 커지면서 그 안에 담고 있는 정보의 양과 종류가 많아지고 복잡해지고 있다. 이에 사용자는 같은 사이트 내에서도 정보를 찾는 것에 어려움을 느끼고 있다. 이에 대한 해결책으로써 웹사이트 안에 있는 각 페이지들의 하이퍼링크 정보로부터 얻어낸 연결 정보를 분석하여 그 안에서 관계성을 추출 하고 이를 관련 있는 페이지들끼리의 모임으로 분류해서 시각화 하는 방법을 제안하였다. 본 논문에서는 시각화 인터페이스로써 태양계의 행성들을 메타포로 이용하였다. 즉 웹사이트 안의 페이지는 하나의 행성의 모습으로 표현되고, 페이지들의 하이퍼링크에 의한 연결된 수는 중력으로써 다른 페이지를 끌어 당기는 힘으로 사용된다. 이때 행성의 모습으로 시각화된 모든 페이지들은 서로의 끌어당기는 힘에 악해 유기적으로 재배치되는 모습의 인터랙션을 제공한다. 서로 다른 사이트는 구성 페이지들의 연관관계에 따라서 서로 다른 태양계의 모습으로 표현될 것이다. 결국 이 연구는 사용자에게 웹사이트의 대략적인 성격을 파악하는 것에 도움을 주고 웹 사이트 안에서의 페이지 탐색 시, 관련 주제의 정보가 속해있는 비슷한 페이지 들을 알려 줌으로써 보다 효율적인 정보 검색을 돕는다.

  • PDF