• 제목/요약/키워드: Visual Data Mining Information Visualization

검색결과 7건 처리시간 0.02초

CiteSpace 적용을 통한 디지털 보존 지식영역 비주얼화 연구 (A Study on Visualization of Digital Preservation Knowledge Domain Using CiteSpace)

  • 김희정
    • 한국문헌정보학회지
    • /
    • 제39권4호
    • /
    • pp.89-104
    • /
    • 2005
  • 디지털 보존 주제분야를 중심으로 지식영역 비주얼화(knowledge domain visualization)를 시도하였다. 분석을 위한 데이터는 1990년부터 2005년까지의 기간 동안의 Web of Science DB를 중심으로 총 74건의 문헌을 추출하여 활용하였다. 지식영역 비주얼화를 위하여 사용한 툴은 서지DB를 중심으로 비주얼 데이터마이닝 결과를 제공하는 Java 어플리케이션인 CiteSpace이다. 분석 결과, 디지털 보존 분야의 핵심적인 지식 영역은 최신정보기술을 중심으로 한 디지털 보존전략, 정보네트워크와 보존시스템, 전자정부와 지식관리의 세 영역인 것으로 나타났다.

비주얼 애널리틱스 연구 소개 (Introduction to Visual Analytics Research)

  • 오유상;이충기;오주영;양지현;곽희나;문성우;박소환;고성안
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제22권5호
    • /
    • pp.27-36
    • /
    • 2016
  • 컴퓨터 그래픽스 (Computer Graphics) 및 인간-컴퓨터 상호작용 (Human-Computer Interaction, HCI) 기술을 기반으로 효과적인 데이터 분석을위한 가시화 툴 (Tool) 기술이 크게 발전 하였다. 해당 기술 분야는 Visual Analytics (비주얼애널리틱스)라는 연구 분야로 발전하여 2006년 첫 심포지엄이 열린 이래, 다양한 데이터 마이닝 (Data Mining), 상호작용 (Interaction) 기술이 정보 가시화 (Information Visualization) 기술에 접목하여 사용자 중심의 빅 데이터분석 및 의사 결정 시스템을 연구하는 분야로 확장 되었다. 그러나 국내에서는 아직 해당 연구 분야에 대하여 제대로 알려지지 않아, 국내 컴퓨터 그래픽스 및 HCI 기술 연구에 비하여, 가시화 기술을 통한 빅데이터 분석 및 의사결정을 지원하는 시스템을 설계 하는 기술이 뒤쳐지는 편이다. 따라서 본 논문에서는 비주얼 애널리틱스 연구의 기본 철학을 살펴 보고, IEEE Symposium on Visual Analytics Science and Technology (VAST) 학회에 2015년 출판된 논문으로 사용된 데이터 및 가시화 기술 분석 서베이를 진행함으로써 국내 컴퓨터 그래픽스 연구자들의 해당 분야에 대한 이해를 돕고자 한다.

유용한 연관 규칙 추출을 위한 시각적 탐색 기반 접근법 (Visual Exploration based Approach for Extracting the Interesting Association Rules)

  • 김준우;강현경
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권9호
    • /
    • pp.177-187
    • /
    • 2013
  • 연관 규칙 탐사는 다양한 분야에서 널리 쓰이는 데이터 마이닝 기법으로 트랜잭션 데이터에 포함된 이산적인 항목들 간의 인과관계를 추출하는데 목적을 둔다. 하지만 분석자들은 때로 방대한 양의 데이터에서 추출된 많은 연관규칙들을 해석하고 활용하는데 곤란을 겪기도 한다. 이러한 문제점을 해결하기 위하여 본 논문에서는 주어진 트랜잭션 데이터에서 유용한연관 규칙을 탐색하기 위한 새로운 방법인 HTM 접근법을 제안하고자 한다. HTM 접근법은 크게 계층 군집, 테이블 뷰 및 모자이크 플롯의 세 가지 단계로 구성되며, 각 단계는 분석자들에게 적절한 시각적 표현을 제공한다. 예시를 위해 본 논문에서는 상기 접근법을 건강 검진 결과 데이터 분석에 적용하였으며, 실험결과 HTM 접근법을 통해 분석자들은 유용한 규칙들을 보다 효과적으로 탐색할 수 있을 것으로 기대된다.

The BIOWAY System: A Data Warehouse for Generalized Representation & Visualization of Bio-Pathways

  • Kim, Min Kyung;Seo, Young Joo;Lee, Sang Ho;Song, Eun Ha;Lee, Ho Il;Ahn, Chang Shin;Choi, Eun Chung;Park, Hyun Seok
    • Genomics & Informatics
    • /
    • 제2권4호
    • /
    • pp.191-194
    • /
    • 2004
  • Exponentially increasing biopathway data in recent years provide us with means to elucidate the large-scale modular organization of the cell. Given the existing information on metabolic and regulatory networks, inferring biopathway information through scientific reasoning or data mining of large scale array data or proteomics data get great attention. Naturally, there is a need for a user-friendly system allowing the user to combine large and diverse pathway data sets from different resources. We built a data warehouse - BIOWAY - for analyzing and visualizing biological pathways, by integrating and customizing resources. We have collected many different types of data in regards to pathway information, including metabolic pathway data from KEGG/LIGAND, signaling pathway data from BIND, and protein information data from SWISS-PROT. In addition to providing general data retrieval mechanism, a successful user interface should provide convenient visualization mechanism since biological pathway data is difficult to conceptualize without graphical representations. Still, the visual interface in the previous systems, at best, uses static images only for the specific categorized pathways. Thus, it is difficult to cope with more complex pathways. In the BIOWAY system, all the pathway data can be displayed in computer generated graphical networks, rather than manually drawn image data. Furthermore, it is designed in such a way that all the pathway maps can be expanded or shrinked, by introducing the concept of super node. A subtle graphic layout algorithm has been applied to best display the pathway data.

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

빅데이터 분석을 활용한 스마트팩토리 연구 동향 분석 (Analysis of Smart Factory Research Trends Based on Big Data Analysis)

  • 이은지;조철호
    • 품질경영학회지
    • /
    • 제49권4호
    • /
    • pp.551-567
    • /
    • 2021
  • Purpose: The purpose of this paper is to present implications by analyzing research trends on smart factories by text analysis and visual analysis(Comprehensive/ Fields / Years-based) which are big data analyses, by collecting data based on previous studies on smart factories. Methods: For the collection of analysis data, deep learning was used in the integrated search on the Academic Research Information Service (www.riss.kr) to search for "SMART FACTORY" and "Smart Factory" as search terms, and the titles and Korean abstracts were scrapped out of the extracted paper and they are organize into EXCEL. For the final step, 739 papers derived were analyzed using the Rx64 4.0.2 program and Rstudio using text mining, one of the big data analysis techniques, and Word Cloud for visualization. Results: The results of this study are as follows; Smart factory research slowed down from 2005 to 2014, but until 2019, research increased rapidly. According to the analysis by fields, smart factories were studied in the order of engineering, social science, and complex science. There were many 'engineering' fields in the early stages of smart factories, and research was expanded to 'social science'. In particular, since 2015, it has been studied in various disciplines such as 'complex studies'. Overall, in keyword analysis, the keywords such as 'technology', 'data', and 'analysis' are most likely to appear, and it was analyzed that there were some differences by fields and years. Conclusion: Government support and expert support for smart factories should be activated, and researches on technology-based strategies are needed. In the future, it is necessary to take various approaches to smart factories. If researches are conducted in consideration of the environment or energy, it is judged that bigger implications can be presented.

CSR·CSV·ESG 연구 동향 분석 - 빅데이터 분석을 중심으로 - (Analysis of CSR·CSV·ESG Research Trends - Based on Big Data Analysis -)

  • 이은지;문재영
    • 품질경영학회지
    • /
    • 제50권4호
    • /
    • pp.751-776
    • /
    • 2022
  • Purpose: The purpose of this paper is to present implications by analyzing research trends on CSR, CSV and ESG by text analysis and visual analysis(Comprehensive/ Fields / Years-based) which are big data analyses, by collecting data based on previous studies on CSR, CSV and ESG. Methods: For the collection of analysis data, deep learning was used in the integrated search on the Academic Research Information Service (www.riss.kr) to search for "CSR", "CSV" and "ESG" as search terms, and the Korean abstracts and keyword were scrapped out of the extracted paper and they are organize into EXCEL. For the final step, CSR 2,847 papers, CSV 395 papers, ESG 555 papers derived were analyzed using the Rx64 4.0.2 program and Rstudio using text mining, one of the big data analysis techniques, and Word Cloud for visualization. Results: The results of this study are as follows; CSR, CSV, and ESG studies showed that research slowed down somewhat before 2010, but research increased rapidly until recently in 2019. Research have been found to be heavily researched in the fields of social science, art and physical education, and engineering. As a result of the study, there were many keyword of 'corporate', 'social', and 'responsibility', which were similar in the word cloud analysis. Looking at the frequent keyword and word cloud analysis by field and year, overall keyword were derived similar to all keyword by year. However, some differences appeared in each field. Conclusion: Government support and expert support for CSR, CSV and ESG should be activated, and researches on technology-based strategies are needed. In the future, it is necessary to take various approaches to them. If researches are conducted in consideration of the environment or energy, it is judged that bigger implications can be presented.