• 제목/요약/키워드: word cloud

검색결과 186건 처리시간 0.028초

건설 IT 시스템 발전단계분석을 통한 변화관리 요인 기초 연구 (A Preliminary Study on Change Management Factors through Analysing Development Phase of Construction IT System)

  • 김한얼;이동헌;임형철
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2022년도 봄 학술논문 발표대회
    • /
    • pp.214-215
    • /
    • 2022
  • This study analyzed the development stage and change management necessity of the construction IT system through existing research and literature review, and used WordCloud, one of the text mining techniques, to analyze current construction trends and major issues. The necessity of change management is derived by using existing research literature and construction-related social issues as analysis data.

  • PDF

텍스트 분석 기술 및 활용 동향 (Investigations on Techniques and Applications of Text Analytics)

  • 김남규;이동훈;최호창
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.471-492
    • /
    • 2017
  • 최근 데이터의 양 자체가 해결해야 할 문제의 일부분이 되는 빅데이터(Big Data) 분석에 대한 수요와 관심이 급증하고 있다. 빅데이터는 기존의 정형 데이터 뿐 아니라 이미지, 동영상, 로그 등 다양한 형태의 비정형 데이터 또한 포함하는 개념으로 사용되고 있으며, 다양한 유형의 데이터 중 특히 정보의 표현 및 전달을 위한 대표적 수단인 텍스트(Text) 분석에 대한 연구가 활발하게 이루어지고 있다. 텍스트 분석은 일반적으로 문서 수집, 파싱(Parsing) 및 필터링(Filtering), 구조화, 빈도 분석 및 유사도 분석의 순서로 수행되며, 분석의 결과는 워드 클라우드(Word Cloud), 워드 네트워크(Word Network), 토픽 모델링(Topic Modeling), 문서 분류, 감성 분석 등의 형태로 나타나게 된다. 특히 최근 다양한 소셜미디어(Social Media)를 통해 급증하고 있는 텍스트 데이터로부터 주요 토픽을 파악하기 위한 수요가 증가함에 따라, 방대한 양의 비정형 텍스트 문서로부터 주요 토픽을 추출하고 각 토픽별 해당 문서를 묶어서 제공하는 토픽 모델링에 대한 연구 및 적용 사례가 다양한 분야에서 생성되고 있다. 이에 본 논문에서는 텍스트 분석 관련 주요 기술 및 연구 동향을 살펴보고, 토픽 모델링을 활용하여 다양한 분야의 문제를 해결한 연구 사례를 소개한다.

Data Dictionary 기반의 R Programming을 통한 비정형 Text Mining Algorithm 연구 (A study on unstructured text mining algorithm through R programming based on data dictionary)

  • 이종화;이현규
    • 한국산업정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.113-124
    • /
    • 2015
  • 미리 선언된 구조를 이용하여 수집 저장된 정형적 데이터와는 달리 웹 2.0의 시대에서 일반 사용자들이 평상시에 사용하는 자연어 형태로 작성된 비정형 데이터 분석은 과거보다 훨씬 더 넓은 응용범위를 가지고 있다. 데이터 양이 폭발적으로 증가하고 있다는 특성뿐 만 아니라 인간의 감성이 그대로 표현된 특성을 가진 텍스트에서 의미 있는 정보를 추출하는 빅데이터 분석 기법을 텍스트마이닝(Text Mining)이라 하며 본 연구는 이를 주제로 하고 있다. 본 연구를 위해 오픈 소스인 통계분석용 소프트웨어 R 프로그램을 이용하였으며, 비정형 텍스트 문서를 웹 환경에서 수집, 저장, 전처리, 분석 작업과 시각화(Frequency Analysis, Cluster Analysis, Word Cloud, Social Network Analysis)작업 등의 과정에 관한 알고리즘 구현을 연구하였다. 특히, 연구자의 연구 영역 분석에 초점을 더욱 높이기 위해 Data Dictionary를 참조한 키워드 추출 기법을 사용하였다. 실제 사례에 적용한 R은 다양한 OS 구동, 일반적 언어와의 인터페이스 지원 등 통계 분석용 소프트웨어로써 매우 유용하다는 점을 발견할 수 있었다.

의료서비스 실패유형 재조명: 복구 가능과 복구 불가능 서비스 (Reexamination of Failure Type in Medical Service: Recoverable and Irrecoverable Service)

  • 윤성욱;서미옥
    • 한국콘텐츠학회논문지
    • /
    • 제16권11호
    • /
    • pp.72-82
    • /
    • 2016
  • 지금까지 의료서비스에 대한 다양한 연구가 진행되었지만 기존 연구들은 원인변수와 결과변수와의 관계를 규명하는 데만 초점을 두고 있다. 하지만 의료서비스 문제는 다른 서비스 산업과 상대적으로 비교해볼 때 문제 발생 시 고객이 느끼는 감정은 다를 것이라 예측되며, 최근 의료관광과 더불어 의료서비스의 중요성이 부각되는 시점이다. 이에 본 연구는 의료서비스 문제에 관한 정성적 자료를 실증 분석하였으며, 단어구름기법도 이용하였다. 연구의 주요결과를 살펴보면, 의료서비스 문제는 항목별로 의료과실, 간호사 업무미숙, 무심한 진료, 과잉검사 및 진료, 치료강요 및 거부, 응급대기, 불친절, 예약문제, 프로세스문제, 불편함 등 총 10개의 요인으로 나타났다. 그 중 복구 불가능한 서비스 실패에서 가장 많이 산출된 주요 단어는 의료과실, 무심한 진료, 간호사의 업무미숙 순이며, 복구 가능한 서비스 실패에서는 불친절한 태도와 예약시스템에 관한 부정적 경험의 주요 단어가 가장 많이 도출되었다. 의료서비스 문제 후 고객행동은 대부분 강력한 항의를 하며, 아주 심각한 문제에 대해서는 공개적 항의를 하거나 법적대응을 하는 것으로 나타났다. 본 연구의 결론에서는 연구결과 요약과 시사점, 그리고 향후 연구에 대한 제언을 하였다.

논문의 저자 키워드를 이용한 실시간 연구동향 분석시스템 설계 및 구현 (Design and Implementation of Real-Time Research Trend Analysis System Using Author Keyword of Articles)

  • 김영찬;진병삼;배영철
    • 한국전자통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.141-146
    • /
    • 2018
  • 저자가 작성하는 논문의 저자 키워드는 논문 내용의 특징을 나타내는 가장 중요한 요소이며, 이를 실시간으로 분석하여 사용자에게 제공하게 함으로써, 연구동향을 파악하는 것이 가능하다. 서지로 작성된 논문의 비정형 데이터를 데이터베이스로 구축 하고, 이를 활용하여 실시간 탐색이 가능하도록 색인데이터 구조를 만든다. 특정 키워드가 포함된 논문을 색인데이터 구조에서 탐색하고, 저자키워드를 대상으로 추출, 클러스터링 하여 가중치에 따라 크기별로 나타낼 수 있는 워드클라우드로 사용자에게 제공하여, 연구동향을 가시화 하는 방법을 설계하였다. 또한, 구현된 시스템에서 "바이러스"와 "홍채인식" 키워드를 통하여 연구동향 분석 결과를 제시하였다.

우울과 스트레스에 관한 국내 연구 분석 : 치료와 대상자를 중심으로 (Analysis of Domestic Research on Depression and Stress : Focused on the Treatment and Subjects)

  • 조남희;나은영
    • 융합정보논문지
    • /
    • 제7권6호
    • /
    • pp.53-59
    • /
    • 2017
  • 본 연구는 우울 및 스트레스와 관련된 국내 연구를 파악하기 위해 시도되었다. 분석대상은 2016년 11월 30일을 기준으로 우울, 스트레스 키워드로 검색된 1,875편의 국회도서관 등재 학위논문으로 하였다. 분석방법은 텍스트마이닝 기법의 하나인 워드 클라우드로 비정형 자료를 시각화하였다. 또한, 치료와 대상자를 분류하기 위해서는 잠재디리클레 할당(LDA), R의 LDA패키지를 사용하였다. 분석 결과, 치료 관련 키워드를 가지고 있는 논문은 전체 논문 중 233건(12.4%)이었다. 치료방법의 적용은 미술치료, 음악치료, 원예치료, 인지행동치료, 임상미술치료, 인지치료, 심리치료, 우울증치료, 집단치료, 웃음치료 순으로 나타났다. 연구 대상자는 청소년, 노인, 환자, 어머니, 아동, 여성, 부모, 대학생 순으로 나타났다. 청소년을 대상으로 한 LDA 토픽분석 결과 자아지지, 치료프로그램, 관계효과, 변인연구의 4개의 토픽으로 분류되었다. 본 연구 결과는 우울과 스트레스 관련 향후 연구에서 연구 대상자와 주제의 다양화 및 새로운 치료방법의 적용과 개발을 탐색하는 기초자료로 활용될 수 있을 것으로 기대된다.

텍스트 마이닝 기법을 활용한 동남권 신공항 신문기사 분석 (Analysis of News Regarding New Southeastern Airport Using Text Mining Techniques)

  • 한무명초;김양석;이충권
    • 스마트미디어저널
    • /
    • 제6권1호
    • /
    • pp.47-53
    • /
    • 2017
  • 사회적 이슈는 정책의 방향을 결정하는 중요한 요인이며, 신문은 사회적 이슈를 반영하는 중요한 채널이다. 신문기사의 텍스트를 분석하는 것은 사회적 이슈를 이해하는 데 기여할 수 있지만, 대규모의 비정형 데이터인 뉴스를 수작업으로 분석하는 것은 매우 어렵다. 따라서 본 연구는 텍스트 분석기법과 연관분석 기법을 활용해 비정형 신문기사 내용을 정형화하여 사회적 이슈의 이해관계자들 간 관점 차이를 시스템적으로 분석하는 것을 목적으로 한다. 본 연구 수행을 위해 각 지역을 대표하는 신문사(조선일보, 중앙일보, 동아일보, 매일신문, 부산일보)를 선정한 후 기사 115건과 댓글 6,772건을 2주간 수집하여 분석하였다. 연구 결과 전국 일간지들은 해당 지역과 정치적인 관계에 초점을 맞춘 반면에, 지역 일간지들은 속해 있는 지자체를 대변하는 논조로 기사가 작성된 측면이 강하게 나타났다.

빅데이터 분석을 활용한 스마트팩토리 연구 동향 분석 (Analysis of Smart Factory Research Trends Based on Big Data Analysis)

  • 이은지;조철호
    • 품질경영학회지
    • /
    • 제49권4호
    • /
    • pp.551-567
    • /
    • 2021
  • Purpose: The purpose of this paper is to present implications by analyzing research trends on smart factories by text analysis and visual analysis(Comprehensive/ Fields / Years-based) which are big data analyses, by collecting data based on previous studies on smart factories. Methods: For the collection of analysis data, deep learning was used in the integrated search on the Academic Research Information Service (www.riss.kr) to search for "SMART FACTORY" and "Smart Factory" as search terms, and the titles and Korean abstracts were scrapped out of the extracted paper and they are organize into EXCEL. For the final step, 739 papers derived were analyzed using the Rx64 4.0.2 program and Rstudio using text mining, one of the big data analysis techniques, and Word Cloud for visualization. Results: The results of this study are as follows; Smart factory research slowed down from 2005 to 2014, but until 2019, research increased rapidly. According to the analysis by fields, smart factories were studied in the order of engineering, social science, and complex science. There were many 'engineering' fields in the early stages of smart factories, and research was expanded to 'social science'. In particular, since 2015, it has been studied in various disciplines such as 'complex studies'. Overall, in keyword analysis, the keywords such as 'technology', 'data', and 'analysis' are most likely to appear, and it was analyzed that there were some differences by fields and years. Conclusion: Government support and expert support for smart factories should be activated, and researches on technology-based strategies are needed. In the future, it is necessary to take various approaches to smart factories. If researches are conducted in consideration of the environment or energy, it is judged that bigger implications can be presented.

소셜 빅데이터 기반 융합연구 동향 분석 (Trend Analysis of Convergence Research based on Social Big Data)

  • 노영희;김태연;정대근;이광희
    • 한국콘텐츠학회논문지
    • /
    • 제19권2호
    • /
    • pp.135-146
    • /
    • 2019
  • 본 연구는 4차 산업혁명과 함께 학제간 융합연구의 중요성이 부각되는 시점에서 소셜미디어 빅데이터 분석을 통하여 학술적 연구를 넘어 융합연구 전반에 대한 동향을 분석하고자 하였다. 이를 위해 텍스트마이닝 기법을 활용하여 소셜미디어에서 융합연구와 관련하여 2009년 1월부터 2018년 9월까지 약 10년간 게시된 글과 제목 등 약 150,000건을 수집하였으며, 이를 바탕으로 기간별로 워드클라우드와 네트워크 분석을 실시하였다. 분석결과, 각 기간별로 활발하게 진행된 연구분야는 2009년과 2010년에는 친환경, 2011년과 2012년에는 스마트, 2013년과 2014년에는 정보통신, 2015년과 2016년에는 로봇, 2017년과 2018년에는 인공지능이다. 또한 약 10년간 지속적으로 수행되고 있는 연구분야는 문화, 디자인, 화학, 나노, 바이오, 로봇, IT, 정보통신이다. 본 연구에서는 기간별 융합연구 동향을 파악하므로 써, 융합연구를 기획하고 있는 연구자들에게 연구방향을 설정하는데 있어 도움이 될 수 있다.

비정형 텍스트 데이터 정제를 위한 불용어 코퍼스의 활용에 관한 연구 (A Study on the Use of Stopword Corpus for Cleansing Unstructured Text Data)

  • 이원조
    • 문화기술의 융합
    • /
    • 제8권6호
    • /
    • pp.891-897
    • /
    • 2022
  • 빅데이터 분석에서 원시 텍스트 데이터는 대부분 다양한 비정형 데이터 형태로 존재하기 때문에 휴리스틱 전처리 정제와 컴퓨터를 이용한 후처리 정제과정을 거쳐야 분석이 가능한 정형 데이터 형태가 된다. 따라서 본 연구에서는 텍스트 데이터 분석 기법의 하나인 R 프로그램의 워드클라우드를 적용하기 위해서 수집된 원시 데이터 전처리를 통해 불필요한 요소들을 정제하고 후처리 과정에서 불용어를 제거한다. 그리고 단어들의 출현 빈도수를 계산하고 출현빈도가 높은 단어들을 핵심 이슈들로 표현해 주는 워드클라우드 분석의 사례 연구를 하였다. 이번 연구는 R의워드클라우드 기법으로 기존의 불용어 처리 방법인 "내포된 불용어 소스코드" 방법의 문제점을 개선하기 위하여 "일반적인 불용어 코퍼스"와 "사용자 정의 불용어 코퍼스"의 활용 방안을 제안하고 사례 분석을 통해서 제안된 "비정형 데이터 정제과정 모델"의 장단점을 비교 검증하여 제시하고 "제안된 외부 코퍼스 정제기법"을 이용한 워드클라우드 시각화 분석의 실무적용에 대한 효용성을 제시한다.