• 제목/요약/키워드: Modeling language

검색결과 1,027건 처리시간 0.024초

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

가정간호사업 운용을 위한 정보전달체계 개발 I (가정간호 데이터베이스 구축과 뇌졸중 환자의 가정간호 전산개발) (Development of the Information Delivery System for the Home Nursing Service)

  • 박정호;김매자;홍경자;한경자;박성애;윤순녕;이인숙;조현;방경숙
    • 가정∙방문간호학회지
    • /
    • 제4권
    • /
    • pp.5-22
    • /
    • 1997
  • The purpose of the study was to development an information delivery system for the home nursing service, to demonstrate and to evaluate the efficiency of it. The period of research conduct was from September 1996 to August 31, 1997. At the 1st stage to achieve the purpose, Firstly Assessment tool for the patients with cerebral vascular disease who have the first priority of HNS among the patients with various health problems at home was developed through literature review. Secondly, after identification of patient nursing problem by the home care nurse with the assessment tool, the patient's classification system developed by Park (1988) that was 128 nursing activities under 6 categories was used to identify the home care nurse's activities of the patient with CAV at home. The research team had several workshops with 5 clinical nurse experts to refine it. At last 110 nursing activities under 11 categories for the patients with CVA were derived. At the second stage, algorithms were developed to connect 110 nursing activities with the patient nursing problems identified by assessment tool. The computerizing process of the algorithms is as follows: These algorithms are realized with the computer program by use of the software engineering technique. The development is made by the prototyping method, which is the requirement analysis of the software specifications. The basic features of the usability, compatibility, adaptability and maintainability are taken into consideration. Particular emphasis is given to the efficient construction of the database. To enhance the database efficiency and to establish the structural cohesion, the data field is categorized with the weight of relevance to the particular disease. This approach permits the easy adaptability when numerous diseases are applied in the future. In paralleled with this, the expandability and maintainability is stressed through out the program development, which leads to the modular concept. However since the disease to be applied is increased in number as the project progress and since they are interrelated and coupled each other, the expand ability as well as maintainability should be considered with a big priority. Furthermore, since the system is to be synthesized with other medical systems in the future, these properties are very important. The prototype developed in this project is to be evaluated through the stage of system testing. There are various evaluation metrics such as cohesion, coupling and adaptability so on. But unfortunately, direct measurement of these metrics are very difficult, and accordingly, analytical and quantitative evaluations are almost impossible. Therefore, instead of the analytical evaluation, the experimental evaluation is to be applied through the test run by various users. This system testing will provide the viewpoint analysis of the user's level, and the detail and additional requirement specifications arising from user's real situation will be feedback into the system modeling. Also. the degree of freedom of the input and output will be improved, and the hardware limitation will be investigated. Upon the refining, the prototype system will be used as a design template. and will be used to develop the more extensive system. In detail. the relevant modules will be developed for the various diseases, and the module will be integrated by the macroscopic design process focusing on the inter modularity, generality of the database. and compatibility with other systems. The Home care Evaluation System is comprised of three main modules of : (1) General information on a patient, (2) General health status of a patient, and (3) Cerebrovascular disease patient. The general health status module has five sub modules of physical measurement, vitality, nursing, pharmaceutical description and emotional/cognition ability. The CVA patient module is divided into ten sub modules such as subjective sense, consciousness, memory and language pattern so on. The typical sub modules are described in appendix 3.

  • PDF

창업가의 인지편향이 지각된 위험과 조절된 창업효능감에 따라 창업기회평가에 미치는 영향 (The Effects of Cognitive Bias on Entrepreneurial Opportunity Evaluations through Perceived Risks in Entrepreneurial Self-Efficacy)

  • 김대엽;박재환
    • 벤처창업연구
    • /
    • 제15권1호
    • /
    • pp.95-112
    • /
    • 2020
  • 본 연구는 개인이 지닌 인지편향이 지각된 위험 및 창업기회평가와 어떤 연관성이 있는지를 알아보고, 창업집단에 따라 인지편향과 창업효능감이 창업기회를 다르게 평가하는지를 분석하는 것이다. 본 연구를 통해 대학생을 위한 창업교육의 개선점을 찾고, 현직의 창업가가 행하는 의사결정과정에서 어떤 문제점이 있으며 개선 가능성이 있는지를 제시하고자 한다. 대학생과 창업가를 대상으로 설문을 실시하였으며, 총 363명의 설문 데이터를 기반으로 구조방정식모형을 통해 실증하였다. 연구분석 결과는 다음과 같다. 첫째, 인지편향과 지각된 위험은 유의적인 부의 관계를 가지며, 구체적으로 인지편향 중 과잉자신감과 통제착각은 지각된 위험과 부(-)의 유의적 관계를 가지는 것으로 분석되었다. 둘째로, 인지편향은 기회평가와 유의한 정(+)의 관계가 있으며 구체적으로 통제착각과 현상유지편향과 유의한 정(+)의 관계를 가지는 것으로 분석되었다. 셋째, 지각된 위험은 기회평가와 유의한 부(-)의 관계가 있는 것으로 나타났다. 넷째, 대학생과 창업가집단을 나누어 살펴본 창업집단간의 차이를 살펴보면 창업효능감이 지각된 위험과 기회평가 사이에서 조절효과를 하고 있다는 것을 대학생집단에서는 확인할 수 있으나, 창업가집단에서는 유의미한 결과를 발견하지 못했다. 또한 대학생집단과 창업가집단은 다른 인지편향을 가지고 있으며, 지각된 위험을 매개로 창업기회평가에 다르게 관계가 있음을 실증하였다. 불확실한 상황에서 판단을 해야 하는 예비 창업가인 대학생과 기존 창업가에게는 시간적인 압박, 또는 스트레스를 원인으로 발생하는 서로 다른 인지편향이 존재하며, 이런 편향의 존재를 인정하고 스스로 자신의 판단을 개선하는 노력을 해야 한다는 점을 확인하였다. 대학생은 높은 창업효능감을 기반으로 새로운 기회에 대한 긍정적인 시각을 지닐 수 있지만, 창업교육을 통해 창업이 가지고 있는 본질적인 위험에 대한 철저한 지각과 함께 직접적인 창업경험에 존재하는 인지편향을 충분히 이해한다면 과거보다 좋은 기회평가를 하게 될 수 있다는 점이다. 본 연구는 대학생과 창업가를 통합하여 실증하였다는 점과 제한된 방식의 임의추출법에 의해 설문응답자를 선정하였다는 점에서 한계를 가진다. 두 번째로 선행연구에서 사용한 측정도구를 번역하여 사용하였으며, 언어 문제로 측정도구의 명확한 의미가 전달되지 않을 수도 있다. 연구의 정확성을 위해 보다 정밀한 척도를 구성할 필요가 있을 것이다.

컴포넌트 유통환경을 위한 컴포넌트 메타데이타 레지스트리 구축 : C_MDR (A Construction of the C_MDR(Component_MetaData Registry) for the Environment of Exchanging the Component)

  • 송치양;임성빈;백두권;김철홍
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.614-629
    • /
    • 2001
  • 21세기 지식기반 사회로의 정착화와 글로벌 인터넷화 추진으로 소프트웨어는 대형화 및 복잡화 되어가고 있으며, 그 수요는 폭주하는 실정이다. 이에, 표준화된 컴포넌트의 개발 및 유통을 통한 재사용의 활성화가 최근 산업계와 학계에서 중요한 이슈로 부각되는 실정이다. 현재, 컴포넌트의 재사용을 위하여 해외 컴포넌트 판매 마켓에서는 자사별 판매하는 제품의 특성에 따라 정보를 제공하고 있으나, 상이하게 정보를 정의하고 있으며, 그 정보의 수준이 미약하며, 표준화되지 않은 메타정보를 제공하고 있다. 즉, 국제표준 ISO 11179에 기반한 컴포넌트 데이타 레지스트리의 구축이 이루어지고 있지 않다. 국내에서는 2001년도에 공용 컴포넌트의 출시를 추진하고 있다. 따라서, 개발된 컴포넌트의 정보 공유와 유통을 위한 지원도구로서 표준화된 컴포넌트의 메타정보를 서비스 해주는 시스템이 필요하다. 본 논문은 컴포넌트 재사용 활성화의 일환으로 체계적인 정보공유와 정보유통을 위하여, 제품화된 공용 컴포넌트에 대한 표준화된 메타정보의 등록 및 관리를 제공해주는 ISO 11179 표준에 근거한 컴포넌트 유통환경의 도구로서, 컴포넌트 메타데이타 레지스트리(C_MDR) 시스템을 제시한다. 이를 위해, 컴포넌트에 대한 메타정보의 명세 플랫폼을 제시하고, 이 플랫폼에 따라 메타정보를 정의하고, 또한 타 시스템과의 정보의 호환성 증진을 위해 XML을 이용해 표현한다. 그리고 시스템 디자인을 위해 3계층 아키텍쳐 표현방식을 적용하여 단순하고 이해성 있는 시각화 모델링을 제공한다. 시스템 구현은 웹 상의 인터넷을 통해 컴포넌트 메타정보를 서비스를 할 수 있도록 시스템을 구축하며, ASP 개발언어와 PC용 RDMS 오라클을 사용한다. 이로서, 제품화된 컴포넌트j에 대한 유통 메타정보의 표준화를 기할 수 있고, 재사용을 위한 유통지원도구로서 지원이 가능할 것이다.

  • PDF

트위터 오피니언 마이닝을 통한 코로나19 기간 대학 비대면 수업에 대한 의견 고찰 (Exploring Opinions on University Online Classes During the COVID-19 Pandemic Through Twitter Opinion Mining)

  • 김동훈;강정;주영준
    • 한국문헌정보학회지
    • /
    • 제55권4호
    • /
    • pp.5-22
    • /
    • 2021
  • 본 연구는 코로나바이러스감염증-19 (이하 코로나19) 확산 이후 대학의 부분 또는 전면 비대면 수업으로의 전환에 대해 소셜 미디어 플랫폼 중 하나인 트위터에서 이를 어떻게 생각하고 논의하고 있는지를 파악하기 위해 진행되었다. 이를 위해 트위터에서 비대면 수업 관련 트윗을 수집한 후 감성분석 및 시계열 주제 분석을 실시하였다. 감성분석결과, 전반적으로 긍정적인 여론보다 부정적인 여론이 많았지만 시간이 지남에 따라 점차 부정적인 여론이 줄어드는 경향이 나타남을 확인하였다. 또한 월별 감성점수분포를 통해 학기 중이 방학기간보다 감성점수 분포의 폭이 넓음을 확인하였고, 이를 통해 학기 중일 때가 방학 때보다 비대면 수업에 대해 더 다양한 감정과 의견을 교환한다는 사실을 확인할 수 있었다. 다음으로 긍정트윗과 부정트윗을 구분하여 시계열 주제 분석을 실시한 결과, 긍정트윗에서는 수업환경 및 장비, 긍정적인 감정 표현, 강의시청장소, 언어수업, 시험 및 과제와 같은 다섯 가지 주요한 주제가 나타났으며, 부정트윗에서는 시간(수업시간, 쉬는시간), 시험 및 과제, 부정적인 감정 표현, 수업환경 및 장비와 같은 네 가지 주요한 주제가 나타남을 확인하였다. 또한 각 주제별 대표 키워드들의 비율을 통해 시간에 따른 주제의 변화를 파악함으로써 비대면 수업에 대한 여론의 트렌드를 살펴 보고자 하였다. 본 연구는 기존 비대면 수업 관련 연구들과는 달리 소셜 미디어 중 하나인 트위터를 활용하여 국내 대학의 비대면 수업에 대한 전반적인 의견을 파악하고자 하였으며, 감성분석과 시계열 주제 분석을 활용하여 비대면 수업에 대한 긍부정 여론을 나누어 식별 및 시간의 흐름에 따른 트렌드의 변화를 파악하였다는 점에서 학문적 함의를 지닌다. 또한 연구결과는 국내 대학에서의 비대면 수업에 대한 구성 및 개선방안 등에 활용될 수 있으며, 비대면 수업을 설계하는 대학 및 교수자들에게 도움이 될 수 있다는 점에서 실질적인 함의를 지닌다.

온라인 과학 기사 텍스트 마이닝을 통해 분석한 에너지 용어 사용의 맥락 (Analyzing Different Contexts for Energy Terms through Text Mining of Online Science News Articles)

  • 오치영;강남화
    • 과학교육연구지
    • /
    • 제45권3호
    • /
    • pp.292-303
    • /
    • 2021
  • 본 연구에서는 일상생활에서 에너지 용어가 사용되는 맥락을 알아보기 위하여 온라인 과학 기사를 수집하여 언어 네트워크, 토픽 모델링 분석 기법을 활용해 에너지 관련 기사에 사용된 용어의 빈도, 용어 네트워크, 기사의 주제를 분석하였다. 분석에 사용된 자료는 2018.3.1.부터 1년간의 온라인 과학 분야의 기사 중 에너지를 검색어로 하여 10개의 국내 중앙지에서 검색 및 선정된 2,171편이다. 이 기사들을 자연어 처리하여 51,224개의 문장과 507,901개의 단어로 데이터를 구성하였다. R 프로그램을 활용하여 용어 빈도수 분석 및 언어 네트워크 분석을 실시하였고, 에너지 용어 사용의 맥락 탐색을 위해 구조적 토픽 모델링 분석을 적용해 기사의 주제를 도출하였다. 기사에 사용된 용어 중 빈도수가 유난히 높은 용어는 기술, 연구, 개발로 새로운 소식을 알리는 기사의 특성을 반영한 것으로 나타났다. 한편, 기사 2편당 한 번 이상의 빈도로 사용되는 용어에는 산업 관련 용어(산업, 제품, 시스템, 생산, 시장)와 '전기', '환경'과 같이 에너지 관련 용어로 충분히 기대되는 용어들이 있었다. 한편, 에너지 관련 과학 수업에서 자주 사용되는 '태양', '열', '온도', '발전'도 빈도수 상위에 속하는 용어로 드러났다. 용어 네트워크 분석에서는 산업 및 기술과 관련된 용어와 기초과학 및 연구 관련 용어들이 약한 강도이지만 서로 군집을 이루는 것을 확인하였다. 한편, 에너지와 쌍을 이루는 용어의 분석에서는 '에너지 효율'을 비롯해 '에너지 절감', '에너지 소비' 등과 같이 에너지의 사용에 관한 용어들이 다수를 이루고 그 사용 빈도가 가장 높았다. 에너지 용어가 사용되는 맥락은 16개의 주제를 분류한 4가지 영역으로 '첨단산업', '산업', '기초과학', '환경 및 건강'으로 나타났다. 에너지 사용 관련 용어가 상당히 많이 사용된다는 결과는 에너지 수업의 시작점으로 에너지 저급화 개념의 도입이 효과적일 수 있음을 시사한다. 또한, 첨단산업이나 환경 및 건강의 맥락을 에너지 학습에 도입할 필요성도 보여준다. 본 연구에서 드러난 16개 주제에서 보이는 다양한 에너지 용어가 사용되는 맥락을 재구성해 에너지 관련 수업에 활용한다면 학생들이 학교에서의 에너지 학습과 일상적 상황을 통합적으로 인식하는 데 도움이 될 것이다.

호텔 산업의 서비스 품질 향상을 위한 토픽 마이닝 기반 분석 방법 (An Analytical Approach Using Topic Mining for Improving the Service Quality of Hotels)

  • 문현실;성다윗;김재경
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.21-41
    • /
    • 2019
  • 정보 기술의 발전으로 온라인에서 활용 가능한 데이터의 양이 급속히 증대되고 있다. 이러한 빅데이터 시대에 많은 연구들이 통찰력을 발견하고 데이터의 효과를 입증하기 위해 노력하고 있다. 특히 관광 산업의 경우 정보에 민감한 사업으로 소셜 미디어의 영향력이 높고 소셜 미디어의 상품 후기에 소비자들이 영향을 많이 받아 많은 기업과 연구자들이 소셜 미디어를 분석하여 새로운 서비스 및 통찰력을 얻고자 시도하였다. 하지만 소셜 미디어의 후기는 텍스트로 이루어진 대표적인 비정형 데이터로 적절한 처리를 하지 않으면 분석에 활용할 수 없다. 또한 후기 데이터의 양이 방대함에 따라 사람이 직접 분석하기도 어려운 실정이다. 따라서, 본 연구에서는 이러한 소셜미디어 상의 온라인 후기로부터 직접 호텔의 서비스 품질 향상을 위한 통찰력을 추출할 수 있는 분석 방법을 제시하고자 한다. 이를 위해 본 연구에서는 먼저 후기 데이터에 포함되어 있는 주제어를 추출하는 토픽 마이닝 기법을 적용하였다. 토픽 마이닝은 대용량의 문서 집합으로부터 문서를 대표하는 단어 집합을 추출하는 기법을 의미하며 본 연구에서는 다양한 연구에서 활용되고 있는 LDA모형을 사용하여 토픽 마이닝을 수행하였다. 하지만, 토픽 마이닝 자체만으로는 주제어와 평점 사이의 관계를 도출할 수 없어 서비스 품질 향상을 위한 통찰력을 발견하기 어렵다. 그에 따라 본 연구에서는 토픽 마이닝의 결과값을 기반으로 의사결정나무 모형을 사용하여 주제어와 평점 사이의 관계를 도출하였다. 이러한 방법론의 유용성을 평가하기 위해 홍콩에 있는 4개 호텔의 온라인 후기를 수집하고 제안한 방법론의 분석 결과를 해석하는 실험을 진행하였다. 실험 결과 긍정 후기를 통해 각 호텔이 유지해야할 서비스 영역을 발견할 수 있었으며 부정 후기를 통해 개선해야할 서비스 영역을 도출할 수 있었다. 따라서, 본 연구에서 제안한 방법론을 사용하여 방대한 양의 후기 데이터로부터 서비스 개선 및 유지 영역을 발견할 수 있으리라 기대된다.