• 제목/요약/키워드: Modeling information

검색결과 8,596건 처리시간 0.038초

가정간호사업 운용을 위한 정보전달체계 개발 I (가정간호 데이터베이스 구축과 뇌졸중 환자의 가정간호 전산개발) (Development of the Information Delivery System for the Home Nursing Service)

  • 박정호;김매자;홍경자;한경자;박성애;윤순녕;이인숙;조현;방경숙
    • 가정∙방문간호학회지
    • /
    • 제4권
    • /
    • pp.5-22
    • /
    • 1997
  • The purpose of the study was to development an information delivery system for the home nursing service, to demonstrate and to evaluate the efficiency of it. The period of research conduct was from September 1996 to August 31, 1997. At the 1st stage to achieve the purpose, Firstly Assessment tool for the patients with cerebral vascular disease who have the first priority of HNS among the patients with various health problems at home was developed through literature review. Secondly, after identification of patient nursing problem by the home care nurse with the assessment tool, the patient's classification system developed by Park (1988) that was 128 nursing activities under 6 categories was used to identify the home care nurse's activities of the patient with CAV at home. The research team had several workshops with 5 clinical nurse experts to refine it. At last 110 nursing activities under 11 categories for the patients with CVA were derived. At the second stage, algorithms were developed to connect 110 nursing activities with the patient nursing problems identified by assessment tool. The computerizing process of the algorithms is as follows: These algorithms are realized with the computer program by use of the software engineering technique. The development is made by the prototyping method, which is the requirement analysis of the software specifications. The basic features of the usability, compatibility, adaptability and maintainability are taken into consideration. Particular emphasis is given to the efficient construction of the database. To enhance the database efficiency and to establish the structural cohesion, the data field is categorized with the weight of relevance to the particular disease. This approach permits the easy adaptability when numerous diseases are applied in the future. In paralleled with this, the expandability and maintainability is stressed through out the program development, which leads to the modular concept. However since the disease to be applied is increased in number as the project progress and since they are interrelated and coupled each other, the expand ability as well as maintainability should be considered with a big priority. Furthermore, since the system is to be synthesized with other medical systems in the future, these properties are very important. The prototype developed in this project is to be evaluated through the stage of system testing. There are various evaluation metrics such as cohesion, coupling and adaptability so on. But unfortunately, direct measurement of these metrics are very difficult, and accordingly, analytical and quantitative evaluations are almost impossible. Therefore, instead of the analytical evaluation, the experimental evaluation is to be applied through the test run by various users. This system testing will provide the viewpoint analysis of the user's level, and the detail and additional requirement specifications arising from user's real situation will be feedback into the system modeling. Also. the degree of freedom of the input and output will be improved, and the hardware limitation will be investigated. Upon the refining, the prototype system will be used as a design template. and will be used to develop the more extensive system. In detail. the relevant modules will be developed for the various diseases, and the module will be integrated by the macroscopic design process focusing on the inter modularity, generality of the database. and compatibility with other systems. The Home care Evaluation System is comprised of three main modules of : (1) General information on a patient, (2) General health status of a patient, and (3) Cerebrovascular disease patient. The general health status module has five sub modules of physical measurement, vitality, nursing, pharmaceutical description and emotional/cognition ability. The CVA patient module is divided into ten sub modules such as subjective sense, consciousness, memory and language pattern so on. The typical sub modules are described in appendix 3.

  • PDF

사용자환경의 메타포가 스마트폰 애플리케이션 사용의도에 미치는 영향 (The Effects of Metaphors in the Interface of Smartphone Applications on Users' Intention to Use)

  • 정원진;홍석기
    • Asia pacific journal of information systems
    • /
    • 제24권3호
    • /
    • pp.255-279
    • /
    • 2014
  • It is not too much to say that smartphones have become an essential part of our lives due to their versatility. Nevertheless, they still have less overall capabilities than their desktop counterparts. Specifically, they have small screens and low resolutions, which make their applications difficult to have a usable interface. To account for these limitations, the interface of smartphone applications should be designed carefully and properly. Good interface design to any application is critical. However, a comprehensive information systems (IS) literature review found that there has been little research on the user interface design of smartphone applications. More specifically, there has been little empirical evidence and understanding about how metaphors, an imaginative way of describing objects and concepts, in the user interface of smartphone applications affect users' intention to use the applications. Thereby, the research goals of this study are to examine 1) the effects of the metaphors in the user interface of smartphone applications on the interaction between users and applications and 2) the effects of mediating variables including the interaction between users and applications, users' beliefs and attitudes, on users' intention to use the applications. A survey was conducted to collect data. University students and practitioners participated in the survey. A 24-item questionnaire was developed on a 5-point Likert-type scale. The measurement items were mostly adapted from the previous studies in the IS literature and modified to fit the context of this study. First, a principal component factor analysis was performed to explore the inter-relationships among a set of variables. The analysis showed that most of the items loaded quite strongly on the six components. The analysis also revealed the six components with eigenvalues exceeding 1, explaining a total of 70.7 per cent of the variance. The reliabilities of the items were also checked. Most Cronbach alpha values were above 0.8, so the scales were considered reliable. In sum, the results of the analysis support the decision to retain the six factors for further investigation. Next, the structural model was analyzed with AMOS structural equation modeling. The values of GFI, AGFI, NFI, TLI, CFI, and RMSEA were checked. The values showed that the research model considerably have a good fit in general. Next, the convergent and discriminant validities of all constructs were examined. The values for the standardized regression weights and critical ration (CR) indicated sufficient convergent validity for all constructs. In addition, the square root of the average variance extracted (AVE) of each construct was compared with its correlations with all other constructs. The results supported discriminant validity for all constructs. In sum, the results of analysis demonstrated adequate convergent and discriminant validities for all constructs. Finally, path coefficients between the variables were examined. Methphor was found to have an impact on interaction (${\beta}$ = .457, p = .000). There were also significant effects of the interaction on perceived usefulness (${\beta}$ = .273, p = .000) and ease of use (${\beta}$ = .405, p = .000). User attitude was significantly influenced by these two beliefs, perceived usefulness (${\beta}$ = .386, p = .000) and ease of use (${\beta}$ = .347, p = .000) respectively. Further, the results of analysis found that users' intention to use smartphone applications was significantly influenced by user attitude (${\beta}$ = .567, p = .000). Based upon the analyses, all hypotheses were supported. This study found that the metaphors used in the interface of smartphone applications affect not only the interaction between users and applications, but also users' intention to use the applications through the mediating variables, perceived usefulness and ease of use. These findings imply that if the metaphors used in the user interface of application are easy enough to understand for smartphone users, then the application can be perceived useful and easy to use, which in turn make users to have an intention to use the application. In conclusion, this study contributed not only to validate and extend Technology Acceptance Model (TAM) partially, but also to develop the construct of metaphor in smartphone settings. However, since a single empirical study cannot be enough to validate the findings, some limitations should be considered.

유전자 알고리즘을 이용한 동적통행배정에 관한 연구 (Dynamic Traffic Assignment Using Genetic Algorithm)

  • 박경철;박창호;전경수;이성모
    • 대한공간정보학회지
    • /
    • 제8권1호
    • /
    • pp.51-63
    • /
    • 2000
  • 최근 교통문제를 해결하기 위한 방법으로 교통계획분야에 GIS나 ITS를 활용한 다양한 연구가 활발히 진행 중에 있다. 이와 함께 정보환경의 급격한 발달과 더불어 대안 경로의 선정, 또는 교통예보 서비스와 같은 온라인 상에서의 교통정보 제공이 이루어지고 있어 GIS 환경 내에서도 가로망의 교통량을 정확하게 예측할 수 있는 기능이 요구되고 있어 통행배정모형의 중요성이 증가하고 있다. 그런데, 전통적인 정적 통행배정모형은 급변하는 교통상황에 적합하지 않기 때문에 실시간 교통상황에 대한 교통흐름을 예측할 수 있는 동적 통행배정모형의 개발이 요구되고 있다. 그러나, 동적 통행배정모형은 시공간적인 변수들의 복잡성으로 인해서 그 최적해를 찾는데 많은 수학적인 어려움과 제약조건이 존재한다. 따라서, 이를 해결하기 위한 여러 가지 해법이 연구되어왔지만, 기존의 방법은 목적함수나 제약조건이 convex(하지 않은 경우에는 적용이 불가능한 단점을 가지고 있다. 본 연구에서는 인공지능방법(Artificial Intelligence Technique)의 한 분야로 활발히 연구되고 있는 유전자 알고리즘(Genetic Algorithm)을 동적 통행배정 모형에 도입하여 그 해결 방법을 제시하였다. 논문에서 사용한 동적 통행배정모형은 제약조건이 convex(하지 않은 Merchant-Nemhauser모형이고, 새로운 해결기법으로 사용된 유전자 알고리즘은 일반적인 제약조건을 처리할 수 있다고 알려진 GENOCOP III시스템이다. 새로 도입된 방법의 효율성과 유의성을 검증하기 위해 간단한 네트워크에 적용하였다. 그 결과 GENOCOP III 시스템이 계산과정의 효율성에 있어서 기존의 비선형 해법 알고리즘보다 우수한 것으로 입증되었다.연구가 진행되어야 할 것이다. 실질적으로 성감별 수정란의 대량생산이 가능할 것으로 사료되며, 농가차원에서 산업적 실용화가 될 수 있을 것으로 기대한다.twork descrition)를 통해 교통분석후의 제반 교통특성(교통량, 교통량/용량 비(比), 속도 등)을 교통망상에 표시할 수 있음으로서 의사결정에 보다 많은 도움을 줄 수 있을 것이다. 비트율의 증가와 화질 열화는 각각 최대 1.32%와 최대 0.11dB로 무시할 수 있을 정도로 작음을 확인 하였다.을 알 수 있었다. 현지관측에 비해 막대한 비용과 시간을 절약할 수 있는 위성영상해석방법을 이용한 방법은 해양수질파악이 가능할 것으로 판단되며, GIS를 이용하여 다양하고 복잡한 자료를 데이터베이스화함으로써 가시화하고, 이를 기초로 공간분석을 실시함으로써 환경요소별 공간분포에 대한 파악을 통해 수치모형실험을 이용한 각종 환경영향의 평가 및 예측을 위한 기초자료로 이용이 가능할 것으로 사료된다.염총량관리 기본계획 시 구축된 모형 매개변수를 바탕으로 분석을 수행하였다. 일차오차분석을 이용하여 수리매개변수와 수질매개변수의 수질항목별 상대적 기여도를 파악해 본 결과, 수리매개변수는 DO, BOD, 유기질소, 유기인 모든 항목에 일정 정도의 상대적 기여도를 가지고 있는 것을 알 수 있었다. 이로부터 수질 모형의 적용 시 수리 매개변수 또한 수질 매개변수의 추정 시와 같이 보다 세심한 주의를 기울여 추정할 필요가 있을 것으로 판단된다.변화와 기흉 발생과의 인과관계를 확인하고 좀 더 구체화하기 위한 연구가 필요할 것이다.게 이루어질 수 있을 것으로 기대된다.는 초과수익률이 상승하지만, 이후로는 감소하므로, 반전거래전략을 활용하는 경우 주식투자기간은 24개월이하의 중단기가 적합함을

  • PDF

사회연결망분석과 인공신경망을 이용한 추천시스템 성능 예측 (Predicting the Performance of Recommender Systems through Social Network Analysis and Artificial Neural Network)

  • 조윤호;김인환
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.159-172
    • /
    • 2010
  • 협업필터링 추천은 다양한 분야에서 활용되고 있지만 트랜잭션 데이터의 성격에 따라 추천 성능에 현저한 차이를 보이고 있다. 기존 연구에서는 이러한 추천 성능의 차이가 나타나는 이유에 대한 설명을 구체적으로 제시하지 못하고 있고 이에 따라 추천 성능의 예측 또한 연구된 바가 없다. 본 연구는 사회네트워크분석과 인공신경망 모형을 이용하여 협업필터링 추천시스템의 성능을 예측하고자 한다. 본 연구의 목적을 달성하기 위해 국내 백화점의 트랜잭션 데이터를 기반으로 형성되는 고객간 사회 네트워크의 구조적 지표를 측정한 후 이를 기반으로 인공신경망 모형을 구축하고 검증한다. 본 연구는 협업필터링 추천 성능을 예측할 수 있는 새로운 모형을 제시하였다는 점에서 그 의의가 있으며 이를 통해 기업들의 협업필터링 추천시스템 도입에 대한 의사결정에 도움을 줄 수 있을 것으로 기대된다.

중국 관광객의 온라인 구전에 대한 자아일치성과 기능일치성의 효과: 자기해석의 조절효과를 중심으로 (The Effects of Self-Congruity and Functional Congruity on e-WOM: The Moderating Role of Self-Construal in Tourism)

  • 양금;이영찬
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제25권1호
    • /
    • pp.1-23
    • /
    • 2016
  • 목적 자아일치성(self-congruity)은 "비실용 대상 포지셔닝(Non-utilitarian destination positioning)" 이론에 근거한 것으로,소비자들이 의사결정을 하거나 행동을 할 때 대상(제품, 서비스 등)과 자신의 가치를 일치시키려는 성향을 의미한다. 반면, 기능일치성(functional congruity)은 대상(장소, 제품, 서비스)의 실용적 가치에 자신의 의사결정이나 행동을 일치시키려는 성향을 의미한다. 최근 모바일 기반의 소셜네트워크서비스를 통해 소비자들이 제품이나 서비스에 대한 개인적 경험을 언제 어디서나 공유하게 되면서 온라인 구전을 통한 커뮤니케이션 기회가 많아지고 활발해지고 있다. 한편, 자기해석(self-construal)은 마케팅 및 현대 심리학에서 그동안 많이 다루어져 온 주제이다. 본 연구는 자아일치성 및 기능일치성과 중국 관광객의 긍정적인 온라인 구전 간의 관계와 자기해석의 조절효과를 검증하는 것을 연구 목적으로 한다. 설계/방법론/접근 연구가설을 검증하기 위해 본 연구에서는 32개 문항으로 구성된 설문지를 개발하였고, 모든 항목은 리커트 5점 척도를 사용하였다. 중국 설문조사 전문 웹사이트인 sojump.com에서 한국을 방문한적이 있는 사용자들을 대상으로 설문조사를 실시하였고, 자료분석을 위해 SPSS 20.0과 AMOS 18.0을 사용하였고, 구조방정식과 회귀분석을 이용하여 연구가설을 검증하였다. 전반적인 모형의 적합도, 신뢰도, 타당성 등을 검증하기 위해 확인요인분석을 실시하였고, 동일방법편의(common method bias) 여부도 함께 진단하였다. 결과 연구결과 자아일치성과 기능일치성은 온라인 구전에 긍정적인 효과를 미치는 것으로 나타났다. 그리고 자아일치성이 온라인 구전에 미치는 효과는 독립적인 자기해석 성향이 있는 중국 관광객이 의존적인 자기해석 성향이 있는 중국 관광객보다 더 강하다는 것을 알 수 있었다. 반면, 기능일치성이 온라인 구전에 미치는 효과는 의존적인 자기해석 성향이 있는 중국 관광객이 독립적인 자기해석 성향이 있는 중국 관광객보다 더 강하다는 것을 알 수 있었다.

멀티에이전트시스템(MAS)을 이용한 G2B 조달 프로세스 혁신의 효과평가에 관한 연구 : 나라장터 G2B사례 (A Study on the Performance Evaluation of G2B Procurement Process Innovation by Using MAS: Korea G2B KONEPS Case)

  • 서원준;이대철;임규건
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.157-175
    • /
    • 2012
  • 방대한 규모와 복잡한 프로세스로 구성된 공공조달의 혁신성과를 평가하기란 매우 어려운 문제이다. 기존의 프로세스 혁신 평가는 주로 설문 및 인터뷰, 그리고 운영데이터를 분석한 정성적, 또는 통계적인 정량적 방법들이었다. 이에 본 연구에서는 공공조달 프로세스를 복잡계로 보고 이에 대한 시뮬레이션 방법으로 멀티에이전트시스템(MAS)을 이용하여 공공조달 프로세스 혁신효과 평가모델을 개발하였다. 그리고, 개발된 MAS 기반의 공공조달 혁신평가 모델을 우리나라 조달청의 G2B(나라장터, KONEPS) 시스템에 적용하여 혁신효과를 평가하였다. MAS 시뮬레이션 도구는 Northwestern University에서 개발된 Netlogo Version 4.1.3을 사용하였고, 모델링에서는 에이전트 정의, 에이전트 행동특성 정의, 에이전트 관계 정의의 세단계로 진행하였다. 첫째, 에이전트 정의에서는 에이전트가 될 대상을 선정하고, 에이전트가 가진 속성과 변수들을 정의하였다. 둘째, 행동특성 정의에서는 각 에이전트의 행동계획 및 자원할당을 설정하였고, 셋째, 관계정의 단계에서는 상태변화에 따른 행동 규칙을 설정하였다. 또한 프로세스 혁신의 목적에 맞는 성과를 측정하기 위하여 혁신 효과평가항목을 선정하였고, 데이터는 조달청의 협조를 통해 DB 데이터와 설문데이터를 활용하였다. 이를 통해 프로세스 전체 및 프로세스별 절감시간과 업무량의 절감율을 측정하였다. 실험결과 전체 프로세스의 효율성이 증대되었으며 '평균 업무처리 건수'의 절감율이 92.7%, '평균 업무처리 시간'의 절감율이 95.4%로 나타났다. 즉 공공조달분야는 G2B 시스템 도입을 통해 프로세스 혁신을 추진한 결과 매우 높은 효율성이 제고된 것으로 분석되었다. 또한 본 연구를 통해 '계약'과 관련한 업무프로세스에서 추가적인 개선이 이루어질 경우 프로세스 혁신효과가 더욱 향상될 수 있는 것으로 분석되었다. 본 연구는 MAS를 이용하여 프로세스 개선효과에 대한 평가모델을 제시하고 분석했다는데 의의가 있다.

산악기상자료와 목재평형함수율에 기반한 산림연료습도 추정식 개발 (Modeling and mapping fuel moisture content using equilibrium moisture content computed from weather data of the automatic mountain meteorology observation system (AMOS))

  • 이훈택;원명수;윤석희;장근창
    • 한국지리정보학회지
    • /
    • 제22권3호
    • /
    • pp.21-36
    • /
    • 2019
  • 본 연구는 산불 위험 예측의 주요 인자인 10시간 사연료습도(10-h FMC)를 산악기상관측망 기상자료로 추정하는 방법을 마련하기 위해 수행되었다. 안성(도심지)과 홍릉 두 지점(숲 속, 숲 밖)의 자동기상관측소에서 기상인자와 10-h FMC를 측정하고 이를 이용해 10-h FMC 추정식을 도출했다. 도출한 추정식을 이용해 지난 6년간(2013~2018년) 산불발생 다발일의 10-h FMC를 분석하고 전국 10-h FMC 지도를 제작했다. 기상인자(기온, 풍속, 목재평형함수율, 강우량)와 10-h FMC의 회귀분석 결과 목재평형함수율이 가장 효율적으로 10-h FMC를 설명했음을 확인했다. 목재평형함수율을 이용해 도출한 10-h FMC 추정식은 모형 적합과 검증과정 모두에서 높은 적합도를 보였다. 각 연구지의 추정식을 서로 다른 연구지에 적용하면 모형의 적합도가 같은 연구지에서 만든 식을 적용했을 때보다 줄어들었지만 여전히 만족할 만한 결과를 보였다. 본 연구의 회귀식은 10-h FMC와 목재평형함수율 사이 강우 후 건조반응 차이와 식생 유무가 10-h FMC에 미치는 영향을 반영하지 못해 적합도가 줄어든 것으로 나타났다. 마지막으로 도출한 추정식을 사용한 공간분석을 통해 지난 6년간 산불발생 다발일의 산불 중 70% 이상이 10.5% 이하의 10-h FMC 조건에서 발생했음을 확인했다. 본 연구 결과는 산악기상관측망과 연계하여 전국 산지의 10-h FMC를 추정하는 데 사용할 수 있다. 10-h FMC는 산불 위험 예측 기초 연구 자료로 활용되어 재해 관련 국가 정책 결정에 기여할 것으로 판단된다.

과정기반 모형을 활용한 산림의 순일차생산성 평가: 남북한 소나무 및 참나무 임분을 중심으로 (Assessing forest net primary productivity based on a process-based model: Focusing on pine and oak forest stands in South and North Korea)

  • 송철호;최현아;손지원;고영진;;이우균
    • 환경생물
    • /
    • 제41권4호
    • /
    • pp.400-412
    • /
    • 2023
  • 본 연구에서는 과정기반 생지화학모형 중 하나인 BGC-MAN (Biogeochemistry Management) 모형을 남북한에 적용하여 산림생태계의 생산성을 나타내는 지표인 순일차생산성(Net Primary Productivity, NPP)을 평가하였다. 기상자료의 경우에는 우리나라 기상청 기후정보포털의 실측 및 동아시아 시나리오 자료를 병행하여 활용하였다. 식생정보로는 소나무(Pinus densiflora) 및 참나무(Quercus spp.) 임분을 대상으로 우리나라의 광릉 및 설마천 유역과 북한 내 양묘장이 있는 것으로 알려져 있는 사리원, 서흥, 해주, 정주, 원산을 대상지로 선정하였다. 생물리적 정보 중경위도, 고도, 사면 방향 등의 지형정보는 SRTM (Shuttle Radar Topography Mission)의 수치표고모델을 활용하였으며, 토양정보 등의 경우에는 HWSD (Harmonized World Soil Database)의 정보를 활용하였다. 관리 요인의 경우에는 1950년의 한국전쟁으로 인한 남북한 산림파괴와 이후 산림의 재조림 과정을 고려하였다. 1991년부터 2100년까지 모의된 NPP의 전체 평균 값은 5.17 Mg C ha-1이었으며, 범위는 3.30~8.19Mg C ha-1로 도출되었다. 또한 기후 시나리오의 변동성이 커짐에 따라서 산림 생산성의 교란이 커졌으며, 소나무 임분의 생장 둔화가 두드러지게 나타났다. 기후변화에 따라 생태계 과정기반 모형의 중요성이 커지는 시점에서 BGC-MAN 모형의 한반도 적용성이 검토되었다. 본 연구의 제한된 자료를 통해서 기후변화에 대한 교란이 산림생태계에 미치는 여러 요인들이 분석된 만큼, 향후 모델링 방법의 보완을 통해 보다 한반도 전역의 정밀한 생태계 변화를 과정기반 모형을 통해 모의할 수 있도록 해야 할 것이다.

빅데이터와 딥러닝을 활용한 동물 감염병 확산 차단 (Animal Infectious Diseases Prevention through Big Data and Deep Learning)

  • 김성현;최준기;김재석;장아름;이재호;차경진;이상원
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.137-154
    • /
    • 2018
  • 조류인플루엔자와 구제역 같은 동물감염병은 거의 매년 발생하며 국가에 막대한 경제적 사회적 손실을 일으키고 있다. 이를 예방하기 위해서 그간 방역당국은 다양한 인적, 물적 노력을 기울였지만 감염병은 지속적으로 발생해 왔다. 최근 빅데이터와 딥러닝 기술을 활용하여 감염병의 예측모델을 개발하고자 하는 시도가 시작되고 있지만, 실제로 활용가능한 모델구축 연구와 사례보고는 활발히 진행되고 있지 않은 실정이다. KT와 과학기술정보통신부는 2014년부터 국가 R&D사업의 일환으로 축산관련 차량의 이동경로를 분석하여 예측하는 빅데이터 사업을 수행하고 있다. 동물감염병 예방을 위하여 연구진은 최초에는 차량이동 데이터를 활용한 회귀분석모델을 기반으로 한 예측모델을 개발하였다. 이후에는 기계학습을 활용하여 좀 더 정확한 예측 모델을 구성하였다. 특히, 2017년 예측모델에서는 시설물에 대한 확산 위험도를 추가하였고 모델링의 하이퍼 파라미터를 다양하게 고려하여 모델의 성능을 높였다. 정오분류표와 ROC 커브를 확인한 결과, 기계 학습 모델보다 2017년 구성된 모형이 우수함을 확인 할 수 있었다. 또한 2017에는 결과에 대한 설명을 추가하여 방역당국의 의사결정을 돕고 이해관계자를 설득할 수 있는 근거를 확보하였다. 본 연구는 빅데이터를 활용하여 동물감염병예방시스템을 구축한 사례연구로 모델주요변수값, 이에따른 실제예측성능결과, 그리고 상세하게 기술된 시스템구축 프로세스는 향후 감염병예방 영역의 지속적인 빅데이터활용 및 분석 모델 개발에 기여할 수 있을 것이다. 또한 본 연구에서 구축한 시스템을 통해 보다 사전적이고 효과적인 방역을 할 수 있을 것으로 기대한다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).