텍스트 마이닝을 활용한 신문사에 따른 내용 및 논조 차이점 분석 (A Study on Differences of Contents and Tones of Arguments among Newspapers Using Text Mining Analysis)
-
- 지능정보연구
- /
- 제18권3호
- /
- pp.53-77
- /
- 2012
본 연구는 경향신문, 한겨레, 동아일보 세 개의 신문기사가 가지고 있는 내용 및 논조에 어떠한 차이가 있는지를 객관적인 데이터를 통해 제시하고자 시행되었다. 본 연구는 텍스트 마이닝 기법을 활용하여 신문기사의 키워드 단순빈도 분석과 Clustering, Classification 결과를 분석하여 제시하였으며, 경제, 문화 국제, 사회, 정치 및 사설 분야에서의 신문사 간 차이점을 분석하고자 하였다. 신문기사의 문단을 분석단위로 하여 각 신문사의 특성을 파악하였고, 키워드 네트워크로 키워드들 간의 관계를 시각화하여 신문사별 특성을 객관적으로 볼 수 있도록 제시하였다. 신문기사의 수집은 신문기사 데이터베이스 시스템인 KINDS에서 2008년부터 2012년까지 해당 주제로 주제어 검색을 하여 총 3,026개의 수집을 하였다. 수집된 신문기사들은 불용어 제거와 형태소 분석을 위해 Java로 구현된 Lucene Korean 모듈을 이용하여 자연어 처리를 하였다. 신문기사의 내용 및 논조를 파악하기 위해 경향신문, 한겨레, 동아일보가 정해진 기간 내에 일어난 특정 사건에 대해 언급하는 단어의 빈도 상위 10위를 제시하여 분석하였고, 키워드들 간 코사인 유사도를 분석하여 네트워크 지도를 만들었으며 단어들의 네트워크를 통해 Clustering 결과를 분석하였다. 신문사들마다의 논조를 확인하기 위해 Supervised Learning 기법을 활용하여 각각의 논조에 대해 분류하였으며, 마지막으로는 분류 성능 평가를 위해 정확률과 재현률, F-value를 측정하여 제시하였다. 본 연구를 통해 문화 전반, 경제 전반, 정치분야의 통합진보당 이슈에 대한 신문기사들에 전반적인 내용과 논조에 차이를 보이고 있음을 알 수 있었고, 사회분야의 4대강 사업에 대한 긍정-부정 논조에 차이가 있음을 발견할 수 있었다. 본 연구는 지금까지 연구되어왔던 한글 신문기사의 코딩 및 담화분석 방법에서 벗어나, 텍스트 마이닝 기법을 활용하여 다량의 데이터를 분석하였음에 의미가 있다. 향후 지속적인 연구를 통해 분류 성능을 보다 높인다면, 사람들이 뉴스를 접할 때 그 뉴스의 특정 논조 성향에 대해 우선적으로 파악하여 객관성을 유지한 채 정보에 접근할 수 있도록 도와주는 신뢰성 있는 툴을 만들 수 있을 것이라 기대한다.
Health education, as the most fundamental concept for national health promotion, alms for developing the self-care ability of the general public. High school days are regarded as the period when most important physical, mental and social developments occur, and most health-related behaviors are formed. School health education is one of the major learning resources influencing health potential in the home and community as well as for the individual student. High school health education in Korea has a fundamental systemic flaw in that health-related subjects are divided and taught under various subjects areas at school. In order to achieve the goal of school health education, it is essential to make a systematic assessment of the learner's concerns connected with his health and life, and the factors affecting them. So far, most of the research projects that had been carried out for improving high school health education were limited in their concerns to a particular aspect of health. Even though some had been done in view of comprehensive school health education, they failed to Include a health assessment of the learner. Therefore, in this study the high school students' concerns related to health and life were investigated in the first place on the basis of the PRECEDE model, developed by Green and others for the purpose of a comprehensive diagnostic research on high school health education. This study was done in two steps : one was the basic study for developing research instrument and the other was the main one. The former was conducted at five high schools in Seoul and Cheongju for 2 months-beginning in March, 1996. The students were asked to respond to questions related to their health and lives in unstructured open-ended question forms. On the basis of analysis of the basic study, the diagnostic instruments for the quality of life, health problems, health behavior and educational factors were constructed to be used for the collection of data for main study. An expert panel and the pilot study were used to improve content validity and reliability of the instruments. The reliability of the instruments was measured at between .7697 and .9611 by the Cronbach
산업에서 발생되는 온실가스를 줄이기 위해서는 각 산업별 온실가스 발생량을 정확히 예측해야 한다. 이에 본 연구에서는 2003년 산업연관표와 에너지 사용량 통계자료를 기초로 401개 산업별 직 간접
의복의 자아 근접성 개념을 기반으로 한 여러 연령층의 설문조사 결과를 바탕으로 하여 2004년에 Sontag과 Lee가 객관적 측정도구, 의복의 자아 근접성 척도(PCS Scale)를 개발하였다. Sontag과 Lee는 24-항목을 포함한 4-요인으로 구성된 PCS 척도를 청소년층을 대상으로 타당화 하였다. 본 연구는 그들 연구의 연계로 초기 6-요인으로 구성되었던 PCS 척도를 노년층에 적용하여 19-항목을 포함한 3-요인으로 구성된 PCS 척도를 타당화 한다. 65세 이상의 노인층이 본 연구의 표본집단으로 설정되었고 임의 표집방법을 이용, 미국 전역 1,700명의 노년 표본이 표본조사회사로부터 구입되었다. 2004년 11월 설문조사가 시작되어 2005년 2월에 총 250개의 이용 가능한 설문자료가 수집되었다(15.6%의 응답 비율). PCS 척도의 타당성을 검증하기 위하여 Sontag과 Lee의 연구에서 사용한 요인분석과 신뢰도분석을 동일하게 3단계 절차로 노인층을 대상으로 실시하였다. AMOS 5.0 을 사용한 3단계 신뢰도 분석 결과 19-항목을 포함한 3-요인으로 구성된 PCS척도의 타당성이 노인층을 대상으로 검증되었다. 노인층의 PCS척도는 다음의 3-요인으로 구성된다: 1) 의복이 자아 구성 과정에 미치는 영향(PCS 요인 1-2-3의 병합), 2) 의복이 평가적이고 정서적인 자존 형성과정에 미치는 영향(PCS 요인 4-5의 병합), 그리고 3) 의복이 신체상과 신체에 쏟는 정신 집중정도에 미치는 영향(PCS 요인 6). Sontag과 Lee가 초기적으로 가설한 6-요인 PCS 척도는 청소년층과 노인층을 대상으로 한 어느 연구에서도 검증되지 않았다. 더 나아가, 이들이 검증한 청소년층의 4-요인 PCS 척도도 노인층을 대상으로 한 연구에서 검증되지 않았다. 이는 노인들의 자아 구성 이젊은 층보다 더 통괄/복합적인 것에서 기인된다고 보인다. 이 글은 PCS 척도의 앞으로의 연구방향과 이용방향을 끝으로 마무리 지어 진다.
M&A 과정, 특히 인수 후 통합에 관한 기존의 연구는 내부 조직의 통합에 중점을 두어 왔는데, 본 연구는 백화점 간의 인수합병 과정에서 브랜드 네임 및 회원 제도의 통합 사례에 대한 분석을 통해 양사의 브랜드와 고객의 통합 과정이 어떻게 이루어지며, 그 과정에서 무엇이 중요한지를 보고자 하였다. 본 연구는 유통학문의 연구방법론 중 규범적 연구방법론이나 경험적 분석기법에 적용되는 사례연구의 접근법을 적용하여, 인수합병을 통해 두 회사의 브랜드 네임과 회원 제도를 통합한 기업을 선정하여 분석하였다. 연구 결과, 인수합병 과정의 브랜드와 고객 측면의 통합을 위해서는 양사의 브랜드 및 고객 관리 현황에 대한 이해를 바탕으로 주요 통합 영역을 설정하여 고객과 기업의 양쪽 측면에서 의사결정을 고려해야 한다는 것, 통합의 목표를 단기적인 사업 효율성 추구가 아니라 장기적인 브랜드 파워와 구체적인 시너지 등으로 추구해야 한다는 것, 브랜드의 통합과 회원 제도의 통합은 사업 전략과 마케팅 프로그램 등의 변화를 유발하기 때문에 구체적인 후속 프로그램이 필요하다는 것을 알 수 있었다. 본 연구는 단일 기업을 대상으로 한 서술식 사례 연구라는 한계가 있어, 향후에는 복수 기업들의 비교분석적 연구나 브랜드 및 고객 통합 관련 이론들을 체계적인 분석의 틀로 이용하는 연구 등이 필요할 것이다.
본 연구는 낙동강 본류의 안동댐 하류(4,565.7 km2) 하천을 대상으로 1차원 물리적 서식처 모형인 PHABSIM과 2차원 물리적 서식처 모형인 River2D를 활용하여 대상어종에 대해 환경생태유량을 산정하고 어류서식처에 대한 2차원 공간분석을 수행하였다. 서식처 모형의 구축을 위해 낙동강유역의 하천기본계획보고서를 활용하여 하천단면정보와 수리학적 입력자료를 수집하였다. PHABSIM 구축범위는 구담수위관측소(GD)로부터 약 410.0 m, River2D의 경우 GD를 포함한 약 6.0 km에 대해 구축하였다. 대상어종 선정 및 HSI 구축을 위해 대상하천의 하류에 위치한 풍지교에서 어류 현장조사를 수행하였다. 어류 현장조사 결과, 피라미가 우점종으로 나타나 피라미(Zacco platypus)를 대상어종으로 선정하였고 피라미의 물리적 서식처 특성을 활용하여 HSI를 구축하였다. 피라미의 최적 HSI 범위는 유속에서 0.3~0.5 m/s, 수심에서 0.4~0.6 m, 그리고 하상재료는 모래에서 잔자갈로 나타났다. HSI를 PHABSIM에 적용하여 환경생태유량을 산정한 결과, 대상하천의 최적 환경생태유량은 20.0 m3/sec로 산정되었다. River2D를 활용하여 어류서식처의 2차원 공간분석을 수행한 결과 WUA는 환경생태유량 조건에서 107,392.0 m2/1000 m으로 산정되었고, Q355 조건과 비교하여 하천 전반적으로 어류서식처가 확보되는 것을 확인하였다.
인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.
The wall shear stress in the vicinity of end-to end anastomoses under steady flow conditions was measured using a flush-mounted hot-film anemometer(FMHFA) probe. The experimental measurements were in good agreement with numerical results except in flow with low Reynolds numbers. The wall shear stress increased proximal to the anastomosis in flow from the Penrose tubing (simulating an artery) to the PTFE: graft. In flow from the PTFE graft to the Penrose tubing, low wall shear stress was observed distal to the anastomosis. Abnormal distributions of wall shear stress in the vicinity of the anastomosis, resulting from the compliance mismatch between the graft and the host artery, might be an important factor of ANFH formation and the graft failure. The present study suggests a correlation between regions of the low wall shear stress and the development of anastomotic neointimal fibrous hyperplasia(ANPH) in end-to-end anastomoses. 30523 T00401030523 ^x Air pressure decay(APD) rate and ultrafiltration rate(UFR) tests were performed on new and saline rinsed dialyzers as well as those roused in patients several times. C-DAK 4000 (Cordis Dow) and CF IS-11 (Baxter Travenol) reused dialyzers obtained from the dialysis clinic were used in the present study. The new dialyzers exhibited a relatively flat APD, whereas saline rinsed and reused dialyzers showed considerable amount of decay. C-DAH dialyzers had a larger APD(11.70
The wall shear stress in the vicinity of end-to end anastomoses under steady flow conditions was measured using a flush-mounted hot-film anemometer(FMHFA) probe. The experimental measurements were in good agreement with numerical results except in flow with low Reynolds numbers. The wall shear stress increased proximal to the anastomosis in flow from the Penrose tubing (simulating an artery) to the PTFE: graft. In flow from the PTFE graft to the Penrose tubing, low wall shear stress was observed distal to the anastomosis. Abnormal distributions of wall shear stress in the vicinity of the anastomosis, resulting from the compliance mismatch between the graft and the host artery, might be an important factor of ANFH formation and the graft failure. The present study suggests a correlation between regions of the low wall shear stress and the development of anastomotic neointimal fibrous hyperplasia(ANPH) in end-to-end anastomoses. 30523 T00401030523 ^x Air pressure decay(APD) rate and ultrafiltration rate(UFR) tests were performed on new and saline rinsed dialyzers as well as those roused in patients several times. C-DAK 4000 (Cordis Dow) and CF IS-11 (Baxter Travenol) reused dialyzers obtained from the dialysis clinic were used in the present study. The new dialyzers exhibited a relatively flat APD, whereas saline rinsed and reused dialyzers showed considerable amount of decay. C-DAH dialyzers had a larger APD(11.70
Background : A pressure sore was defined as any skin lesion caused by unrelieved pressure and resulting in damage to underlying tissue. The health care institutions in the United States were reported the incident rate of pressure sores ranging from 6 to 14 %. Intensive Care Unit needed highest quality of care has been found over 40% incidence rate of pressure sore. Also, Annual expenditures for the care of pressure sores in patients in the United States have been estimated to be $7.5 billion; furthermore, 50 percent more nursing time is required to care for patients with pressure sore in comparison to the time needed to implement preventive measures against pressure sore formation. However, In Korea, there were little reliable reports, or researches, about incidence rates of pressure sore in health care institution including intensive care unit and about the integrated approach like CQI action team for risk assessment, prevention and treatment of pressure ulcers. Therefore, this study was to develop pressure sore risk assessment tool and the protocol for prevention of pressure sore formation through CQI action team activities, to monitor incident rate of pressure sore and the length of sore formation for patients at high risk, and to approximately estimate nursing time for sore dressing during research period as the effect of CQI action team. Method : CQI action team in intensive care unit, launched since early 1996, reviewed the literature for the standardized risk assessment tool, developed the pressure sore assessment tool based on the Braden Scale, tested its validity, compared on statistics including incidence rate of pressure sore for patients at high risk. Throughout these activities, CQI action team was developed the protocol, called as St. Marys hospital Intensive Care Unit Pressure Sore Protocol, shifted the emphasis from wound treatment to wound prevention. After applied the protocol to patients at high risk, the incident rate and the period of prevention against pressure development were tested with those for patients who received care before implementation of protocol by Chi-square and Kaplan-Meier Method of Survival Analysis. Result : The CQI action team found that these was significant difference of in incidence rate of pressure sores between patients at high risk (control group) who received care before implementation of protocol and those (experimental group) who received it after implementation of protocol (p<.05). 25% possibility of pressure sore formation was shown for the patients with 6th hospital day in ICU in control group. In experimental group, the patients with 10th hospital day had 10% possibility of pressure sore. Therefore, there was significant difference(p<.05) in survival rate between two groups. Also, nursing time for dressing on pressure sore in experimental group was decreased as much as 50% of it in control group. Conclusion : The collaborative team effort led to reduced incidence, increased the length of prevention against pressure sore, and declined nursing care times for sore dressing. However, there have had several suggestions for future study. The preventive care system for pressure sore should be applied to patients at moderate, or low risk throughout continuous CQI team activities based on Bed Sore Indicator Fact Sheet. Hospital-wide supports, such as incentives, would be offered to participants for keeping strong commitment to CQI team. Also, Quality Information System monitoring incidents and estimating cost of poor quality, like workload (full time equivalence) or financial loss, regularly in a hospital has to be developed first for supporting CQI team activities as well as empowering hospital-wide QI implementation. Being several limitations, this study would be one of the report cards for the CQI team activities in intensive care unit of an acute hospital and a trial of quality improvement of health care in Korea.