• Title/Summary/Keyword: 과학 텍스트

Search Result 598, Processing Time 0.032 seconds

선택적 자질 차원 축소를 이용한 최적의 지도적 LSA 방법 (Optimal supervised LSA method using selective feature dimension reduction)

  • 김정호;김명규;차명훈;인주호;채수환
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.47-60
    • /
    • 2010
  • 기존 웹 페이지 자동분류 연구는 일반적으로 학습 기반인 kNN(k-Nearest Neighbor), SVM(Support Vector Machine)과 통계 기반인 Bayesian classifier, NNA(Neural Network Algorithm)등 여러 종류의 분류작업에서 입증된 분류 기법을 사용하여 웹 페이지를 분류하였다. 하지만 인터넷 상의 방대한 양의 웹 페이지와 각 페이지로부터 나오는 많은 양의 자질들을 처리하기에는 공간적, 시간적 문제에 직면하게 된다. 그리고 분류 대상을 표현하기 위해 흔히 사용하는 단일(uni-gram) 자질 기반에서는 자질들 간의 관계 분석을 통해 자질에 정확한 의미를 부여하기 힘들다. 특히 본 논문의 분류 대상인 한글 웹 페이지의 자질인 한글 단어는 중의적인 의미를 가지는 경우가 많기 때문에 이러한 중의성이 분류 작업에 많은 영향을 미칠 수 있다. 잠재적 의미 분석 LSA(Latent Semantic Analysis) 분류기법은 선형 기법인 특이치 분해 SVD(Singular Value Decomposition)을 통해 행렬의 분해 및 차원 축소(dimension reduction)를 수행하여 대용량 데이터 집합의 분류를 효율적으로 수행하고, 또한 차원 축소를 통해 새로운 의미공간을 생성하여 자질들의 중의적 의미를 분석할 수 있으며 이 새로운 의미공간상에 분류 대상을 표현함으로써 분류 대상의 잠재적 의미를 분석할 수 있다. 하지만 LSA의 차원 축소는 전체 데이터의 표현 정도만을 고려할 뿐 분류하고자 하는 범주를 고려하지 않으며 또한 서로 다른 범주 간의 차별성을 고려하지 않기 때문에 축소된 차원 상에서 분류 시 서로 다른 범주 데이터간의 모호한 경계로 인해 안정된 분류 성능을 나타내지 못한다. 이에 본 논문은 새로운 의미공간(semantic space) 상에서 서로 다른 범주사이의 명확한 구분을 위한 특별한 차원 선택을 수행하여 최적의 차원 선택과 안정된 분류성능을 보이는 최적의 지도적 LSA을 소개한다. 제안한 지도적 LSA 방법은 기본 LSA 및 다른 지도적 LSA 방법들에 비해 저 차원 상에서 안정되고 더 높은 성능을 보였다. 또한 추가로 자질 생성 및 선택 시 불용어의 제거와 자질에 대한 가중치를 통계적인 학습을 통해 얻음으로써 더 높은 학습효과를 유도하였다.

  • PDF

성인의 바른 우유 섭취를 위한 카드뉴스 형식의 교육자료 개발 (Development of Education Materials for Healthy Consumption of Milk in a Card News Format for Korean Adults)

  • 김선효
    • 한국가정과교육학회지
    • /
    • 제32권3호
    • /
    • pp.97-110
    • /
    • 2020
  • 본 연구는 스마트폰이나 인터넷으로 쉽게 접할 수 있고 파급력이 높은 카드뉴스 형태로 우유 섭취를 습관화 하는 과학적 근거에 기반한 성인용 우유 교육 교재 콘텐츠를 개발하는 것에 목적을 두었다. 카드뉴스는 문헌 인용 및 참여적 디자인 방법을 적용하여 [정보 요구도 분석→ 정보의 범위 및 주제 선정→ 콘텐츠 시안 작성→ 카드뉴스 시안 개발→ 카드뉴스 시안 검토→카드뉴스 최종안 완성] 단계를 밟아 개발함으로써 체계적이고 정확한 결과물을 생성하고자 하였다. 카드뉴스에 담을 주제 선정은 문헌 분석과 함께 편의추출법으로 선정한 성인 남녀 10명(만나이 32.0±6.4세)을 대상으로 포커스 그룹 인터뷰를 실시하는 방식에 의해 이루어졌다. 이 결과 콘텐츠 시안은 성인의 하루 칼슘 섭취량과 우유의 영양성분, 우유 섭취와 건강, 우유 섭취와 체중관리, 우유에 대한 잘못된 정보 바로 잡기, 우유의 바른 선택방법, 흰우유를 섭취해야 하는 이유와 권장기준, 우유 섭취방법, 우유를 이용한 간단한 요리로 구성하였으며 장별로 인용한 문헌을 제시하였다. 콘텐츠 시안 작성 시 주제별로 성인기의 식습관, 생활습관, 영양 및 건강 관심사를 반영하면서 사용자가 알고 싶어하는 몇가지 정보를 선별하여 담도록 하였다. 카드뉴스 시안 개발은 경험이 풍부한 전문가가 콘텐츠 시안을 성인이 이해하기 쉬운 텍스트로 바꾸고 주제와 어울리는 이미지, 그래프, 그림 등을 전문프로그램을 사용해 제시하는 방식으로 이루어졌다. 카드뉴스 시안에 대해 연구자가 1차 수정한 후 전문가 자문을 받았으며, 또한 성인 남녀 50명(만나이 42.7±10.2세)을 대상으로 5점 척도로 만족도 설문조사를 실시하였다. 설문조사 결과 만족도는 문항별로 5점 만점 중 4점 이상으로 높아 교육 효과를 낼 수 있을 것으로 기대되었다. 전문가 자문 및 설문조사 결과를 반영하여 수정한 후 11장 분량의 카드뉴스 최종안을 완성하였다. 따라서 본 연구에서 성인이 손쉽게 접근하고 활용할 수 있는 모바일용 우유 교육 교재를 카드뉴스로 개발하였으며 이는 친근하면서 체계적인 우유 교육을 통해 성인기의 우유 섭취 증대와 영양·건강 향상 효과를 낼 것으로 생각된다.

효율적인 이미지 분할을 위한 RGB 채널 선택 기법 (RGB Channel Selection Technique for Efficient Image Segmentation)

  • 김현종;박영배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권10호
    • /
    • pp.1332-1344
    • /
    • 2004
  • 최근 초고속 통신망 및 멀티미디어 관련기술의 발달로 인해 멀티미디어 데이타를 좀 더 효율적으로 전송하고 저장, 검색하는 기술이 요구되고 있다. 그 중에서 의미 기반 영상 검색은 색상, 질감, 모양 정보 등의 저 차원 특징 정보와 이미지 데이타에 의미를 부여하기 위해 주석 처리하는 것이 일반적이다. 그리고 부여된 키워드와 같은 어휘 사전을 이용하여 의미기반 정보검색을 수행하고 있지만, 기존의 키 워드기반 텍스트 정보검색의 한계를 벗어나지 못하는 문제를 야기 시킨다. 두 번째 문제점으로 내용 기반이미지 검색시스템에서 검색 성능이 떨어지며, 복잡한 배경을 가진 이미지에서 객체를 분리하기가 어렵고, 그리고 영역의 과잉 분할로 인하여 영역 추출이 어렵다. 그리고 복잡한 다중 객체를 가진 이미지에서 객체들을 분리하기 어렵다는 것이다. 이러한 문제점들을 해결하기 위해서, 본 논문에서는 총 다섯 가지 단계로 처리할 수 있는 내용 기반 검색 시스템을 구축한다. 다섯 단계 중에서 가장 중요한 부분은 RGB 이미지들 중에서 배경이 가장 큰 것과 가장 작은 것을 추출한다. 특히, 배경이 가장 큰 이미지를 이용하여 피사체와 배경을 추출하는 방법을 제안한다. 두 번째 문제점을 해결하기 위해서, RGB 채널 분할 기법을 이용하여 객체를 분리하고, Watermerge의 임계값을 이용하여 영역의 과잉분할을 최적화하며, RGB 채널 선택 기법을 이용하여 다중객체를 분리하는 방법을 제안한다. 실험을 통하여 기존에 검색하기 어려웠던 복잡한 객체들을 검색하는 방법들을 대체할 수 있도록, 제안한 기법이 기존의 방법보다 검색 성능이 우수함을 입증한다.과 황산이온의 농도에 따르는 것으로 생각된다. 이상과 같이, 에트린자이트는 콘크리트 내에서 다양한 내외부적인 화학작용 따라 특징적인 산출 양상을 보이며, 주변 환경 조건에 따라 다른 광물로 전이되는 나타내었다. 이러한 연구결과, 에트린자이트의 생성에 따른 콘크리트의 성능저하는 그 광물학적 특성과 분포양상에 관련성을 가지는 것으로 나타났다.인 상관관계를 보이지 않는 것으로 나타난다. 이에 비해서 팽윤도는 벤토나이트의 광물조성, 표면전하 특성, 입도 및 형상 등의 물리화학적 성향을 포괄하는 체표면적 수치와 대략적으로 반비례적인 관계를 보인다 따라서 벤토나이트 현탁액에서의 유변학적 특성은 몬모릴로나이트의 표면전하 특성, 형태, 입도 및 조직 등의 차이에 의해서 달라지는 점토 입자들의 응집특성 및 취합결정체의 형상에 주로 규제되고, 제올라이트와 같은 미세한 불순 광물성분들의 영향도 부수적으로 관여되는 복합적인 성향인 것으로 해석된다.18.88%이상 향상시키는 것으로 나타났다. 3. 유지방 함량 23.80%인 control 치즈의 cholesterol 함량은 81.47mg/100g이었고, 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 2%를 첨가한 cheese에서는 cholesterol 함량이 20.15mg/100g으로 cholesterol 제거율이 75.27%로 가장 높게 나타났다. 4. Meltability는 균질압력 1200psi(91kg/$cm^2$)에 $\beta$-cyclodextrin 1과 2%로 처리한

독일 유전자검사법의 규율 구조 이해 - 의료 목적 유전자검사의 문제를 중심으로 - (Understanding the Legal Structure of German Human Gene Testing Act (GenDG))

  • 김나경
    • 의료법학
    • /
    • 제17권2호
    • /
    • pp.85-124
    • /
    • 2016
  • 독일 유전자검사법은 분석과 해석이라는 유전자검사의 이원적 구조에 대한 이해에 기초하여 법문언을 의미론적으로 차별화한다. 동법은 우선 유전자 "검사", "분석" 및 검사결과에 대한 "판단"을 언어적으로 구별한다. 법 제3조의 정의 규정을 보면 '분석'은 각 유형의 분석 기술을 표상하는 용어로 그리고 '판단'은 가능성에 대한 예견을 함축하는 용어로 사용하고 있음을 확인할 수 있다. 아울러 동법은 정보적 자기결정권을 법의 이념적 목표로 상정하는데 이에 기초하여, 한편으로는 유전정보가 갖는 의미에 대한 올바른 인식에 기초하여 개인이 자신의 삶을 새롭게 기획하는 과정의 합리성을 확보하고 다른 한편 타인의 유전정보를 합리적으로 이해하는 것을 도모하는 장치를 마련하라는 정언명령이 도출된다. 이러한 규범텍스트의 설정과 이념은 유전자검사법에서 검사의 유형을 분류하는 기초가 된다. 특히 의료 목적 유전자검사의 경우에는 그 목적에 따라 진단적 검사와 예견적 검사로 분류되는데, 검사가 갖는 예견적 가치는 어느 검사에서든 보편적으로 인정된다는 점에서 양자가 분명히 구별되기는 어렵다고 보인다. 이러한 점에 비추어볼 때, 유전자검사에 대한 법적 규율에서 중요한 것은 무엇보다 유전자검사를 구성하는 분석과 판단 행위에 내재된 불확실성과 주관성을 합리적으로 관리하는 것이다. 동법은 한편으로는 분석 행위의 정확성을 도모하기 위해 제5조에서 분석의 질을 보장하기 위한 장치를 마련하고 있으며, 제23조에 설치 근거를 둔 유전자진단위원회(GEKO)에서는 가이드라인을 통해 분석의 타당성을 확보하기 위한 구체적인 기준을 제시하고 있다. 다른 한편 해석의 스펙트럼이 넓은 의료 목적 유전자검사의 경우 해석의 절차적 합리성을 보장하기 위한 장치를 마련하고 있다. 특히 GEKO는 가이드라인을 통해 의료 목적 유전자검사에서 유전적 특징이 갖는 의미에 대한 가치평가의 기준으로 임상적 타당성, 유전자변형의 병인론적 의미, 임상적 유용성 등을 제시한다. 다만 이러한 가치평가 기준의 구체적 내용들은 과학 기술의 발전에 따라 늘 새롭게 변화될 수 있고 더 나아가 연구 주체나 의료 행위의 주체에 따라 그 의미에 대한 이해가 달라질 수 있다. 그렇기 때문에 유전자검사에서 다른 한편 중요한 것은 피검사자가 유전자검사의 구조적 특징 및 검사와 검사결과의 의미를 이해하고 유전자를 둘러싼 개인적 불안과 기대를 조율하면서 자신의 삶을 기획할 수 있도록 하는 합리적 절차를 마련하는 것이다. 이를 위해 유전자검사법은 - 우리나라의 생명윤리안전법은 마련하고 있지 않은 - 유전상담의 절차를 제도화하고 있다. 이러한 이해를 종합해볼 때, 독일 유전자검사법 역시 아직 개선되어야 할 문제들을 안고 있지만, 유전자검사의 고유한 특징을 인식하는 데에서 출발하여 검사의 이념적 목표를 분명히 하고 규율 영역을 설정하는 기본 구상, 커뮤니케이션의 이상을 실현하고 임상적 적용을 위한 다양한 가이드라인을 전문 기구에서 지속적으로 고민하고 제정하는 시스템 등은 우리 생명윤리안전법의 올바른 정책적 방향을 모색하는 데에 시사하는 바가 크다.

  • PDF

통합된 비디오 인덱싱 방법을 이용한 내용기반 비디오 데이타베이스의 설계 및 구현 (Design and Implementation of Content-based Video Database using an Integrated Video Indexing Method)

  • 이태동;김민구
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권6호
    • /
    • pp.661-683
    • /
    • 2001
  • 오늘날 멀티미디어 정보의 양이 매우 빠른 속도로 증가함에 따라 비디오 데이타베이스에 대한 효율적인 관리는 더욱 중요한 의미를 가지게 되었다. 그리고 초고속 정보통신망과 디지털 기술의 발전은 비디오 데이타를 통신 및 컴퓨터와 결합하여 새로운 멀티미디어로 발전하고 있으며, 인터넷 방송, 주문형 비디오(VOD) 등에 크게 활용하고 있다. 비디오는 대용량적인 특성과 비정형적인 특성을 가지고 있으므로 신속하고 효율적으로 비디오를 검색하기 위해 비디오의 정확한 특징정보를 추출하여 비디어 데이타베이스를 구축하여야 한다. 비디오 데이타베이스는 텍스트 기반의 전통 데이타베이스와는 다른 모델링 방법과 검색방법을 사용한다. 따라서, 비디오 데이타베이스에서의 검색속도와 정확도를 향상시키기 위해서는 새로운 비디오 데이타베이스 생성기법과 효율적인 검색기법이 필요하다. 본 논문에서는 비디오의 의미적 구조와 사전 제작지식정보를 구조적으로 축적할 수 있는 내용기반 비디오 데이타베이스의 구축 방안과 생성기법을 제시하였다. 그리고 제안된 비디오 데이타베이스의 구축 방안과 생성기법을 사용하여 새로운 인터넷 방송 프로그램 컨텐츠 제작에 활용할 수 있는 비디오 데이타베이스를 구현하였다. 이를 위해 비디오 분할과 대표키 프레임 추출 시 비디오의 의미적 구조와 사전 제작지식정보의 상호관계를 기반으로 하여 비디오 데이타의 특징정보를 추출하고, 검색할 수 있도록 주석기반 검색과 내용기반 검색을 통합한 비디오 인덱싱 방법을 제시하였다. 통합된 비디오 인덱싱 방법은 비디오의 하위 레벨에 표현된 내용기반 메타데이타 유형과 비디오의 특징정보 추출이 어려운 상위 레벨에 표현된 주석기반 메타데이타 유형을 동시에 이용하므로 컨텐츠 검색의 성능을 향상시킬 수 있다. 마지막으로 본 논문에서 제시한 비디오 데이타베이스는 비디오의 의미적 구조와 사전 제작지식정보를 구조적으로 축적하여 데이타베이스를 구축하므로 정확한 인터넷 방송 컨텐츠 정보의 축적관리와 구축작업의 효율화가 가능하며, 또한 인터넷 방송 컨텐츠 제작 시 정보공유 및 재이용이 가능하므로 새로운 컨텐츠 제작의 효율성을 높일 수 있다.

  • PDF

남부루이지애나의 베트남 移民集團과 佛敎: 鎔鑛爐 속의 成分? 혹은 文化的 多樣性의 成分? (Vietnamese Immigrants and Buddhism in Southern Louisiana: Ingredients for 'Melting Pot' or for Cultural Diversity?)

  • 이영민
    • 대한지리학회지
    • /
    • 제31권4호
    • /
    • pp.685-698
    • /
    • 1996
  • 1975년 베트남 공산화 이후 본격적으로 이루어진 베트남인들의 미국 이민은 짧은 기간동안 대규모로 진행되어 1991년 현재, 약 850,000명에 이르고 있다. 그들의 다문화사회로의 인구이동과 문화적 적응의 문제는 그 동안 사회과학계의 쟁점으로 부상하여 적지 않은 연구들이 이루어 졌다. 그러나 대부분의 연구들은 베트남 이민집단을 단순히 미국 다문화사회의 여러 민족집단들 중 하나의 하위민족으로, 즉 주류집단의 관점에서 다루고 있다. 어떻게 하위민족으로서 미국사회에 편입되고 있는가?, 어떻게 새로운 장소에 정착하고 그 장소를 고유하게 창조해 나고 있는가? 등의 문제를 베트남인 자신의 입장에서 개진한 연구는 매우 적은 실정이다. 본 연구는 미국 루이지애나주 배톤루즈시 근교의 베트남 불교사원 신도들의 생활과 적응전략을, 즉 새로운 장소에서의 사회환경과 문화적 정체성 형성과정과의 관계를 민속지적 연구방법을 통하여 다루고 있다. 참여관찰과 인터뷰는 1992년 9월부터 11월 사이에 실시되었다. 남부루이지애나, 배톤루즈시, 그리고 불교사원, Chua Tu-Bi(慈悲寺)는 베트남 이민집단과 주류문화집단과의 상호교류의 장으로서 일종의 공간적 텍스트이다. 불교사원은 베트남인들의 내적 평화를 연마하는 종교적 목적을 달성키 위해 그들 자신들의 손으로 건조되었다. 현세의 모든 고통을 부의 추구와 같은 인간 자신의 욕망에 기인하는 것으로 간주하는 불교이념은 직관적 사고와 자기성찰을 통한 정신적 풍요를 추구한다. 이러한 불교의 가치는 프로테스탄트 이념에 바탕을 둔, 물질적 풍요를 위한 근로정신을 강조하는 미국적 가치와 어긋난다. 이러한 베트남 불교의 중교적 특징은 변화된 새로운 환경에서 재창조되어 오히려 그들의 적응전략으로서 기능한다. 사회, 경제적 차별을 극복하기 위해 그들은 경제적 부의 축적을 통한 계층상승만이 최선의 방법이라고 생각하고 있다. 불교사원은 그들이 불교이념을 연마하는 장소이기도 하지만, 동시에 현실세계에서 주류집단의 이념을 따르면서 겪게되는 정신적 피로를 위로 받는 장소이기도 하다. 불교의 정신적 풍요라는 가치가 주류사회의 가치와 전략적으로 혼합되어 변화된 현실에의 적응에 공헌을 하고 있는 것이다. 그러나 더욱 중요한 것은 불교를 통한 동족집단의 결속망이 이중노동시장이라는 미국사회의 불평등한 경제 구조를 극복할 수 있는 기반을 제공하고 있다는 점이다. 주류집단의 외부적 범주화에 의한 격리(segregation)를 그들은 내부적 범주화를 통한 응집(congregation)으로 승화시켜 계층상승의 도약대로 삼고 있다. 불교사원은 베트남 이민자들간의 상호 결속을 도모함으로써 그들의 정체성을 공고하게 해주는 역할을 하고 있다. 또한 불교사원은 주류집단이 자신들의 문화적 정체성을 인정하고 있고, 따라서 자신들도 미국사회에 통합되어 있다는 확신을 갖게 하는 일종의 가시적 상징이다. 그러나 다문화사회로의 국제인구이동을 통한 권력관계의 변화가 그들로 하여금 하위집단으로서 생존할 수 있는 전응전략을 창출해 내게 하였고, 그 과정에서 정체성의 변화는 필연적이라 하겠다. 민족정체성은 사회공간적 현상과 밀접히 연결되어 있는 가변적 현상인 것이다.

  • PDF

스마트가든의 인식경향에 관한 연구 (Study on the Current Status of Smart Garden)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제49권2호
    • /
    • pp.51-60
    • /
    • 2021
  • 현대사회는 인간, 사물, 네트워크가 관계를 형성하는 디지털기술의 발전으로 정보화, 지능화되고 있다. 이와 같은 시대적 변화에 따라 식물 재배 시 온도, 습도, 일광량, 수분공급 등 식물관리를 용이하게 할 수 있는 정원 관련 시스템이 등장하기 시작하였다. 이에 본 연구에서는 최근 이슈가 되고 있는 스마트가든의 개념 및 인식경향에 대하여 파악하고자 하였다. 본 연구의 목적을 달성하기 위하여 선행연구와 텍스트마이닝을 활용하였으며, 결과는 다음과 같다. 첫째, 스마트가든의 특성은 기술의 발전 및 사람들의 라이프스타일의 변화로 실내·외 공간에서 IoT기술과 정원이 융합한 새로운 정원형태 혹은 여가의 유형 중 하나이다. 기술의 발전과 환경의 중요성이 높아지면서 인간과 자연이 융합되는 생활공간의 요구로 스마트가든이 현실화되고 보편화되고 있다. 스마트가든의 등장으로 정원 관련 산업의 변화, 사람들의 라이프스타일 변화 등 정원의 활성화에 기여할 수 있을 것이다. 둘째, 현재 스마트가든과 관련된 연구 및 이용자의 경험에서 공통적으로 스마트가든의 기술적인 측면에 관심이 가장 높다. 사람들은 스마트가든이 일상생활 속에서 안전하고 쾌적하며 편리한 생활을 할 수 있는 기능 및 기술적인 측면을 중요시하며, 개인의 취향 및 디지털 기기의 이용능력에 따라 주체적인 이용이 나타나고 있다. 셋째, 스마트가든의 이용행태를 살펴보면 주로 가정 및 실내공간에서 이용하고 있으며, 먹을 수 있는 식물을 재배하고 있는 추세이다. 환경의 중요성이 높아지고 기후변화, 식량위기 등에 대한 우려로 먹거리와 관련된 식물 재배를 선호하고 있지만, 화훼류 등을 키울 수 있는 다양한 기술 및 매뉴얼로 이용자의 욕구를 만족시켜주어 정원기능의 확대에 이바지할 수 있을 것이다. 또한, 스마트가든의 형태를 새롭고 세련된 형태라고 느끼고 있어 스마트가든의 디자인이 이용자의 가치를 만족시키는 중요한 요소임을 알 수 있다. 현재 스마트가든은 기술적인 차원에서 발전하고 있다. 그러나 스마트가든의 주요 구성 요인은 인간과 자연 그리고 기술일 것이다. 단순하게 화분과 스마트기기를 연결하여 식물을 편하게 기르는데 집중하는 것이 아니라, 스마트시티, 스마트홈 등 다양한 도시서비스와 연계성을 강화하고, 스마트가든이 과학기술에 의해서만 자연이 재현되는 것이 아니라, 조경가와 상호작용하여 정원의 기능 및 이용자의 니즈를 포함한 디자인이어야 할 필요가 있다. 또한, 실내뿐만이 아니라, 도시공원 및 공공시설에서 시민에게 제공하여 연령 및 디지털 기기·정보의 격차로 인하여 '스마트'한 서비스를 향유하지 못하는 계층을 대상으로 하여 세대 간 커뮤니케이션, 정원의 기능을 공유할 수 있는 새로운 조경공간으로 잠재성을 갖고 있다.

데이터 마이닝과 텍스트 마이닝의 통합적 접근을 통한 병사 사고예측 모델 개발 (Development of the Accident Prediction Model for Enlisted Men through an Integrated Approach to Datamining and Textmining)

  • 윤승진;김수환;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.1-17
    • /
    • 2015
  • 최근, 군에서 가장 이슈가 되고 있는 문제는 기강 해이, 복무 부적응 등으로 인한 병력 사고이다. 이 같은 사고를 예방하는 데 있어 가장 중요한 것은, 사고의 요인이 될 수 있는 문제를 사전에 식별 관리하는 것이다. 이를 위해서 지휘관들은 병사들과의 면담, 생활관 순찰, 부모님과의 대화 등 나름대로의 노력을 기울이고 있기는 하지만, 지휘관 개개인의 역량에 따라 사고 징후를 식별하는 데 큰 차이가 나는 것이 현실이다. 본 연구에서는 이러한 문제점을 극복하고자 모든 지휘관들이 쉽게 획득 가능한 객관적 데이터를 활용하여 사고를 예측해 보려 한다. 최근에는 병사들의 생활지도기록부 DB화가 잘 되어있을 뿐 아니라 지휘관들이 병사들과 SNS상에서 소통하며 정보를 얻기 때문에 이를 데이터화 하여 잘 활용한다면 병사들의 사고예측 및 예방이 가능하다고 판단하였다. 본 연구는 이러한 병사의 내부데이터(생활지도기록부) 및 외부데이터(SNS)를 활용하여 그들의 관심분야를 파악하고 사고를 예측, 이를 지휘에 활용하는 데이터마이닝 문제를 다루며, 그 방법으로 토픽분석 및 의사결정나무 방법을 제안한다. 연구는 크게 두 흐름으로 진행하였다. 첫 번째는 병사들의 SNS에서 토픽을 분석하고 이를 독립변수화 하였고 두 번째는 병사들의 내부데이터에 이 토픽분석결과를 독립변수로 추가하여 의사결정나무를 수행하였다. 이 때 종속변수는 병사들의 사고유무이다. 분석결과 사고 예측 정확도가 약 92%로 뛰어난 예측력을 보였다. 본 연구를 기반으로 향후 장병들의 사고예측을 과학적으로 분석, 맞춤식으로 관리한다면 군대 내 각종 사고를 미연에 예방하는데 기여할 것으로 기대된다.