• 제목/요약/키워드: compare

검색결과 30,600건 처리시간 0.069초

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

텍스트 마이닝을 활용한 지역 특성 기반 도시재생 유형 추천 시스템 제안 (Suggestion of Urban Regeneration Type Recommendation System Based on Local Characteristics Using Text Mining)

  • 김익준;이준호;김효민;강주영
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.149-169
    • /
    • 2020
  • 현 정부의 주요 국책사업 중 하나인 도시재생 뉴딜사업은 매년 100 곳씩, 5년간 500곳을대상으로 50조를 투자하여 낙후된 지역을 개발하는 것으로 언론과 지자체의 높은 이목이 집중되고 있다. 그러나, 현재 이 사업모델은 면적 규모에 따라 "우리동네 살리기, 주거정비지원형, 일반근린형, 중심시가지형, 경제기반형" 등 다섯 가지로 나뉘어 추진되어 그 지역 본래의 특성을 반영하지 못하고 있다. 국내 도시재생 성공 키워드는 "주민 참여", "지역특화" "부처협업", "민관협력"이다. 성공 키워드에 따르면 지자체에서 정부에게 도시재생 사업을 제안할 때 지역주민, 민간기업의 도움과 함께 도시의 특성을 정확히 이해하고 도시의 특성에 어울리는 방향으로 사업을 추진하는 것이 가장 중요하다는 것을 알 수 있다. 또한 도시재생 사업 후 발생하는 부작용 중 하나인 젠트리피케이션 문제를 고려하면 그 지역 특성에 맞는 도시재생 유형을 선정하여 추진하는 것이 중요하다. 이에 본 연구는 '도시재생 뉴딜 사업' 방법론의 한계점을 보완하기 위해, 기존 서울시가 지역 특성에 기반하여 추진하고 있는 "2025 서울시 도시재생 전략계획"의 도시재생 유형을 참고하여 도시재생 사업지에 맞는 도시재생 유형을 추천하는 시스템을 머신러닝 알고리즘을 활용하여 제안하고자 한다. 서울시 도시재생 유형은 "저이용저개발, 쇠퇴낙후, 노후주거, 역사문화자원 특화" 네 가지로 분류된다 (Shon and Park, 2017). 지역 특성을 파악하기 위해 총 4가지 도시재생 유형에 대해 사업이 진행된 22개의 지역에 대한 뉴스 미디어 10만여건의 텍스트 데이터를 수집하였다. 수집된 텍스트를 이용하여 도시재생 유형에 따른 지역별 주요 키워드를 도출하고 토픽모델링을 수행하여 유형별 차이가 있는 지 탐색해 보았다. 다음 단계로 주어진 텍스트를 기반으로 도시재생 유형을 추천하는 추천시스템 구축을 위해 텍스트 데이터를 벡터로 변환하여 머신러닝 분류모델을 개발하였고, 이를 검증한 결과 97% 정확도를 보였다. 따라서 본 연구에서 제안하는 추천 시스템은 도시재생 사업을 진행하는 과정에서 신규 사업지의 지역 특성에 기반한 도시재생 유형을 추천할 수 있을 것으로 기대된다.

복합레진의 간헐적 광중합 방법이 변연적합도에 미치는 영향 (THE EFFECT OF INTERMITTENT COMPOSITE CURING ON MARGINAL ADAPTATION)

  • 윤용환;박성호
    • Restorative Dentistry and Endodontics
    • /
    • 제32권3호
    • /
    • pp.248-259
    • /
    • 2007
  • 이 실험의 목적은 광중합복합 레진을 자체 제작한 광조사 차단 장치를 이용하여 간헐적 광중합시켜 기존의 연속 중합법과 변연적합도를 비교함으로써 간헐적 광중합의 영향을 알아 보는 것이다. 이번 실험에 사용된 재료는 Pyramid (Bisco, Schaumburg, U.S.A)와 Heliomolar (Ivoclar Vivadent, Liechtenstein)이다. 발치된 상악 소구치에 class II MOD 와동 형성 후 위 두 재료를 bulk 충전하고 다음의 중합cycle에 따라 중합시켰다: 제1군- 연속 광중합 (60초간 계속 광조사); 제2군-2초 광조사, 1초 광차단 (90초 시행); 제3군- 1초 광조사 1초 광차단 (120초 시행); 제4군- 1초 광조사, 2초 광차단 (180초 시행). 저작재현장치 (R&B, Daejeon, Korea)로 720000회의 운동횟수, 분당 120의 회전속도, $5^{\circ}C$$55^{\circ}C$의 물을 교대로 치아에 6000회 주사하면서 5.0 kg의 하중을 치아에 적용하였고 실험 전후 변연적합도를 전체와 부위별 변연으로 나누어서 $\times200$배율의 광학 현미경으로 측정하였다. 부위별 변연은 교합면, 인접면, 치은면 등 세 부위로 나누어서 법랑질 변연을 측정하였다. 전체 변연적합도에서 각 군간, 재료간, 저작 운동 전후 차이를 보기 위해 three-way ANOVA와 Duncan's multiple range test를 시행하였고, 부위별 변연적합도에서는 각 군에서 부위별 차이와 각 부위에서 군간 차이를 보기 위해 각각 one-way ANOVA와 Duncan's multiple range test를 시행하였다 (95% 유의수준). 전체 변연적합도를 보면, 저작 운동 전에는 Pyramid의 경우 3, 4군이 1,2군에 비해, Heliomolar의 경우 3.4군이 1군에 비해 전체 변연적합도가 우수하였고, 저작 운동 후에는 Pyramid. Heliomolar모두 3군이 1군에 비해 전체 변연적합도가 우수하였다 (p < 0.05). 재료간 비교에서는 저작 운동 잔에는 2군에서 Heliomolar가 Pyramid보다 변연적합도가 우수하였고 (p < 0.05) 그 외의 군에서는 유의차가 없었으며, 저작 운동 후에는 모든 군에서 재료간 유의차가 없었다. 각 부위별 변연적합도를 비교하면, 저작 운동 전 Pyramid에서는 교합면 변연에서는 4군이 2군에 비해 높은 변연적합도를 보였고 (p < 0.05), 인접면과 치은면에서는 군 간 유의차를 보이지 않았다. Heliomolar에서는 교합면 변연에서 2, 4군이 1군에 비해 높은 변연적합도를 보였고 (p < 0.05), 인접면과 치은면에서는 군간 유의차를 보이지 않았다. 저작 운동 후 Pyramid에서는 교합면 변연에서는 3군이 1, 2군에 비해 높은 변연적합도를 보였고 (p < 0.05), 인접면과 치은면에서는 군간 유의차를 보이지 않았다. Heliomolar에서는 교합면에서 2, 3, 4군이 1군에 비해 변연적합도가 높았으며 (p < 0.05), 인접면과 치은면에서는 군간 유의차를 보이지 않았다 이번 연구를 통하여 복합레진을 간헐적 광중합시킴으로써 변연적합도가 향상될 수 있음을 알 수 있었다.

해저준설토 사면에서 개량제 처리에 의한 한국들잔디 직파 지표고정 공법에 관한 연구 (Soil Surface Fixation by Direct Sowing of Zoysia japonica with Soil Improvement on the Dredged Soil Slope)

  • 정용호;이임균;서경원;임주훈;김정호;신문현
    • 한국환경복원기술학회지
    • /
    • 제14권4호
    • /
    • pp.1-10
    • /
    • 2011
  • 본 연구는 새만금방조제의 해저준설토 매립지반에서 한국들잔디(Zoysia japonica)에 의한 효율적인 지표고정 공법을 개발하기 위해 수행하였다. 관행적 방법인 줄떼붙이기 시공지(A처리구 : 해저준설토 위에 15cm의 일반 흙을 복토)를 대조구로 하고, 해저준설토와 토양개량제를 혼합한 처리구와 여기에 일반 흙을 추가로 혼합한 처리구 등 생육기반이 다른 3개의 처리구에 한국들잔디를 기계파종 하였다. 관행방식으로 처리한 대조구인 A는 일반 흙을 15cm나 복토한 상태에서 시공한 것임에도 피복률이 43%이었으나 해저준설토 개량처리구인 B(천층)와 C, D(심층) 처리구는 모두 100%로 피복률이 높게 나타났다. 생육상황 분석은 엽장, 엽폭, 뿌리길이에 대해 실시하였는데 토양개량 효과가 뚜렷하였다. 엽장은 대조구 A는 5.73cm, 천층처리구 B는 5.97cm로 유사하였으며, 심층처리구인 C와 D처리구는 27.42cm, 30.18cm로 높게 나타났다. 엽폭은 C와 D처리구가 각각 3.79mm, 3.49mm이었으며 천층처리구 B는 2.40mm, 대조구 A는 1.97mm에 그쳤다. 뿌리길이는 D, C, B처리구에서 각각 13.18cm, 12.20cm, 8.56cm이었으며 대조구 A는 9.38cm이었다. 식물체 내 양분 분석 결과 전질소를 비롯하여 다른 양분함량에 대해서도 토양개량 효과가 확인되었다. 전질소 함량은 심층개량구인 C처리구의 지상부가 1.014%로 가장 높았으며 D와는 근소한 차이를 보였고 천층개량구 B, 대조구 A처리구 순으로 나타났다. 질소는 식물의 생장에 가장 큰 영향을 하는 양분으로서 지상부 생육상황 조사결과와 일치하였으며 지하부는 D처리구가 0.892%, C > A > B처리구 순이었다. 뿌리생장에 중요한 기능을 하는 인산의 함량에 있어서는, C처리구의 지상부가 0.442%로 가장 높았으며 D > B > A 처리구 순으로 나타났고, 지하부는 D > C > A > B처리구 순으로 높게 나타나 전질소와 같은 경향을 보였다. 칼륨 함량은 지상부에서 C > D > B > A 순으로, 지하부에서는 D > C > B > A 순으로 나타나 전질소만큼의 차이는 아니지만 뚜렷한 토양개량 효과를 보였다. 나트륨은 칼슘과 더불어 간척지, 건조지 등에서 토양의 염분집적으로 식물생장에 장애를 일으키는 대표적인 염류로서 토양을 개량하지 않은 대조구 A에서 지상부의 함량이 월등히 높았다. 이에 반해 지하부의 함량은 나트륨, 칼슘 모두 모든 처리구에서 큰 차이를 보이지 않았다. 또한 엽록소의 생성에 영향하는 마그네슘도 모든 처리구에서 유사한 수치를 나타냈는데 지상부는 0.226~0.237%, 지하부는 0.167~0.211%이었다. 이상과 같이 본 연구를 수행함으로써 해저준설토만의 생육기반에 일반 흙을 사용하지 않거나 최소화를 추구하면서 식재가 아닌 파종에 의한 지표고정공법을 개발하였다. 즉, 피복률은 물론 엽장, 엽폭, 뿌리길이 등 생장에서 심층개량구(C와 D)는 물론 천층개량구(B)도 관행방법이나 다른 집약관리 시험지에 비해 아주 우수한 것으로 나타났다. 단 C와 D 심층처리구는 수목식재기반까지 고려한 것이므로 잔디가 필요이상으로 생장한 것이다. 따라서 교목성 수목 식재를 고려하지 않고 지표고정만을 목적으로 한다면 B 처리구가 적합한 것으로 판단된다. 현재 방조제 사면에 대한 지표고정은 해저준설토 위에 산지채취토를 15~30cm 복토하고 한국들잔디(Zoysia japonica)를 평떼나 줄떼붙이기로 시공되어 있는데 특히 줄떼붙이기 시공지의 경우 피복속도가 예상보다 더디고 잡초와의 전쟁을 하고 있으며, 더욱이 일부 구간에는 2종의 녹화매트류가 시험적 규모로 시공된 상태이나 1년도 못되어 완전히 고사하는 등 충분한 지표고정 효과를 보지 못하고 있다. 일반 흙을 전혀 사용하지 않거나 적은 양을 사용하면 훼손산지가 줄게 됨으로 자연을 보호하고 보전하는 효과와 가치는 헤아릴 수 없을 정도로 지대하다고 생각한다. 따라서 관행적으로 시공하고 있는 현행의 지표고정공법은 바꾸어야 할 필요가 있으며, 본 연구결과가 널리 활용되기를 기대한다.

제약업종 부산물 및 화장품 제조업 폐수처리오니 처리토양에 대한 유기화합물 및 Bioassay 분석 평가 (Assessment of Organic Compound and Bioassay in Soil Using Pharmaceutical Byproduct and Cosmetic Industry Wastewater Sludge as Raw Materials of Compost)

  • 임동규;이상범;이승환;남재작;나영은;권장식;권순익;소규호
    • 한국환경농학회지
    • /
    • 제23권4호
    • /
    • pp.203-210
    • /
    • 2004
  • 본 연구는 퇴비원료로 지정된 제약업종 부산물(공정오니) 및 화장품 제조업 폐수처리오니를 퇴비로서 활용 가능성을 판단하기 위하여 기존의 일반성분이나 중금속 성분 분석 이외 유기성. 화합물과 기타 여러 생물검정법 등을 활용하여 시용한 오니에 의한 토양 내 비료의 피해를 밝혀내고 이들의 평가방법을 확립하고자 포장시험을 수행하였다. 오니의 처리에 따른 HEM의 함량은 제약업종 오니2(PS2)와 화장품 오니(CS)처리가 각각 0.51, 1.10 mg/kg로 가장 높았고, PAHs의 함량은 제약업종 오니2(PS2) 처리에서 $3,406.8\;{\mu}g/kg$로 가장 높았다. 토양에 서식하는 미소동물의 밀도변화는 생육 중기(7월 23일) 및 수확기(10월 1일) 모두 제약오니2 및 돈분 처리구에서 가장 높았으며, 기타 처리구는 차이가 없이 아주 낮았다. 오니의 처리에 따른 세균 및 사상균의 균수는 제약업종오니2처리에서 각각 136, 909 cfu/g로 가장 많았고, 화장품오니도 각각 440, 236 cfu/g으로 다른 처리에 비해 많은 경향을 보였다. 제약오니 및 화장품오니 처리시 우점세균은 무비, 돈분처리에 비해 일정한 경향이 없었으나 3요소 처리보다 다양한 세균이 검출되었다. 오니의 처리에 따른 우점사상균은 무처리에 비해 제약업종 오니2와 화장품 오리처리에서 형태적 특징이 다른 콜로니가 검출되었으나 다른 처리는 비슷한 경향으로 종류간에 큰 차이는 보이지 않았다. Microcosm test를 통하여 오니 처리 후 3개월이 경과한 토양의 오염정도를 평가한 결과는 제약업종 오니3과 화장품 오니처리는 약간 영향을 받아서 $80{\sim}90%$ 생존하였으나, 제약업종 오니1처리는 처리 2주(14일) 이후에는 급격히 생존율이 떨어져서 4주 이후에는 10%만 생존하였다. 그러나 6개월이 경과한 토양에서는 지렁이의 생존율은 제약업종 오니1처리만 약간 영향을 받은 것으로 보였으며 다른 처리들은 전혀 영향을 받지 않았던 것으로 조사되었다. 유기성 오니의 퇴비원료로 활용은 비료관리법의 비료공정규격 중 퇴비의 비고란에 "퇴비의 원료로 사용 가능한 물질과 사용 불가능한 물질"(별표1)에서 "퇴비의 원료 중 사전 분석검토 후 사용 가능한 원료에 대한 지정요령"에는 유기물과 중금속(8성분) 함량(건물중)과 제조공정 등을 검토하여 지정하고 있으나, 지정된 원료가 과연 퇴비원료로 적합한지 잘 알 수 없으며 또한 앞으로 현재의 퇴비원료 규정을 변경할 필요가 있을 경우를 대비하여 퇴비원료의 적합성 여부를 판별할 수 있는 방법의 개발이 필요하다. 따라서 퇴비원료로 이미 지정('02. 12. 31)된 제약오니 및 화장품 오니를 과량으로 토양에 시용한 후 유해 유기화합물, 미소동물, 미생물 및 생물학적(지렁이) 유해성 검정방법의 도입 가능성을 평가하기 거하여 고추를 재배한 포장에서 비료의 피해시험을 실시한 과 유해 유기화합물과 생물학적(지렁이) 유해성 검정방법은 앞으로 연구를 통해서 보완할 경우 상당히 활용 가능성이 있는 좋은 평가방법인 것으로 생각된다.

자궁경부암 강내조사 시 CT를 이용한 CTV에 근거한 치료계획과 ICRU 38에 근거할 치료계획의 비교 (Comparison of CT based-CTV plan and CT based-ICRU38 plan in brachytherapy planning of uterine cervix cancer)

  • 심진섭;조정근;시창근;이기호;이두현;최계숙
    • 대한방사선치료학회지
    • /
    • 제16권2호
    • /
    • pp.9-17
    • /
    • 2004
  • 목적 : 최근 CT, MRI 등 영상진단기술 및 방사선치료계획 소프트웨어 등이 획기적으로 발전하였음에도 불구하고 자궁경부암의 강내조사는 아직까지 A 점 등 ICRU 38에 근거한 치료계획을 보편적으로 사용하고 있다. CT를 이용한 3차원 강내조사 계획은 종양 및 정상조직에 대한 선량뿐 아니라 선량-용적 히스토그람(DVH)에 대한 정보를 제공한다. 본 연구에서는 CT를 이용하여 CTV에 목표선량을 조사하는 치료계획(CTV계획)과 ICRU 38에 근거한 치료계획(ICRU계획)을 시행하여 이 두 치료계획간에 종양선량, 직장선량, 방광선량 등을 비교하고 각각에 대한 DVH를 분석하였다. 대상 및 방법 : Ir-192 고선량율강내치료(HDR)를 시행 받은 11명의 환자를 대상으로 하였다. 강내조사계획은 외부방사선치료를 약 40Gy 시행한 후 수립되었으며 모든 환자에서 CT 모의치료기를 이용한 CT가 시행되었고 치료계획은 PLATO(Nucletron) v.14.2를 이용하였다. CT 영상에 CTV, 직장, 방광 등을 도시한 후 CTV에 $100\%$의 선량을 조사하는 치료계획 및 ICRU 38에 근거하여 A점에 $100\%$를 조사하는 치료계획을 수립하였다. 결과 : 11명 환자의 CTV 용적(평균${\pm}$표준편차)은 $21.8{\pm}26.6cm^3$, 직장 용적은 $60.9{\pm}25.0cm^3$, 방광용적은 $116.1{\pm}40.1cm^3$이었다. ICRU계획에서 $100\%$의 선량이 포함하는 용적은 $126.7{\pm}18.9cm^3$, CTV 계획에서는 $98.2{\pm}74.5cm^3$으로서 잔류종양의 크기가 4cm 이상인 1례에서는 ICRU계획 시 CTV 용적 $22.0cm^3$$100\%$ 등선량곡선에 포함되지 않는 것으로 나타났다. 잔류종양의 크기가 4cm 미만인 나머지 8례에서는 종양용적 $12.9{\pm}5.9cm^3$이 불필요하게 $100\%$ 이상의 선량이 조사되었다. ICRU 38의 권고에 따른 방광선량은 ICRU계획 및 CTV계획에서 각각 $90.1{\pm}21.3\%,\;68.7{\pm}26.6\%$이었고, 직장선량은 $86.4{\pm}18.3\%,\;76.9{\pm}15.6\%$이었다. 방광 및 직장선량 최대값도 ICRU계획에서 각각 $137.2{\pm}50.1\%,\;101.1{\pm}41.8\%$, CTV계획에서 $107.6{\pm}47.9\%,\;86.9{\pm}30.8\%$로서 CTV계획에서 정상조직에 조사되는 선량이 더 적게 나타났다. 그러나 잔류종양이 4cm 이상인 환자에서는 CTV계획에서 정상조직 선량이 견딤선량보다 현저히 높게 나타났다. DVH에서는 목표선량의 $80\%$ 이상을 받는 직장용적(V80rec)은 ICRU계획 및 CTV계획에서 각각 $1.8{\pm}2.4cm^3,\;0.7{\pm}1.0cm^3$, 방광용적 (V80bla)은 $12.2{\pm}8.9cm^3,\;3.5{\pm}4.1cm^3$로서 역시 CTV계획에서 정상조직이 적게 조사되었다. 결과 : 기존의 ICRU계획은 그 효과 및 안전성이 입증되었음에도 불구하고 CT를 이용한 CTV계획 등을 적용 한다면 잔류종양이 적은 경우 정상조직에 대한 조사를 줄이면서 잔류종양에 목표선량을 조사할 수 있을 것이다. 다만 잔류종양이 큰 경우는 정상조직에 대한 조사선량을 줄이기 위한 효과적 치료계획에 대한 연구가 필요할 것으로 판단된다.

  • PDF

데이터 마이닝과 텍스트 마이닝의 통합적 접근을 통한 병사 사고예측 모델 개발 (Development of the Accident Prediction Model for Enlisted Men through an Integrated Approach to Datamining and Textmining)

  • 윤승진;김수환;신경식
    • 지능정보연구
    • /
    • 제21권3호
    • /
    • pp.1-17
    • /
    • 2015
  • 최근, 군에서 가장 이슈가 되고 있는 문제는 기강 해이, 복무 부적응 등으로 인한 병력 사고이다. 이 같은 사고를 예방하는 데 있어 가장 중요한 것은, 사고의 요인이 될 수 있는 문제를 사전에 식별 관리하는 것이다. 이를 위해서 지휘관들은 병사들과의 면담, 생활관 순찰, 부모님과의 대화 등 나름대로의 노력을 기울이고 있기는 하지만, 지휘관 개개인의 역량에 따라 사고 징후를 식별하는 데 큰 차이가 나는 것이 현실이다. 본 연구에서는 이러한 문제점을 극복하고자 모든 지휘관들이 쉽게 획득 가능한 객관적 데이터를 활용하여 사고를 예측해 보려 한다. 최근에는 병사들의 생활지도기록부 DB화가 잘 되어있을 뿐 아니라 지휘관들이 병사들과 SNS상에서 소통하며 정보를 얻기 때문에 이를 데이터화 하여 잘 활용한다면 병사들의 사고예측 및 예방이 가능하다고 판단하였다. 본 연구는 이러한 병사의 내부데이터(생활지도기록부) 및 외부데이터(SNS)를 활용하여 그들의 관심분야를 파악하고 사고를 예측, 이를 지휘에 활용하는 데이터마이닝 문제를 다루며, 그 방법으로 토픽분석 및 의사결정나무 방법을 제안한다. 연구는 크게 두 흐름으로 진행하였다. 첫 번째는 병사들의 SNS에서 토픽을 분석하고 이를 독립변수화 하였고 두 번째는 병사들의 내부데이터에 이 토픽분석결과를 독립변수로 추가하여 의사결정나무를 수행하였다. 이 때 종속변수는 병사들의 사고유무이다. 분석결과 사고 예측 정확도가 약 92%로 뛰어난 예측력을 보였다. 본 연구를 기반으로 향후 장병들의 사고예측을 과학적으로 분석, 맞춤식으로 관리한다면 군대 내 각종 사고를 미연에 예방하는데 기여할 것으로 기대된다.

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.

머신러닝 기반 기업부도위험 예측모델 검증 및 정책적 제언: 스태킹 앙상블 모델을 통한 개선을 중심으로 (Machine learning-based corporate default risk prediction model verification and policy recommendation: Focusing on improvement through stacking ensemble model)

  • 엄하늘;김재성;최상옥
    • 지능정보연구
    • /
    • 제26권2호
    • /
    • pp.105-129
    • /
    • 2020
  • 본 연구는 부도위험 예측을 위해 K-IFRS가 본격적으로 적용된 2012년부터 2018년까지의 기업데이터를 이용한다. 부도위험의 학습을 위해, 기존의 대부분 선행연구들이 부도발생 여부를 기준으로 사용했던 것과 다르게, 본 연구에서는 머튼 모형을 토대로 각 기업의 시가총액과 주가 변동성을 이용하여 부도위험을 산정했으며, 이를 통해 기존 방법론의 한계로 지적되어오던 부도사건 희소성에 따른 데이터 불균형 문제와 정상기업 내에서 존재하는 부도위험 차이 반영 문제를 해소할 수 있도록 하였다. 또한, 시장의 평가가 반영된 시가총액 및 주가 변동성을 기반으로 부도위험을 도출하되, 부도위험과 매칭될 입력데이터로는 비상장 기업에서 활용될 수 있는 기업 정보만을 활용하여 학습을 수행함으로써, 포스트 팬데믹 시대에서 주가 정보가 존재하지 않는 비상장 기업에게도 시장의 판단을 모사하여 부도위험을 적절하게 도출할 수 있도록 하였다. 기업의 부도위험 정보가 시장에서 매우 광범위하게 활용되고 있고, 부도위험 차이에 대한 민감도가 높다는 점에서 부도위험 산출 시 안정적이고 신뢰성 높은 평가방법론이 요구된다. 최근 머신러닝을 활용하여 기업의 부도위험을 예측하는 연구가 활발하게 이루어지고 있으나, 대부분 단일 모델을 기반으로 예측을 수행한다는 점에서 필연적인 모델 편향 문제가 존재하고, 이는 실무에서 활용하기 어려운 요인으로 작용하고 있다. 이에, 본 연구에서는 다양한 머신러닝 모델을 서브모델로 하는 스태킹 앙상블 기법을 활용하여 개별 모델이 갖는 편향을 경감시킬 수 있도록 하였다. 이를 통해 부도위험과 다양한 기업정보들 간의 복잡한 비선형적 관계들을 포착할 수 있으며, 산출에 소요되는 시간이 적다는 머신러닝 기반 부도위험 예측모델의 장점을 극대화할 수 있다. 본 연구가 기존 머신러닝 기반 모델의 한계를 극복 및 개선함으로써 실무에서의 활용도를 높일 수 있는 자료로 활용되기를 바라며, 머신러닝 기반 부도위험 예측 모형의 도입 기준 정립 및 정책적 활용에도 기여할 수 있기를 희망한다.

전국 종합병원 방사선사의 개인피폭선량에 대한 고찰 (A Review of Personal Radiation Dose per Radiological Technologists Working at General Hospitals)

  • 정홍량;임청환;이만구
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제28권2호
    • /
    • pp.137-144
    • /
    • 2005
  • 본 연구는 1998년부터 2002년도까지 전국 16개시 도 44개 종합병원에서 근무하고 있는 최근 5년간 방사선사의 개인평균피폭선량을 측정하여 지역별, 연도별, 병원별로 비교 분석 하였고, 방사선 장비 및 시설의 차이에서 발생될 수 있는 근무환경과 촬영건수의 표준화를 통하여 향후 체계적이고 합리적인 방사선사의 피폭선량 관리가 이루어질 수 있는 기초 자료를 제공하는 목적으로 분석하였다. 5년간 방사선사의 지역별 전체평균피폭선량은 1.61 mSv이었고, 지역별로 보면 대구가 4.74 mSv로 가장 높으며 강원이 4.65 mSv, 경기가 2.15 mSv로 높은 순으로 나타났으며, 가장 낮은 지역은 충북이 0.91 mSv이고 다음이 제주 0.94 mSv, 부산이 0.97 mSv 순으로 나타났다. 5년간 연도별 평균선량은 2000년도가 1.80 mSv로 가장 높게 나타났으며, 2002년이 1.77 mSv, 1999년 1.55 mSv, 2001년 1.50 mSv, 1998년이 1.36 mSv 순으로 나타났으며, 연도별, 지역별 평균피폭선량은 2001년도는 대구지역이 1998년, 1999년, 2000년, 2002년은 강원지역이 가장 높게 나타났고, 평균피폭선량이 1.0 mSv 이하로 나타난 지역은 1998년에는 제주, 충북, 울산, 1999년 울산, 경북, 제주, 2000년 충북, 2001년 경북, 전북, 2000년에는 인천, 전북, 제주로 나타났다. 병원별 피폭선량은 대구의 KMH가 가장 높게 나타났고, 다음으로 강원의 GAH, 서울의 CAH 순으로 높게 나타났으며, 피폭선량이 낮은 병원은 전남의 YSH가 가장 낮고, 경남의 GNH, 충남의 DKH 순으로 나타났다.

  • PDF