• 제목/요약/키워드: 통계적 모델링

검색결과 288건 처리시간 0.023초

2007 한국 소아 청소년 성장도표 : 개발 과정과 전망 (2007 Korean National Growth Charts: review of developmental process and an outlook)

  • 문진수;이순영;남정모;최중명;최봉근;서정완;오경원;장명진;황승식;유명환;김영택;이종국
    • Clinical and Experimental Pediatrics
    • /
    • 제51권1호
    • /
    • pp.1-25
    • /
    • 2008
  • 목 적 : 1967년 이후로 1998년까지 대한소아과학회와 정부는 매 10년마다 한국 소아청소년 신체발육표준치를 제정하여 왔다. 지난 40년간의 한국 성장도표는 체계적이고 통계학적인 표준화를 거치지 않은 기술적인 도표였다. 전 세계적인 비만의 유행에 대하여 WHO나 CDC와 같은 국제적인 기관들은 이에 대처하기 위하여 성장도표의 제정 원리들을 변경하여 왔다. 본 논문은 고찰과 함께 새로운 2007년 성장도표 개발과정을 요약하였다. 방 법 : 질병관리본부 만성병조사과의 주도로 2005년에 새로운 성장도표 제정을 위한 신체계측 조사를 시행하였고, 그 결과 소아 비만의 급증과 청소년 최종 성장의 세대별 증가 현상이 정체된 것을 확인하였다. 이에 연구진은 혁신적인 방법론을 도입하였으며, 이를 통하여 새로운 성장도표를 제정하였다. 확보 가능한 원자료인 1997년 및 2005년 측정 자료를 표준화고 통합하였으며, LMS 방법을 도입하여 통계적 모델링을 시행하였다. 결 과 : 표준화된 자료로서 연령별 신장, 연령별 체중, 연령별 체질량지수, 연령별 두위, 신장별 체중 도표가 제공되며, 2005년 조사의 표준화되지 않은 자료로 제공되는 연령별 허리둘레, 연령별 가슴둘레, 연령별 상완둘레, 연령별 피부 두겹집기가 제공된다. 임상 지침도 함께 제공된다. 결 론 : 새로운 한국 성장도표의 개발 과정과 결과는 국제적인 기준인 WHO 표준성장도표 및 미국 CDC 성장도표의 방법론을 적용한 것으로서, 비만과 성 발육이 가속화된 현 상황에 적절하다. 이는 특히 한국 국민과 한민족에게 유용하다. 향후 보다 과학적인 표준을 제시하기 위하여 지속적인 연구가 요청된다.

어린이집 급식시간 중 영유아의 식사행동 실태 및 보육교사의 식사지도 방법 (Children's eating behaviors and teachers' feeding practices during mealtime at child-care centers)

  • 여윤재;권수연
    • Journal of Nutrition and Health
    • /
    • 제48권1호
    • /
    • pp.71-80
    • /
    • 2015
  • 본 연구에서는 어린이집 급식시간에 관찰되는 영유아의 바람직하지 않은 식사행동과 이에 대한 보육교사의 식사지도 방법을 조사하기 위하여 서울시 금천구의 보육교사 169명을 대상으로 2013년 12월에 설문조사를 실시하였으며, 조사결과를 담당 영유아연령으로 구분하여 분석하였다. 본 연구결과, 조사대상 보육교사 중 59.2%는 승급교육 및 직무연수 등의 의무교육을 통해 식생활 교육을 수강한 것 이외에 별도의 교육을 수강한 경험이 없다고 하였다. 영양 및 위생 관련 지식점수는 30점 만점에 평균 14.6점이었다. 보육교사는 급식시간에 관찰되는 여러 식행동 중 '영유아가 돌아다니면서 음식을 먹는 행동'이 가장 바람직하지 않다고 응답하였으며 '영유아가 음식 또는 수저 등을 가지고 장난치는 행동'이 가장 빈번하게 나타난다고 하였다. '영유아가 돌아다니면서 음식을 먹는 행동 (p < 0.05)'은 담당 영유아연령에 따라 통계적으로 유의한 차이가 있었다. 급식시간에 관찰되는 영유아의 바람직하지 않은 식사행동에 대해 보육교사의 식사지도 방법을 조사한 결과, '영유아의 음식을 남기는 행동 (p < 0.05)' 및 '영유아가 식사 후 식사도구 등을 정리하지 않는 행동 (p < 0.05)'에 대해 수행하는 식사지도 방법이 담당 영유아연령에 따라 통계적 차이를 보였다. '영유아가 음식을 남기는 행동'에 대해서 영아반 담당교사는 '칭찬 (34.6%)' 및 '영유아의 의사에 맡김(24.6%)'으로, 유아반 담당교사는 '설명 (38.5%)' 및 '칭찬(35.9%)'으로 식사지도 하는 경우가 많았으며, 식사 후 식사도구 등을 정리하지 않는 행동을 할 때, 유아반 담당교사의 61.5%가 '설명'의 방법으로 식사지도를 수행하였으며, 영아반 담당교사는 '설명 (33.1%)'이외에 '칭찬 (33.8%)', '모델링 (23.1%)'으로 식사지도를 수행하였다. 응답자가 근무하는 87.6%의 어린이집은 가정통신문 (45.0%)을 발송하거나 간담회 (21.9%)를 실시하여 영유아의 식사지도에 대해 가정과 상호작용하고 있는 것으로 조사되었다. 본 연구는 어린이집의 보육교사에게 직접 관찰이 아닌 설문조사를 통하여 영유아의 바람직하지 않은 식사행동 및 이에 대한 식사지도 방법을 파악하여 실제 보육교사가 수행하고 있는 식사지도 방법과 차이가 있을 수 있다. 그러나 본 연구는 어린이집 급식시간에 관찰되는 영유아의 바람직하지 않은 식사행동과 이에 대한 보육교사의 식사지도 방법에 대한 실태를 파악하였다는 점에서 의의가 있으며, 본 연구결과는 어린이집에서 실시하는 식사지도에 대한 지침 및 프로그램 개발 시 기초자료로 활용 될 수 있다.

단말에 대한 공정성을 고려한 이더넷 PON 시스템의 동적대역할당방법의 성능분석 (Performance Evaluation of a Dynamic Bandwidth Allocation Algorithm with providing the Fairness among Terminals for Ethernet PON Systems)

  • 박지원;윤종호;송재연;임세윤;김진희
    • 한국통신학회논문지
    • /
    • 제29권11B
    • /
    • pp.980-990
    • /
    • 2004
  • 본 논문에서는 Ethernet Passive Optical Network(EPON)시스템에서 단말들에 대한 공정성을 부여하는 동적 대역할당 알고리듬을 제안하고 시뮬레이션을 통한 성능분석을 하였다. 기존 EPON에서는 Optical Network Unit(ONU)로부터 보고 받는 버퍼의 상태만을 고려하여Optical Line Termination (OLT)가 상향링크의 대역을 할당한다 이러한 ONU버퍼상태에 따른 대역할당방법은 ONU들에 대한 공정한 대역할당은 가능하지만 ONU에 연결된 단말들에 대한 공정한 대역할당을 보장하지 않는 문제가 있다. 예를 들어, 어떤 ONU에 연결된 어떤 단말로부터의 전송이 일시적으로 폭증할 경우, 급격하게 증가된 이 ONU의 버퍼상태가 OLT에 보고됨으로써, 이 ONU는 더 많은 상향 대역폭을 할당받게 된다. 이러한 대역할당의 결과, 상향전송이 많은 단말에 대해서는 많은 대역이 할당되지만, 상대적으로 전송량이 적은 단말들이 접속된 다른 ONU들에는 기존보다 감소된 대역이 할당됨으로써 이러한 ONU들에 접속되어 있는 단말들의 전송지연시간이증가되는 불공정성 문제가 발생한다. 이러한 문제점에 착안하여, 본 논문에서는 ONU가 보고하는 버퍼상태뿐만 아니라, ONU에 연결된 단말의 개수도 OLT에 보고함으로써, OLT가 단말들에 대한 공정한 대역할당을 할 수 있는 방식을 제안하였다. 제안된 방법의 성능분석을 위해 SIMULA 시뮬레이션 언어를 이용하여 EPON시스템을 모델링하였다. 각 단말과 ONU 관점에서의 수율과 지연시간, 시간에 따른 ONU의 버퍼 변화 등을 비교 분석한 시뮬레이션 결과로부터, 제안된 방법이 각 단말들에 대하여 대역을 공정하게 분배할 수 있음을 보였다. 마지막으로, EPON 시스템을 망사업자가 운용할 때, 최종단에 위치한 가입자 단말들에 대하여 공정하게 대역을 할당할 경우, 제안된 방법이 효율적으로 활용될 수 있을 것이다.고체 식품에서 보다 높게 나타났다. 이상의 결과에서 식습관이 치아우식발생과 밀접한 관계를 가지고 있으므로 초등학교 아동에 있어 치아우식을 유발할 수 있는 간식의 섭취를 줄이되 우식성 식품을 간식으로 섭취한 후에는 잇솔질을 반드시 실시하도록 하며 정규식사에서 치아를 보호하는 세정식품의 섭취에 대한 영양교육이 지속적이고 단계적으로 꾸준히 이루어져야 한다고 본다.lity regardless difference on companies, ages, departments, and authority of an employees. Second, Satisfaction on incentive for employees in Family Restaurants were not well received. Although these necessary demand, there is not yet incentive system operation to most of business. Especially, it is not even studied on Family Restaurants. This study should have been studied on more customers and spotted employees to be objective. It is strongly recommended to do this study without limitation and further studies is considered on this subjects. 비하여 전반적으로 낮은 염증반응을 보였다. 7) 각 군간 결과의 차이에 통계적 유의성은 없었다(p>0.05).mmunity. Then, a hierarchical language is to defeat its own purpose.중 행정부가 북한에 대해 실시한 포용정책이 어떠한 성과를 거두고 어떠한 문제점을 간과하고 있는가에 대해 논의하고, 대북 정책의 새로운

고해상도 항공자력탐사를 이용한 Italia Vulcano-Lipari 화산 복합체의 천부 지하 구조 (Shallow subsurface structure of the Vulcano-Lipari volcanic complex, Italy, constrained by helicopter-borne aeromagnetic surveys)

  • 대웅무웅;중총 정;구택정부;삼원광언;중야 준
    • 지구물리와물리탐사
    • /
    • 제9권1호
    • /
    • pp.129-138
    • /
    • 2006
  • 남부 Italia Aeolian 군도의 Vulcano-Lipari 화산 복합체의 천부 지하구조를 잘 이해하고 또한 이 지역의 화산활동을 모니터링하기 위해서 고해상도 항공자력탐사가 3 년간의 간격을 두고 두 번 수행되었다. 두 개의 서로 다른 자력탐사 자료가 화산활동의 변화를 지시하는 어떠한 의미있는 차이를 보이지 않기 때문에, 자료들은 서로 합쳐져서 단일 자료보다 넓은 영역에 대한 항공자력도로 만들어졌다. 지형보정된 자력이상으로부터 겉보기 자화강도 분포도가 만들어졌으며 이로부터 Fossa 원추구의 이질성을 제시하는 국부적인 고 자화 이상을 볼 수 있었다. 이중 세 개의 고자화 이상에 대해 자력 모델링이 수행되었다. 각 모델은 Fossa 화구의 화산쇄설류로 덮혀있는 화산생성물의 존재를 밝히는 데에 적용되었다. Fossa 화구 지역에 대한 모델로부터 현재 화구의 남쪽 가장자리에는 조면암질 용암류가 묻혀있다는 것이 제시되었다. Forgia Vecchia에서 적용한 자력모델은 수증기 폭발성 원추구가, Fossa 칼데라를 메운 레타이트질 용암류(현무암질조면암과 안산암질조면암을 통칭)에 덮혀버린 한 분출중심으로부터 형성되었다는 것을 제시해 준다. 하지만 용암류의 분포는 기존의 시추 결과들로부터 알려진 것보다도 적은 지역에 국한되는 것처럼 나타난다. 이는 Porto Levante에 인접한 지열지역에서 알 수 있듯이, 강렬한 열수활동으로 인한 용암류의 부분적인 변질에 기인한 것으로 설명될 수 있다. Fossa 원추구 북동부에서의 모델은 두꺼운 용암류가 Fossa 화산활동의 초기단계에 또 다른 분출중심에서 집적되어 있다는 것을 암시한다. 최근의 전기탐사는 마지막 두 자력모델 지역에서 고비저항대를 보여준다.를 재활성화 시키는 $CO_2$의 탄성파 반응 또한 예측될 수 있다. 이 논문에서는 암석물리학 모의실험장치를 적용했던 현장(해상과 육상의 잠재적 $CO_2$ 격리 지역)의 사례를 보여주고 있다. 4차원 탄성파 반응들이 모니터링 프로그램의 설계를 돕기 위하여 만들어 졌다. 액체상의 $CO_2$ 주입은 공기로 포화된 상태에 비해 속도-유효응력 반응을 평균 약 8% 정도 낮게 한다. 실험자료들은 높은 유효응력에서 Gassmann 계산들과 일치한다. 이러한 이론과 일치하는 "임계" 유효응력은 사암의 종류에 따라 달라진다. 이 차이는 각각의 사암 종류의 미세구조에서 미세 균열 수의 차이에 기인한 것이라 생각된다. 높은 유효응력에서의 이론과 의미있게 일치하였으며, $CO_2$ 주입 시 현장에서의 탄성파 거동을 예상하는데 있어서 어느 정도 확신을 준다.극압 증가의 최대 허용치를 결정하는데는 사용할 수 없다고 주장하고자 한다. 초기폐사율이 낮음을 확인할수 있었으며, 상기 결과를 토대로, 넙치 치어의 경우 ${\beta}-1,3$ 글루칸을 0.05% 이상 0.1% 미만을 사료에 첨가하는 것이 성장, 사료효율 증진, 항산화능 및 질병저항성에 가장 좋은 효과를 나타낼 수 있을 것을 사료된다./Cip1}(-)/p27^{kip1}(-)$인 경우는 미만형인 경우(87.0%)가 장형(54.9%)의 경우보다 많은 비율을 차지하였다(P<0.05). 5년 장기 생존율에 있어서는 각각의 $p21^{Waf1/Cip1}$$p27^{kip1}$의 발현 유무에 따른 통계적인 유의성은 없었고 복합

기후 변화 적응을 위한 벡터매개질병의 생태 모델 및 심층 인공 신경망 기반 공간-시간적 발병 모델링 및 예측 (Spatio-Temporal Incidence Modeling and Prediction of the Vector-Borne Disease Using an Ecological Model and Deep Neural Network for Climate Change Adaption)

  • 김상윤;남기전;허성구;이선정;최지훈;박준규;유창규
    • Korean Chemical Engineering Research
    • /
    • 제58권2호
    • /
    • pp.197-208
    • /
    • 2020
  • 본 연구에서는 발병 횟수가 빠르게 증가하고 있는 벡터매개질병(vector-borne disease) 중 하나인 쯔쯔가무시증의 발병 특성을 공간적 그리고 시간적으로 분석하고 기후변화 시나리오에 따른 미래 발병 특성을 예측하였다. 쯔쯔가무시증의 공간적 분포와 발병률을 예측하기 위하여 환경 그리고 사회 변수의 공간적 특성을 이용하여 maximum entropy(MaxEnt) 생태 모델을 구성하고, 주요 변수의 쯔쯔가무시증 발병에 관한 상관관계를 분석하였다. 공간 특성 중 환경변수인 고도 및 기온이 주요한 변수로 분석되었으며, 이는 쯔쯔가무시증의 매개체인 털진드기의 생육 환경과 주요 관련이 있는 것으로 나타났다. 쯔쯔가무시증의 시간적 발병 횟수는 심층 인공 신경망 모델기반 예측을 하였으며, 특히 쯔쯔가무시증의 주요 특성인 지연 효과를 고려하여 모델을 구성하였다. 심층 인공 신경망을 이용한 예측 결과 여름철의 기온, 강우량, 그리고 습도가 털진드기의 활동에 주된 관련이 있으며 가을철의 쯔쯔가무시증 발병 횟수에 영향을 끼치는 것으로 확인 되었다. 또한, 기존 통계적 예측 모델과 비교하였을 때, 심층 인공 신경망 기반 예측 모델의 예측 정확성이 우수함을 확인하였다. 공간적 그리고 시간적 모델에 기후 변화 시나리오를 이용하여 2040년의 쯔쯔가무시증 발병 특성을 예측한 결과, 최대 발병률이 8% 증가, 발병률이 높은 지역이 9% 확대, 그리고 주된 발병 기간이 2개월 증가하였다. 본 연구 결과를 통해 쯔쯔가무시증의 공간적 및 시간적 발병 특성 분석을 통하여, 공중보건 측면에서 벡터매개 질병 발병 요인 규명을 통해 주민 건강을 위한 질병 관리 및 예측에 기여할 수 있을 것으로 기대한다.

멀티에이전트시스템(MAS)을 이용한 G2B 조달 프로세스 혁신의 효과평가에 관한 연구 : 나라장터 G2B사례 (A Study on the Performance Evaluation of G2B Procurement Process Innovation by Using MAS: Korea G2B KONEPS Case)

  • 서원준;이대철;임규건
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.157-175
    • /
    • 2012
  • 방대한 규모와 복잡한 프로세스로 구성된 공공조달의 혁신성과를 평가하기란 매우 어려운 문제이다. 기존의 프로세스 혁신 평가는 주로 설문 및 인터뷰, 그리고 운영데이터를 분석한 정성적, 또는 통계적인 정량적 방법들이었다. 이에 본 연구에서는 공공조달 프로세스를 복잡계로 보고 이에 대한 시뮬레이션 방법으로 멀티에이전트시스템(MAS)을 이용하여 공공조달 프로세스 혁신효과 평가모델을 개발하였다. 그리고, 개발된 MAS 기반의 공공조달 혁신평가 모델을 우리나라 조달청의 G2B(나라장터, KONEPS) 시스템에 적용하여 혁신효과를 평가하였다. MAS 시뮬레이션 도구는 Northwestern University에서 개발된 Netlogo Version 4.1.3을 사용하였고, 모델링에서는 에이전트 정의, 에이전트 행동특성 정의, 에이전트 관계 정의의 세단계로 진행하였다. 첫째, 에이전트 정의에서는 에이전트가 될 대상을 선정하고, 에이전트가 가진 속성과 변수들을 정의하였다. 둘째, 행동특성 정의에서는 각 에이전트의 행동계획 및 자원할당을 설정하였고, 셋째, 관계정의 단계에서는 상태변화에 따른 행동 규칙을 설정하였다. 또한 프로세스 혁신의 목적에 맞는 성과를 측정하기 위하여 혁신 효과평가항목을 선정하였고, 데이터는 조달청의 협조를 통해 DB 데이터와 설문데이터를 활용하였다. 이를 통해 프로세스 전체 및 프로세스별 절감시간과 업무량의 절감율을 측정하였다. 실험결과 전체 프로세스의 효율성이 증대되었으며 '평균 업무처리 건수'의 절감율이 92.7%, '평균 업무처리 시간'의 절감율이 95.4%로 나타났다. 즉 공공조달분야는 G2B 시스템 도입을 통해 프로세스 혁신을 추진한 결과 매우 높은 효율성이 제고된 것으로 분석되었다. 또한 본 연구를 통해 '계약'과 관련한 업무프로세스에서 추가적인 개선이 이루어질 경우 프로세스 혁신효과가 더욱 향상될 수 있는 것으로 분석되었다. 본 연구는 MAS를 이용하여 프로세스 개선효과에 대한 평가모델을 제시하고 분석했다는데 의의가 있다.

천부 굴절법 탄성파 탐사 자료의 정보정 (Statics corrections for shallow seismic refraction data)

  • Palmer Derecke;Nikrouz Ramin;Spyrou Andreur
    • 지구물리와물리탐사
    • /
    • 제8권1호
    • /
    • pp.7-17
    • /
    • 2005
  • 천부 탄성파 굴절법 탐사를 이용하여 굴절이 발생하는 지층의 속도를 산출하는 것은 ill-posed 문제이다. 계산된 시간 변수들에서의 작은 변화들이 이로부터 산출된 속도들에 커다란 수평적 변화를 가져올 수 있으며 이는 종종 역산 알고리듬의 인위적인 오차를 유발한다. 이러한 인위적인 오차들은 모델링을 통해 인지되거나 보정되지 않는다. 그러므로 만약 모델에 근거한 역산을 통해 정밀한 지하 굴절 모델을 얻고자 한다면 정확한 초기 모델이 필요하다. 탄성파속도에서 인위적인 오차의 원인은 일반적으로 불규칙한 굴절면에 있다. 대부분의 경우에 GRM 방법을 이용하면 불규칙한 굴절면을 다룰 수 있고 굴절면의 정밀한 초기 모델을 만들 수 있다. 하지만 지표에 매우 가까운 극천부 지역 또한 불규칙하다면 GRM 방법의 효능은 감소하고 풍화대 보정이 필요하다. 천부 불균질대에 대한 일반적인 보정방법들은 수평적 확장이 제한된 극천부지역의 불균질대의 경우 효과적이지 못하다. 이럴 경우 GRM 평활화 통계적 방법(Smoothing Statics Method; SSM)이 지층의 속도를 좀 더 정확하게 평가할 수 있는 간단하고 실용적인 방법이다. GRM SSM 방법은 제로 XY 값을 가지고 계산된 시간-심도값들로부터 실제 XY 값을 가지고 얻어진 시간-심도값들의 평균값을 빼줌으로써 평활화 정보정을 수행한다. 심도가 깊어질수록 시간-심도값들이 XY 값에 따라 크게 변하지 않으므로 이들의 평균값은 최적값과 훨씬 더 같아진다. 그러나 극천부의 불균질대에 대해 시간-심도값들은 XY 값들이 증가함에 따라 수평적으로 이동하고 평균화 과정을 통해 대폭 감소한다. 결과적으로, XY값들에 대해 평균화된 시간-심도단면도는 천부의 불균질대에 대한 보정에 효과적이다. 또한 제로 XY 값을 가지고 계산된 시간-심도값들은 천부 불균질대의 영향과 대상 굴절면에 대한 시간-심도값들의 합으로 주어지므로 그들의 차는 정보정을 위해 주시로부터 빼주어야 할 대략적인 값들을 제공한다. GRM SSM 방법은 결정론적인 풍화대에 대한 보정법이라기 보다는 평활화 과정이다. 이 방법은 수평적으로 확장이 매우 제한된 천부 불균질대에 대해 가장 효과적이다. 모델과 현장 적용 결과들을 통해 GRM SSM 방법을 이용하여 불규칙한 굴절면을 가진 지층들에 대해 좀 더 신뢰할 수 있는 정밀한 탄성파 속도를 산출할 수 있음을 보여주고 있다.

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).