• 제목/요약/키워드: Filtering Process

검색결과 829건 처리시간 0.03초

계층적 행위 스크립트 표현을 통한 아바타-객체 행위 제어를 위한 인터페이스 기법 (An Interface Technique for Avatar-Object Behavior Control using Layered Behavior Script Representation)

  • 최승혁;김재경;임순범;최윤철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권9호
    • /
    • pp.751-775
    • /
    • 2006
  • 본 논문에서는 아바타의 행위(Avatar Behavior)를 상위 레벨 명령어(High-Level Behavior)들로 이루어진 스크립트로 제어하는 기법을 제안한다. 아바타 행위를 추상화 정도에 따라 구분하고 이를 표준화된 계층적 스크립트(Layered Script)로 정의 함으로써 사용자는 스크립트를 재사용할 수 있고 행위의 추상화 조절이 가능하다. 또한 가상 환경이 복잡해짐에 따라 아바타 행위도 다양하게 늘어날 뿐 아니라 아바타-객체 상호작용 처리 역시 복잡해지고 있다. 이러한 문제점을 해결하기 위해 아바타와 객체간의 상호작용을 위한 객체 모델을 제안하여 아바타와 객체간 벌어지는 행위들을 객체 안에 분산시켜 표현함으로써 객체지향 방식으로 아바타 행위를 유연하게 제어할 수 있도록 설계하였다. 이를 위해 제안 객체 모델에서는 객체의 상태에 따라 사용 가능한 행위가 결정되는 컨텍스트 메뉴(context menu) 인터페이스와 동작 생성 모델을 정의하였다. 또한 사용자는 기존의 2D 혹은 텍스트기반 스크립트 작성기법을 벗어나 제안된 3D 인터페이스 기법을 통하여 실시간으로 아바타의 행위 스크립트를 작성 및 재생 할 수 있다. 본 연구에서는 제안 기법의 활용을 위해 프레젠테이션 도메인 환경의 시스템을 구축하고 아바타-객체 행위제어 및 스크립트 생성 기법을 적용하였다. 본 논문에서는 아바타의 행위(Avatar Behavior)를 일종의 상위 레벨 명령어(Hi8h-Level TaskBehavior)들로 이루어진 스크립트로 제어하는 기법을 제시한다제안한다. 아바타 행위를 추상화 정도에 따라 구분하고 이를 표준화된 계층적 스크립트(Multi-LeveiLayered Script)로 정의 함으로써 사용자는 쉽게 스크립트를 재사용할 수 있고 행위의 추상화 정도도 쉽게 조절이 가능하다. 또한 또한 아바타와 객체간의 상호작용을 위한 객체 모델을 제시한다. 가상 환경이 복잡해짐에 따라 아바타 행위도 다양하게 늘어날 뿐 아니라 아바타-객체 상호작용 처리 역시 복잡해지고 있다. 이러한 문제점을 해결하기 위해 아바타와 객체간의 상호작용을 위한 객체 모델을 제안하여 아바타와 객체간 벌어지는 모든 행위들을 객체 안에 분산시켜 저장표현함으로써 객체지향 방식으로 아바타 행위를 유연하게 제어객체의 수와 무관하게 상호작용을 처리할 수 있도록 설계하였다. 이를 위해 또한 복잡해진 제안 객체 모델에서는 객체의 상태에 따라 사용 가능한 행위가 결정되는 가상 환경을 위해 새로운 인터페이스로 컨텍스트 메뉴(context menu) 인터페이스와 동작 생성 모델을 제시한다. 정의하였다. 객체 모델에서 객체의 상태 정보와 행위 정보를 분석해 아바타가 할 수 있는 행위를 컨텍스트 메뉴로 제공하기 때문에 사용자는 가상 환경의 상태에 상관 없이 직관적으로 명령을 줄 수 있다. 또한 사용자는 기존의 2D 혹은 텍스트기반 스크립트 작성기법을 벗어나 사용자는 제안된 3D 인터페이스 기법을 통하여 실시간으로 아바타의 행위 스크립트를 작성 및 재생 할 수 있다. 본 논문에서 제시한 시스템은 기존의 아바타 중심적인 제어를 객체에 분산함으로써 효율적이고 직관적인 명령을 내릴 수 있고 또한 손쉬운 시나리오 생성을 가능하게 하였다. 본 연구에서는 제안 기법의 활용을 위해 프리젠테이션 도메인 환경의 시스템을 구축하고 아바타-객체 행위제어 및 스크립트 생성 기법을 적용하였다.

부영양 저수지의 조류제거를 위한 기능성 천연물질혼합제의 최적화 연구 (Optimization Test of Plant-Mineral Composites to Control Nuisance Phytoplankton Aggregates in Eutrophic Reservoir)

  • 이주환;김백호;문병천;황순진
    • 생태와환경
    • /
    • 제44권1호
    • /
    • pp.31-41
    • /
    • 2011
  • 유해 조류 제거를 위해 기 개발된 천연물질혼합제의 최적화 조건을 찾기 위해 다양한 환경조건에서 조류제거율 및 유기물 응집부상량을 조사하였다. 천연무질혼합제는 천연 식물체(상수리나무, 밤나무, 녹차 잎)와 광물질(황토, 맥반석, 제오라이트)을 단순 추출법을 이용하여 추출한 후 혼합한 물질로 비중이 낮은 유기물질을 응집시켜 부상시키는 특징을 갖는다. 실험은 농도 $0{\sim}1.0\;mL\;L^{-1}$, 광도는 $8{\sim}1,400\;{\mu}mol\;m^{-2}s^{-1}$, 수온은 $10{\sim}30^{\circ}C$, pH는 7~10, 수심은 10~50 cm 그리고 조류종은 cyanobacteria, diatom, green algae의 조건 범위에서 각각 진행하였다. 실험결과 $0{\sim}1.0\;mL\;L^{-1}$ 농도에서 모두 80% 이상의 조류제거율을 나타냈으나 경제성과 안전성을 고려했을 때 가장 낮은 농도인 $0.05\;mL\;L^{-1}$가 적정 농도로 판단되었다. 광도는 $1,400\;{\mu}mol\;m^{-2}s^{-1}$에서 약 93%, 수온은 $20{\sim}30^{\circ}C$에서 약 60~74%, pH는 7~9 사이에서 약 93%, 수심은 50 cm 이하 모든 수심에서 90% 이상, 조류종에서는 cyano bacteria가 우점하는 수체에서 약 86%로 각각 가장 좋은 조류제거율을 나타냈으며, 응접부상효과 역시 높게 나타났다. 이상의 실험에서 천연물질혼합제는 수중 부유물보다 조류의 제거에 더 효과적이었으며, 수중 조류나 부유물질의 크기가 효율에 영향을 미치는 것으로 판단된다. 결국 천연물질혼합제는 수온이 상승하는 봄~여름(수온: $20{\sim}30^{\circ}C$), cyanobacteria와 green algae가 우점하는 수체에 적용 시 높은 효과를 나타낼 것으로 사료되며, 향후 현장 적용을 통한 효과 검증이 필요할 것으로 판단되었다.

투과 감마선 계측신호의 Cross correlation 기법 적용에 의한 다중상 유체의 유량측정 (The Flow-rate Measurements in a Multi-phase Flow Pipeline by Using a Clamp-on Sealed Radioisotope Cross Correlation Flowmeter)

  • 김진섭;김종범;김재호;이나영;정성희
    • Journal of Radiation Protection and Research
    • /
    • 제33권1호
    • /
    • pp.13-20
    • /
    • 2008
  • 석유 및 정유관련 산업에서 다중상(multi-phase flow) 유체의 배관 내 흐름은 일반적인 현상의 하나이다. 그러나 각각의 상에 대한 정확한 유량측정은 항상 정확한 결과획득을 얻는데 장애의 근원으로 작용하였다. 일반 상업용 유량계는 일정 이상의 기포가 포함된 유체 흐름의 경우 유량계측에 상당한 오차를 유발한다. 본 연구에서는 ${\gamma}$-ray attenuation 기법을 이용하여 clamp-on 타입으로 배관 외부에서 다중상 유체흐름의 유량 측정을 수행하였다. 사용된 밀봉 감마선원으로는 $^{137}Cs$ 20 mCi와 17 mCi 두 개의 동위원소를 사용하였으며, 감마선 검출기로는 $2"{\times}2"$ NaI(Tl) 섬광계수관을 이용하였다. 방사선 검출기로부터 데이터를 수집하고 각각의 데이터에 대해 푸리에 변환과 필터링을 통해 노이즈를 최소화하였다. 복원된 신호에 대해 상호상관함수(cross correlation function)를 적용하여 두 검출기 사이의 통과시간(transit time)을 측정함으로써 유량을 산정하였다. 배관 내 기포함량 측정을 통해 유량을 보정해줌으로써 측정유량의 정확도를 높였다. 두 선원간의 거리가 4D(D; inner diameter) 그리고 본 실험의 측정조건(N/S: $0.12{\sim}0.15$, sampling time ${\Delta}\;t$: 4msec) 하에서 기포량(단면적 대비 $6.1\;%{\sim}9.2\;%$) 보정을 통해 산정된 유량은 계측오차가 실제 평균유량 대비 1.7 % 이하인 정확도를 보였다. 또한 두 밀봉 감마선원 간의 거리가 가까울수록 통과시간 측정에 정확도가 향상되므로 보다 정확한 유량측정이 가능하였다. 본 연구를 통해 다중상 혼합유체의 유량을 밀봉감마선원과 상호상관 기법으로 이용하여 계측할 수 있음을 확인하였다. 방사성동위원소의 선택 및 계측시스템의 최적화 조건 등에 대한 추가연구가 수행된다면 석유화학 산업과 같은 장치산업의 유지관리 측면에 경제적으로 크게 기여할 수 있을 것으로 판단된다.

정밀한 다중센서 영상정합을 위한 통계적 상관성의 증대기법 (Enhancement of Inter-Image Statistical Correlation for Accurate Multi-Sensor Image Registration)

  • 김경수;이진학;나종범
    • 대한전자공학회논문지SP
    • /
    • 제42권4호
    • /
    • pp.1-12
    • /
    • 2005
  • 영상정합은 동일한 장면에 대해서 서로 다른 시간 혹은 서로 다른 특성의 센서로부터 서로 다른 위치에서 얻은 영상들의 위치적 대응관계를 찾는 기법이다. 이 논문에서는 특성이 다른 적외선 센서와 광학 센서로부터 얻은 영상의 정합을 위한 새로운 알고리즘을 제안한다. 지금까지 제안된 서로 다른 특성의 영상을 위한 정합기법은 크게 특징점 기반 영상정합기법과 밝기값 기반 영상정합기법으로 구분될 수 있다. 특징점 기반의 영상정합기법은 정확하게 대응하는 특징점을 선택하는 것이 성능에 결정적인 영향을 준다 그러나 적외선 영상과 가시광선 영상에서는 특징점이 서로 같지 않은 경우가 많기 때문에 강인하지 못하다 그리고 밝기 값 기반의 정합기법에서는 정규상호정보를 유사성 척도로 사용한 영상정합기법이 가장 좋은 성능을 제공하는 것으로 알려져 있다. 그러나 정규상호정보 기반의 영상정합기법은 두 영상의 통계적 상관성이 전역적이어야 한다는 가정을 전제하는데, 적외선 영상과 가시광선 영상에서는 이를 보장하지 못하는 경우가 많아 정규상호정보를 유사성 척도로 사용하는 영상정합기법에서도 좋은 성능을 기대하기 힐들다. 따라서 이 논문에서는 적외선 영상과 가시광선 영상의 통계적 상관성의 해석에 기반한 두 단계 영상정합기법을 제안한다. 정확하고 강인한 정합을 위해서 첫 단계에서는 두 영상에서 통계적 상관성이 높은 부분을 추출하는 ESCR기법과 두 영상을 통계적 상관성이 높도록 필터링하는 ESCF기법을 수행한다. 그리고 두 번째 단계에서는 첫 단계에서의 결과 영상에 대해서 정규상호정보를 유사성 척도로 한 영상정합을 수행한다. 다양한 적외선 영상과 가시광선 영상을 이용한 실험으로부터 제안하는 두 단계 영상정합기법이 기존의 정규상호정보 기반의 영상정합기법에 비해 정확도와 강인함, 그리고 실행 속도의 측면에서 더욱 향상된 성능을 제공함을 확인하였다.

가우시안 군집분석을 이용한 천리안 위성의 대기운동벡터 표적추적 알고리듬 개발 및 분석 (Development and Analysis of COMS AMV Target Tracking Algorithm using Gaussian Cluster Analysis)

  • 오유림;김재환;박형민;백강현
    • 대한원격탐사학회지
    • /
    • 제31권6호
    • /
    • pp.531-548
    • /
    • 2015
  • 위성영상을 이용하여 산출된 대기운동벡터(AMV)와 라디오존데 바람 관측 자료를 이용한 검증결과는 산출된 AMV가 지속적으로 관측 자료에 비해서 풍속이 약하게 나타나는 Slow Speed Bias(SSB)를 보여 주었다. 이러한 SSB는 표적추적, 표적선정, 그리고 고도할당 단계의 오차에 의해 야기될 수 있으며, 이 중 고도할당 단계의 오차는 SSB를 발생시키는 주된 요인으로 여겨진다. 그러나 최근 연구에서는 고도할당 단계의 개선만으로는 SSB 문제를 해결하는데 한계가 있음을 밝혔다. 그러므로 본 연구에서는 새로운 표적추적 알고리듬을 개발하여 SSB를 감소시킴으로서 기상청 현업 AMV 알고리듬의 성능을 개선하고자 하였다. 표적추적 단계의 오차는 표적 내에 다양한 시 공간 규모의 바람이 포함되어 벡터가 과도하게 평균된 움직임으로 계산되거나, 구름이 추적 시간동안 형태를 유지하지 못하고 변형되는 경우에 발생한다. 이러한 문제를 해결하기 위해 개발된 표적추적 알고리듬에서는 가우시안 군집분석(GMM)을 이용하여 변형이 적고 추적에 용이한 저온 군집을 표적으로 재선정하고, 이미지를 변형시켜 군집의 움직임을 보다 쉽게 추적할 수 있게 하였다. 또한 표적을 추적하기 위한 방법으로 거리제곱합 방법을 사용하였다. 개발된 알고리듬과 기존 COMS 알고리듬을 천리안 위성의 적외채널 영상에 적용하여 AMV를 산출하였으며, 이를 라디오존데 관측 자료와 비교 검증해 보았다. 제안된 알고리듬으로 산출된 AMV는 기존 알고리듬으로 산출된 AMV보다 평균 풍속이 $2.7ms^{-1}$증가함에 따라 SSB가 평균 29%까지 감소하는 개선된 결과를 보여주었다. 그러나 개발된 알고리듬으로 산출된 AMV는 중 하층의 정확도가 감소하였고, 기존 알고리듬에 비해 산출되는 AMV 벡터수가 약 40%까지 감소함을 보였다. 이에 따라 중 하층의 정확도 개선과 기존의 알고리듬과 비교하여 산출되는 벡터 개수가 감소하는 문제를 보완하기 위한 연구가 필요할 것으로 판단된다.

인도네시아 열대작물 오일의 Amberlyst-15 촉매 에스테르화 반응 및 바이오디젤 물성 분석 (Esterification of Indonesia Tropical Crop Oil by Amberlyst-15 and Property Analysis of Biodiesel)

  • 이경호;;이준표;이진석;김덕근
    • 한국응용과학기술학회지
    • /
    • 제36권1호
    • /
    • pp.324-332
    • /
    • 2019
  • 한국과 인도네시아를 포함한 대부분의 국가는 온실가스 감축을 위해 바이오디젤 같은 바이오연료 보급에 대한 강력한 정책을 추진하고 있다. 하지만, 바이오디젤 보급 확대를 위해서는 원료 부족 문제를 먼저 해결해야 한다. 본 연구에서는 원료 공급 안정성을 개선하고 바이오디젤 생산 가격을 낮추기 위해 비식용이면서 동시에 단위면적당 생산성이 높은 인도네시아 열대작물(R. Trisperma) 오일의 바이오디젤 생산 가능성을 조사하였다. 수확기간이 다른 두 종류의 오일은 많은 불순물과 높은 유리지방산 함량을 가지고 있어 효율적인 바이오디젤 생산을 위해, 에스테르화 반응과 전이에스테르화 반응을 실시하였다. 오일은 반응을 진행하기 앞서 여과와 수분제거 과정을 통해 반응의 효율을 높이고자 하였다. 에스테르화 반응은 불균질계 산 촉매인 Amberlyst-15를 사용하였으며, 반응 전 오일들의 산가는 각각 41, 17 mg KOH / g이었으나, 에스테르화 반응 후 3.7, 1.8 mg KOH/g으로 약 90% 이상의 전환율을 보이며 유리지방산 함량을 2%이하로 감소시켰다. 이후 전이에스테르화 반응은 KOH를 염기 촉매로 사용하여 바이오디젤 합성 실험을 진행하였다. 생성된 바이오디젤은 약 93%의 FAME 함량을 나타냈으며, 총 글리세롤의 함량은 0.43%으로 제품 규격(FAME 96.5%, 총 글리세롤 0.24%)에는 미달되었다. 이는 지방산 조성 분석 결과 일반적으로 관찰되지 않는 특이 지방산인 ${\alpha}$-Eleostearic acid가 10.7~33.4% 포함되어 나타나는 특성으로 판단되며, 추가 반응 최적화 및 분리정제 연구 진행으로 연료품질 규격 달성이 필요한 것으로 나타났다. 기존에 활용되지 못하던 비식용 원료로부터 바이오디젤 생산 기술을 확보할 경우 바이오디젤 보급 확대를 위한 안정적 원료 공급에 기여할 것으로 판단된다.

사용자 선호도 변화에 따른 추천시스템의 다양성 적용 (Application of diversity of recommender system accordingtouserpreferencechange)

  • 나혜연;남기환
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.67-86
    • /
    • 2020
  • 추천시스템은 시간이 흐를수록 사용자와 기업에게 점점 더 큰 영향을 주고 있다. 최근 코로나(COVID-19) 팬데믹 현상이 전 세계적으로 일어나면서 세대를 뛰어넘어 E-Commerce의 중요성이 증대되었고 추천시스템은 E-Commerce 활성화의 최중심에 있다. 추천시스템이 개발된 이래로 다수의 알고리즘이 추천시스템의 정확도를 올리는 것에 집중되어 있었고, 추천시스템의 희귀성, 다양성, 우연성 등과 같은 다른 가치들이 간과되고 있다. 본 논문에서는 사용자의 만족도는 추천시스템의 정확도에만 달려있지 않고 다양한 성능을 겸비했을 때 고객에게 만족스러운 추천서비스 경험을 제공할 것이라 생각하여 다양성을 위한 그래프 기반의 추천시스템을 개발하였다. 사용자 네트워크를 구성한 뒤 카테고리를 활용한 무게중심변화를 통해 유사도가 낮은 이질적인 사용자를 찾아 추천상품의 유사성을 낮추는 방식으로 다양성을 도모하였다. 또한, 추천의 다양성은 사용자의 다양성 선호 수준에 따라 상이할 것이라는 가정에 따라 사용자의 다양성 선호 수준을 구별하였고 다양성 모델 성능이 사용자 특성별로 다름을 확인할 수 있었다. 전체 연구 결과, 추천시스템의 정확성과 다양성이 트레이드 오프 관계에 놓여있다는 것을 확인할 수 있었지만 본 연구모델을 통해 근소한 정확도 손실 대비 높은 다양성을 얻을 수 있었다. 본 연구는 그래프 기반의 추천시스템을 통해 사용자의 만족도를 향상시키는 다양성을 실현하였다는 연구적 의의와 사용자 수준을 고려한 추천의 다양성을 적용 결과를 통해 기업의 장기적 이윤을 상승시킬 수 있는 모델 개발이라는 실무적 의의를 꼽을 수 있다.

지하수내 갈색 부유/침전 물질의 생성 반응에 관한 평형 및 반응속도론적 연구: 적정 양수 기법 및 탁도 제거 방안에 대한 제안 (Geochemical Equilibria and Kinetics of the Formation of Brown-Colored Suspended/Precipitated Matter in Groundwater: Suggestion to Proper Pumping and Turbidity Treatment Methods)

  • 채기탁;윤성택;염승준;김남진;민중혁
    • 대한지하수환경학회지
    • /
    • 제7권3호
    • /
    • pp.103-115
    • /
    • 2000
  • 갈색 침전물의 생성은 우리나라 지하수의 개발 및 공급에 있어 흔히 발생하는 문제 중의 하나인데, 이에 따라 색도, 맛, 탁도 및 용존 철 함량 등의 항목에 있어 먹는 물 수질 기준을 초과하게 되고, 물 공급 시스템에 스케일링의 문제를 야기하게 된다. 경기도 파주 지역 지하수의 경우에도 양수 후 몇 시간 내에 갈색 침전물이 형성되어 수질을 악화시키고 있다. 본 연구에서는 지하수의 탁도를 유발하는 원인과 지화학적 반응 경로를 이해하고자, 평형열역학 및 반응속도론적 접근을 통하여 갈색 침전물의 형성과정을 파악하였다. 본 연구결과는 침전물의 형성을 최소화하기 위한 적정 양수 기법은 물론 수질 향상을 위한 최적 수처리 기법을 설계하는데 있어 중요한 자료로 활용될 것이다. 파주 지역의 암반 지하수는 물/암석(편마암)반응에 의해 Ca-$HCO_3$형의 수질 특성을 보인다. SEM-EDS 및 XRD 분석 결과, 갈색 침전물은 비정질의 함철 산화물 또는 수산화물로 해석된다. 다양한 공극 크기(6, 4, 1, 0.45, 0.2 $\mu\textrm{m}$)를 갖는 여과지를 이용한 다단계 여과 결과, 이들 침전물은 크기에 있어 대부분 1 내지 0.45$\mu\textrm{m}$의 입도를 갖는 콜로이드 형태이지만, 질량 분포로 볼 때는 1 내지 6$\mu\textrm{m}$범위가 우세함(총 질량의 약 81%)을 알 수 있다. 다량의 용존 철(II)은 지하수 유동 중에 철 함량이 높은(최대 3wt.%) 단층 파쇄암 내의 녹니석(clinochore)의 용해로부터 기원하는 것으로 판단된다. PHREEQC 프로그램을 이용한 포화지수 계산 및 pH-Eh 관계도에 대한 검토 결과, 침전물은 함철 수산화물임이 확인되며, 환원 조건에 있던 심부 지하수가 양수에 의해 산소에 노출되면서 화학성 변화(특히, 산화)에 의하여 침전함을 알 수 있다. 양수 이후의 시간 경과와 더불어 양수된 지하수의 pH, DO, 알칼리도는 점차 감소하며. 탁도는 증가하다가 일정 시간 경과 후 감소하는 경향을 보인다. 양수 이후의 경과 시간에 따른 용존 철(II)의 농도 감소율(즉, 반응 속도)은 Fe(II)=10.l exp(-0.0009t)로 표현된다. 따라서 갈색 침전물의 생성 반응은 양수 및 양수 후 저장 과정 중에 산소의 유입에 따른 산화 반응에 기인하며, 그 반응은 시간, 산소분압 및 pH에 의존함을 알 수 있다. 탁도를 제거하여 음용 가능한 수질을 확보하기 위해서는, 충분한 시간 동안 충분한 크기를 갖는 탱크 내에서의 다단계 저장 및 폭기를 거친 이후에 응집된 침전물에 대한 여과가 제안된다. 이때, 비용 절감 차원에서 상이한 입도 조건에서의 다단계 여과가 효과적일 것으로 생각된다. 한편, 개발 관정 내에서의 스케일링을 최소화하기 위해서는 심부 지하수로 산소가 풍부한 천층 지하수가 유입되는 과정을 최소화할 필요가 있다. 이를 위해서는 적정 채수량 범위 내에서의 지속적인 양수가 효과적일 것이다. 아울러, 산소가 풍부한 천층 지하수의 채수를 위한 별도의 관정 설치도 고려할 수 있을 것이다.

  • PDF

사회문제 해결형 기술수요 발굴을 위한 키워드 추출 시스템 제안 (A Proposal of a Keyword Extraction System for Detecting Social Issues)

  • 정다미;김재석;김기남;허종욱;온병원;강미정
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.1-23
    • /
    • 2013
  • 융합 R&D가 추구해야 할 바람직한 방향은 이종 기술 간의 결합에 의한 맹목적인 신기술 창출이 아니라, 당면한 주요 문제를 해결함으로써 사회적 니즈를 충족시킬 수 있는 기술을 개발하는 것이다. 이와 같은 사회문제 해결형 기술 R&D를 촉진하기 위해서는 우선 우리 사회에서 주요 쟁점이 되고 있는 문제들을 선별해야 한다. 그런데 우선적이고 중요한 사회문제를 분별하기 위해 전문가 설문조사나 여론조사 등 기존의 사회과학 방법론을 사용하는 것은 참여자의 선입견이 개입될 수 있고 비용이 많이 소요된다는 한계를 지닌다. 기존의 사회과학 방법론이 지닌 문제점을 보완하기 위하여 본 논문에서는 사회적 이슈를 다루고 있는 대용량의 뉴스기사를 수집하고 통계적인 기법을 통하여 사회문제를 나타내는 키워드를 추출하는 시스템의 개발을 제안한다. 2009년부터 최근까지 3년 동안 10개 주요 언론사에서 생산한 약 백 30만 건의 뉴스기사에서 사회문제를 다루는 기사를 식별하고, 한글 형태소 분석, 확률기반의 토픽 모델링을 통해 사회문제 키워드를 추출한다. 또한 키워드만으로는 정확한 사회문제를 파악하기 쉽지 않기 때문에 사회문제와 연관된 키워드와 문장을 찾아서 연결하는 매칭 알고리즘을 제안하다. 마지막으로 사회문제 키워드 비주얼라이제이션 시스템을 통해 시계열에 따른 사회문제 키워드를 일목요연하게 보여줌으로써 사회문제를 쉽게 파악할 수 있도록 하였다. 특히 본 논문에서는 생성확률모델 기반의 새로운 매칭 알고리즘을 제안한다. 대용량 뉴스기사로부터 Latent Dirichlet Allocation(LDA)와 같은 토픽 모델 방법론을 사용하여 자동으로 토픽 클러스터 세트를 추출할 수 있다. 각 토픽 클러스터는 연관성 있는 단어들과 확률값으로 구성된다. 그리고 도메인 전문가는 토픽 클러스터를 분석하여, 각 토픽 클러스터의 레이블을 결정하게 된다. 이를 테면, 토픽 1 = {(실업, 0.4), (해고, 0.3), (회사, 0.3)}에서 토픽 단어들은 실업문제와 관련있으며, 도메인 전문가는 토픽 1을 실업문제로 레이블링 하게 되고, 이러한 토픽 레이블은 사회문제 키워드로 정의한다. 그러나 이와 같이 자동으로 생성된 사회문제 키워드를 분석하여 현재 우리 사회에서 어떤 문제가 발생하고 있고, 시급히 해결해야 될 문제가 무엇인지를 파악하기란 쉽지 않다. 따라서 제안된 매칭 알고리즘을 사용하여 사회문제 키워드를 요약(summarization)하는 방법론을 제시한다. 우선, 각 뉴스기사를 문단(paragraph) 단위로 세그먼트 하여 뉴스기사 대신에 문단 세트(A set of paragraphs)를 가지게 된다. 매칭 알고리즘은 각 토픽 클러스터에 대한 각 문단의 확률값을 측정하게된다. 이때 토픽 클러스터의 단어들과 확률값을 이용하여 토픽과 문단이 얼마나 연관성이 있는지를 계산하게 된다. 이러한 과정을 통해 각 토픽은 가장 연관성이 있는 문단들을 매칭할 수 있게 된다. 이러한 매칭 프로세스를 통해 사회문제 키워드와 연관된 문단들을 검토함으로써 실제 우리 사회에서 해당 사회문제 키워드와 관련해서 구체적으로 어떤 사건과 이슈가 발생하는 지를 쉽게 파악할 수 있게 된다. 또한 매칭 프로세스와 더불어 사회문제 키워드 가시화를 통해 사회문제 수요를 파악하려는 전문가들은 웹 브라우저를 통해 편리하게 특정 시간에 발생한 사회문제가 무엇이며, 구체적인 내용은 무엇인지를 파악할 수 있으며, 시간 순서에 따른 사회이슈의 변동 추이와 그 원인을 알 수 있게 된다. 개발된 시스템을 통해 최근 3년 동안 국내에서 발생했던 다양한 사회문제들을 파악하였고 개발된 알고리즘에 대한 평가를 수행하였다(본 논문에서 제안한 프로토타입 시스템은 http://dslab.snu.ac.kr/demo.html에서 이용 가능함. 단, 구글크롬, IE8.0 이상 웹 브라우저 사용 권장).