• 제목/요약/키워드: Decision Tree

검색결과 1,650건 처리시간 0.027초

구룡 해안마을 경관형성 기본계획 (Preliminary Landscape Improvement Plan for Gu-ryong Village)

  • 김연금;최정민
    • 한국조경학회지
    • /
    • 제40권6호
    • /
    • pp.23-34
    • /
    • 2012
  • 본 연구는 '2010년도 해안마을 경관형성 시범사업'의 일환으로 국토해양부가 주관하고 고흥군이 시행한 '구룡 해안마을 경관형성 기본계획'을 다룬다. 해안마을 경관은 정주, 경제, 문화 활동을 포함하고 있는 시스템이므로 해안마을 경관형성 기본계획은 관광자원화와 정주환경조성, 문화 활동 간의 균형이 필요하다고 보았다. 이에 '주민들의 생활이 이루어지고 있는 경관의 잠재성과 생활문화방식을 존중하면서 경관의 개선 및 증진'을 주요 목적으로 설정했다. 연구 진행에 있어서는 주민참여 프로그램을 운영해 주민들 스스로가 자신들의 경관 인식과 아이디어를 이야기할 수 있도록 했고 경관 추진위원회라는 소통 창구를 통해 경관형성 계획과 관련된 의사결정을 진행했다. 경관형성 계획은 먼저 시간에 따라 훼손된 자연경관을 복원하고 정비하였다. 구룡산은 배후산으로서 역할을 할 수 있도록 나대지를 복원하고 산마루 지형을 활용하여 전망공간을 조성했다. 해안과 관련해서는 돌을 사용한 계단식 스탠드와 노두길 조성으로 접근성을 높였다. 마을 길 체계는 해안도로, 마을 안길, 산자락길, 노두길 등을 대상으로 사라진 길은 복원하고, 끊긴 부분은 잇고 연결하면서 경관 주제에 맞도록 재구성하였다. 또한 주민들의 외부활동 편의성 증진과 방문객이 체계적인 경험을 할 수 있도록 기존의 거점 공간을 정비하거나 새롭게 조성했다. 이와 함께 가이드라인을 통해 사적영역에서의 경관 개선이 이루어지도록 했다. 가이드라인은 건축물의 지붕 벽체 담장과 가로에 놓이는 컨테이너 박스와 어구를 대상으로 했다. 본 연구는 주민참여 프로그램과 주민들과의 협의를 통해 주민들의 생활에 밀착한 해안마을 경관형성 기본계획을 수립했다는데 의의가 있다. 연구를 진행하면서 해안마을 경관 형성 사업의 한계점과 과제도 발견할 수 있었는데, 첫째는 주민들의 인식과 실천 사이의 간극이다. 주민들은 마을경관의 문제점을 알고 있었으나 실제 행동으로 옮기는데 있어서는 한계를 나타냈다. 둘째는 마을 경관형성사업에 대한 이해와 인식의 부족이다. 지방정부와 주민들은 마을 경관형성 사업을 신규 건축이나 도로 확장 같은 개발 사업으로 이해하는 경향이 있었다. 셋째는 경관이 그러하듯이, 이러한 계획은 단시간에 이루어지지 않으므로 일회적인 사업보다는 지속적인 관심과 지원이 필요하다는 것이다.

기록 생애주기 관점에서 본 기록관리 메타데이터 표준의 특징 분석 (Feature Analysis of Metadata Schemas for Records Management and Archives from the Viewpoint of Records Lifecycle)

  • 백재은;스기모토 시게오
    • 한국기록관리학회지
    • /
    • 제10권2호
    • /
    • pp.75-99
    • /
    • 2010
  • 인터넷과 컴퓨터의 발전으로 다양한 환경이 끊임없이 제공되고, 이로 인해 대량의 디지털 리소스가 축적, 발신되고 있다. 이는 다양한 문제를 가져왔고, 우리는 디지털 리소스를 미래에 이용가능하도록 지속하고 보존하기 위한 기본적인 문제에 직면하게 되었다. 디지털 리소스를 장기간 보존하기 위해서는 리소스에 적합한 보존 방침과 방법이 필요하고, 따라서 여러 스탠다드가 개발되고 사용되어지고 있다. 메타데이터는 디지털 리소스를 장기간 유지하기 위한 디지털 아카이브에서 가장 중요한 구성요소 중 하나 이다. 디지털 리소스의 아카이빙과 보존을 위해 사용되는 메타데이터는 많이 있다. 그러나 각각의 스탠다드 는 주된 어플리케이션에 따라 각각의 특징을 가지고 있다. 이는 각각의 스키마가 특정한 어플리케이션에 따라 적절하게 선택하고 맞춰지지 않으면 안 되는 것을 의미한다. 경우에 따라서는DCMI의 어플리케이션 프레임워크와 METS와 같이, 스키마는 거대한 프레임워크와 컨테이너 메타데이터로 결합되어 있다. 다양한 메타데이터가 있는 가운데, 본 논문에서는 아카이브를 행하기 위해 용이되어 있는 메타데이터 스키마로, 공문서 혹은 행정문서등의 아카이브를 위해 기술하고 있는 ISAD(G), 디지털 리소스를 위해 작성된 EAD, 보존한 디지털 리소스를 위해 메타데이터 프레임워크를 정의하고 있는 OAIS, 디지털 리소스의 보존을 위한 PREMIS, 그리고 리소스의 관리와 검색을 위해 작성된 AGLS Metadata를 사용하여, '보존해야 되는 리소스에 하나의 메타데이터만을 선택해서 이용한다면 어떠한 문제가 생기는 가'라고 하는 의문을 바탕으로 접근하였다. 본 논문은 기록 생애주기 모델을 기초로, 스탠다드의 특징분석을 통해서 알게 된 메타데이터 스탠다드의 특징을 보여주고 있다. 특징은 이들 스탠다드의 메타데이터 기술요소가 기록 생애주기에서의 작업(task)에 관련하는 것을 간단하게 단일의 프레임워크로 보여줬다. 메타데이터 기술요소의 상세한 분석을 통해서, 우리는 기술 생애주기의 단계와 기술요소 간의 관계의 관점에서부터 스탠다드의 특징을 확실하게 할 수 있었다. 메타데이터 스키마간의 매핑은 다른 스키마가 기록 생애주기에서 사용되기에 장기 보존과정에 있어 자주 요구된다. 따라서 이러한 스키마의 상호운용성을 향상시키기 위해서는 통일된 프레임워크를 구축하는 것이 중요하다. 이 연구에서는 디지털 아카이빙과 보존에 사용되는 다른 메타데이터 스키마의 상호운용성을 기초로 제시한다.

불균형 데이터 환경에서 변수가중치를 적용한 사례기반추론 기반의 고객반응 예측 (Response Modeling for the Marketing Promotion with Weighted Case Based Reasoning Under Imbalanced Data Distribution)

  • 김은미;홍태호
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.29-45
    • /
    • 2015
  • 고객반응 예측모형은 마케팅 프로모션을 제공할 목표고객을 효과적으로 선정할 수 있도록 하여 프로모션의 효과를 극대화 할 수 있도록 해준다. 오늘날과 같은 빅데이터 환경에서는 데이터 마이닝 기법을 적용하여 고객반응 예측모형을 구축하고 있으며 본 연구에서는 사례기반추론 기반의 고객반응 예측모형을 제시하였다. 일반적으로 사례기반추론 기반의 예측모형은 타 인공지능기법에 비해 성과가 낮다고 알려져 있으나 입력변수의 중요도에 따라 가중치를 상이하게 적용함으로써 예측성과를 향상시킬 수 있다. 본 연구에서는 프로모션에 대한 고객의 반응여부에 영향을 미치는 중요도에 따라 입력변수의 가중치를 산출하여 적용하였으며 동일한 가중치를 적용한 예측모형과의 성과를 비교하였다. 목욕세제 판매데이터를 사용하여 고객반응 예측모형을 개발하고 로짓모형의 계수를 적용하여 입력변수의 중요도에 따라 가중치를 산출하였다. 실증분석 결과 각 변수의 중요도에 기반하여 가중치를 적용한 예측모형이 동일한 가중치를 적용한 예측모형보다 높은 예측성과를 보여주었다. 또한 고객 반응예측 모형과 같이 실생활의 분류문제에서는 두 범주에 속하는 데이터의 수가 현격한 차이를 보이는 불균형 데이터가 대부분이다. 이러한 데이터의 불균형 문제는 기계학습 알고리즘의 성능을 저하시키는 요인으로 작용하며 본 연구에서 제안한 Weighted CBR이 불균형 환경에서도 안정적으로 적용할 수 있는지 검증하였다. 전체데이터에서 100개의 데이터를 무작위로 추출한 불균형 환경에서 100번 반복하여 예측성과를 비교해 본 결과 본 연구에서 제안한 Weighted CBR은 불균형 환경에서도 일관된 우수한 성과를 보여주었다.

머신러닝 기법을 활용한 터널 설계 시 시추공 내 암반분류에 관한 연구 (A study on the rock mass classification in boreholes for a tunnel design using machine learning algorithms)

  • 이제겸;최원혁;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.469-484
    • /
    • 2021
  • 터널 설계 시 지반조사를 통한 암반분류 결과는 공사기간 및 공사비 산출, 그리고 터널안정성 평가에 지대한 영향을 미친다. 국내에서 지금까지 완공된 3,526개소의 터널들의 설계 및 시공을 통해 관련 기술들은 지속적으로 발전되어 왔지만, 터널 설계 시 암질 및 암반등급을 보다 정확하게 평가하기 위한 방법에 대한 연구는 미미하여 평가자의 경험 및 주관에 따라 결과의 차이가 큰 경우가 적지 않다. 따라서 본 연구에서는 암석샘플에 대한 주관적 평가를 통한 기존의 인력에 의한 암반분류 대신, 최근 지반분야에서도 그 활용도가 급증하고 있는 머신러닝 알고리즘을 이용하여 시추조사에서 획득한 다양한 암석 및 암반정보를 분석하여 보다 신뢰성있는 RMR에 의한 암반분류 모델을 제시하고자 하였다. 국내 13개 터널을 대상으로 11개의 학습 인자(심도, 암종, RQD, 전기비저항, 일축압축강도, 탄성파 P파속도 및 S파 속도, 영률, 단위중량, 포아송비, RMR)를 선정하여 337개의 학습 데이터셋과 60개의 시험 데이터셋을 확보하였으며, 모델의 예측성능을 향상시키기 위해 6개의 머신러닝 알고리즘(DT, SVM, ANN, PCA & ANN, RF, XGBoost)과 각 알고리즘별 다양한 초매개변수(hyperparameter)를 적용하였다. 학습된 모델의 예측성능을 비교한 결과, DT 모델을 제외한 5개의 머신러닝 모델에서 시험데이터에 대한 RMR 평균절대오차 값이 8 미만으로 수렴되었으며, SVM 모델에서 가장 우수한 예측성능을 나타내었다. 본 연구를 통해 암반분류 예측에 대한 머신러닝 기법의 적용 가능성을 확인하였으며, 향후 다양한 데이터를 지속적으로 확보하여 예측모델의 성능을 향상시킨다면 보다 신뢰성 있는 암반 분류에 활용될 수 있을 것으로 기대된다.

1시간 호우피해 규모 예측을 위한 AI 기반의 1ST-모형 개발 (Development of 1ST-Model for 1 hour-heavy rain damage scale prediction based on AI models)

  • 이준학;이하늘;강나래;황석환;김형수;김수전
    • 한국수자원학회논문집
    • /
    • 제56권5호
    • /
    • pp.311-323
    • /
    • 2023
  • 집중호우, 홍수 및 도시침수와 같은 재해를 저감시키기 위하여 자연 재난으로 인한 재해의 발생 여부를 사전에 파악하는 것은 중요하다. 현재 국내는 기상청에서 운영하고 있는 호우주의보 및 호우경보를 발령하고 있지만, 이는 전국에 일괄적인 기준으로 적용하고 있어 사전에 호우로 인한 피해를 명확하게 인지하지 못하고 있는 실정이다. 따라서, 일괄된 기준을 지역적 특성을 반영한 호우특보 기준으로 재설정하고 1시간 후에 강우로 발생할 수 있는 피해의 규모를 예측하고자 하였다. 연구 대상 지역으로는 호우피해가 가장 빈번하게 발생하였던 경기도 지역으로 선정하였고, 강우량 및 호우 피해액 자료를 활용하여 지역적 특성을 고려한 시간단위 재해 유발 강우를 설정하였다. 강우에 의한 호우피해 발생 여부를 예측하는 모형을 개발하기 위해 재해 유발 강우 및 강우 자료를 활용하였으며, 머신러닝 기법인 의사 결정 나무 모형과 랜덤 포레스트 모형을 활용하여 분석 및 비교하였다. 또한 1시간 후의 강우를 예측하기 위한 모형으로는 장단기 메모리, 심층 신경망 모형을 활용하여 분석 및 비교하였다. 최종적으로 예측 모형을 통해 예측된 강우를 훈련된 분류 모형에 적용하여 1시간 후 호우에 의한 규모별 피해 발생 여부를 예측하였고, 이를 1ST-모형이라고 정의하였다. 본 연구를 통해 개발된 1ST-모형을 활용하여 예방 및 대비 차원의 재난관리를 실시한다면 호우로 인한 피해를 저감하는데 기여 할 수 있을 것으로 판단된다.

식품의 소비기한 참고치 설정을 위한 안전계수 (Establishment of Safety Factors for Determining Use-by-Date for Foods)

  • 김병후;정수진;강준구;윤요한;신재욱;이철수;하상도
    • 한국식품위생안전성학회지
    • /
    • 제38권6호
    • /
    • pp.528-536
    • /
    • 2023
  • 2021년 11월 5일 '유통기한(流通期限)' 대신 '소비기한(消費期限)'을 표시하도록 하는 「식품 등의 표시·광고에 관한 법률」 시행령과 시행규칙 일부 개정안이 입법 예고되었다. 이에 본 연구는 식품 유형별 소비기한 참고치 설정을 위한 과학적 기반을 구축하고자 과학적 안전계수 산출법을 마련하고, 안전계수를 제시하고자 하였다. 본 연구에서는 온도 남용, pH, 수분활성도, 포장방법에 대해 모의실험을 진행하며 식품 자체의 수명(소비기한)에 영향을 주는 5가지 특성을 1) 수소이온농도(pH), 2) 수분활성도(Aw), 3) 살균 여부, 보존료(항균, 항산화) 함유 여부, 저장성 향상 포장(레토르트, 진공포장, CO2 충진, N2 충진, 탈산소 제 등), 4) 제품 보관 방법 (냉장, 냉동, 상온, 실온), 5) 멸균 여부로 설정하였다. 수소이온농도(pH) 4.6 이상의 식품은 세균 생장이 용이해 가장 높은 안전계수 값인 0.92를 적용하며, pH 3.5 이하의 강산성 식품은 세균 생장이 중단되고 대부분의 효소반응이 감소하므로 안전계수를 적용하지 않았다(1.0). pH 3.5-4.6 사이의 약산성 식품은 미생물(효모, 곰팡이 포함) 생장이 활발하지는 않지만 가능은하므로 중간값인 안전계수 0.96을 적용하였다. 수분활성도(Aw) 0.91 이상의 식품은 미생물(효모, 곰팡이 포함) 생장이 용이해 가장 높은 안전계수 값인 0.92를 적용하며, Aw 8.0 이하의 건조식품은 세균 생장이 중단되고 대부분의 효소반응이 감소하므로 안전계수를 적용하지 않았다(1.0). Aw 0.8-0.9 사이의 반건조 식품은 세균 생장이 활발하지는 않지만 가능은 하며 진균류(효모, 곰팡이) 생장이 용이하므로 중간값인 안전계수 0.96을 적용하였다. 살균, 보존료(항균, 항산화) 함유 또는 저장성 향상 포장(레토르트, 진공, CO2 충진, N2 충진, 탈산소제 등) 식품은 미생물(효모, 곰팡이 포함) 오염도 및 생장, 대부분의 효소반응이 감소하므로 안전계수를 적용하지 않았다(1.0). 위와 같은 처리를 하지 않은 식품은 미생물(효모, 곰팡이 포함) 생장이 용이하고 대부분의 효소반응이 촉진되므로 가장 높은 안전계수 값인 0.92를 적용하였다. 저장 온도(냉동, 냉장, 상온, 실온)별 안전계수는 표준온도 편차 값(냉장 0.07, 냉동 0.08, 상온 0.27, 실온 0.01)을 사용했으며, 온도편차 중 낮은 온도는 안전에 영향을 주지 않으므로 온도 편차의 절반인 높은 온도 값만 안전에 영향을 주므로 50%(0.5)를 곱해주고 온도 초과에 미치는 '유통+소비단계' 기여율(85%)인 0.85를 다시 곱해 나온 안전계수 값인 냉장 0.03, 냉동 0.03, 상온 0.11, 실온 0.01을 적용하였다. 냉장식품의 온도남용에 대한 안전계수는 온도남용 시 실제 노출시간(1시간)을 반영해 50%(0.5) 곱하고, 소비자 냉장식품 온도남용 비율인 92.3%(0.923)를 곱해 도출한 0.407 값을 활용한 안전계수 값인 0.96을 적용하였다. 멸균 제품의 경우 안전계수를 적용하지 않았다. 요인별 특성을 고려하여 안전계수에 기여하는 비중과 이를 활용하여 최종 안전계수값을 산출하는 방법(A그룹-O그룹)을 decision tree로 나타냈다. 본 연구는 과학적으로 산출한 안전계수를 통해 소비기한을 제시함으로써 음식물쓰레기 감량과 탄소 중립성 달성에 기여할 것으로 사료된다.

GK2A/AMI와 GK2B/GOCI-II 자료를 융합 활용한 주간 고해상도 안개 탐지 알고리즘 개발 (Development of High-Resolution Fog Detection Algorithm for Daytime by Fusing GK2A/AMI and GK2B/GOCI-II Data)

  • 유하영;서명석
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1779-1790
    • /
    • 2023
  • 위성 자료의 성능이 크게 개선됨에 따라 최근에는 위성을 이용하여 광범위한 영역에 대한 실시간 안개 탐지 알고리즘들이 개발되고 있다. 한반도 주변을 관측하는 기상위성 중 관측주기가 10분으로 시간해상도가 가장 우수한 GEO-KOMPSAT-2A/Advanced Meteorological Imager (GK2A/AMI)는 공간해상도가 500 m이다. 반면 GEO-KOMPSAT-2B/Geostationary Ocean Color Imager-II (GK2B/GOCI-II)는 해상도가 250 m지만, 1시간 주기로 관측하고 가시채널만 보유하고 있다. 따라서 본 연구에서는 한반도 주변에서 발생하는 안개를 10분 및 250 m 해상도로 탐지하기 위해 GK2AB 융합 안개 탐지 알고리즘(Fog Detection Algorithm, FDA)인 GK2AB FDA를 개발하였다. GK2AB FDA는 세 파트로 구성된다. 첫 번째로 현업 운용중인 GK2A 안개 탐지 알고리즘(GK2A FDA)으로 10분 및 500 m 해상도로 안개를 탐지한다. 두 번째 단계에서는 두 위성 자료 간 시공간 일치, 태양천정각과 파장역 차이를 보정한 GK2A normalized visible (NVIS)의 10분 변화량을 이용하여 GK2B NVIS를 10분 간격으로 외삽한다. 마지막 단계에서는 외삽된 GK2B NVIS, 태양천정각, GK2A FDA 산출물 등을 입력자료로 기계학습(의사결정나무)을 이용하여 개발된 GK2AB FDA로 지리적위치에 따라 안개를 탐지(250 m, 10분)한다. GK2AB FDA의 훈련에는 6개 사례, 검증에는 4개 사례가 이용되었다. GK2AB FDA의 정량적 검증에는 지상관측 시정, 풍속 그리고 상대습도 자료를 이용하였다. GK2AB FDA는 GK2A FDA에 비해 공간해상도가 4배 증가함에 따라 안개 및 비안개 화소가 보다 자세히 구분되었다. 또한 검증방법에 관계없이 GK2A FDA에 비해 probability of detection (POD)은 높고 Hanssen-Kuiper Skill score (KSS)는 높거나 비슷함을 보여 안개 탐지 수준이 개선된 것으로 보인다. 하지만 일부 사례에서는 GK2AB FDA의 false alarm ratio (FAR)와 Bias가 크게 나타나 안개를 과대탐지하는 문제를 보이고 있다.

인공위성 원격 탐사 정보가 자료 기반 모형의 미계측 유역 하천유출 예측성능에 미치는 영향 분석 (Analysis of the Impact of Satellite Remote Sensing Information on the Prediction Performance of Ungauged Basin Stream Flow Using Data-driven Models)

  • 서지유;정하은;원정은;최시중;김상단
    • 한국습지학회지
    • /
    • 제26권2호
    • /
    • pp.147-159
    • /
    • 2024
  • 부족한 하천유출 관측 데이터는 모델 보정 작업을 어렵게 만들어 모델의 성능 향상을 제한한다. 위성 기반 원격탐사 자료는 수문 관련 데이터의 확보에 적극적으로 활용될 수 있으므로 새로운 대안이 될 수 있다. 최근에는 여러 연구를 통하여 기존의 개념적/물리적 모델보다는 인공지능을 이용한 해법이 더 적절하다는 평가를 받고 있다. 본 연구에서는 다양한 순환 신경망들과 의사결정나무 기반 알고리즘들을 결합한 자료 기반 접근 방식을 제안하였다. 또한 인공지능 학습을 위하여 인공위성 원격탐사 정보의 활용성을 조사하였다. 본 연구에서 위성영상은 MODIS와 SMAP의 자료가 사용된다. 공적으로 공개된 25개 유역의 자료를 사용하여 제안된 접근 방식을 검증하였다. 전통적인 지역화 접근법에서 착안하여 모든 유역의 자료를 통합하여 하나의 자료 기반 모델을 학습하는 전략을 채택하였으며, Leave-one-out cross-validation 지역화 설정을 이용하여 하나의 모델이 다양한 유역의 하천유출을 예측함으로써 제안된 접근 방식의 잠재력을 평가하였다. GRU + Light GBM 모델이 대상 유역에 적합한 모델 조합으로 판명되었으며(25개 미계측 유역 일 하천유량 예측 모형효율계수 평균 0.7187) 하천유출이 매우 작은 시기를 제외하면 우수한 미계측 유역의 하천유출 예측 성능을 보여주었다. 인공위성 원격탐사 정보의 영향력은 최대 10% 정도로 파악되었으며, 위성 정보의 추가 적용이 풍수기 또는 평수기보다는 저수기 또는 갈수기의 하천유출 예측에 더 큰 영향을 미쳤다.

텍스트 마이닝을 활용한 지역 특성 기반 도시재생 유형 추천 시스템 제안 (Suggestion of Urban Regeneration Type Recommendation System Based on Local Characteristics Using Text Mining)

  • 김익준;이준호;김효민;강주영
    • 지능정보연구
    • /
    • 제26권3호
    • /
    • pp.149-169
    • /
    • 2020
  • 현 정부의 주요 국책사업 중 하나인 도시재생 뉴딜사업은 매년 100 곳씩, 5년간 500곳을대상으로 50조를 투자하여 낙후된 지역을 개발하는 것으로 언론과 지자체의 높은 이목이 집중되고 있다. 그러나, 현재 이 사업모델은 면적 규모에 따라 "우리동네 살리기, 주거정비지원형, 일반근린형, 중심시가지형, 경제기반형" 등 다섯 가지로 나뉘어 추진되어 그 지역 본래의 특성을 반영하지 못하고 있다. 국내 도시재생 성공 키워드는 "주민 참여", "지역특화" "부처협업", "민관협력"이다. 성공 키워드에 따르면 지자체에서 정부에게 도시재생 사업을 제안할 때 지역주민, 민간기업의 도움과 함께 도시의 특성을 정확히 이해하고 도시의 특성에 어울리는 방향으로 사업을 추진하는 것이 가장 중요하다는 것을 알 수 있다. 또한 도시재생 사업 후 발생하는 부작용 중 하나인 젠트리피케이션 문제를 고려하면 그 지역 특성에 맞는 도시재생 유형을 선정하여 추진하는 것이 중요하다. 이에 본 연구는 '도시재생 뉴딜 사업' 방법론의 한계점을 보완하기 위해, 기존 서울시가 지역 특성에 기반하여 추진하고 있는 "2025 서울시 도시재생 전략계획"의 도시재생 유형을 참고하여 도시재생 사업지에 맞는 도시재생 유형을 추천하는 시스템을 머신러닝 알고리즘을 활용하여 제안하고자 한다. 서울시 도시재생 유형은 "저이용저개발, 쇠퇴낙후, 노후주거, 역사문화자원 특화" 네 가지로 분류된다 (Shon and Park, 2017). 지역 특성을 파악하기 위해 총 4가지 도시재생 유형에 대해 사업이 진행된 22개의 지역에 대한 뉴스 미디어 10만여건의 텍스트 데이터를 수집하였다. 수집된 텍스트를 이용하여 도시재생 유형에 따른 지역별 주요 키워드를 도출하고 토픽모델링을 수행하여 유형별 차이가 있는 지 탐색해 보았다. 다음 단계로 주어진 텍스트를 기반으로 도시재생 유형을 추천하는 추천시스템 구축을 위해 텍스트 데이터를 벡터로 변환하여 머신러닝 분류모델을 개발하였고, 이를 검증한 결과 97% 정확도를 보였다. 따라서 본 연구에서 제안하는 추천 시스템은 도시재생 사업을 진행하는 과정에서 신규 사업지의 지역 특성에 기반한 도시재생 유형을 추천할 수 있을 것으로 기대된다.

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.