• 제목/요약/키워드: accuracy analysis

검색결과 12,154건 처리시간 0.045초

LIST mode를 이용한 18F-Flutemetamol 의 최적 영상획득 시간에 관한 연구 (A Study on the Optimal Image Acquisition Time of 18F- Flutemetamol using List Mode)

  • 류찬주
    • 한국방사선학회논문지
    • /
    • 제15권6호
    • /
    • pp.891-897
    • /
    • 2021
  • 핵의학은 방사성 동위원소 추적자를 인체에 투여하여 질병의 형태학적 정보와 생물학적 기능 정보를 얻고 평가한 Amyloid PET Tracer 개발로 베타아밀로이드 신경반 확인을 통해서 알츠하이머 진단의 정확도를 높일 수 있다. 그러나 20분이라는 긴 영상획득 시간은 환자에게 힘든 시간 일 수 있다. PET/CT 검사는 환자의 움직임에 민감하며, 검사 결과에도 일부분 영향을 미칠 수 있다. 이에 본 연구에서는 체내 방사성 의약품의 분포를 시간에 따른 list mode acquisition 방법을 통해 영상의 정량적 평가에 영향을 미치지 않으면서 적절한 영상획득 시간 연구하였다. list mode는 기존의 frame mode에 비해 시간에 대한 정보가 포함되어 연구자들이 원하는 시간에 대한 영상을 별도로 reconstruction 할 수 있어 data 분석에 용이하다. 연구 방법은 5 min frame/bed, 10 min frame/bed, 15 min frame/bed, 20 min frame/bed 로 리스트 모드를 이용하여 시간별 재구성 영상을 획득하여 SNR(signal to noise ratio) 과 LPR(lesion-to-pons uptake ratio)의 차이와 판독의 차이를 비교 분석하여 적정한 영상획득시간을 알아보고자 하였다. 정량적 분석 결과 list mode로 측정 시 정량적 평가 결과, 영상획득 시간이 증가함에 따라 관심 영역 6개에서 SUVmean 값은 감소하였으나 5 min/bed 영상에서 가장 많은 차이를 보였고 10 min/bed 그리고 15 min/bed 순으로 SUVmean 값의 차이가 감소하였다. 따라서 15 min/bed 에서의 SUVmean 값은 영상의 평가에 영향을 끼치지 않을 만큼의 차이가 없다는 결과값이 나왔다. LPR 값의 차이는 없었다. 정성적 분석 결과, PET 영상획득시간에 따른 판독 소견의 변화는 없었으며 시간에 따른 영상 재구성의 정성적 분석 점수의 유의한 차이가 없었다. 연구 결과 F-18 fluteme tamol PET/CT 검사 시 15 min/bed 과 20 min/bed 영상이 유의한 차이가 없으므로 환자의 상태에 따라 LIST MODE를 통해 선택적으로 15 min/bed 을 사용하여 영상획득 시간을 줄이는 것이 임상적으로 유용하다고 할 수 있다.

GIS를 이용한 태양광시설 설치를 위한 적정지역 선정에 관한 연구 (A Study for Planning Optimal Location of Solar Photovoltaic Facilities using GIS)

  • 윤성욱;백이;장재경;최덕규;강동현;손진관;박민정;강석원;권진경
    • 생물환경조절학회지
    • /
    • 제28권3호
    • /
    • pp.243-254
    • /
    • 2019
  • 본 연구에서는 전국을 대상으로 태양광에너지와 관련된 기상 및 지형 대리변수를 고려하여 태양광발전 시설에 대한 취약지역을 분석하였으며, GIS를 이용하여 공간분석을 통해 태양광발전 시설의 적정입지에 대한 평가용 지도를 개발하였다. 본 연구에서 최종적으로 개발된 태양광발전 시설에 대한 취약지도에서는 '취약단계 5(매우 취약)' 지역과 '취약단계 1(매우좋음)' 지역은 나타나지 않았다. '취약단계 4(취약)' 지역은 전라남도가 가장 크게 나타났으며, '취약단계3(보통)' 지역은 광주광역시, 전라북도, 충청북도 및 강원도 등 다수의 행정구역에서 높은 것으로 나타났다. '취약단계 2(좋음)' 지역은 대구광역시, 울산광역시 및 인천광역시 등이 높은 것으로 나타났다. 현재 운영되고 있는 태양광발전소 30곳을 비교 검토한 결과, 대부분 취약단계 2 및 3단계 지역에 위치하며, 상대적으로 태양광에너지가 적합한 지역에 위치함을 나타냈다. 하지만 본 연구의 한계점인 태양광발전소의 제한적인 자료량으로 인해 본 연구결과의 정확성을 명확하게 평가하기는 어렵다. 그럼에도 불구하고 본 연구에서는 GIS 공간분석 기법을 이용하여 다양한 기상 및 지형요소들을 고려하여 전국을 대상으로 태양광발전시설에 대한 취약지도 평가를 시도하였으며, 국내 전 지역에 대한 자료를 제시함으로써 태양광발전과 관련된 부분에 기초자료로 활용할 수 있을 것이다.

치과용 모형 스캐너의 지대치 중첩 과정이 최종 가상 모형에 미치는 영향 (Effect of abutment superimposition process of dental model scanner on final virtual model)

  • 유범영;손큰바다;이규복
    • 대한치과보철학회지
    • /
    • 제57권3호
    • /
    • pp.203-210
    • /
    • 2019
  • 목적: 본 연구는 치과용 모형 스캐너를 이용하여 단일 전장관과 3본 고정성의치 모형을 스캔하는 과정에서 지대치의 중첩 과정이 최종 가상 모형에 미치는 영향을 알아보려 하였다. 재료 및 방법: 평가를 위해 단일 전장관과 3본 고정성의치를 위한 석고 모형을 제작하였다. 그리고 Pindex system을 이용하여 핀 작업된 모형을 제작하였다. 기준 스캔 데이터(CAD Reference Model)와 실험 스캔 데이터(CAD Test Model)를 획득하기 위해서 치과용 모형 스캐너(E1, 3Shape A/S, Copenhagen, Denmark)를 이용했다. 기준 스캔 데이터는 지대치를 분할한 후 탈착하지 않고 스캔하였다. 그리고 실험 스캔 데이터는 분할된 지대치를 분리하여 스캔 후, 기준 스캔 데이터에 중첩되었다(n = 20). 마지막으로 3차원 검사 소프트웨어(release 2018.0.0; Geomagic control X; 3D Systems)를 이용하여 root mean square (RMS)를 분석하였고, 통계 분석은 Mann-Whitney U test를 사용하였다 (${\alpha}=.05$). 결과: 단일 전장관 지대치의 RMS 평균은 $10.93{\mu}m$, 3본 고정성의치 지대치의 RMS 평균은 $6.9{\mu}m$가 나왔다. 두 그룹의 RMS 평균값은 통계적으로 유의한 차이를 보여줬다 (P < .001). 또한 두 그룹의 양(positive)과 음(negative)의 오류는 단일 전장관 지대치는 $9.83{\mu}m$, $-6.79{\mu}m$, 3본 고정성의치 지대치는 $6.22{\mu}m$, $-3.3{\mu}m$의 평균값이 나왔다. 두 그룹의 양과 음의 오류 평균값은 통계적으로 모두 3본 고정성의치 지대치가 단일 전장관 지대치보다 통계적으로 유의하게 낮은 값을 보여주었다 (P < .001). 결론: 핀 작업된 모형의 스캔 과정에서 지대치의 개수가 증가하여도 지대치의 중첩에 의한 오류는 증가하지 않았다. 또한 단일 전장관 지대치에서 유의하게 높은 오류를 보였지만 임상적으로 허용 가능한 스캔 정확도의 범위에 있다.

GC를 이용한 화장품 살균·보존제의 다성분 동시분석법 (Simultaneous Multicomponent Analysis of Preservatives in Cosmetics by Gas Chromatography)

  • 조상훈;정홍래;김영숙;김양희;박은미;신상운;엄경숙;홍세라;강효정;윤미혜
    • 대한화장품학회지
    • /
    • 제45권1호
    • /
    • pp.69-75
    • /
    • 2019
  • 우리나라 화장품의 살균 보존제 성분은 포지티브 리스트로 관리되고 있다. 포지티브 리스트는 적절한 정량분석법이 필요하지만 아직 분석법 개발이 미비한 상황이다. 본 실험에서는 가스크로마토그래피와 불꽃이온화검출기(GC/FID)를 이용하여 살균 보존제 성분 14종을 동시분석 하는 방법을 개발하였다. 분석법의 validation 결과 특이성을 확인하였고, 검량선의 직선성은 dehydroacetic acid (0.9891)를 제외한 14종에서 상관계수가 0.9997 이상으로 양호하였다. 검출한계(LOD)와 검량한계(LOQ)는 각각 0.0001 mg/mL ~ 0.0039 mg/mL와 0.0003 mg/mL ~ 0.0118 mg/mL로 나타났으나, dehydroacetic acid는 각각 0.0204 mg/mL, 0.0617 mg/mL로 나타났다. 반복성은 1.0% 이하로 나왔으나 dehydroacetic acid는 7.1%로 나왔다. 회수률은 96.9% ~ 109.2% 나타났다. 본 실험방법으로 유통 중인 화장품 50건을 검사한 결과 화장품에 주로 사용되는 살균 보존제는 chlorophene, phenoxyethanol, benzyl alcohol, parabens 이고, 모두 배합한도 이내로 검출되었다.

18~34 남성의 최대산소 섭취량 추정 (Prediction of Maximal Oxygen Uptake Ages 18~34 Years)

  • 전유정;임재형;이병근;김창환;김병완
    • 한국체육학회지인문사회과학편
    • /
    • 제51권3호
    • /
    • pp.373-382
    • /
    • 2012
  • 본 연구의 목적은 신체변인과 최대하 대사반응을 이용하여 최대산소섭취량(VO2max)을 간편하고 정확하게 추정하는 데 있다. 18~34세 남성 250명을 대상으로 추정집단(n=179)과 타당도 검증집단(n=71)으로 나누어 최대 운동부하검사를 실시하였으며 3분인 1단계와 6분인 2단계 종료 시점의 대사반응을 측정하였다. 추정 집단을 대상으로 단계선택법(stepwise method)으로 다중회귀분석 (multiple regression analysis)을 실시하였다. 단계별분석법으로 분석한 모형 1의 추정변인은 체중, 6분HR, 6분VO2이고 R은 0.64(p<.01)이었으며 SEE와 CV는 각각 4.74, 11.7%로 나타났고(p<.01), 추정식은 VO2max(ml/kg/min)= 72.256-0.340(Weight)-0.220(6분HR)+0.013(6분VO2)이며 다중공선성이 나타나지 않았다. 모형 2의 추정변인은 체중, 6분HR, 6분VO2, 6분VCO2이고 R은 0.66(p<.01)이었으며 SEE와 CV는 각각 4.59, 11.3%로 나타났고(p<.01), 추정식은 VO2max(ml/kg/min)= 68.699-0.277(Weight) -0.206(6분HR)+0.020(6분VO2)-0.009(6분VCO2)이며, 역시 다중공선성이 나타나지 않았다. 모형 1과 비교했을 때 모형 2는 상관이 더 높지만 다중공선성 측면에서는 다소 불리하게 나타났다. 모형 1과 모형 2를 교차타당도 검증집단에 적용했을 때, 측정된 VO2max와 추정된 VO2Max 간에 유의한 상관관계가 나타났다(R=0.53, 0.56, P<.001). 타당도 검증을 통해 유용성과 간편성을 고려하면, 본 연구에서 얻은 신체변인 및 최대하 대사반응을 이용한 추정모형들이 모두 사용가능하나 모형 2가 정확도 측면에서 다소 유리하다.

메콩강 유역의 격자형 강수 자료에 의한 강우-유출 모의 성능 비교·분석 (Comparison of rainfall-runoff performance based on various gridded precipitation datasets in the Mekong River basin)

  • 김영훈;레수안히엔;정성호;연민호;이기하
    • 한국수자원학회논문집
    • /
    • 제56권2호
    • /
    • pp.75-89
    • /
    • 2023
  • 강우-유출 해석은 하천 홍수예경보, 댐 유입량 산정 및 방류량 결정 등 수자원 관리 및 계획수립에 있어 중요한 과정이며, 밀도높은 강우관측망으로부터 수집된 강우 자료는 정확한 강우-유출 해석을 위한 가장 중요한 기초 자료로 활용된다. 본 연구 대상 지역인 메콩강 유역은 국가공유하천으로 강수 자료수집이 어렵고, 구축된 자료의 양적, 질적 품질이 국가별로 상이하여 수문해석 결과의 불확실성을 높일 우려가 있다. 최근 원격탐사 기술의 발달로 격자형 글로벌 강수자료의 획득이 용이해졌으며, 이를 활용한 미계측 유역 또는 대유역에서의 다양한 수문해석 연구들이 수행된 바 있다. 본 연구에서는 미계측 대유역 수문해석에 있어 격자형 강수자료의 적용성을 평가하기 위하여 3개의 위성 강수자료(TRMM, GSMaP, PERSIANN-CDR)와 2개의 지점 격자형 강수자료(APHRODITE, GPCC)를 수집하고, APHRODITE를 관측값으로 합성곱 신경망 모형인 ConvAE 알고리즘을 이용하여 위성 강수자료의 시·공간적 편의보정을 수행하였다. 또한, 메콩강 본류의 주요지점인 Luang Prabang, Pakse, Stung Treng, Kratie 4개 수위 관측소를 선정하여 SWAT 모형의 매개변수를 보정(2004~2011)하고 지점 격자형 강수자료 및 위성 강수자료의 보정전·후의 유출모의(2012~2013) 결과를 비교·분석하였다. 그 결과 원시위성 강수자료 및 GPCC는 APHPRODITE에 비해 정량적으로 과소 또는 과대추정되거나 공간적으로 매우 상이한 패턴을 나타낸 반면, GSMaP과 ConvAE를 이용하여 보정된 위성 강수자료의 경우, APHPRODITE에 대한 시·공간적 상관성이 개선된 것으로 분석되었다. 또한 유출모의의 경우, 모든 지점에 대해서 ConvAE로 보정된 위성 강수자료를 이용한 유출모의 결과가 원시 위성강수자료를 이용한 유출결과 보다 정확도가 향상된 것으로 분석되었다. 따라서 본 연구에서 제시하는 격자형 위성 강수자료 보정기법과 연계한 강우-유출 해석은 향후 다양한 위성 강수자료를 활용한 미계측 대유역 수문해석에서 활용이 가능할 것으로 판단된다.

The Usefulness of 18F-FDG PET to Differentiate Subtypes of Dementia: The Systematic Review and Meta-Analysis

  • Seunghee Na;Dong Woo Kang;Geon Ha Kim;Ko Woon Kim;Yeshin Kim;Hee-Jin Kim;Kee Hyung Park;Young Ho Park;Gihwan Byeon;Jeewon Suh;Joon Hyun Shin;YongSoo Shim;YoungSoon Yang;Yoo Hyun Um;Seong-il Oh;Sheng-Min Wang;Bora Yoon;Hai-Jeon Yoon;Sun Min Lee;Juyoun Lee;Jin San Lee;Hak Young Rhee;Jae-Sung Lim;Young Hee Jung;Juhee Chin;Yun Jeong Hong;Hyemin Jang;Hongyoon Choi;Miyoung Choi;Jae-Won Jang;Korean Dementia Association
    • 대한치매학회지
    • /
    • 제23권1호
    • /
    • pp.54-66
    • /
    • 2024
  • Background and Purpose: Dementia subtypes, including Alzheimer's dementia (AD), dementia with Lewy bodies (DLB), and frontotemporal dementia (FTD), pose diagnostic challenges. This review examines the effectiveness of 18F-Fluorodeoxyglucose Positron Emission Tomography (18F-FDG PET) in differentiating these subtypes for precise treatment and management. Methods: A systematic review following Preferred Reporting Items for Systematic reviews and Meta-Analyses guidelines was conducted using databases like PubMed and Embase to identify studies on the diagnostic utility of 18F-FDG PET in dementia. The search included studies up to November 16, 2022, focusing on peer-reviewed journals and applying the goldstandard clinical diagnosis for dementia subtypes. Results: From 12,815 articles, 14 were selected for final analysis. For AD versus FTD, the sensitivity was 0.96 (95% confidence interval [CI], 0.88-0.98) and specificity was 0.84 (95% CI, 0.70-0.92). In the case of AD versus DLB, 18F-FDG PET showed a sensitivity of 0.93 (95% CI 0.88-0.98) and specificity of 0.92 (95% CI, 0.70-0.92). Lastly, when differentiating AD from non-AD dementias, the sensitivity was 0.86 (95% CI, 0.80-0.91) and the specificity was 0.88 (95% CI, 0.80-0.91). The studies mostly used case-control designs with visual and quantitative assessments. Conclusions: 18F-FDG PET exhibits high sensitivity and specificity in differentiating dementia subtypes, particularly AD, FTD, and DLB. This method, while not a standalone diagnostic tool, significantly enhances diagnostic accuracy in uncertain cases, complementing clinical assessments and structural imaging.

Chelate 법(法)에 의(依)한 Phytin 분석(分析)에 관(關)한 연구(硏究) (Studies on the analysis of phytin by the Chelatometric method)

  • 신재두
    • Applied Biological Chemistry
    • /
    • 제10권
    • /
    • pp.1-13
    • /
    • 1968
  • phytin은 phytic acid의 금속염(金屬鹽)(주(主)로 Ca 와 Mg)임으로 그중(中)의 P,Ca 및 Mg를 정량(定量)하면 순도(純度)를 알 수 있고, 또 분자식(分子式)을 추정(推定)할 수 있다. 저자(著者)는 phytin 중(中)의 P,Ca 및 Mg를 정량분석(定量分析)하는 새로운 방법(방법)으로 서 phytin을 건식(乾式) 분해(分解)하고 ion 교환수지(交換樹脂)로 처리한 다음 Chelate 법(法)으로 정량(定量)하는 방법(方法)을 확정(確定)켰으며 그 결과(結果)를 요약(要約)하면 다음과 같다. 1) phytin 분석(分析)의 전처리과정(前處理課程)으로서는 phytin을 conc. $HNO_3$로 적시면서 $550{\sim}660^{\circ}C$에서 회화(灰化)하는 건식분해법(乾式分解法)을 썼다. 이 방법(方法)은 습식분해법(濕式分解法)보다 분석결과(分析結果)가 정확(正確)하다. 2) phytin을 건식분해(乾式分解)한 시료(試料)를 가지고 종래법(從來法)과 새로운 분석법(分析法) (본법(本法))에 의하여 P,Ca 및 Mg를 정량(定量)하였으며, 본법(本法)은 다음고 같다. phytin 회분(灰分 HCl 용액(溶液)을 양(陽) ion 교환수지(交換樹脂)로 처리하여 양(陽) ion 구분(區分)과 음(陰) ion 분리(分離)하고 양(陽) ion 구분(區分)의 일부(一部)를 pH 7.0로 한다음 완충액(緩衝液)($NH_3-NH_4Cl$으로 pH 10으로 하고 BT 지시약(指示藥)을 써서 표준(標準) EDTA 용액(溶液적정(滴定)하여 Ca와 Mg의 합계치(合計値)를 얻었다. 또 양(陽) ion 구분(區分)의 일부(一部)를 pH 7.0로 하고 표준(標準) EDTA 용액(溶液)을 소량(少量)넣고 8N-KOH로 pH $12{\sim}13$으로 하고 N-N 희석분말(稀釋粉末)을 지시약(指示藥) 으로써 표준(標準) EDTA 용액(溶液)으로 적정(滴定)하여 Ca 치(値)를 얻었다. Ca와 Mg의 합계결정치(合計決定値)와 Ca 적정치(滴定値) 차(差)로 Mg 치(値)를 얻었다. 음(陰) ion 구분(區分)으로부터 상법(常法)에 의하여 $MgNH_4PO_4$의 침전(沈澱)을 만들어서 HCl에 녹키고 일정량(一定量)의 표준(標準) EDTA 용액(溶液)을 넣어 pH 7.0로 한다음 완충액(緩衝液)으로 pH 10으로 하고 BT 지시약(指示藥)을 써서 표준(標準) Mg $SO_4$용액(溶液)으로 적정(滴定)하여 P 치(値)를 얻었다. 본법(本法)으로 Na-phytate를 분석(分析)한 결과(結果) Na-phytate의 분자식(分子式)을 $C_6H_6O_{24}P_6Mg_4CaNa_2{\cdot}5H_2O$라고 하였을 때의 이론치(理論値)에 비(比)하여 P가 98.9% Cark 97.1%, Mg가 99.1%이고 통계처리(統計處理)한 결과분석치(結果分析値)와 이론치(理論値)는 잘 일치(一致)된다. 그러나 종래법(從來法)에 의(依)한 분석치(分析値)는 이론치(理論値)에 비(比)하여 P가 92.40%, Cark 86.80%, Mg가 93.80%로서 이론치(理論値)와 일치(一致)하지 않는다. 3) Na-phytate를 전분(澱粉)과 일정(一定)한 비(比)로 혼합(混合)하고 본법(本法)으로 P,Ca 및 Mc를 정량(定量)한 결과(結果) 이들의 회수율(回收率)은 거의 100%이었다. 4) 본분석법(本分析法)의 정확성(正確性)을 재확인(再確認)하기 위하여 phytic acid 수용액(水溶液)에 $CaCl_2$수용액(水溶液)을 phytic acid 1M:$CaCl_25M:McCl_220M$의 비(比)로 반응(反應)서키어서 Ca 1 원자(原子), Mg 4원자함유(原子含有)된 Na-phytate를 합성(合成)하였으며 이것의 P,Ca 및 Mg 분석치(分析値)와 의(依한) 조제(調製) Naphytate의 분석치(分析値)와 일치(一致)되었다. 이상(以上)과 같이 phytin 시료(試料)를 건식분해(乾式分解)하고 ion 교환수지(交換樹脂)로 처리(處理)한 다음 Chelate 법(法)으로 P,Ca 및 Mg를 정량(定量)하는 본법(本法)은 정확(正確)하고 신속(迅速)한 phytin의 새 분석방법(分析方法)이라고 사료(思料)되는 바이다.

  • PDF

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.

K-Means Clustering 알고리즘과 헤도닉 모형을 활용한 서울시 연립·다세대 군집분류 방법에 관한 연구 (A Study on the Clustering Method of Row and Multiplex Housing in Seoul Using K-Means Clustering Algorithm and Hedonic Model)

  • 권순재;김성현;탁온식;정현희
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.95-118
    • /
    • 2017
  • 최근 도심을 중심으로 연립 다세대의 거래가 활성화되고 직방, 다방등과 같은 플랫폼 서비스가 성장하고 있다. 연립 다세대는 수요 변화에 따른 시장 규모 확대와 함께 정보 비대칭으로 인해 사회적 문제가 발생 되는 등 부동산 정보의 사각지대이다. 또한, 서울특별시 또는 한국감정원에서 사용하는 5개 또는 25개의 권역 구분은 행정구역 내부를 중심으로 설정되었으며, 기존의 부동산 연구에서 사용되어 왔다. 이는 도시계획에 의한 권역구분이기 때문에 부동산 연구를 위한 권역 구분이 아니다. 이에 본 연구에서는 기존 연구를 토대로 향후 주택가 격추정에 있어 서울특별시의 공간구조를 재설정할 필요가 있다고 보았다. 이에 본 연구에서는 연립 다세대 실거래가 데이터를 기초로 하여 헤도닉 모형에 적용하였으며, 이를 K-Means Clustering 알고리즘을 사용해 서울특별시의 공간구조를 다시 군집하였다. 본 연구에서는 2014년 1월부터 2016년 12월까지 3년간 국토교통부의 서울시 연립 다세대 실거래가 데이터와 2016년 공시지가를 활용하였다. 실거래가 데이터에서 본 연구에서는 지하거래 제거, 면적당 가격 표준화 및 5이상 -5이하의 실거래 사례 제거와 같이 데이터 제거를 통한 데이터 전처리 작업을 수행하였다. 데이터전처리 후 고정된 초기값 설정으로 결정된 중심점이 매번 같은 결과로 나오게 K-means Clustering을 수행한 후 군집 별로 헤도닉 모형을 활용한 회귀분석을 하였으며, 코사인 유사도를 계산하여 유사성 분석을 진행하였다. 이에 본 연구의 결과는 모형 적합도가 평균 75% 이상으로, 헤도닉 모형에 사용된 변수는 유의미하였다. 즉, 기존 서울을 행정구역 25개 또는 5개의 권역으로 나뉘어 실거래가지수 등 부동산 가격 관련 통계지표를 작성하던 방식을 속성의 영향력이 유사한 영역을 묶어 16개의 구역으로 나누었다. 따라서 본 연구에서는 K-Means Clustering 알고리즘에 실거래가 데이터로 헤도닉 모형을 활용하여 연립 다세대 실거래가를 기반으로 한 군집분류방법을 도출하였다. 또한, 학문적 실무적 시사점을 제시하였고, 본 연구의 한계점과 향후 연구 방향에 대해 제시하였다.