• 제목/요약/키워드: error matrix

검색결과 1,052건 처리시간 0.035초

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

COMS 위성의 가시 및 적외 영상 채널로부터 복원된 대류운의 강우강도 향상과 검증 (Improvement and Validation of Convective Rainfall Rate Retrieved from Visible and Infrared Image Bands of the COMS Satellite)

  • 문윤섭;이강열
    • 한국지구과학회지
    • /
    • 제37권7호
    • /
    • pp.420-433
    • /
    • 2016
  • 본 연구의 목적은 2011년 4월 22일부터 10월 22일까지 우리나라에서 강수가 있는 총 75일 동안 COMS 위성의 적외 채널 $10.8{\mu}m$ 휘도 온도(IR), 적외 채널 $10.8{\mu}m$와 수증기 채널 $6.7{\mu}m$의 휘도 온도차(IR-WV), 정규화 된 가시반사도(VIS)와 기상 레이더의 강우강도를 이용하여 2-D와 3-D 대류운의 강우강도 (CRR) 조견표를 향상시키는 것이다. 특별히 한국형 2-D와 3-D CRR 조견표를 검증하기 위해 2011년 강수가 있는 24일 동안의 기상 레이더 강우강도 자료가 사용된다. 2-D와 3-D CRR 조견표는 각 채널의 등급 범주별 강우 총수와 비강우 총수의 행렬을 이용하여 구한 강우 확률에 평균 누적강우강도와 최대 강우강도를 각각 곱함으로써 2-D (IR, IR-WV)와 3-D (IR, IR-WV, VIS) 조견표의 기본과 최대 행렬을 얻을 수 있다. 최종적으로 새로운 2-D와 3-D의 CRR 조견표는 경험적으로 기본과 최대 강우강도 행렬의 회귀 분석으로 얻어진다. 그 결과 새로운 CRR 조견표는 기존보다 낮은 IR 휘도 온도, 낮은 IR-WV 휘도 온도차일 때에도 비교적 많은 강우 현상을 나타내며, $10mm\;h^{-1}$ 이상의 강우강도 영역이 확대되어 나타난다. 정확도와 범주별 통계가 주어진 기간 동안 발생했던 CRR 자료에 대해 계산된다. 새로운 2-D와 3-D CRR 조견표의 평균 오차, 평균절대 오차, 제곱근평균 오차가 기존 조견표보다 작게 나타나며, 예측 거짓경고비율은 감소하고, 탐지확률은 증가하며, 임계성공지수는 개선된다. 태풍과 뇌우와 같은 기상 이변에서의 강한 호우를 고려하기 위해서 습윤 보정 계수를 교정한다. 이 인자는 수치모델이나 COMS에서 복원한 지면에서 500 hPa까지 평균한 총가강수량과 상대습도의 곱 (PW RH)으로 정의된다. 이 연구에서는 PW RH에 근거하여 IR 운정 휘도 온도가 210 K 이하일 때, 상대습도가 40% 이상일 때 1에서 2사이를 경험적으로 정한다. 새로운 2-D와 3-D CRR 조견표를 적용한 결과 평균 오차, 평균 절대 오차, 제곱근 평균 오차가 줄어든다.

위성 자료를 이용한 도시지역 극치강우 모니터링: 2011년 7월 집중호우를 중심으로 (Validation of Extreme Rainfall Estimation in an Urban Area derived from Satellite Data : A Case Study on the Heavy Rainfall Event in July, 2011)

  • 윤선권;박경원;김종필;정일원
    • 한국수자원학회논문집
    • /
    • 제47권4호
    • /
    • pp.371-384
    • /
    • 2014
  • 본 논문에서는 천리안(Communication, Ocean and Meteorological Satellite; COMS)과 TRMM(Tropical Rainfall Measurement Mission)을 통하여 관측한 위성영상자료를 이용한 극치강우(Extreme Rainfall) 추정 알고리즘을 개발하였으며, 2011년 7월 집중호우를 대상으로 그 적용성을 평가하였다. TRMM/PR(TRMM/Precipitation Radar)과 AWS(Automatic Weather System) 자료를 이용하여 고도에 따른 멱급수 회귀방정식으로 Z-R관계식을 추정한 결과 $Z=303R^{0.72}$를 산출하였으며, 지상관측 자료와 비교한 결과 상관계수가 0.57로 분석되었다. 이 값과 TRMM/VIRS(TRMM/Visible Infrared Scanner)와의 관계를 이용하여 극치강우알고리즘을 개발하였으며, 천리안 위성에 적용하여 10분강 우를 추정한 결과 강우강도가 큰 경우에는 과소 추정하는 경향이, 작은 경우에는 과대 추정하는 경향이 있는 것으로 분석되었으나, 전반적인 패턴은 관측과 유사한 경향이 있는 것으로 분석되었다. 또한 이 알고리즘을 같은 센서를 이용하는 천리안 위성에 적용하여 AWS의 상관관계를 분석한 결과, 10분 강우량의 경우 상관계수는 0.517로 평균제곱근 오차는 3.146으로 분석되었고, 공간 상관행렬 오차의 평균은 -0.530~-0.228의 음의 상관을 보이는 것으로 분석되었다. 위성자료를 이용한 극치강우량 추정의 오차 발생 원인은 여러 가지 외부적인 요인으로 판단되며, 지속적인 알고리즘 개선 및 오차보정을 통한 정확도 개선이 필요한 것으로 사료된다. 본 연구의 결과는 추후 다양한 정지궤도위성의 이용을통 한 다중 원격탐사자료의 활용으로 보다 정확한 미계측 유역 수문자료 확충 및 실시간 홍수 예 경보 시스템 구축에 활용이 가능할 것으로 사료된다.

폐암 환자에서 Electronic Portal Imaging Device를 이용한 자세 오차 및 종양 이동 거리의 객관적 측정 (Objective Analysis of the Set-up Error and Tumor Movement in Lung Cancer Patients using Electronic Portal Imaging Device)

  • 김웅철;정은지;이창걸;추성실;김귀언
    • Radiation Oncology Journal
    • /
    • 제14권1호
    • /
    • pp.69-76
    • /
    • 1996
  • 목적 : electronic portal imaging device(EPID)를 이용하여 폐암 환자에서 시행한 검증 영상을 분석하여 3차원 입체 조형치료계획 시 자세 오차(set-up error)와 종양의 이동 거리를 고려한 적절한 차폐 여유를 평가해 보고자 한다. 대상 및 방법 : 1995년 연세암센터 치료방사선과에 내원하여 EPID가 장착된 Clinac 2100C/D를 이용하여 치료받은 폐암 환자 10명을 대상으로 하였다. 환자 1인 당 1 port에 대한 검증 영상을 매일 얻어 random 오차와 systematic 오차를 구했고, 치료 1회 당 중복 영상을 얻어 종양의 움직임을 구했다. 매일 얻은 검증 영상은 103개이었고, 중복 영상은 10개이었다. 결과 : 전체 10 명의 환자의 x 축, y 축으로의 평균 이동은 각각 1.41 mm, 1.78 mm 이었고 systematic 이동은 표준편차가 x 축, y 축으로 각각 4.63 mm, 4.11 mm이었다. random 이동은 각 환자의 평균 이동으로부터 x 축, y 축으로 표준편차가 각각 4.17 mm, 3.31 mm 이었다. 호흡에 의한 y 축으로의 이동은 평균 12.2 mm이었고, 표준편차는 4.03 mm 이었다. 결론 : 폐암 환자에서 3차원 방사선치료를 시행하려고 할 경우 치료 계획 시 clinical target volume에서 x, y 축으로 각각 10 mm, 25 mm 정도의 여유가 필요하다고 보이며, 치료 초기에 각 환자별로 매일 EPID를 이용하여 얻은 검증 영상과, 중복 영상으로 차폐 여유를 적절히 조절해 주어야 할 것이다.

  • PDF

평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구 (How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores)

  • 현지연;유상이;이상용
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.219-239
    • /
    • 2019
  • 개인에게 맞춤형 서비스를 제공하는 것이 중요해지면서 개인화 추천 시스템 관련 연구들이 끊임없이 이루어지고 있다. 추천 시스템 중 협업 필터링은 학계 및 산업계에서 가장 많이 사용되고 있다. 다만 사용자들의 평점 혹은 사용 여부와 같은 정량적인 정보에 국한하여 추천이 이루어져 정확도가 떨어진다는 문제가 제기되고 있다. 이와 같은 문제를 해결하기 위해 현재까지 많은 연구에서 정량적 정보 외에 다른 정보들을 활용하여 추천 시스템의 성능을 개선하려는 시도가 활발하게 이루어지고 있다. 리뷰를 이용한 감성 분석이 대표적이지만, 기존의 연구에서는 감성 분석의 결과를 추천 시스템에 직접적으로 반영하지 못한다는 한계가 있다. 이에 본 연구는 리뷰에 나타난 감성을 수치화하여 평점에 반영하는 것을 목표로 한다. 즉, 사용자가 직접 작성한 리뷰를 감성 수치화하여 정량적인 정보로 변환해 추천 시스템에 직접 반영할 수 있는 새로운 알고리즘을 제안한다. 이를 위해서는 정성적인 정보인 사용자들의 리뷰를 정량화 시켜야 하므로, 본 연구에서는 텍스트 마이닝의 감성 분석 기법을 통해 감성 수치를 산출하였다. 데이터는 영화 리뷰를 대상으로 하여 도메인 맞춤형 감성 사전을 구축하고, 이를 기반으로 리뷰의 감성점수를 산출한다. 본 논문에서 사용자 리뷰의 감성 수치를 반영한 협업 필터링이 평점만을 고려하는 전통적인 방식의 협업 필터링과 비교하여 우수한 정확도를 나타내는 것을 확인하였다. 이후 제안된 모델이 더 개선된 방식이라고 할 근거를 확보하기 위해 paired t-test 검증을 시도했고, 제안된 모델이 더 우수하다는 결론을 도출하였다. 본 연구에서는 평점만으로 사용자의 감성을 판단한 기존의 선행연구들이 가지는 한계를 극복하고자 리뷰를 수치화하여 기존의 평점 시스템보다 사용자의 의견을 더 정교하게 추천 시스템에 반영시켜 정확도를 향상시켰다. 이를 기반으로 추가적으로 다양한 분석을 시행한다면 추천의 정확도가 더 높아질 것으로 기대된다.

직무 - 노출매트릭스의 설계 (The Construction of Job Exposure Matrix)

  • 임현우;노영만;이원철
    • 한국산업보건학회지
    • /
    • 제11권2호
    • /
    • pp.161-168
    • /
    • 2001
  • 직업성 역학 연구에서 직업적으로 유해인자와 질병과의 연관성에 대한 연구를 수행함에 타당도 높은 노출 평가를 어떻게 실시할 것인가에 대한 논의가 있어 왔다. 노출 평가를 위한 최상의 상태는 관심있는 물질에 대하여 개인별로 계량화된 노출값을 가지고 있을 때이고, 노출 값의 계산 방법 중 가장 가치가 적은 정보는 노출확률이 높은 공장, 산업 또는 직업에 고용된 사실여부만을 갖고 있을 때이다. 대부분의 산업보건연구에서 노출정보는 두 극단사이에 존재한다. 최근 유사노출군 설정 방법과 대표치 추정을 위한 통계방법들이 소개되면서 전향적으로는 이러한 노출 값의 계산이 가능해지고 있다. 그러나 후향적 노출 평가에서는 순수하게 노출 평가를 목적으로 조사된 자료가 아닌 자료들을 수집하여 노출을 추정하여야 하기 때문에 사실상 계량화된 개인 노출 값을 얻기는 매우 어렵다. 직무-노출매트릭스를 통하여 노출 값을 추정하는 것은 환자-대조군 연구, 단면조사 연구 등의 연구방법에서 흔히 일어 날 수 있는 정보편의를 줄일 수 있어 직업성 역학 연구에서 생애 노출 값의 추정 혹은 노출강도의 추정에 직무-노출매트릭스의 사용이 점차 증가되고 있다. 따라서 직업성 역학연구에서 유용하게 사용되고 있는 직무-노출매트릭스를 고찰하고 분석함으로써 특정 사업장 혹은 산업 중심의 직무-노출매트릭스의 설계 방안을 제시하고자 하였다. 특히 직무구분 축을 중점적으로 설명함으로써 향후 직업적 역학연구의 노출평가를 수행할 때와 근로자 건강보호를 위한 작업장 유해인자 관리를 위한 노출평가를 수행할 때 유용한 방법을 제공하고자 하였다.

  • PDF

로지스틱 회귀분석을 이용한 임도붕괴 위험도 평가 (Assessment of Slope Failures Potential in Forest Roads using a Logistic Regression Model)

  • 백승안;조구현;황진성;정도현;박진우;최병구;차두송
    • 한국산림과학회지
    • /
    • 제105권4호
    • /
    • pp.429-434
    • /
    • 2016
  • 임도 사면의 붕괴는 환경적 피해 뿐 만 아니라 사회 경제적 손실을 발생시킨다. 본 연구는 2013년 집중호우로 임도 붕괴가 발생한 강원도 홍천군 화촌면 지역을 대상으로 GIS의 속성정보와 로지스틱 회귀분석을 이용하여 임도 붕괴지 위험도 평가를 실시하였다. 로지스틱 회귀분석결과, 토성이 사토인 지역의 회귀계수는 6.616으로 임도붕괴에 가장 위험성이 높았으며, 경급이 중경목인 지역의 경우 회귀계수가 -3.282로 임도사면의 안정성이 높았다. 임도 붕괴지의 정오분류결과는 74.6%의 분류정확도를 보였다. 로지스틱 회귀모델식을 이용하여 전 구간을 대상으로 적용해 본 결과, 임도붕괴지의 경우 0.5의 기준점 보다 높은 0.7이상의 구간에서 가장 많이 분포하여 붕괴가능성이 높은 것으로 나타났다. 임도 위험도 평가의 판별적중률로 볼 때 임도의 산림환경 및 입지인자의 분석을 통해서도 충분한 붕괴위험 평가가 가능할 것으로 사료된다.

Elevated Cellular Retinoic Acid Binding Protein-I in Cerebrospinal Fluid of Patients with Hemorrhagic Cerebrovascular Diseases : Preliminary Study

  • Jeon, Jin Pyeong;Cho, Won-Sang;Kang, Hyun-Seung;Kim, Jeong Eun;Kim, Seung-Ki;Oh, Chang Wan
    • Journal of Korean Neurosurgical Society
    • /
    • 제57권2호
    • /
    • pp.88-93
    • /
    • 2015
  • Objective : Elevated cellular retinoic acid binding protein-I (CRABP-I) is thought to be related to the abnormal proliferation and migration of smooth muscle cells (SMCs). Accordingly, a higher CRABP-I level could cause disorganized vessel walls by causing immature SMC phenotypes and altering extracellular matrix proteins which could result in vulnerable arterial walls with inadequate responses to hemodynamic stress. We hypothesized that elevated CRABP-I level in the cerebrospinal fluid (CSF) could be related to subarachnoid hemorrhage (SAH). Moreover, we also extended this hypothesis in patients with vascular malformation according to the presence of hemorrhage. Methods : We investigated the CSF of 26 patients : SAH, n=7; unruptured intracranial aneurysm (UIA), n=7; arteriovenous malformation (AVM), n=4; cavernous malformation (CM), n=3; control group, n=5. The optical density of CRABP-I was confirmed by Western blotting and presented as mean${\pm}$standard error of the measurement. Results : CRABP-I in SAH ($0.33{\pm}0.09$) was significantly higher than that in the UIA ($0.12{\pm}0.01$, p=0.033) or control group ($0.10{\pm}0.01$, p=0.012). Hemorrhage presenting AVM (mean 0.45, ranged 0.30-0.59) had a higher CRABP-I level than that in AVM without hemorrhage presentation (mean 0.16, ranged 0.14-0.17). The CRABP-I intensity in CM with hemorrhage was 0.21 and 0.31, and for CM without hemorrhage 0.14. Overall, the hemorrhage presenting group (n=11, $0.34{\pm}0.06$) showed a significantly higher CRABP-I intensity than that of the non-hemorrhage presenting group (n= 10, $0.13{\pm}0.01$, p=0.001). Conclusion : The results suggest that elevated CRABP-I in the CSF could be related with aneurysm rupture. Additionally, a higher CRABP-I level seems to be associated with hemorrhage development in vascular malformation.

EPID의 적정관리 도구로서의 유용성에 관한 연구 (The useage of the EPID as a QA tools)

  • 조정희;방동완;윤성익;박재일
    • 대한방사선치료학회지
    • /
    • 제11권1호
    • /
    • pp.16-21
    • /
    • 1999
  • Purpose : The aim of this study is to conform the possibility of the liquid type EPID as a QC tools to clinical indication and of replacement of the film dosimetry. Aditional aim is to describe a procedure for the use of a EPID as a physics calibration tool in the measurements of radiation beam parameters which are typically carried out with film. Method & Materials : In this study we used the Clinac 2100c/d with EPID. This system contains 65536 liquid-filled ion chambers arranged in a $256{\times}256$ matrix and the imaging area is $32.5{\times}32.5cm$ with liquid layer thickness of 1mm. The EPID was tested for different field sizes under typical clinical conditions and pixel values were calibrated against dose by producing images using various thickness of lead attenuators(lead step wedge) using 6 & 10MV x-ray. We placed various thickness of lead on the table of linear accelerator and set the portal vision an SDD of 100cm. To acquire portal image we change the field size and energy, and we recorded the average pixel value in a $3{\times}3$ pixel region of interest(ROI) at field center was recorded. The pixel values were also measured for different field sizes in order to evaluate the dependence of pixel value on x-ray energy spectrum and various scatter components. Result : The EPID, as a whole, was useful as a QA tool and dosimetry device. In mechanical check, cross-hair centering was well matched and the error was less than ?2mm and light/radiation field coincidence was less than 1mm also. In portal dosimetry the wider the field size the the higher the pixel value and as the lead thickness increase, the pixel value was exponentially decreased. Conclusions : The EPID was very suitable for QA tools and it can be used to measure exit dose during patients treatment with reasonable accuracy. But when indicate the EPID to clincal study deep consideration required

  • PDF

배출량 목록에 따른 수도권 PM10 예보 정합도 및 국내외 기여도 분석 (Impact of Emission Inventory Choices on PM10 Forecast Accuracy and Contributions in the Seoul Metropolitan Area)

  • 배창한;김은혜;김병욱;김현철;우정헌;문광주;신혜정;송인호;김순태
    • 한국대기환경학회지
    • /
    • 제33권5호
    • /
    • pp.497-514
    • /
    • 2017
  • This study quantitatively analyzes the effects of emission inventory choices on the simulated particulate matter (PM) concentrations and the domestic/foreign contributions in the Seoul Metropolitan Area (SMA) with an air quality forecasting system. The forecasting system is composed of Weather Research and Forecasting (WRF)-Sparse Matrix Operator Kernel Emissions (SMOKE)-Community Multi-Scale Air Quality (CMAQ). Different domestic and foreign emission inventories were selectively adopted to set up four sets of emissions inputs for air quality simulations in this study. All modeling cases showed that model performance statistics satisfied the criteria levels (correlation coefficient >0.7, fractional error <50%) suggested by previous studies. Notwithstanding the apparently good model performance of total PM concentrations by all emission cases, annual average concentrations of simulated total PM concentrations varied up to $20{\mu}g/m^3$ (160%) depending on the combination of emission inventories. In detail, the difference in simulated annual average concentrations of the primary PM coarse (PMC) was up to $25.2{\mu}g/m^3$ (6.5 times) compared with other cases. Furthermore, model performance analyses on PM species showed that the difference in the simulated primary PMC led to gross model overestimation in general, which indicates that the primary PMC emissions need to be improved. The contribution analysis using model direct outputs indicated that the domestic contributions to the annual average PM concentrations in the SMA vary from 44% to 67%. To account for the uncertainty of the simulated concentration, the contribution correction factor method proposed by Bae et al. (2017) was applied, which resulted in converged contributions(from 48% to 57%). We believe this study shows that it is necessary to improve the simulated concentrations of PM components in order to enhance the accuracy of the forecasting model. It is deemed that these improvements will provide more accurate contribution results.