• 제목/요약/키워드: error performance

검색결과 9,533건 처리시간 0.037초

심층신경망과 천리안위성 2A호를 활용한 지상기온 추정에 관한 연구 (Estimation for Ground Air Temperature Using GEO-KOMPSAT-2A and Deep Neural Network)

  • 엄태윤;김광년;조용한;송근용;이윤정;이윤곤
    • 대한원격탐사학회지
    • /
    • 제39권2호
    • /
    • pp.207-221
    • /
    • 2023
  • 본 연구는 천리안위성 2A호의 Level 1B (L1B) 정보를 사용해 지상기온을 추정하기 위한 심층신경망(deep neural network, DNN) 기법을 적용하고 검증을 실시하였다. 지상기온은 지면으로부터 1.5 m 높이의 대기온도로 일상생활뿐만 아니라 폭염이나 한파와 같은 이슈에 밀접한 관련을 갖는다. 지상기온은 지표면 온도와 대기의 열 교환에 의해 결정되므로 위성으로부터 산출된 지표면 온도(land surface temperature, LST)를 이용한 지상기온 추정 연구가 활발하였다. 하지만 천리안위성 2A호 산출물 LST는 Level 2 정보로 구름영향이 없는 픽셀만 산출되는 한계가 있다. 따라서 본 연구에서는 Advanced Meteorological Imager 센서에서 측정된 원시데이터에 오직 복사와 위치보정을 마친 L1B 정보를 사용해 지상기온을 추정하기 위한 DNN 모델을 제시하고 그 성능을 가늠하기 위해 위성 LST와 지상관측 기온 사이의 선형회귀모델을 기준모델로 사용하였다. 연구기간은 2020년부터 2022년까지 3년으로 평가기간 2022년을 제외한 기간은 훈련기간으로 설정했다. 평가지표는 기상청의 종관기상관측소에서 정시에 관측된 기온정보로 평균 제곱근 오차를 사용하였다. 관측지점에서 추출된 픽셀 중 손실된 픽셀의 비율은 LST는 57.91%, L1B는 1.63%를 보였으며 LST의 비율이 낮은 이유는 구름의 영향 때문이다. 제안한 DNN의 구조는 16개 L1B 자료와 태양정보를 입력 받는 층과 은닉층 4개, 지상기온 1개를 출력하는 층으로 구성하였다. 연구결과 구름의 영향이 없는 경우 DNN 모델이 root mean square error (RMSE) 2.22℃로 기준모델의 RMSE 3.55℃ 보다 낮은 오차를 보였고, 흐린 조건을 포함한 총 RMSE는 3.34℃를 나타내면서 구름의 영향을 제거할 수 있을 것으로 보였다. 하지만 계절과 시간에 따른 분석결과 여름과 겨울철에 모델의 결정계수가 각각 0.51과 0.42로 매우 낮게 나타났고 일 변동의 분산이 0.11과 0.21로 나타났다. 가시채널을 고려해 태양 위치정보를 추가한 결과에서 결정계수가 0.67과 0.61로 개선되었고 시간에 따른 일 변동의 분산도 0.03과 0.1로 감소하면서 모든 계절과 시간대에 더 일반화된 모델을 생성할 수 있었다.

영상처리기법을 이용한 다중 변위응답 측정 알고리즘의 검증 (Verification of Multi-point Displacement Response Measurement Algorithm Using Image Processing Technique)

  • 김성완;김남식
    • 대한토목학회논문집
    • /
    • 제30권3A호
    • /
    • pp.297-307
    • /
    • 2010
  • 최근 토목, 건축 구조물의 유지관리 기술에 대한 관심이 커지고 있으며 구조물의 성능저하 및 노후화 등으로 구조적 안전성의 검토가 요구되는 구조물의 수가 급증하고 있는 실정이다. 그리고 구조물의 노후화 및 부재의 균열 등으로 인하여 강성이 저하되면 구조물의 동특성에 변화가 나타나게 되며 구조물의 실제 거동상태에서 동특성을 분석하여 손상부위와 손상정도를 정확히 판단하는 것은 중요한 문제이다. 구조물 모니터링에 사용되는 대표적 계측장비가 동적계측기이다. 기존의 동적계측기는 측정 센서와 장비를 연결하는 케이블 길이가 길어질 경우 신뢰할 수 있는 데이터를 얻기 힘들고 각 센서와 계측기를 1:1로 연결하는 방식을 취하고 있어 비경제적이다. 따라서 센서를 부착하지 않고 원거리에서 진동을 측정하는 방법이 필요하다. 구조물의 진동을 계측하기 위하여 적용 가능한 비접촉식 방법으로는 레이저의 도플러효과, GPS를 이용하는 방법 및 영상처리기법 등이 대표적이다. 레이저의 도플러효과를 이용하는 방법은 정확도가 상대적으로 높지만 비경제적이며, GPS를 이용하는 방법은 장비가 고가이고 신호 자체의 오차와 데이터 취득속도의 제약이 있는 단점이 있다. 그러나 영상신호를 이용하는 방법은 간편하고 경제적이며 접근이 어려운 구조물의 진동 및 동특성 추출에 적합하다. 기존에도 센서를 대신하여 카메라의 영상신호를 이용하는 연구가 수행되기도 하였으나, 기존의 방법은 구조물에 부착된 표적의 한 지점을 기록한 후 영상처리기법을 이용하여 진동을 측정하는 방법으로서 측정 대상이 비교적 국한적일 수 있다. 그러므로 본 연구에서는 영상처리기법을 이용하여 구조물의 다중 변위응답을 측정할 수 있는 방법의 타당성을 검증하기 위하여 진동대 실험 및 현장재하실험을 수행하였다.

용적세기조절회전치료 치료계획 확인에 사용되는 MapPHAN의 유용성 평가 (Evaluation of the Usefulness of MapPHAN for the Verification of Volumetric Modulated Arc Therapy Planning)

  • 우헌;박장필;민제순;이제희;유숙현
    • 대한방사선치료학회지
    • /
    • 제25권2호
    • /
    • pp.115-121
    • /
    • 2013
  • 목 적: 최신 선형가속기와 새로운 평가 장비를 도입하게 되어 이를 임상에 적용하기 위한 준비과정 중 몇 가지 문제가 발생하여 유용성을 확인하는 과정을 분석함으로써 앞으로 이 장비를 도입하는 기관에 도움이 되고자 한다. 대상 및 방법: 모든 측정은 TrueBEAM STX (Varian, USA)를 이용하였으며, 전산화치료계획장비(Eclipse ver 10.0.39, Varian, USA)를 이용하여 각 에너지 별, 조사조건 별 선량분포파일을 산출하였다. MapCHECK 2의 고유의 성능과 오차로 발생 할 수 있는 원인에 대하여 측정 및 분석하였다. MapCHECK 2의 성능 확인을 위해 6X, 6X-FFF (Flattening Filter Free), 10X, 10X-FFF, 15X의 에너지별로 필드사이즈 $10{\times}10$ cm, gantry $0^{\circ}$, $180^{\circ}$ 방향에서 측정을 하였다. 또한 기존 IGRT couch의 CT값이 volumetric dosimetry에 영향을 주는지 확인을 위해서, CT 넘버 값: -800 (Carbon) & -950 (COUCH안의 공기), -100 & -950을 지정해준 상태에서 6X-FFF, 15X의 에너지별로 필드사이즈 $10{\times}10$ cm, gantry $0^{\circ}$, $180^{\circ}$, $135^{\circ}$, $275^{\circ}$ 방향에서 측정을 하였고, MapPHAN에 할당된 HU 값 확인을 위해 Solid water phantom 3 cm을 위로 얹은 MapCHECK 2와 치료계획용 컴퓨터를 이용해 비교하였고, MapPHAN의 각진 모서리에 의한 측정오류문제, MapPHAN의 gantry 방향 의존성을 알아보기 위해 3가지 방법으로 측정 하였다. 세로로 세운 세팅 상태에서 6X-FFF, 15X를 GANTRY $90^{\circ}$, $270^{\circ}$ 방향에서 각각 측정하고, 가로로 세운 세팅상태에서 에너지 6X-FFF, 15X를 필드사이즈 $10{\times}10$ cm, $90^{\circ}$, $45^{\circ}$, $315^{\circ}$, $270^{\circ}$의 방향에서 각각 측정하였다. 세 번째로 빔의 세기조절을 하지 않은 상태에서 open arc를 조사하였다. 결 과: MapCHECK의 기본 성능을 확인, Couch에 의한 감약 측정, MAP-PHAN에 할당하는 HU값 측정, MapPHAN의 각진 모서리에 대한 계산 정확도 확인을 위한 측정에서 모두 유효한 범위에 들어와 측정오류에 영향을 미치지 않는 것을 확인 할 수 있었다. Gantry 방향의존성 확인하기 위한 3가지 방법 중 첫 번째로 측정기를 세운 상태에서의 값은 Gantry $270^{\circ}$ (상대적 $0^{\circ}$), $90^{\circ}$ (상대적 $180^{\circ}$)에서 6X-FFF, 15X에서 각각 -1.51, 0.83%와 -0.63, -0.22%를 나타내어 AP/PA 방향에 의한 영향이 없음을 나타냈다. 측정기를 가로로 세팅한 상태에서는 Gantry $90^{\circ}$, $270^{\circ}$에서 에너지 6X-FFF 4.37, 2.84%, 15X에서는 -9.63, -13.32%의 차이가 측정되어 gamma pass rate 3%의 값보다 큰 값을 나타내므로 MapPHAN에 의한 측방향 측정값이 유효범위 안에 들지 못하는 것을 확인 할 수 있었다. 마지막 Open Arc에서 6X-FFF, 15X 에너지를 필드사이즈 $10{\times}10$ cm에 $360^{\circ}$ 회전상태에서의 선량분포를 보면 pass rate가 90% 가까이 나오는 것을 확인 할 수 있다. 결 론: 위 결과를 토대로 MapPHAN은 상대등선량분포 감마값 측정에는 적합 하지만, 측방향 빔에 대한 gantry 방향의 의존성 때문에 절대선량은 정확한 측정을 할 수 없는 것으로 판단되어진다. 본 논문에서는 더욱 정확한 치료계획 확인을 위해서 VMAT 같은 회전조사시 측방향에 대한 오차를 줄이고 정확한 절대선량을 측정하기 위해서 MapCHEK 2와 IMF (Isocentric Mounting Fixture)의 조합을 사용하여 gantry 방향 의존성에 의한 영향을 최소화 할 수 있을 것이라 판단된다.

  • PDF

사용자 리뷰를 통한 소셜커머스와 오픈마켓의 이용경험 비교분석 (A Comparative Analysis of Social Commerce and Open Market Using User Reviews in Korean Mobile Commerce)

  • 채승훈;임재익;강주영
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.53-77
    • /
    • 2015
  • 국내 모바일 커머스 시장은 현재 소셜커머스가 이용자 수 측면에서 오픈마켓을 압도하고 있는 상황이다. 산업계에서는 모바일 시장에서 소셜커머스의 성장에 대해 빠른 모바일 시장진입, 큐레이션 모델 등을 주요 성공요인으로 제시하고 있지만, 이에 대한 학계의 실증적인 연구 및 분석은 아직 미미한 상황이다. 본 연구에서는 사용자 리뷰를 바탕으로 모바일 소셜커머스와 오픈마켓의 사용자 이용경험을 비교 분석하는 탐험적인 연구를 수행하였다. 먼저 본 연구는 구글 플레이에 등록된 국내 소셜커머스 주요 3개 업체와 오픈마켓 주요 3개 업체의 모바일 앱 리뷰를 수집하였다. 본 연구는 LDA 토픽모델링을 통해 1만여건에 달하는 모바일 소셜커머스와 오픈마켓 사용자 리뷰를 지각된 유용성과 지각된 편리성 토픽으로 분류한 뒤 감정분석과 동시출현단어분석을 수행하였다. 이를 통해 본 연구는 국내 모바일 커머스 상에서 오픈마켓 이용자들에 비해 소셜커머스 이용자들이 서비스와 이용편리성 측면에서 더 긍정적인 경험을 하고 있음을 증명하였다. 소셜커머스는 '배송', '쿠폰', '할인'을 중심으로 서비스 측면에서 이용자들에게 긍정적인 이용경험을 이끌어내고 있는 반면, 오픈마켓의 경우 '로그인 안됨', '상세보기 불편', '멈춤'과 같은 기술적 문제 및 불편으로 인한 이용자 불만이 높았다. 이와 같이 본 연구는 사용자 리뷰를 통해 서비스 이용경험을 효과적으로 비교 분석할 수 있는 탐험적인 실증연구법을 제시하였다. 구체적으로 본 연구는 LDA 토픽모델링과 기술수용모형을 통해 사용자 리뷰를 서비스와 기술 토픽으로 분류하여 효과적으로 분석할 수 있는 새로운 방법을 제시하였다는 점에서 의의가 있다. 또한 본 연구의 결과는 향후 소셜커머스와 오픈마켓의 경쟁 및 벤치마킹 전략에 중요하게 활용될 수 있을 것으로 기대된다.

복부 방사선치료를 받는 환자에서 발생하는 오심 및 구토에 대한 온단세트론과 메토클로프라미드의 효과 : 제 3상 전향적 무작위 비교임상시험 (A Prospective Randomized Comparative Clinical Trial Comparing the Efficacy between Ondansetron and Metoclopramide for Prevention of Nausea and Vomiting in Patients Undergoing Fractionated Radiotherapy to the Abdominal Region)

  • 박희철;서창옥;성진실;조재호;임지훈;박원;송재석;김귀언
    • Radiation Oncology Journal
    • /
    • 제19권2호
    • /
    • pp.127-135
    • /
    • 2001
  • 목적 : 본 연구는 중등도 정도의 오심 및 구토의 발생 위험도를 가지는 복부 방사선치료를 받는 환자들을 대상으로 오심 및 구토에 대한 항구토제의 효과와 부작용 여부를 비교하는 전향적 무작위 임상연구로, 예방 목적으로 항구토제를 사용할 때 현재 통상적으로 많이 처방되는 항구토제인 메토클로프라미드(metoclopramide)에 비하여 온단세트론(Ondansetron; $Zofran^{\circledR}$)을 사용하는 것이 더 나은 효과를 가져오는지 알아보고자 하였다. 대상 및 방법 : 대상 환자의 포함 기준은 병리학적으로 암으로 확진되고 전이성 원인이 아닌 원발 부위에 치료를 받는 환자, 신체수행도가 ECOG 기준으로 2기 이하인 환자, 항암 화학요법이나 방사선치료를 받은 과거력이 없는 환자로 하였다. 1997년 3월부터 1998년 2월까지 총 60명의 환자가 덜 연구에 참여하였다. 내원한 순서에 따라 미리준비된 난수표에 의하여 각각 온단세트론 투약군(O군)과 메토클로프라미드 투약군(M 군)으로 할당하였다. O군의 온단세트론 용량은 8 mg, bid 로 하였고, M군의 메토클로프라미드 용량은 5 mg, tid 로 하였다. 평가 항목은 오심의 정도, 구토 회수, 식욕감소의 정도로 하였다. 환자에게 일일 기록카드를 교부하여 환자의 주관적인 증상인 오심의 정도, 구토의 횟수, 식욕감소의 정도를 기록하도록 하였다. 치료기간을 일주일 간격으로 나누어 각 주별 오심 및 식욕감소의 정도, 평균 구토횟수를 구하였다. 결과 : 본 연구에 참여한 60명의 대상 환자 중 55명의 환자에서 분석이 가능하였다. M군은 28명, O군은 27명이었다. 환자 특성 및 방사선치료에 관한 특성은 연령을 제외하면 차이가 없었다. 연령은 M 군이 $52.9{\pm}11.2$세, O군이 $46.5{\pm}9.6$세로 통계적으로 의미 있는 차이가 있었다. M군에 비해 O군에서 오심의 정도, 구토의 횟수, 식욕감소의 정도의 세 항목 모두 낮은 점수 분포를 보였다. M군의 경우 방사선치료를 시작한 후 5주째 각 항목별 점수가 가장 높은 경향을 보였다. 혼합모형을 이용한 반복측정 자료의 분석 결과 오심의 정도에는 원발암의 종류, 투약군이 의미 있게 영향을 미치는 요소였다. 구토의 횟수에는 성별, 연령, 총선량, 투약군이 의미 있게 영향을 미치는 요소였다. 식욕감소의 정도에는 연령, 투약군이 의미 있게 영향을 미치는 요소였다. 따라서, 투약군이 유일하게 세 가지 항목 모두에 통계적으로 의미 있는 영향을 미치는 요소임을 알 수 있었다. 전 치료기간 동안 양 투약군 모두 약제의 투여로 인한 부작용은 없었으며, 일반혈액검사 및 일반화학검사에서도 이상 소견을 보이지 않았다. 결론 : 연령이 적으면 오심 및 구토의 위험도가 증가하는 점을 고려하면, 양 투약군 간에 연령의 차이가 있었던 점이 통계적 변별력을 저하시켰을 가능성이 있다. 상기 결과를 토대로 본 연구자들은 중등도 정도의 오심 및 구토의 발생 위험도를 가지는 상복부 및 전복부조사를 전통적인 분할조사법을 이용하여 치료하는 경우 현재 흔히 사용되는 항구토제인 메토클로프라미드에 비해 온단세트론이 오심 및 구토, 식욕의 저하 등의 급성 부작용을 더 효과적으로 억제함을 알 수 있었다. 하지만, 온단세트론을 투여하는 경우에도 오심 및 구토가 호전되지 않는 경우도 많이 있으므로 이 부작용을 더욱 경감하기 위한 여러 가지 방안들이 강구되어야 한다고 생각된다.

  • PDF

반복적 대화식 통합 탄성파 속도분석 (An Iterative, Interactive and Unified Seismic Velocity Analysis)

  • 서상용;정부흥;장성형
    • 지구물리와물리탐사
    • /
    • 제2권1호
    • /
    • pp.26-32
    • /
    • 1999
  • 탄성파 속도분석법은 일괄식 속도분석법과 대화식 속도 분석등 두 가지가 있다. 일괄식 속도분석법에서는 각 속도 분석점마다 셈블런스 컨투어, 슈퍼게더 및 중합 패널등을 일괄 작성하여 도면화 시킨 후 분석자가 그 도면을 보고 속도 함수를 결정하는 방법이다. 과거 유행한 전산처리 소프트웨어들이 이 방법을 사용하고 있다. 그러나 이 방법은 도면 분석시 아주 많은 수작업이 필요하고 속도분석 결과도 정밀치 못하다는 단점이 있다. 최근에는 워크스테이션의 고속 그래픽 기능을 이용한 대화식 속도분석 기술이 개발되었다. 그런데 이들 프로그램은 기존 일괄식 속도분석법과 대동소이한 내용을 그래픽 화면으로 처리할 수 있도록 함으로써 종이 절약 외에는 특별히 나아진 것이 없다. 프로그램의 주 기능은 속도 스펙트럼에서 속도점 노드를 선택하는 것이며, 입력자료에 있을 수 있는 잡음을 제거하여 다시 속도 스펙트럼을 수정하는 기능은 없다. 잡음의 제거없이 계산한 부정확한 속도 스펙트럼을 이용해서 속도 함수를 선정한다면 정밀 속도분석은 불가능할 것이다. 방대한 탄성파 탐사자료에 대한 속도분석을 신속 정확하게 수행하기 위해서는 속도 분석과 밀접한 관련이 있는 전산처리 공정들 즉, 슈퍼게더 조립, 셈블런스 계산, 동보정, 뮤트, 중합등을 동시에 지원하는 통합된 반복적 대화식 속도분석 프로그램이 필요하다. 분석 구간의 속도와 뮤트함수를 변화시켰을 때 그로부터 얻어지는 셈블런스와 동보정 및 중합을 검토하고 이러한 수정과 검토를 신속히 반복할 수 있도록 함으로써 정확한 속도분석이 가능하기 때문이다. 여기에서는 속도분석을 신속 정확하게 수행하기 위해 속도 분석과 밀접한 관련이 있는 전산처리 공정들 즉, 슈퍼게더 조립, 셈블런스 계산, 동보정, 뮤트, 중합등을 동시에 지원하는 대화식 속도분석 프로그램 xva를 작성하였다. 대화식 속도분석에서는 분석 구간의 트레이스들을 고속으로 참조해야 하는데 이를 위해 간단한 트레이스 인덱스 파일을 설계하여 사용하였다. 직접파와 굴절파등 천부 잡음을 제거하기 위한 효과적인 수단인 뮤트 함수 영역 변환법을 새로 고안하였으며, 본 프로그램은 이 기법을 이용하고 있다. 본 영 역 변환법은 기존 알려진 역동보정법과 같이 정밀 전산처리가 가능할 뿐만 아니라 동보정과 역동보정시 발생하는 자료의 내삽 오차가 없으며 계산 시간이 크게 단축되기 때문에 정밀 대화식 속도 분석에 사용 가능하다. 프로그램 xva는 28개의 소스 파일로 구성된 패키지인데 줄 수는 12,029, 단어 수는 34,990, 글자 수는 304,073이다. 프로그램 xva는 X-Window와 Motif 환경하에서 작동한다. 프로그램 메뉴는 Motif 표준 스타일에 따라 작성하였는 바 그 사용법을 간략히 기술하였다. 본 프로그램이 완성됨으로 인하여 정밀 탄성파 속도 분석이 가능하게 되었고 그 결과 가스층의 존재 여부를 직접 확인할 수 있는 AVO(Amplitude Versus Offset)단면도등의 제작에 활용할 수 있었다.

  • PDF

가맹본부의 배타적 영업지역보호에 대한 탐색적 연구 (A New Exploratory Research on Franchisor's Provision of Exclusive Territories)

  • 임영균;이수동;김주영
    • 한국유통학회지:유통연구
    • /
    • 제17권1호
    • /
    • pp.37-63
    • /
    • 2012
  • 가맹사업에 있어 배타적 영업지역보호정책의 문제는 경제학 및 경영학 분야뿐만 아니라 사회 정치적으로 매우 중요한 쟁점이다. 본 연구는 배타적 영업지역과 관련한 기존 문헌을 토대로 가맹사업에서의 효율성 관점에서 배타적 영업지역보호에 영향을 미치는 변수와 배타적 영업지역 보호가 가맹본부 및 가맹점의 성과에 미치는 영향을 분석하고 있다. 가맹점의 대부분이 중소상인들이란 점을 감안하면 유통정책적으로도 중요한 의미가 있다고 할 수 있다. 본연구는 사회적으로도 잇슈가 될 수 있는 기업의 전략을 타당성과 당위성, 그리고 논리성으로만 평가하는 것이 아니라 실제 자료를 근거로 분석하였다. 또, 정책연구들이 가지고 있는 자료와 이론의 한계를 감안한 탐색적 방법론을 활용하여 보다 실질적이고 현실적용성이 뛰어난 분석을 제안하였다. 분석 결과, 배타적 영업지역보호는 긍정적인 효과가 있기는 하지만 통계적으로 유의하지 못하였으며, 가맹점과 가맹본부간의 로얄티가 많아서 위험공유성향이 클때에는 배타적 영업지역보호를 하지 않는 것이 효과적이었고, 가맹점을 모집하기 위해 배타적 영업지역보호를 해주거나 배타적 영업지역보호를 통해서 가맹사업본부내의 효율성을 키우기 위한 경우에는 긍정적인 효과가 유의하게 나타나는 것으로 밝혀졌다. 하지만 외부경쟁으로부터 직영점을 보호하기 위하거나 시장성장을 활용하기 위한 배타적 영업지역보호는 좋은 성과를 내지 못하였다. 또한 쉽게 배타적 영업지역보호를 할 수 있기에 이런 제도를 도입하는 것도 역시 좋은 성과를 내지 못한 것으로 나타났다. 결과적으로 배타적 영업지역보호가 기업의 운영효율을 증대시키기 위하여 하는 경우는 성과가 좋으나 다른 목적을 위하여 배타적 영업지역보호를 활용하는 것은 바람직한 결과를 못내는 것으로 나타났다. 본 연구는 분석결과를 토대로 영업지역 보호를 획일적으로 활용하거나 법으로 강제하기 보다는 가맹사업본부와 가맹점의 관계 및 상황, 또 동기에 맞추어 탄력적으로 적용하는 것이 바람직하다는 제안을 하고 있으며, 이를 근거로 몇 가지 정책적 시사점을 제시하였다.

  • PDF

적응형 군집화 기반 확장 용이한 협업 필터링 기법 (Scalable Collaborative Filtering Technique based on Adaptive Clustering)

  • 이오준;홍민성;이원진;이재동
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.73-92
    • /
    • 2014
  • 기존 협업 필터링 기법은 사용자들의 아이템에 대한 선호도를 기반으로 유사 아이템 집합 또는 유사 사용자 집합을 구성하고, 이를 이용해 예측된 사용자의 특정 아이템에 대한 선호도를 기반으로 추천을 수행한다. 이로 인해, 사용자 선호도 정보가 부족하게 되면, 유사 아이템 사용자 집합의 신뢰도가 낮아지고, 추천 서비스의 신뢰도 또한 따라서 낮아진다. 또한, 서비스의 규모가 커질수록, 유사 아이템, 사용자 집합의 생성에 걸리는 시간은 기하급수적으로 증가하고 추천서비스의 응답시간 또한 그에 따라 증가하게 된다. 위와 같은 문제점을 해결하기 위해 본 논문에서는 적응형 군집화 기법을 제안하고 이를 적용한 협업 필터링 기법을 제안하고 있다. 이 기법은 크게 네 가지 방법으로 이루어진다. 첫째, 사용자와 아이템의 특성 벡터를 기반으로 사용자와 아이템 각각을 군집화 하여, 기존 협업 필터링 기법에서 유사 아이템, 사용자 집합을 생성하는데 소요되는 시간을 절약하며, 사용자 선호도 정보만을 이용한 부분 집합 생성보다 추천의 신뢰도를 높이고, 초기 평가 문제와 초기 이용자 문제를 일부 해소한다. 둘째, 미리 구성된 사용자와 아이템의 군집을 기반으로 군집간의 선호도를 이용해 추천을 수행한다. 사용자가 속한 군집의 선호도가 높은 순서대로 아이템 군집을 조회하여 사용자에게 제공할 아이템 목록을 구성하여, 추천 시스템의 부하 대부분을 모델 생성 단계에서 부담하고 실제 수행 시 부하를 최소화한다. 셋째, 누락된 사용자 선호도 정보를 사용자와 아이템 군집을 이용하여 예측함으로써 협업 필터링 추천 기법의 사용자 선호도 정보 희박성으로 인한 문제를 해소한다. 넷째, 사용자와 아이템의 특성 벡터를 사용자의 피드백에 따라 학습시켜 아이템과 사용자의 정성적 특성 정량화의 어려움을 해결한다. 본 연구의 검증은 기존에 제안되었던 하이브리드 필터링 기법들과의 성능 비교를 통해 이루어졌으며, 평가 방법으로는 평균 절대 오차와 응답 시간을 이용하였다.

개인화된 뉴스 서비스를 위한 소셜 네트워크 기반의 콘텐츠 추천기법 (Content-based Recommendation Based on Social Network for Personalized News Services)

  • 홍명덕;오경진;가명현;조근식
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.57-71
    • /
    • 2013
  • 세계에는 수많은 사람들이 살아가고 있고, 사람들의 일상으로부터 매일, 매 시간 단위로 새로운 뉴스가 발생한다. 발생되는 뉴스는 예정된 일과 예상하지 못한 일들을 포함하고 있다. 발생하는 뉴스의 거대한 양과 이를 전달하는 수많은 미디어들로 인해 사람들은 뉴스 콘텐츠를 이용하는데 많은 시간을 소비하게 된다. 하지만 미디어에 시시각각 나타나는 속보와 실시간 이슈의 대부분이 가십 기사로 이루어져 있어 사용자들이 자신의 성향에 맞는 뉴스를 선별하고, 뉴스로부터 정보를 획득하는 것은 쉽지 않은 일이다. 또한 사용자의 관심사가 시간에 따라 변하기 때문에 뉴스 제공에 있어 사용자의 변하는 관심사를 반영하는 것이 요구된다. 본 논문에서는 사용자의 최근 관심사를 기반으로 사용자 선호도에 맞는 뉴스를 제공하기 위한 콘텐츠 기반의 추천 기법 및 시스템을 제안한다. 사용자의 최근 선호도를 파악하기 위하여 소셜 네트워크 서비스인 Facebook 사용자의 정보와 최근 게시글을 이용하여 동적으로 사용자 프로파일을 생성하여 이를 뉴스 서비스에 활용하고, 사용자 선호도에 적합한 뉴스를 추출하기 위해서 뉴스 콘텐츠의 분석을 요구한다. 뉴스 콘텐츠 분석을 위해 미디어에서 제공되는 뉴스의 카테고리를 사용하고, 뉴스 방송원고의 분석 및 주요 키워드 추출을 통해 뉴스 프로파일을 생성한다. 사용자 프로파일과 뉴스 프로파일 간의 유사도 측정을 위해서는 두 프로파일 간 형식의 일치화가 요구되므로 사용자 프로파일을 뉴스 프로파일과 동일한 형태로 생성한다. 사용자가 시스템에 접속하면 시스템은 사용자 프로파일에 명시된 선호도를 기반으로 뉴스 프로파일과의 유사도를 측정하고, 사용자 선호도에 가장 적합한 뉴스들을 제공하게 된다. 또한 사용자에게 제공된 뉴스 프로파일과 다른 뉴스 프로파일들 간에 유사도를 측정하여 유사도가 높은 관련된 뉴스들을 제공하게 된다. 제안한 개인화된 뉴스 서비스의 성능을 평가하기 위해 사용자에게 추천된 뉴스에 대한 사용자 평가와 시스템 예측값의 오차를 기반으로 6Sub-Vectors 벤치마크 알고리즘과 성능 평가를 수행하였고, 실험 결과를 통해 제안한 시스템의 우수성을 입증하였다.

한정된 O-D조사자료를 이용한 주 전체의 트럭교통예측방법 개발 (DEVELOPMENT OF STATEWIDE TRUCK TRAFFIC FORECASTING METHOD BY USING LIMITED O-D SURVEY DATA)

  • 박만배
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1995년도 제27회 학술발표회
    • /
    • pp.101-113
    • /
    • 1995
  • The objective of this research is to test the feasibility of developing a statewide truck traffic forecasting methodology for Wisconsin by using Origin-Destination surveys, traffic counts, classification counts, and other data that are routinely collected by the Wisconsin Department of Transportation (WisDOT). Development of a feasible model will permit estimation of future truck traffic for every major link in the network. This will provide the basis for improved estimation of future pavement deterioration. Pavement damage rises exponentially as axle weight increases, and trucks are responsible for most of the traffic-induced damage to pavement. Consequently, forecasts of truck traffic are critical to pavement management systems. The pavement Management Decision Supporting System (PMDSS) prepared by WisDOT in May 1990 combines pavement inventory and performance data with a knowledge base consisting of rules for evaluation, problem identification and rehabilitation recommendation. Without a r.easonable truck traffic forecasting methodology, PMDSS is not able to project pavement performance trends in order to make assessment and recommendations in the future years. However, none of WisDOT's existing forecasting methodologies has been designed specifically for predicting truck movements on a statewide highway network. For this research, the Origin-Destination survey data avaiiable from WisDOT, including two stateline areas, one county, and five cities, are analyzed and the zone-to'||'&'||'not;zone truck trip tables are developed. The resulting Origin-Destination Trip Length Frequency (00 TLF) distributions by trip type are applied to the Gravity Model (GM) for comparison with comparable TLFs from the GM. The gravity model is calibrated to obtain friction factor curves for the three trip types, Internal-Internal (I-I), Internal-External (I-E), and External-External (E-E). ~oth "macro-scale" calibration and "micro-scale" calibration are performed. The comparison of the statewide GM TLF with the 00 TLF for the macro-scale calibration does not provide suitable results because the available 00 survey data do not represent an unbiased sample of statewide truck trips. For the "micro-scale" calibration, "partial" GM trip tables that correspond to the 00 survey trip tables are extracted from the full statewide GM trip table. These "partial" GM trip tables are then merged and a partial GM TLF is created. The GM friction factor curves are adjusted until the partial GM TLF matches the 00 TLF. Three friction factor curves, one for each trip type, resulting from the micro-scale calibration produce a reasonable GM truck trip model. A key methodological issue for GM. calibration involves the use of multiple friction factor curves versus a single friction factor curve for each trip type in order to estimate truck trips with reasonable accuracy. A single friction factor curve for each of the three trip types was found to reproduce the 00 TLFs from the calibration data base. Given the very limited trip generation data available for this research, additional refinement of the gravity model using multiple mction factor curves for each trip type was not warranted. In the traditional urban transportation planning studies, the zonal trip productions and attractions and region-wide OD TLFs are available. However, for this research, the information available for the development .of the GM model is limited to Ground Counts (GC) and a limited set ofOD TLFs. The GM is calibrated using the limited OD data, but the OD data are not adequate to obtain good estimates of truck trip productions and attractions .. Consequently, zonal productions and attractions are estimated using zonal population as a first approximation. Then, Selected Link based (SELINK) analyses are used to adjust the productions and attractions and possibly recalibrate the GM. The SELINK adjustment process involves identifying the origins and destinations of all truck trips that are assigned to a specified "selected link" as the result of a standard traffic assignment. A link adjustment factor is computed as the ratio of the actual volume for the link (ground count) to the total assigned volume. This link adjustment factor is then applied to all of the origin and destination zones of the trips using that "selected link". Selected link based analyses are conducted by using both 16 selected links and 32 selected links. The result of SELINK analysis by u~ing 32 selected links provides the least %RMSE in the screenline volume analysis. In addition, the stability of the GM truck estimating model is preserved by using 32 selected links with three SELINK adjustments, that is, the GM remains calibrated despite substantial changes in the input productions and attractions. The coverage of zones provided by 32 selected links is satisfactory. Increasing the number of repetitions beyond four is not reasonable because the stability of GM model in reproducing the OD TLF reaches its limits. The total volume of truck traffic captured by 32 selected links is 107% of total trip productions. But more importantly, ~ELINK adjustment factors for all of the zones can be computed. Evaluation of the travel demand model resulting from the SELINK adjustments is conducted by using screenline volume analysis, functional class and route specific volume analysis, area specific volume analysis, production and attraction analysis, and Vehicle Miles of Travel (VMT) analysis. Screenline volume analysis by using four screenlines with 28 check points are used for evaluation of the adequacy of the overall model. The total trucks crossing the screenlines are compared to the ground count totals. L V/GC ratios of 0.958 by using 32 selected links and 1.001 by using 16 selected links are obtained. The %RM:SE for the four screenlines is inversely proportional to the average ground count totals by screenline .. The magnitude of %RM:SE for the four screenlines resulting from the fourth and last GM run by using 32 and 16 selected links is 22% and 31 % respectively. These results are similar to the overall %RMSE achieved for the 32 and 16 selected links themselves of 19% and 33% respectively. This implies that the SELINICanalysis results are reasonable for all sections of the state.Functional class and route specific volume analysis is possible by using the available 154 classification count check points. The truck traffic crossing the Interstate highways (ISH) with 37 check points, the US highways (USH) with 50 check points, and the State highways (STH) with 67 check points is compared to the actual ground count totals. The magnitude of the overall link volume to ground count ratio by route does not provide any specific pattern of over or underestimate. However, the %R11SE for the ISH shows the least value while that for the STH shows the largest value. This pattern is consistent with the screenline analysis and the overall relationship between %RMSE and ground count volume groups. Area specific volume analysis provides another broad statewide measure of the performance of the overall model. The truck traffic in the North area with 26 check points, the West area with 36 check points, the East area with 29 check points, and the South area with 64 check points are compared to the actual ground count totals. The four areas show similar results. No specific patterns in the L V/GC ratio by area are found. In addition, the %RMSE is computed for each of the four areas. The %RMSEs for the North, West, East, and South areas are 92%, 49%, 27%, and 35% respectively, whereas, the average ground counts are 481, 1383, 1532, and 3154 respectively. As for the screenline and volume range analyses, the %RMSE is inversely related to average link volume. 'The SELINK adjustments of productions and attractions resulted in a very substantial reduction in the total in-state zonal productions and attractions. The initial in-state zonal trip generation model can now be revised with a new trip production's trip rate (total adjusted productions/total population) and a new trip attraction's trip rate. Revised zonal production and attraction adjustment factors can then be developed that only reflect the impact of the SELINK adjustments that cause mcreases or , decreases from the revised zonal estimate of productions and attractions. Analysis of the revised production adjustment factors is conducted by plotting the factors on the state map. The east area of the state including the counties of Brown, Outagamie, Shawano, Wmnebago, Fond du Lac, Marathon shows comparatively large values of the revised adjustment factors. Overall, both small and large values of the revised adjustment factors are scattered around Wisconsin. This suggests that more independent variables beyond just 226; population are needed for the development of the heavy truck trip generation model. More independent variables including zonal employment data (office employees and manufacturing employees) by industry type, zonal private trucks 226; owned and zonal income data which are not available currently should be considered. A plot of frequency distribution of the in-state zones as a function of the revised production and attraction adjustment factors shows the overall " adjustment resulting from the SELINK analysis process. Overall, the revised SELINK adjustments show that the productions for many zones are reduced by, a factor of 0.5 to 0.8 while the productions for ~ relatively few zones are increased by factors from 1.1 to 4 with most of the factors in the 3.0 range. No obvious explanation for the frequency distribution could be found. The revised SELINK adjustments overall appear to be reasonable. The heavy truck VMT analysis is conducted by comparing the 1990 heavy truck VMT that is forecasted by the GM truck forecasting model, 2.975 billions, with the WisDOT computed data. This gives an estimate that is 18.3% less than the WisDOT computation of 3.642 billions of VMT. The WisDOT estimates are based on the sampling the link volumes for USH, 8TH, and CTH. This implies potential error in sampling the average link volume. The WisDOT estimate of heavy truck VMT cannot be tabulated by the three trip types, I-I, I-E ('||'&'||'pound;-I), and E-E. In contrast, the GM forecasting model shows that the proportion ofE-E VMT out of total VMT is 21.24%. In addition, tabulation of heavy truck VMT by route functional class shows that the proportion of truck traffic traversing the freeways and expressways is 76.5%. Only 14.1% of total freeway truck traffic is I-I trips, while 80% of total collector truck traffic is I-I trips. This implies that freeways are traversed mainly by I-E and E-E truck traffic while collectors are used mainly by I-I truck traffic. Other tabulations such as average heavy truck speed by trip type, average travel distance by trip type and the VMT distribution by trip type, route functional class and travel speed are useful information for highway planners to understand the characteristics of statewide heavy truck trip patternS. Heavy truck volumes for the target year 2010 are forecasted by using the GM truck forecasting model. Four scenarios are used. Fo~ better forecasting, ground count- based segment adjustment factors are developed and applied. ISH 90 '||'&'||' 94 and USH 41 are used as example routes. The forecasting results by using the ground count-based segment adjustment factors are satisfactory for long range planning purposes, but additional ground counts would be useful for USH 41. Sensitivity analysis provides estimates of the impacts of the alternative growth rates including information about changes in the trip types using key routes. The network'||'&'||'not;based GMcan easily model scenarios with different rates of growth in rural versus . . urban areas, small versus large cities, and in-state zones versus external stations. cities, and in-state zones versus external stations.

  • PDF