• 제목/요약/키워드: 정보필터링

검색결과 1,884건 처리시간 0.033초

구인구직사이트의 구인정보 기반 지능형 직무분류체계의 구축 (Development of Intelligent Job Classification System based on Job Posting on Job Sites)

  • 이정승
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.123-139
    • /
    • 2019
  • 주요 구인구직사이트의 직무분류체계가 사이트마다 상이하고 SW분야에서 제안한 'SQF(Sectoral Qualifications Framework)'의 직무분류체계와도 달라 SW산업에서 SW기업, SW구직자, 구인구직사이트가 모두 납득할 수 있는 새로운 직무분류체계가 필요하다. 본 연구의 목적은 주요 구인구직사이트의 구인정보와 'NCS(National Competaency Standars)'에 기반을 둔 SQF를 분석하여 시장 수요를 반영한 표준 직무분류체계를 구축하는 것이다. 이를 위해 주요 구인구직사이트의 직종 간 연관분석과 SQF와 직종 간 연관분석을 실시하여 직종 간 연관규칙을 도출하고자 한다. 이 연관규칙을 이용하여 주요 구인구직사이트의 직무분류체계를 맵핑하고 SQF와 직무 분류체계를 맵핑함으로써 데이터 기반의 지능형 직무분류체계를 제안하였다. 연구 결과 국내 주요 구인구직사이트인 '워크넷,' '잡코리아,' '사람인'에서 3만여 건의 구인정보를 open API를 이용하여 XML 형태로 수집하여 데이터베이스에 저장했다. 이 중 복수의 구인구직사이트에 동시 게시된 구인정보 900여 건을 필터링한 후 빈발 패턴 마이닝(frequent pattern mining)인 Apriori 알고리즘을 적용하여 800여 개의 연관규칙을 도출하였다. 800여 개의 연관규칙을 바탕으로 워크넷, 잡코리아, 사람인의 직무분류체계와 SQF의 직무분류체계를 맵핑하여 1~4차로 분류하되 분류의 단계가 유연한 표준 직무분류체계를 새롭게 구축했다. 본 연구는 일부 전문가의 직관이 아닌 직종 간 연관분석을 통해 데이터를 기반으로 직종 간 맵핑을 시도함으로써 시장 수요를 반영하는 새로운 직무분류체계를 제안했다는데 의의가 있다. 다만 본 연구는 데이터 수집 시점이 일시적이기 때문에 시간의 흐름에 따라 변화하는 시장의 수요를 충분히 반영하지 못하는 한계가 있다. 계절적 요인과 주요 공채 시기 등 시간에 따라 시장의 요구하는 변해갈 것이기에 더욱 정확한 매칭을 얻기 위해서는 지속적인 데이터 모니터링과 반복적인 실험이 필요하다. 본 연구 결과는 향후 SW산업 분야에서 SQF의 개선방향을 제시하는데 활용될 수 있고, SW산업 분야에서 성공을 경험삼아 타 산업으로 확장 이전될 수 있을 것으로 기대한다.

협력필터링과 사회연결망을 이용한 신규고객 추천방법에 대한 연구 (The Research on Recommender for New Customers Using Collaborative Filtering and Social Network Analysis)

  • 신창훈;이지원;양한나;최일영
    • 지능정보연구
    • /
    • 제18권4호
    • /
    • pp.19-42
    • /
    • 2012
  • 고객이 상품을 구매하는 패턴이 빠르게 변화하고 있다. 오프라인에서 고객이 직접 상품을 보고, 체험한 후 구매하던 패턴이 TV홈쇼핑, 인터넷 쇼핑 등 고객이 편리한 장소에서 자유롭게 구매하는 방법으로 확산되었다. 이처럼 구매 가능한 상품의 범위는 점점 더 다양해지고 있지만 이로 인하여 고객이 상품을 구매할 때 생기는 번거로움은 더욱 커지고 있다. 오프라인에서는 물건을 직접보고 구매하기 때문에 반품율이 낮은 반면에 온라인 구매 물품은 배송과 환불 등에서 복잡한 일들이 많이 발생한다. 온라인을 통해서 물건을 구매할 때 상품에 대한 사전 정보는 매우 한정적이며 실제로 물건을 구매했을 경우 고객이 생각했던 것과 다를 수 있다. 이러한 결과는 결국 고객의 불만족 및 구매취소로 이어진다. 또한 TV홈쇼핑이나 인터넷 쇼핑 등을 통해서 물건을 구매할 때 고객들은 이미 상품을 구매한 고객의 리뷰에도 관심을 기울이고 있다. 좋은 평가를 받은 상품은 더 많은 매출로 이어질 수 있기 때문에 기업은 이에 관심을 기울일 필요가 있다. 고객의 욕구를 만족시킬 수 있는 적절한 상품을 추천해 주고 이를 구매로 연결시키는 것은 기업의 이윤 창출과 직결되기 때문에 그 중요성이 강조된다. 고객을 위한 추천방법은 베스트셀러기반 추천방법, 인구통계 정보기반 추천방법, 최소질의대상 상품결정방법, 내용필터링기법, 협력필터링기법 등이 존재하며, 이에 대한 많은 연구가 활발하게 진행되고 있다. 그러나 위의 방법들을 신규고객에게 적용하는 것에는 문제가 발생할 수 있다. 신규고객은 상품에 대한 과거 구매이력이 존재하지 않기 때문이다. 이를 해결하기 위한 방안으로 가입 시, 고객의 인구통계적 정보나 선호도에 대한 응답을 유도하는 방법을 활용할 수 있다. 그러나 고객이 이에 대한 번거로움을 느낄 수도 있으며, 불완전한 답변을 하게 되면 추천의 정확도는 감소한다. 최근 이미 상품을 구매한 고객의 리뷰 및 기업에서 추천하는 제품에 의존하는 고객들이 증가하면서 이를 악용하는 사례도 자주 등장한다. 결국 추천에 대한 고객들의 신뢰는 감소하게 될 것이다. 따라서 좀 더 명확한 방식의 추천시스템이 절실하며, 이것이 개선된다면 는 곧 고객들의 신뢰 증가로 이어질 것이다. 본 연구에서는 협력필터링기법과 사회연결망기법의 중심성을 결합한 분석을 시도하였다. 중심성은 신규고객의 선호도를 기존고객들의 데이터를 통하여 유추하기 위하여 활용되는 정보이다. 기존 연구들에서는 기존고객들의 구매 가운데 구매성향이 유사한 고객들의 정보에 초점을 맞추고 있으며 구매성향이 다른 고객들의 정보에 대한 분석은 이루어지고 있지 않다. 그러나 이처럼 구매성향이 서로 다른 고객들의 정보를 활용한다면 추천의 정확성이 더 향상되지 않을까 하는 점을 기반으로 데이터들을 다양한 방식으로 분석하였다. 연구에 사용된 데이터는 미네소타대학의 GroupLens Research Project팀이 협력필터링기법을 통하여 영화를 추천하기 위해 만든 MovieLens의 데이터이다. 이는 1,684편의 영화에 대한 선호도를 943명이 응답한 정보로 총 100,000개의 데이터가 있다. 이를 시간 순으로 구분하여 초기 50,000개의 데이터를 기존고객의 데이터로, 후기 50,000개의 데이터를 신규고객의 데이터로 사용하였다. 이 때, 신규고객과 기존고객은 연구자가 임의로 구분한 것이다. 따라서 신규고객이라고 표현되는 고객의 데이터는 실제로 추천시스템을 통해 정보를 제공받은 고객이라고는 볼 수 없다. 그러나 현실적으로 실제 신규고객의 데이터를 수집하는 것이 쉽지 않기 때문에 전체 고객의 정보를 시간 순으로 구분하고 신규고객으로 분류한 것임을 밝혀둔다. 제시된 추천시스템은 [+]집단 추천시스템, [-]집단 추천시스템, 통합 추천시스템으로 총 3가지이다. [+]집단 추천시스템은 기존의 연구들과 유사한 방식으로 유사도가 높은 고객들을 신규고객의 이웃고객으로 분석하였다. 유사도가 높다는 것은 다른 고객들과 상품 구매에 대한 성향이 유사한 것을 의미한다. 또한 [-]집단 추천시스템은 유사도가 낮고 다른 고객들과 상품의 구매패턴이 반대에 가까운 고객들의 데이터를 활용하였으며, 통합 추천시스템은 [+]집단 추천시스템과 [-]집단 추천시스템을 결합한 방식이다. [+]집단 추천시스템과 [-]집단 추천시스템에서 각각 추천된 영화 가운데 중복되는 영화만을 신규고객에게 추천하는 방식이다. 다양한 방법의 시도를 통하여 적절한 추천시스템을 찾고, 추천시스템의 정확도를 향상시키는데 그 목적이 있다. 활용된 데이터의 분석 결과는 통합 추천시스템이 정확도가 가장 높았으며 [-]집단 추천시스템, [+]집단 추천시스템의 순인 것으로 나타났다. 이는 통합 추천시스템이 가장 효율적일 것이라는 연구자의 추측과 일치하는 결과이다. 각각의 추천시스템은 정확도의 변화를 쉽게 비교할 수 있도록 등고선지도 및 그래프를 이용하여 나타냈다. 연구의 한계점으로는 연구자가 제시한 통합 추천시스템과 [-]집단 추천시스템에 대한 정확도는 향상되었지만 이는 임의로 구분한 기준을 바탕으로 분석하였다는 점이다. 실제 추천된 영화를 바탕으로 신규고객이 영화를 선택 한 것이 아니라 기존고객의 데이터를 임의로 분류하였기 때문이다. 따라서 이는 추천 영화가 실제 고객에 미친 영향이 아니라는 한계가 존재한다. 또한 영화가 아닌 다른 상품에 대해서 이 추천시스템을 적용하였을 경우 추천 정확도에는 차이가 있을 수 있다. 따라서 추천시스템을 적용할 때에는 각 상품 및 고객집단의 특성에 적합한 적용이 필요하다.

중립도 기반 선택적 단어 제거를 통한 유용 리뷰 분류 정확도 향상 방안 (Increasing Accuracy of Classifying Useful Reviews by Removing Neutral Terms)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.129-142
    • /
    • 2016
  • 전자상거래에서 소비자들의 구매 의사결정에 판매 제품을 이미 구매하여 사용한 고객의 리뷰가 중요한 영향을 미치고 있다. 전자상거래 업체들은 고객들이 제품 리뷰를 남기도록 유도하고 있으며, 구매고객들도 적극적으로 자신의 경험을 공유하고 있다. 한 제품에 대한 고객 리뷰가 너무 많아져서 구매하려는 제품의 모든 리뷰를 읽고 제품의 장단점을 파악하는 것은 무척 힘든 일이 되었다. 전자상거래 업체들과 연구자들은 텍스트 마이닝을 활용하여 리뷰들 중에서 유용한 리뷰들의 속성을 파악하거나 유용한 리뷰와 유용하지 않은 리뷰를 미리 분류하는 노력을 수행하고 있다. 고객들에게 유용한 리뷰를 필터링하여 전달하는 방안이다. 본 연구에서는 문서-단어 매트릭스에서 단어의 제거 기준으로 온라인 고객 리뷰가 유용한 지, 그렇지 않은지를 구분하는 문제에서 단어들이 유용 리뷰 집합과 유용하지 않은 리뷰집합에 중복하여 등장하는 정도를 측정한 중립도를 제시한다. 제시한 중립도를 희소성과 함께 분석에 활용하여 제거할 단어를 선정한 후에 각 분류 알고리즘의 성과를 비교하였다. 최적의 성과를 보이는 중립도를 찾았으며, 희소성과 중립도에 따라 단어를 선택적으로 제거하였다. 실험은 Amazon.com의 'Cellphones & Accessories', 'Movies & TV program', 'Automotive', 'CDs & Vinyl', 'Clothing, Shoes & Jewelry' 제품 분야 고객 리뷰와 사용자들의 리뷰에 대한 평가를 활용하였다. 전체 득표의 수가 4개 이상인 리뷰 중에서 제품 카테고리 별로 유용하다고 판단되는 1,500개의 리뷰와 유용하지 않다고 판단되는 1,500개의 리뷰를 무작위로 추출하여 연구에 사용하였다. 데이터 집합에 따라 정확도 개선 정도가 상이하며, F-measure 기준으로는 두 알고리즘에서 모두 희소성과 중립도에 기반하여 단어를 제거하는 방안이 더 성과가 높았다. 하지만 Information Gain 알고리즘에서는 Recall 기준으로는 5개 제품 카테고리 데이터에서 언제나 희소성만을 기준으로 단어를 제거하는 방안의 성과가 높았으며, SVM에서는 전체 단어를 활용하는 방안이 Precision 기준으로 성과가 더 높았다. 따라서, 활용하는 알고리즘과 분석 목적에 따라서 단어 제거 방안을 고려하는 것이 필요하다.

IFSA 알고리즘을 이용한 유전자 상호 관계 분석 (Analysis of Interactions in Multiple Genes using IFSA(Independent Feature Subspace Analysis))

  • 김혜진;최승진;방승양
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제33권3호
    • /
    • pp.157-165
    • /
    • 2006
  • 세포는 환경 변화 및 자극으로부터 자신을 보호하기 위해 유전자가 발현하여 생명을 유지 시스템을 갖고 있다. 유전자의 발현은 비정상적인 상태의 세포를 환경을 조절, 변화시켜 정상으로 바꾸기 위한 기능, 발달단계에 필요한 기능 등 생명현상에 필요한 특수 역할을 수행한다. 따라서 각 유전자의 기능을 아는 것은 생물학적으로 상당히 의미 있는 일이다. 본 논문에서는 유전자 기능을 알아보기 위해 발현 패턴을 통해 같을 때, 유사한 형태 혹은 시차를 갖고 동일한 형태로 발현하는 유전자들은 같은 기능을 한다는 가정을 하였다. 이 가정에 기반하여 각 유전자들을 기능에 따라 분류하였다. (1) IFSA선형 모델을 적용하여 데이타를 잘 나타내 줄 수 있는 특징 패턴을 찾았으며 (2) 이 특징 패턴으로부터 본 논문에서 제안한 Membership Scoring Function을 이용하여 유전자를 필터링(filtering) 하였다. 이 유전자들은 기존의 ICA(Independent Component Analysis) 방법에서 보다 IFSA 방법이 더 효과적으로 각 기능에 따른 유전자 그룹을 찾아내줌을 GO(Gene Ontology)에서 확인할 수 있었다. 이는 시차 혹은 위상 변화에 상관없이 데이타를 잘 나타낼 수 있는 IFSA의 특성이, ICA보다. 생물학적인 변수를 더 고려해 줄 수 있기 때문이라고 생각된다[1]. 이 논문의 또 다른 주요 작업은 유전자의 상호작용 관계로부터 유전자 네트웍을 얻어내는 것이다. 유전자 네트웍은 같은 그룹 내에서 유전자간의 상관 계수를 구하고 가장 높은 상관도를 보이는 유전자쌍을 연결시켜 얻게되었다. 이 네트웍 역시 GO 해석에서 그 유효성을 확인하였다.를 평균 66.02에서 58.98로 줄이면서 계산시간은 평균 71ms에서 44ms 으로 빠르게 됨을 알 수 있었다.적외선 분광법을 이용한 사일리지의 화학적 조성분 함량 측정은 적은 오차 범위 내에서 신속하고 정확한 분석법이 될 수 있음을 확인 할 수 있었다. 비록 원물 생시료(IF)에 대한 직접적인 측정은 다소 예측 정확성이 떨어지지만 현장 적용성과 편리성을 높이기 위해서는 생시료의 측정시 오차를 줄일 수 있는 스펙트럼의 수처리 방법이나 산란보정 방법과 같은 데이터 처리기법에 대한 더 많은 연구가 앞으로 진행되어야 한다고 생각되어진다.상자의 50% 이상이 매일 생선 콩 및 콩제품과 채소류를 먹고 있었고, 인스턴트나 패스트푸드는 정상 체중군이 저체중군이나 과체중보다 매일 섭취하는 빈도가 낮았다(p<0.0177). 7. 가장 낮은 영양 섭취 상태를 보여준 영양소(% RDA< 75%)는 철분과 칼슘으로 조사 대상자의 3/4에 해당하는 조사 대상자가 영양 부족 상태였다. 칼슘 섭취의 경우 정상 체중군이 과체중군과 저체중군보다 섭취율이 낮았으나(p<0.0257) 철분은 군간 유의차는 없었다. 8. 칼슘의 경우 과체중군이 저체중군이나 정상 체중군에 비해 영양소 적정비율(NAR) 값이 높았으며(p<0.0257) 철분, 단백질, 비타민 $B_1$$B_2$, 나이아신의 경우도 통계적으로 유의하지는 않으나 과체중군이 저체중군 또는 정상 체중군의 NAR 값이 높은 경향을 보여주었다. 9가지 영양소의 NAR을 평균한 MAR 값은 군간 유의적이지는 않으나 과체중군(0.76)이 정상체중(0.73) 또는 저체중군(0.73)에 비해 높은 값은 보여주었다. 9.

정량적 도전율측정의 오차와 $B_1{^+}$ map의 노이즈에 관한 분석 (Quantitative Conductivity Estimation Error due to Statistical Noise in Complex $B_1{^+}$ Map)

  • 신재욱;이준성;김민오;최나래;서진근;김동현
    • Investigative Magnetic Resonance Imaging
    • /
    • 제18권4호
    • /
    • pp.303-313
    • /
    • 2014
  • 목적: 자기공명 영상장치(MRI)의 송신 자기장 정보를 이용한 인체 내 도전율을 측정하는 기술이 최근 제안되었다. 송신 자기장 정보의 노이즈에 따른 도전율의 오차를 측정하고 도전율과 노이즈의 관계를 모델화 하였다. 대상과 방법: 송신 자기장의 분포는 원형 모델에 대해서 시뮬레이션을 수행하였다. 시뮬레이션으로 생성된 송신 자기장의 분포에 가우시안 노이즈를 더해준 후 정량적인 도전율 측정에 어떤 영향을 주는지 공명 주파수, 물체의 크기, 송신 자기장의 신호 대 잡음 비에 대해서 수행하였다. 각 각의 변수에 따른 도전율 대 잡음 비를 측정하여 모델화 하였다. 결과: 시뮬레이션 결과 도전율 측정은 송신 주파수의 크기 오차보다 위상 오차에 더 큰 영향을 받는 것을 보였다. 또한, 송신 자기장의 신호 대 잡음 비, 공명 주파수, 도전율 값, 평균필터의 크기에 따라서 도전율 대 잡음비가 비례하는 경향성을 보였다. 하지만, 물체를 둘러싼 외부 물질의 크기는 도전율 측정에 큰 영향을 주지 않았다. 위의 시뮬레이션 결과는 3T 임상용 MRI에서 원형 모델 팬텀에 대해서 검증되었다. 결론: 시뮬레이션을 통해 얻어진 변수와 도전율 측정의 오차와의 관계를 통해서 정량적인 도전율 측정에서 발생되는 오차를 모델화 할 수 있었다. 또한 제시된 분석 방법을 통하여 자기공명 영상 장치를 이용한 도전율 측정의 필터링 및 재구성 알고리즘의 효과를 검증 할 수 있을 것으로 보인다.

분포형 비차등위상차를 이용한 S-밴드 이중편파레이더의 정량적 강우 추정 (Quantitative Rainfall Estimation for S-band Dual Polarization Radar using Distributed Specific Differential Phase)

  • 이건행;임상훈;장봉주;이동률
    • 한국수자원학회논문집
    • /
    • 제48권1호
    • /
    • pp.57-67
    • /
    • 2015
  • 이중편파레이더는 강우입자의 모양, 크기, 위상, 방향에 대한 정보를 제공해줌으로써 단일편파레이더보다 정확한 정량적 강우 추정에 장점이 있다. 본 연구에서는 대표적인 이중편파레이더 강우 추정 알고리즘인 JPOLE 알고리즘과 CSU 알고리즘을 이용하여 강우량을 산정 비교하였다. 이 두 알고리즘은 강우의 크기에 따라 반사도, 차등반사도, 비차등위상차를 각각 이용하거나 조합하여 강우량을 계산한다. 비차등위상차는 강우입자의 모양과 분포밀도에 대한 정보를 주는 차등위상차에 필터링이나 회귀분석기법을 이용하여 계산되는데, 대류성 강우 지역에서는 비차등위상차의 첨두값이 과소 추정되거나 음의 값을 보일 수 있으며, 약한 강우지역에서는 진동하기도 한다. 본 연구에서는 이러한 문제를 해결하고자 Lim et al. (2013)에서 제안된 새로운 분포형 비차등위상차 산정방법의 이용을 제안하였다. 2012년도의 두 강우사상에 대한 국토교통부의 비슬산 레이더 자료를 이용하여 분포형 비차등위상차를 산정한 후 강우 추정 알고리즘에 적용하였다. 산정된 분포형 비차등위상차는 첨두값이 개선되었으며, 크게 진동하거나 음의 값이 산정되지 않았다. 이를 이용하여 추정된 강우량에 있어서는 일강우량 80mm 이상의 강한 강우에 대해 일강우량의 누적값이 AWS 관측값에 가깝게 개선되는 것을 확인하였으며 80mm 이하의 약한 강우에서는 개선 정도가 미약하였다. 이는 강우 추정 알고리즘에서 강우강도가 높은 경우에 비차등위상차가 사용되고, 낮은 경우에는 반사도와 차등반사도가 사용되기 때문인 것으로 판단된다. 본 연구를 통해 향후 이중편파레이더를 이용한 강우량 추정의 정확도를 향상시킬 수 있을 것으로 기대된다.

랜드마크 코너 추출을 적용한 모바일 카메라 기반 위치결정 기법 (Mobile Camera-Based Positioning Method by Applying Landmark Corner Extraction)

  • 이유진;윤완상;이수암
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1309-1320
    • /
    • 2023
  • 모바일 기기의 기술 발전과 대중화는 어디서든 사용자의 위치를 확인할 수 있으며 인터넷을 사용할 수 있도록 발전되었다. 그러나 실내의 경우 인터넷은 끊김없이 사용할 수 있지만 global positioning system (GPS) 기능은 활용하기 어렵다. 실내 공공장소인 백화점, 박물관, 컨퍼런스장, 학교, 터널 등 GPS가 수신되지 않는 음영 지역에서 실시간 위치정보 제공의 필요성이 증가하고 있다. 이에 따라 최근의 실내 측위 기술은 랜드마크 데이터베이스를 구축하기 위해 light detection and ranging (LiDAR) 장비를 기반으로 연구가 증가하고 있다. 본 연구에서는 랜드마크 데이터베이스 구축의 접근성에 초점을 두어 모바일 기기를 기반으로 랜드마크를 촬영한 단일 이미지와 사전에 구축된 랜드마크 데이터베이스 정보를 이용하여 사용자의 위치를 추정하는 기법을 개발하고자 하였다. 첫 번째로, 랜드마크 데이터베이스를 구축하였다. 랜드마크를 촬영한 모바일 이미지만으로 사용자 위치를 추정하기 위해서는 모바일 이미지에서 랜드마크 검출이 필수적이고, 검출된 랜드마크에서 고정적인 성격을 가진 지점의 지상좌표 취득이 필수적이다. 두 번째 단계에서는 bag of words (BoW) 영상 검색 기술을 적용해 랜드마크 데이터베이스 중 모바일 이미지가 촬영한 랜드마크를 유사한 4위까지 검색하였다. 세 번째 단계에서는 scale invariant feature transform (SIFT) 특징점 추출 기법과 Homography random sample consensus (RANSAC)을 통해 검색된 4개의 후보 랜드마크들 중 가장 유사한 하나의 랜드마크를 선정하였고, 이때 임계값 설정을 통해 정합점 수를 기반으로 한 차례 더 필터링을 수행하였다. 네 번째 단계에서는 대응된 랜드마크와 모바일 이미지간의 Homography 행렬을 통해 랜드마크 이미지를 모바일 이미지에 투사하여 랜드마크의 영역과 코너(외곽선)점을 검출하였다. 마지막으로, 위치추정 기법을 통해 사용자의 위치를 추정하였다. 해당 기술의 성능을 분석한 결과, 랜드마크 검색 성능은 약 86%로 측정되었다. 위치추정 결과와 사용자의 실제 지상좌표를 비교한 결과, 약 0.56 m의 수평 위치 정확도를 갖는 것이 확인되어 별도의 고가 장비 없이 랜드마크 데이터베이스를 구축하여 모바일 영상으로 사용자 위치 추정이 가능한 것을 확인하였다.

무선 CCTV 시스템을 이용한 환자 고정 보조기술의 개발 (Patient Setup Aid with Wireless CCTV System in Radiation Therapy)

  • 박양균;하성환;예성준;조웅;박종민;박석원;허순녕
    • Radiation Oncology Journal
    • /
    • 제24권4호
    • /
    • pp.300-308
    • /
    • 2006
  • 목 적: 본 연구에서는 선형가속기 갠트리 헤드에 부착된 무선 CCTV 카메라를 이용한 영상처리를 통하여 환자 고정과 치료에 있어서의 정확성과 재현성 향상 방안을 개발하고자 하였다. 대상 및 방법: 선형가속기의 유사-빔 방향상(semi-beams eye view, semi-BEV)을 얻기 위하여 무선 CCTV 모듈을 자체 제작된 아크릴 어플리케이터를 이용하여 갠트리 헤드에 부착하였다. CCTV 카메라의 영상은 2.4 GHz의 고주파를 통해 치료실 벽면의 수신기로 전송된다. 선형가속기 작동 시 발생하는 무선 주파수에 의한 간섭현상(RF interference)과 누설 방사선으로 영상에 잡음이 발생하는데, 구리 호일로 카메라를 차폐하고 미디안 필터링과 같은 영상처리 기법을 이용하여 이러한 잡음을 최소화할 수 있었다. 스테레오 정합 기법과 Gauss-Newton 최적화 방법론을 기반으로 자체 제작된 소프트웨어를 통해, 환자의 고정 상태를 나타내는 3차원적 위치, 이동, 회전 정도를 정량적으로 평가하였다. 시스템의 정확도를 평가하기 위하여 팬톰 실험을 수행하였다. 또, 환자 호흡에 대한 실시간 영상분석을 통해 호흡 동기 시스템(respiratory gating system)을 구현하기 위한 방법론을 개발하였다. 결 과: 구리 호일 차폐와 영상처리를 통해 잡음을 80% 이상 줄일 수 있었다. 3차원 위치정보의 오차는 팬톰 실험을 통해 $1.5{\pm}0.7\;mm$로 나타났고, 이동 및 회전량에 대한 오차는 각각, 1 mm, $1^{\circ}$ 미만으로 나타났다. 환자 호흡에 따른 호흡 동기 시스템을 구현한 결과, 0.2초의 오차 범위 내에서 실시간 모니터링이 가능한 것으로 나타났다. 결 론: 선형가속기에 부착된 CCTV를 이용한 환자 고정 보조기술은 기존의 높은 비용을 필요로 하는 타 IGRT 기법에 비하여 설치와 이용이 간편하다. 시스템이 선형가속기와 근접해 있기 때문에 야기되는 문제점은 본 연구에서 제시된 방법을 통해 해결될 수 있었다. 시스템의 정확도를 평가해 볼 때, 임상적으로 적용이 가능할 것으로 판단된다.

CT 영상 및 kV X선 영상을 이용한 자동 표지 맞춤 알고리듬 개발 (Development of an Automatic Seed Marker Registration Algorithm Using CT and kV X-ray Images)

  • 정광호;조병철;강세권;김경주;배훈식;서태석
    • Radiation Oncology Journal
    • /
    • 제25권1호
    • /
    • pp.54-61
    • /
    • 2007
  • 목 적: 본 연구의 목적은 전립선암 환자의 방사선 치료 시 표적의 정확한 위치를 찾기 위해 표지(marker)를 삽입한 경우 방사선치료계획 시 촬영한 CT 영상과 매 치료 시 온보드 영상장치(on-board imager, OBI)로부터 획득된 직교 kV X선 영상을 이용하여 표지의 위치를 계산하고 자동으로 맞춤을 수행하여 환자 셋업 오차를 보정하도록 하는 방법을 개발하는 것이다. 대상 및 방법: 세 개의 금 표지를 환자 전립선의 기준 위치에 삽입한 후 CT 모의치료기를 이용하여 2 mm 슬라이스 간격으로 CT 영상을 획득하였으며 매 치료 전에 환자 셋업 보정을 위하여 OBI를 이용하여 직교하는 kV X선 환자 영상을 획득하였다. CT 및 kV X선 영상 내 표지 정보 및 좌표 값 추출을 위하여 화소값의 문턱값 처리, 필터링, 외곽선 추출, 패턴 인식 등 다수의 영상처리 알고리듬을 적용하였다. 각 표지들 위치의 대표값으로 삼각형의 무게중심 개념을 이용하였으며 기준 CT 영상 및 직교 kV X선 영상으로부터 각각 무게중심의 좌표를 구한 후 그 차이를 보정해야 할 셋업의 오차로 계산하였다. 알고리듬의 건전성(robustness) 평가를 위해 팬텀을 이용하여 계산된 CT 및 kV X선 영상의 무게중심이 실제 지정된 위치와 일치하는지 여부를 확인하였으며, 본원에서 방사선 치료를 시행한 네 명의 전립선암 환자에 대상으로 치료 직전 촬영한 38 내지 39쌍의 kV X선 영상에 대하여 알고리듬을 적용한 후 OBI 프로그램에서 제공되는 2차원-2차원 맞춤 결과와 비교하였다. 결 과: 팬텀 실험 결과 실제 값과 CT 영상 및 직교 kV X선 영상으로부터 계산된 무게 중심 좌표 값이 1 mm 오차 내에서 일치함을 확인할 수 있었다. 환자 영상에 적용한 경우에도 모든 영상에 대하여 성공적으로 각 표지의 위치를 계산할 수 있었으며 2차원-2차원 맞춤 기능을 이용하여 계산된 셋업 오차와 비교해본 결과 1 mm 범위 내에서 일치함을 확인할 수 있었다. 본 알고리듬을 이용하여 계산한 결과 셋업 오차는 전후(AP) 방향으로 환자별로 작게는 $0.1{\pm}2.7\;mm$에서 크게는 $1.8{\pm}6.6\;mm$까지, 상하(SI) 방향으로 $0.8{\pm}1.6\;mm$에서 $2.0{\pm}2.7\;mm$, 좌우(Lat) 방향으로 $-0.9{\pm}1.5\;mm$에서 $2.8{\pm}3.0\;mm$까지였으며 환자에 따라 그 편차의 차이가 있었다. 결 론: 제안된 알고리듬을 이용하여 1회 셋업 오차를 평가하는 데 소요되는 시간은 10초 미만으로서 임상 적용 시 환자 셋업 시간을 줄이고 주관성을 배제하는 데 도움이 될 수 있을 것으로 기대된다. 그러나 온라인 환자 셋업 보정 시스템에 적용하기 위해서는 선형가속기의 제어 시스템에 통합되는 것이 필요하다.

협업필터링에서 고객의 평가치를 이용한 선호도 예측의 사전평가에 관한 연구 (Pre-Evaluation for Prediction Accuracy by Using the Customer's Ratings in Collaborative Filtering)

  • 이석준;김선옥
    • Asia pacific journal of information systems
    • /
    • 제17권4호
    • /
    • pp.187-206
    • /
    • 2007
  • The development of computer and information technology has been combined with the information superhighway internet infrastructure, so information widely spreads not only in special fields but also in the daily lives of people. Information ubiquity influences the traditional way of transaction, and leads a new E-commerce which distinguishes from the existing E-commerce. Not only goods as physical but also service as non-physical come into E-commerce. As the scale of E-Commerce is being enlarged as well. It keeps people from finding information they want. Recommender systems are now becoming the main tools for E-Commerce to mitigate the information overload. Recommender systems can be defined as systems for suggesting some Items(goods or service) considering customers' interests or tastes. They are being used by E-commerce web sites to suggest products to their customers who want to find something for them and to provide them with information to help them decide which to purchase. There are several approaches of recommending goods to customer in recommender system but in this study, the main subject is focused on collaborative filtering technique. This study presents a possibility of pre-evaluation for the prediction performance of customer's preference in collaborative filtering before the process of customer's preference prediction. Pre-evaluation for the prediction performance of each customer having low performance is classified by using the statistical features of ratings rated by each customer is conducted before the prediction process. In this study, MovieLens 100K dataset is used to analyze the accuracy of classification. The classification criteria are set by using the training sets divided 80% from the 100K dataset. In the process of classification, the customers are divided into two groups, classified group and non classified group. To compare the prediction performance of classified group and non classified group, the prediction process runs the 20% test set through the Neighborhood Based Collaborative Filtering Algorithm and Correspondence Mean Algorithm. The prediction errors from those prediction algorithm are allocated to each customer and compared with each user's error. Research hypothesis : Two research hypotheses are formulated in this study to test the accuracy of the classification criterion as follows. Hypothesis 1: The estimation accuracy of groups classified according to the standard deviation of each user's ratings has significant difference. To test the Hypothesis 1, the standard deviation is calculated for each user in training set which is divided 80% from MovieLens 100K dataset. Four groups are classified according to the quartile of the each user's standard deviations. It is compared to test the estimation errors of each group which results from test set are significantly different. Hypothesis 2: The estimation accuracy of groups that are classified according to the distribution of each user's ratings have significant differences. To test the Hypothesis 2, the distributions of each user's ratings are compared with the distribution of ratings of all customers in training set which is divided 80% from MovieLens 100K dataset. It assumes that the customers whose ratings' distribution are different from that of all customers would have low performance, so six types of different distributions are set to be compared. The test groups are classified into fit group or non-fit group according to the each type of different distribution assumed. The degrees in accordance with each type of distribution and each customer's distributions are tested by the test of ${\chi}^2$ goodness-of-fit and classified two groups for testing the difference of the mean of errors. Also, the degree of goodness-of-fit with the distribution of each user's ratings and the average distribution of the ratings in the training set are closely related to the prediction errors from those prediction algorithms. Through this study, the customers who have lower performance of prediction than the rest in the system are classified by those two criteria, which are set by statistical features of customers ratings in the training set, before the prediction process.