• 제목/요약/키워드: 의사결정 알고리즘

검색결과 583건 처리시간 0.025초

철도 유휴부지 활용방안: 군집분석을 활용한 태양광발전 입지 제안 (Utilizing the Idle Railway Sites: A Proposal for the Location of Solar Power Plants Using Cluster Analysis)

  • 강은경;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.79-105
    • /
    • 2023
  • 지구온난화와 기후변화 등의 유례없는 기상이변으로 전 세계 곳곳이 극심한 몸살을 앓고 있으며, 경제적 손실 또한 눈덩이처럼 불어나고 있다. 이러한 문제를 해결하기 위해 2016년 '파리기후변화협정(The Paris Agreement)'이 체결되어 지구의 평균온도 상승을 1.5℃ 아래로 유지하기 위한 정부간 협의체가 결성되었으며, 우리나라도 2050년 탄소중립을 선언함으로써 기후재앙을 막기 위한 노력을 진행하고 있다. 특히, 온실가스 배출로 인한 기온상승은 수출 의존도가 높은 우리나라 경제는 물론 환경과 사회 전반에 부정적인 영향을 미칠 것으로 예상된다. 또한, 교통수단의 다변화가 가속화되면서 수단선택의 변화도 크게 증가하고 있는 가운데 저성장 시대의 개발 패러다임이 도시재생으로 변화함에 따라, 노선의 수요 감소, 선형 개량, 도심 철도의 외곽 이설 등에 영향을 받아 증가하고 있는 철도 유휴부지 활용에 대한 관심이 높아지고 있다. 한편, 철도 유휴부지를 활용한 태양광발전은 '재생에너지 3020'의 태양광발전 목표를 일부 달성하면서도, 입지를 둘러싼 환경훼손과 주민 수용성 문제에서 자유로워질 수 있는 장점에도 불구하고, 설비실태나 설비계획에 있어 미진한 상황이다. 이에, 본 연구에서는 국가철도공단과 재생에너지클라우드플랫폼에서 제공하는 데이터를 활용하여 태양광발전 설비 설치가 가능한 적합 유휴지를 발굴 및 분석하는 알고리즘을 개발하고, 사용자가 원하는 조건을 고려한 잠재적인 적합 지역을 탐색 및 도출함으로써, 개발 초기 설비나 확충 등에 소요되는 막대한 비용을 절약할 수 있는 방안을 마련하고자 하였다. 본 연구는 다양한 군집분석을 활용하여 철도 유휴부지에 태양광발전 설치입지를 도출할 수 있는 최적의 알고리즘을 개발하고, 면적, 설치용량, 발전량, 예상수익 등이 모두 높은 '태양광발전 설치 적극권장 지역' 202곳을 도출하였다. 이를 바탕으로 경제와 환경을 동시에 고려한 관점에서 의사결정자의 합리적인 판단을 도울 수 있을 것으로 기대한다.

계좌 이용 과정과 결과의 투명성이 온라인 뱅킹 이용자의 보안 인식에 미치는 영향 (The Role of Control Transparency and Outcome Feedback on Security Protection in Online Banking)

  • 이은곤;최지은;이호근
    • 경영정보학연구
    • /
    • 제14권3호
    • /
    • pp.75-97
    • /
    • 2012
  • 온라인 뱅킹 서비스의 성공을 위해서는 이용 고객의 신뢰를 제고하는 것이 필수적이다. 현재까지 인터넷 뱅킹 이용자들의 신뢰를 제고하는 보안 메커니즘으로 공인인증 서비스가 가장 유력한 대안으로 사용되어 왔다. 그러나 최근 공인인증서를 통한 보안 메커니즘은 해커 등 악의적인 사용자의 침입에 취약할 수 있다는 주장이 제기되고 있다. 본 연구에서는 온라인 뱅킹 보안 메커니즘의 견고성을 높이기 위한 추가적인 대안으로 공인인증서 사용과 관련된 과정의 투명성과 결과 피드백의 투명성이라는 두 가지 요소를 제안하였다. 과정의 투명성은 거래과정에 대한 정보를 이용자에게 제공함으로써 거래 과정을 통제할 수 있도록 하는 것이다. 결과 피드백은 거래결과를 이용자에게 알려줌으로써 이용자가 거래가 의도한 대로 완료되었음을 확인할 수 있도록 하는 것이다. 정보의 투명성에 관한 선행 연구에 따르면, 거래과정과 결과에 대한 정보를 제공하여 투명성을 제고하면 정보시스템 이용자의 의사결정 품질이 제고된다. 거래과정에 대한 정보의 투명성이 확보되면, 정보시스템 이용자들은 거래가 원활하게 수행되고 있는지를 확인할 수 있게 되고, 거래 과정과 결과를 자신이 의도한 대로 통제할 수 있게 되기 때문에, 이용자들의 거래 위험을 감소시킬 수 있다. "구조기반 신뢰" 에 대한 연구에 따르면, 정보시스템 이용자들은 자신들이 성공적으로 거래를 할 수 있도록 구조적인 요소를 제공하는 서비스 제공자들을 보다 신뢰하는 속성이 있다. 거래과정과 거래결과를 확인할 수 있는 정보의 투명성은 정보시스템 이용자가 거래를 원활하게 추진할 수 있는 구조적 기반을 제공하므로 서비스 제공자에 대한 신뢰는 증가하게 된다. 거래 위험이 감소하고 신뢰가 증가되면, 이용자들은 제공되는 서비스에 대해 보다 만족하게 되고, 따라서 서비스 제공자에 대해 충성도가 제고되거나 서비스에 대해 지불 의사를 가지게 될 것이다. 본 연구에서는 실험실 실험을 통해 연구 가설 및 연구 모델을 실증적으로 검증하고자 하였다. 실험설계는 과정의 투명성과 결과의 투명성이라는 두 가지 요인에 따라 $2{\times}2$ 집단으로 구성하여 진행하였다. 공인인증서 사용과 관련된 과정의 투명성과 결과 피드백 요소가 현재 온라인 뱅킹 사이트에서 제공되고 있지 않기 때문에 가상의 온라인 뱅킹 사이트를 구축하여 실험을 진행하였다. 총 138개의 유효한 자료를 실험을 통해 수집하였으며 PLS 알고리즘을 활용하여 분석을 진행하였다. 분석 결과, 과정의 투명성은 온라인 뱅킹 거래의 위험을 줄이고 온라인 뱅킹 사이트에 대한 신뢰를 증가시키는 것으로 나타났다. 결과 피드백은 온라인 뱅킹 사이트에 대한 신뢰를 증가시키는 것으로 나타났다. 이렇게 증가된 신뢰와 감소된 거래위험은 서비스 만족도를 증가시킴으로써 온라인 뱅킹 서비스 이용 고객의 서비스에 대한 지불의도와 온라인 뱅킹 사이트에 대한 충성도를 증가시키는 것으로 조사되었다. 본 연구에서는 온라인 뱅킹 서비스의 보안이라는 주제에 대해 정보의 투명성이 보안에 미치는 영향을 실증자료를 통해 분석함으로써 온라인 보안 메커니즘 연구의 범위를 확대하였을 뿐만 아니라 실제 구현이 가능한 보안 메커니즘에 대한 효과를 검증함으로써 실무적 측면에서의 동헌도가 있다고 판단된다.

  • PDF

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

종합 평점과 다기준 평점을 선택적으로 활용하는 협업필터링 기반 하이브리드 추천 시스템 (A Hybrid Recommender System based on Collaborative Filtering with Selective Use of Overall and Multicriteria Ratings)

  • 구민정;안현철
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.85-109
    • /
    • 2018
  • 추천시스템은 사용자의 과거 구매행동을 통해 향후 구매할 것이라고 예상되는 제품을 자동으로 검색하여 추천해준다. 특히 전자상거래 기업의 상품추천시스템은 일대일 마케팅의 대표적 실현수단으로 가치가 있다. 하지만, 전통적인 추천시스템, 특히 학계 및 산업계에서 가장 널리 사용되고 있는 전통적인 협업필터링 기법은 단일차원의 '종합 평점'만을 고려하여 추천결과를 생성하도록 설계되어 있어, 사용자들의 정확한 니즈를 이해하고 대응하는데 근본적인 한계가 있다. 최근에는 전자 상거래 기업들도 고객들로부터 보다 다각화된, 다기준 방식으로 피드백을 받고 있다. 특히 다기준 평점은 정량적으로 입력되는 정보이므로 상대적으로 분석 및 처리가 용이하다는 장점이 있다. 그러나 다기준 평점 역시 사전에 정해진 기준에 대해서만 사용자의 피드백이 이루어지기 때문에, 보다 상세하게 사용자의 의견을 이해하여 추천에 반영하는 데에는 한계가 있다. 이에 본 연구는 다기준 평점 정보와 선택적 협업필터링의 서로 다른 접근방법을 통해 도출된 추천결과를 종합하여, 최종적으로 추천 대상리스트를 산출할 수 있는 하이브리드 기술을 제안한다. 본 연구에서 제안한 연구모형의 유용성을 검증하기 위해, 식음료점(식당, 카페 등)에 대한 실제 이용자를 대상으로 온라인 설문을 통해 종합 평점과 다기준 평점을 수집하였으며, 데이터를 학습용과 검증용으로 구분하여 학습시키고 성과를 평가하였다. 이 기법은 결합 함수 기반 접근법과 사용자마다 구매의사결정의 체계가 다르다는 전제하에, 사용자들을 유형화하고, 유형에 따라 정보원을 선택적으로 활용하는 협업필터링 알고리즘을 활용했다. 실험결과, 제안 알고리즘을 통한 추천 방법이 단일 차원을 고려하는 전통적인 협업필터링과 비교해 더 우수한 예측정확도를 나타냄을 확인했다. 아울러, 본 연구가 제안하는 다기준 평점과 선택적 협업필터링 알고리즘을 종합하여 추천하는 방법이, 단순히 다기준 평점을 고려했을 때 보다 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.

사용자 행동 기반의 사회적 관계를 결합한 사용자 협업적 여과 방법 (Incorporating Social Relationship discovered from User's Behavior into Collaborative Filtering)

  • 타이쎄타;하인애;조근식
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.1-20
    • /
    • 2013
  • 소셜 네트워크는 사용자들의 공통된 관심사, 경험, 그리고 일상 생활들을 함께 공유하기 위해 소셜 네트워크 상 사람들을 서로 연결시켜주는 거대한 커뮤니케이션 플랫폼이다. 소셜 네트워크상의 사용자들은 포스팅, 댓글, 인스턴스 메시지, 게임, 소셜 이벤트 외에도 다양한 애플리케이션을 통해 다른 사용자들과 소통하고 개인 정보 관리하는데 많은 시간을 소비한다. 소셜 네트워크 상의 풍부한 사용자 정보는 추천시스템이 추천 성능을 향상시키기 위해 필요한 큰 잠재력이 되었다. 대부분의 사용자들은 어떤 상품을 구매하기 전 가까운 관계이거나 같은 성향을 가진 사람들의 의견을 반영하여 의사 결정을 하게 된다. 그러므로 소셜 네트워크에서의 사용자 관계는 추천시스템을 위한 사용자 선호도 예측을 효율적으로 높이는데 중요한 요소라 할 수 있다. 일부 연구자들은 소셜 네트워크에서의 사용자와 다른 사용자들 사이의 상호작용 즉, 소셜 관계(social relationship)와 같은 소셜 데이터가 추천시스템에서 추천의 질에 어떠한 영향을 미치는가를 연구하고 있다. 추천시스템은 아마존, 이베이, Last.fm과 같은 큰 규모의 전자상거래 사이트 또한 채택하여 사용되는 시스템으로, 추천시스템을 위한 방법으로는 협업적 여과 방법과 내용 기반 여과 방법이 있다. 협업적 여과 방법은 사용자들의 선호도 학습에 의해 사용자가 아직 평가하지 않은 아이템 중 선호할 수 있는 아이템을 정확하게 제안하기 위한 추천시스템 방법 중 하나이다. 협업적 여과는 사용자들의 데이터에 초점을 맞춘 방법으로 유사한 배경과 선호도를 가지는 사용자들로부터 정보를 수집하여 사용자들의 선호도 예측을 자동으로 발생시킨다. 특히 협업적 여과는 근접한 이웃 사용자들에 의해서 목적 사용자가 선호할 수 있는 아이템을 제시하는 것으로 유사한 이웃 사용자를 찾는 것이 중요하다. 좋은 이웃 사용자 발견은 사용자와 아이템을 고려하는 방법이 일반적이다. 각 사용자는 아이템 즉, 영화, 상품, 책 등에 자신의 선호도를 나타내기 위하여 평가 값을 입력하고, 시스템은 이를 바탕으로 사용자-평가 행렬을 구축한다. 이 사용자-평가 행렬은 목적 사용자와 유사하게 아이템을 평가한 사용자 그룹을 찾기 위한 것으로, 목적 사용자가 아직 평가하지 않은 아이템에 대하여 사용자-평가 매트릭스를 통해 그 평가 값을 예측한다. 현재 이 협업적 여과 방법은 전자상거래와 정보 검색에서 적용되어 개인화 시스템에 효율적으로 사용되고 있다. 하지만 초기 사용자 문제, 데이터 희박성 문제와 확장성 그리고 예측 정확도 향상 등 해결해야 할 과제가 여전히 남아 있다. 이러한 문제들을 해소하기 위해 많은 연구자들은 하이브리드, 신뢰기반, 소셜 네트워크 기반 협업적 여과와 같은 다양한 방법을 제안하였다. 본 논문에서는 전통적인 협업적 여과 방식의 예측 정확도와 추천 성능을 향상시키기 위해 소셜 네트워크에 존재하는 소셜 관계를 이용한 협업적 여과 시스템을 제안한다. 소셜 관계는 소셜 네트워크 서비스 중 하나인 페이스북 사용자들이 남긴 포스팅과 사용자의 소셜 네트워크 친구와 의견 교류 중 남긴 코멘트와 같은 사용자 행동을 기반으로 정의된다. 소셜 관계를 구축하기 위해 소셜 네트워크 사용자의 포스팅과 댓글을 추출하고, 추출된 텍스트에 불용어 및 특수 기호 제거와 스테밍 등 전처리를 수행하였다. 특징 벡터는 TF-IDF를 이용하여 전처리된 텍스트에 나타난 각 단어에 대한 특징 점수를 계산함으로써 구축된다. 본 논문에서 이웃 사용자를 결정하기 위해 사용되는 사용자 간 유사도는 특징 벡터를 이용한 사용자 행동 유사도와 사용자의 영화 평가를 기반으로 한 전통적 방법의 유사도를 결합하여 계산된다. 제안하는 시스템은 목표 사용자와 제안한 방법을 통해 결정된 이웃 사용자 집단을 기반으로 목표 사용자가 평가하지 않은 아이템에 대한 선호도를 예측하고 Top-N 아이템을 선별하여 사용자에게 아이템을 추천하게 된다. 본 논문에서 제안하는 방법을 확인하고 평가하기 위하여 IMDB에서 제공하는 영화 정보 기반으로 영화 평가 시스템을 구축하였다. 예측 정확도를 평가하기 위해 MAE 값을 이용하여 제안하는 알고리즘이 얼마나 정확한 추천을 수행하는지에 대한 예측 정확도를 측정하였다. 그리고 정확도, 재현율 및 F1값 등을 활용하여 시스템의 성능을 평가하였으며, 시스템의 추천 품질은 커버리지를 이용하여 평가되었다. 실험 결과로부터 본 논문에서 제안한 시스템이 보다 더 정확하고 좋은 성능으로 사용자에게 아이템을 추천하는 것을 볼 수 있었다. 특히 소셜 네트워크에서 사용자 행동을 기반으로 한 소셜 관계를 이용함으로써 추천 정확도를 6% 향상시킴을 보였다. 또한 벤치마크 알고리즘과의 성능비교 실험을 통해 7% 향상된 추천 성능의 결과를 보여준다. 그러므로 사용자의 행동으로부터 관찰된 소셜 관계를 CF방법과 결합한 제안한 방법이 정확한 추천시스템을 위해 유용하며, 추천시스템의 성능과 품질을 향상시킬 수 있음을 알 수 있다.

사례 기반 지능형 수출통제 시스템 : 설계와 평가 (Export Control System based on Case Based Reasoning: Design and Evaluation)

  • 홍원의;김의현;조신희;김산성;이문용;신동훈
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.109-131
    • /
    • 2014
  • 최근 전 세계적인 원전 설비의 수요 증가로 원자력 전략물자 취급의 중요성이 높아지는 가운데, 국외 수출을 위한 원전 관련 물품 및 기술의 신청 또한 급증하는 추세이다. 전략물자 사전판정 업무는 통상 원자력 물자 관리에 해박한 전문가의 경험 및 지식에 근거하여 수행되어 왔지만, 급증하는 수요에 상응하는 전문 인력의 공급이 부족한 실정이다. 이러한 문제를 극복하기 위하여, 본 연구진은 전략물자 수출 통제를 위한 사례 기반 지능형 수출 통제 시스템을 설계 및 개발하였다. 이 시스템은 현장 전문가의 전담 업무이던 신규 사례에 대한 전략물자 사전판정 과정 업무의 주요 맥락을 자동화 하여 전문가 및 관계 기관이 감당해야 할 업무 부담을 줄이며, 빠르고 정확한 판정을 돕는 의사결정 지원 시스템의 역할을 맡는다. 개발된 시스템은 사례 기반 추론 (Case Based Reasoning) 방식에 기반을 두어 설계되었는데, 이는 과거 사례의 특성을 활용하여 신규 사례의 해법을 유추하는 추론 방법이다. 본 연구에서는 자연어로 작성된 전자문서 처리에 널리 사용되는 텍스트 마이닝 분석 기법을 원자력 분야에 특화된 형태로 응용하여 전략물자 수출통제 시스템을 설계하였다. 시스템 설계의 근거로 선행 연구에서 제안된 반자동식 핵심어 추출 방안의 성능을 보다 엄밀히 검증하였고, 추출된 핵심어로 신규 사례와 유사한 과거 사례를 추출하는 알고리즘을 제안하였다. 제안된 방안은 텍스트 마이닝 분야의 TF-IDF 방법 및 코사인 유사도 점수를 활용한 결과(${\alpha}$)와 원자력 분야에서 통용되는 개념적 지식을 계통으로 분류하여 도출한 결과(${\beta}$)를 조합하여 최종 결과 (${\gamma}$) 를 생성하게 된다. 세부 요소 기술의 성능 검증은 임상 데이터를 활용한 실험 및 실무 전문가의 의견수렴을 통해 이루어졌다. 개발된 시스템은 사전판정 전문 인력을 다수 양성하는 데 드는 비용을 절감하는 데 일조할 것이며, 지식서비스 산업의 의미 있는 응용 사례로서 관련 산업의 성장에 기여할 수 있을 것으로 보인다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

이질성 학습을 통한 문서 분류의 정확성 향상 기법 (Improving the Accuracy of Document Classification by Learning Heterogeneity)

  • 윌리엄;현윤진;김남규
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.21-44
    • /
    • 2018
  • 최근 인터넷 기술의 발전과 함께 스마트 기기가 대중화됨에 따라 방대한 양의 텍스트 데이터가 쏟아져 나오고 있으며, 이러한 텍스트 데이터는 뉴스, 블로그, 소셜미디어 등 다양한 미디어 매체를 통해 생산 및 유통되고 있다. 이처럼 손쉽게 방대한 양의 정보를 획득할 수 있게 됨에 따라 보다 효율적으로 문서를 관리하기 위한 문서 분류의 필요성이 급증하였다. 문서 분류는 텍스트 문서를 둘 이상의 카테고리 혹은 클래스로 정의하여 분류하는 것을 의미하며, K-근접 이웃(K-Nearest Neighbor), 나이브 베이지안 알고리즘(Naïve Bayes Algorithm), SVM(Support Vector Machine), 의사결정나무(Decision Tree), 인공신경망(Artificial Neural Network) 등 다양한 기술들이 문서 분류에 활용되고 있다. 특히, 문서 분류는 문맥에 사용된 단어 및 문서 분류를 위해 추출된 형질에 따라 분류 모델의 성능이 달라질 뿐만 아니라, 문서 분류기 구축에 사용된 학습데이터의 질에 따라 문서 분류의 성능이 크게 좌우된다. 하지만 현실세계에서 사용되는 대부분의 데이터는 많은 노이즈(Noise)를 포함하고 있으며, 이러한 데이터의 학습을 통해 생성된 분류 모형은 노이즈의 정도에 따라 정확도 측면의 성능이 영향을 받게 된다. 이에 본 연구에서는 노이즈를 인위적으로 삽입하여 문서 분류기의 견고성을 강화하고 이를 통해 분류의 정확도를 향상시킬 수 있는 방안을 제안하고자 한다. 즉, 분류의 대상이 되는 원 문서와 전혀 다른 특징을 갖는 이질적인 데이터소스로부터 추출한 형질을 원 문서에 일종의 노이즈의 형태로 삽입하여 이질성 학습을 수행하고, 도출된 분류 규칙 중 문서 분류기의 정확도 향상에 기여하는 분류 규칙만을 추출하여 적용하는 방식의 규칙 선별 기반의 앙상블 준지도학습을 제안함으로써 문서 분류의 성능을 향상시키고자 한다.

간 이식편의 체적 예측을 위한 2점 이용 간 분리 (Liver Splitting Using 2 Points for Liver Graft Volumetry)

  • 서정주;박종원
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.123-126
    • /
    • 2012
  • 본 논문은 생체간이식 전에 복부 MDCT(Multi-Detector Computed Tomography) 영상에서 간 이식편의 체적을 간단하고 정확하게 계산하기 위하여 좌간과 우간을 나누는 방법을 제안하였다. 본 알고리즘은 기증자와 수혜자의 안전을 보장하기 위하여 시스템과 의료진의 상호작업을 최소화 하여 의료진이 수술 전 이식편의 판단을 정확하게 처리할 수 있도록 하였다. 간이 추출된 영상에 좌간과 우간을 나눌 수 있는 2점(중간 정맥(MHV: Middle Hepatic Vein) 내부의 한 점과 좌우문맥(PV: Portal Vein) 분지부에서 한 점)을 선택한다. 선택된 중간정맥 내부의 점을 이용하여 중간정맥을 자동 인식한 후 중간정맥을 기준으로 절개선을 결정하여 문맥 분지부의 한 점을 연결하는 절개면을 형성한다. 좌간과 우간의 체적과 간 전체에 대한 좌우간의 비율을 계산한다. 계산된 체적의 정확성을 입증하기 위해 진단 방사선과 의사가 수동으로 처리하여 계산한 체적과 함께 수술 중 획득한 실측무게와 비교하였다. 실측무게와 수동으로 예측된 체적 사이의 오차에 대한 평균${\pm}$표준편차는 $162.38cm^3{\pm}124.39$이고, 실측무게와 2점을 이용하여 예측된 체적과의 오차에 대한 평균${\pm}$표준편차는 $107.69cm^3{\pm}97.24$이다. 실측무게와 수동으로 예측된 체적의 상관관계는 0.79이고, 실측무게와 2점을 이용하여 예측된 체적의 상관관계는 0.87이다. 그리고 2점을 선택한 후 좌우간을 분할하여 체적을 계산하는 시간을 측정하여 수술실에서 실시간으로 처리 가능한지의 여부를 확인하였다. 한 데이터세트($149.17pages{\pm}55.92$) 당 처리 시간의 평균${\pm}$표준편차는 $57.28sec{\pm}32.81$이다.

사용자 선호도 변화에 따른 추천시스템의 다양성 적용 (Application of diversity of recommender system accordingtouserpreferencechange)

  • 나혜연;남기환
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.67-86
    • /
    • 2020
  • 추천시스템은 시간이 흐를수록 사용자와 기업에게 점점 더 큰 영향을 주고 있다. 최근 코로나(COVID-19) 팬데믹 현상이 전 세계적으로 일어나면서 세대를 뛰어넘어 E-Commerce의 중요성이 증대되었고 추천시스템은 E-Commerce 활성화의 최중심에 있다. 추천시스템이 개발된 이래로 다수의 알고리즘이 추천시스템의 정확도를 올리는 것에 집중되어 있었고, 추천시스템의 희귀성, 다양성, 우연성 등과 같은 다른 가치들이 간과되고 있다. 본 논문에서는 사용자의 만족도는 추천시스템의 정확도에만 달려있지 않고 다양한 성능을 겸비했을 때 고객에게 만족스러운 추천서비스 경험을 제공할 것이라 생각하여 다양성을 위한 그래프 기반의 추천시스템을 개발하였다. 사용자 네트워크를 구성한 뒤 카테고리를 활용한 무게중심변화를 통해 유사도가 낮은 이질적인 사용자를 찾아 추천상품의 유사성을 낮추는 방식으로 다양성을 도모하였다. 또한, 추천의 다양성은 사용자의 다양성 선호 수준에 따라 상이할 것이라는 가정에 따라 사용자의 다양성 선호 수준을 구별하였고 다양성 모델 성능이 사용자 특성별로 다름을 확인할 수 있었다. 전체 연구 결과, 추천시스템의 정확성과 다양성이 트레이드 오프 관계에 놓여있다는 것을 확인할 수 있었지만 본 연구모델을 통해 근소한 정확도 손실 대비 높은 다양성을 얻을 수 있었다. 본 연구는 그래프 기반의 추천시스템을 통해 사용자의 만족도를 향상시키는 다양성을 실현하였다는 연구적 의의와 사용자 수준을 고려한 추천의 다양성을 적용 결과를 통해 기업의 장기적 이윤을 상승시킬 수 있는 모델 개발이라는 실무적 의의를 꼽을 수 있다.