• 제목/요약/키워드: 속성 기반 추론법

검색결과 8건 처리시간 0.02초

자료편집기법과 사례기반추론을 이용한 한국종합주가지수 예측 (Prediction of KOSPI using Data Editing Techniques and Case-based Reasoning)

  • 김경재
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권6호
    • /
    • pp.287-295
    • /
    • 2007
  • 본 연구에서는 한국종합주가지수 (KOSPI)의 예측을 위하여 사례기반추론에서의 유전자 알고리즘을 이용한 새로운 자료편집기법을 제안한다. 사례기반추론은 복잡한 문제 해결에서의 편의성과 강점으로 인하여 여러 분야에서 광범위하게 활용되고 있다. 그럼에도 불구하고 사례기반추론은 다른 기계학습기법에 비하여 낮은 예측정확도를 나타내기에 비판을 받아 왔다. 일반적으로 사례기반추론으로부터 성공적인 성과를 도출하기 위해서는 주어진 문제에 유용한 선행 사례를 효과적으로 추출하는 것이 핵심이다. 그러나 사례기반추론 시스템에서 우수한 대응과 추출방법을 설계하는 것은 여전히 논란이 있는 연구 주제이다. 본 연구에서는 사례기반추론 시스템에서 우수한 대응과 추출을 위하여 유전자 알고리즘이 동시에 속성 가중치와 적합한 사례를 선택하는 것을 최적화한다. 본 연구에서는 제안된 모형을 주식시장분석에 응용한다. 실험결과는 유전자 알고리즘 접근법이 사례기반추론에서 유망한 사례편집기법이라는 것을 보여준다.

  • PDF

사례기반추론을 이용한 온라인보험 판매지원시스템의 설계 (Design of On-line Insurance Sales Support Systems Using Case-Based Reasoning)

  • 김진완;옥석재
    • 한국콘텐츠학회논문지
    • /
    • 제10권8호
    • /
    • pp.349-359
    • /
    • 2010
  • 본 논문은 온라인보험 청약 프로세스에서 고객들이 보험설계를 마친 후에 프로세스를 종료하지 않고 실제 구매 단계인 청약신청 단계로 유인하기 위해서 개인화된 보험금 지급사례와 보험통계 정보를 제공하는 온라인보험 판매지원시스템을 설계하였다. 온라인보험 판매지원시스템은 사례기반추론의 최근접 이웃 추출법을 이용하여 입력된 고객 특성과 보험금 지급사례간의 유사도를 측정하고, 사례의 최신도를 반영하여 최종유사도가 가장 높은 보험금 지급사례를 고객에게 제시한다. 또한 최종 선정된 보험금 지급사례의 속성과 일치하는 보험통계 정보를 추가적으로 추출하여 보험금 지급사례와 동시에 집약적으로 제공한다. 이를 통해서 고객들에게 보험의 중요성과 필요성을 더욱 깊이 인식시켜 청약신청 단계로 유인시킴으로써 온라인보험의 판매를 지원하게 된다.

딥러닝 기술을 적용한 그래프 알고리즘 성능 연구 (Research on Performance of Graph Algorithm using Deep Learning Technology)

  • 노기섭
    • 문화기술의 융합
    • /
    • 제10권1호
    • /
    • pp.471-476
    • /
    • 2024
  • 다양한 스마트 기기 및 컴퓨팅 디바이스의 보급에 따라 빅데이터 생성이 광범위하게 일어나고 있다. 기계학습은 데이터의 패턴을 학습하여 추론을 수행하는 알고리즘이다. 다양한 기계학습 알고리즘 중에서 주목을 받는 알고리즘은 신경망 기반의 딥러닝 학습이다. 딥러닝은 다양한 응용이 발표되면서 빠른 성능 향상을 달성하고 있다. 최근 딥러닝 알고리즘 중에서 그래프 구조를 활용하여 데이터를 분석하려는 시도가 증가하고 있다. 본 연구에서는 그래프 구조를 활용하여 딥러닝 네트워크에 전달하기 위한 그래프 생성 방법을 제시한다. 본 논문은 그래프 생성 과정에서 노드의 속성과 간선의 가중치를 일반화하고 행렬화 과정을 제시하여 딥러닝 입력에 필요한 구조로 전환하는 방법을 제시한다. 그래프 생성 과정에서 속성과 가중치 정보를 보전할 수 있는 선형변환 매트릭스 적용 방법을 제시한다. 마지막으로 일반 그래프의 딥러닝 입력 구조를 제시하고 성능 분석을 위한 접근법을 제시한다.

번들상품추천시스템 개발을 위한 객체지향 사례베이스 설계와 유사도 측정에 관한 연구 (An Object-Oriented Case-Base Design and Similarity Measures for Bundle Products Recommendation Systems)

  • 정대율
    • 지능정보연구
    • /
    • 제9권1호
    • /
    • pp.23-51
    • /
    • 2003
  • 인터넷 쇼핑몰에서 사례기반추론기법을 통한 유사상품의 탐색과 사용자 요구에 적합한 상품추천을 위해서는 다양한 요구에 부응할 수 있는 사례베이스의 구축이 우선되어야 한다. 그리고 구축된 사례베이스로부터 유사한 사례를 검색하여 재 사용하거나 필요시 수정하고, 그 결과를 다시 저장하는 기능이 요구된다. 사례기반 상품추천시스템 개발에 있어 가장 중요한 요소는 사례의 표현문제이다. 본 연구에서는 인터넷 수산물 쇼핑몰의 상품추천시스템에서 번들상품 구성문제(집안 이벤트 시 필요한 수산물의 집합)를 표현하는데 적합한 사례표현기법을 개발하며, 유사사례를 추출하기 위한 유사도 척도의 개발에 연구의 첫 번째 주안점을 둔다. 본 논문에서는 번들상품추천을 위한 사례표현기법으로 객체모델링(OMT)기법을 사용하고 있다. 또한 다양한 사례 속성 유사도 측정방법을 적용하며, 유사도 측정에서 분류법(taxonomy)의 의미와 그 적용방법을 제시한다.

  • PDF

플랜트 설비 문서로부터 설비사양 추출 및 유사설비 사양 교차 검증 접근법 (A Method for Extracting Equipment Specifications from Plant Documents and Cross-Validation Approach with Similar Equipment Specifications)

  • 이재현;최승언;서효원
    • 한국산업정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.55-68
    • /
    • 2024
  • 플랜트 엔지니어링 기업은 서로 다른 공종별 부서에서 플랜트 공정/설비/파이프/계장 등 각 관련 분야의 요구사항 문서를 작성하거나 참조하게 된다. 공정 관련 요구사항 문서는 공정에 대한 설명과 함께 이를 운영할 설비 또는 관련 시설의 요구사항들을 포함한다. 각 공종별 문서에 기술된 설비 또는 부품에 관련된 요구사항과 사양 정보는 문서의 작성자와 검토자들이 다르기 때문에 상호 간에 불일치가 발생할 가능성이 있다. 이 사항들에 대한 일치성을 확인하는 것은 전체 플랜트 설계 정보의 신뢰도를 높일 수 있다. 하지만, 문서의 양이 방대하고 서로 다른 문서들에 동일한 설비 부품에 대한 요구사항들이 일반 문장 형태로 흩어져 있기에 이를 사람이 추적하여 관리하는 것은 한계가 있다. 본 논문에서는 서로 다른 문서들 내에 기술된 요구사항 문장들을 분석하여 설비 또는 설비 부품과 관련된 요구사항 문장의 유사도를 계산하여 의미적으로 동일한 문장을 찾아내는 방법을 제안한다. 요구사항 문장의 유사도를 계산하기 위하여 의미적으로 요구사항의 중심이 되는 부품과 속성을 개체명 인식 방법을 활용하여 찾아내고, 찾아진 부품과 속성들의 유사도를 계산하여 두문장이 의미적으로 동일함을 판단하는 방법을 제안한다. 플랜트 현장에서 사용하는 문서의 문장들을 예제로 하여 제안하는 방법을 설명하고 실험 결과를 설명한다.

지식 데이타베이스를 적용한 효율적인 세균 의료영상 검색 시스템의 구현 (Implementation of an Efficient Microbial Medical Image Retrieval System Applying Knowledge Databases)

  • 신용원;구봉오
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.93-100
    • /
    • 2005
  • 본 연구는 신규 임상병리사로 하여금 보다 정확한 의사결정과 효율적인 교육에 이용할 수 있는 지식 및 내용 기반 의료 세균화상 검색 시스템을 설계 및 구현하는 것이다. 이를 위해, 먼저 알고리듬방식의 검색 이전에 경험적 지식을 바탕으로 세균동정단계 중 가장 빠른 경로를 탐색하여 원인균 동정에 소요되는 시간을 줄일 수 있도록 룰 베이스를 근거로 유연성 있는 탐색경로를 설정하여 전체적인 추론을 수행한다. 다음으로, 색상 모델 중에서 HSV 컬러 모델을 이용하여 세균화상 중에서도 특히 세균화상으로부터 시각정보의 색상 특징 벡터를 추출할 수 있는 색상 특징 추출방법을 제안한다. 아울러 대용량 세균화상 데이터베이스를 기반으로 보다 빠른 검색 성능을 위해, 배지, 검체, 부서, 세균명과 같은 단순속성들에 대해서는 B+-트리, 세균화상에 대한 부가적인 설명 정보로부터 추출한 키워드들에 대해서는 역화일기법, 그리고 화상으로부터 추출한 고차원 색상 특징벡터에 대해서는 스캔-기반 필터링(Scan-Based Filtering:SBF) 기법을 결합한 통합 색인기법을 기술한다. 마지막으로 구현된 시스템은 시각적인 내용 자체의 정보와 지식을 이용하여 효과적으로 복잡한 세균화상을 검색 및 관리할 수 있는 가능성을 보인다. 아울러 구현한 지식 및 내-용기반 세균화상 검색 시스템을 통해 임상분야의 지식을 잘 구조화함으로써 초보적인 임상병리사의 학습기간을 현저히 단축시킬 수 있을 것으로 기대된다.

  • PDF

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.