• 제목/요약/키워드: 의사 결정 트리

검색결과 242건 처리시간 0.027초

비신호 횡단보도에서의 어린이 횡단행태 분석 연구 (A Study on Analyzing Children's Crossing Behaviors on Non-signalized Crosswalk)

  • 이덕환;이윤석;김원호;이백진
    • 대한교통학회지
    • /
    • 제31권3호
    • /
    • pp.19-32
    • /
    • 2013
  • 본 연구의 목적은 그간 교통안전 정책에서 간과되어온 어린이 보행자 횡단행태에 대한 분석을 통해 향후 어린이 교통안전 정책을 개선하기 위한 기초자료를 제공함에 있다. 어린이 횡단행태 분석은 물리적 형태와 사고발생빈도가 상이한 어린이 보호구역에서의 횡단행태 및 패턴의 차이를 비교하는 부분에 초점을 두고 이루어졌다. 자료는 경기도 7개 초등학교 비신호 횡단보도를 대상으로 현장관찰과 비디오 녹화를 통해 수집하였으며, 통계분석, CHAID 알고리즘 분석, 통행 패턴비교를 실시하였다. 분석결과, 사고발생 빈도와 유의한 관계가 있는 횡단특성은 대기유무, 주의유무, 특이행동 유무 순으로 나타났다. 구체적으로 사고발생빈도가 낮은 지점에서 대기후 횡단하는 비율이 69.1%인 반면, 사고다발지점에서 대기를 하지 않고 횡단하는 경우가 83.6%로 상이함을 확인하였다. 횡단 전 대기 및 주의 정도는 횡단 시작부 보도폭이 넓고 학교 출구에서 횡단보도까지 거리가 일정규모 이상일 때 높게 나타났다. 한편, 횡단패턴과 사고발생빈도의 관계성은 뚜렷하게 나타나지 않았다. 향후 어린이 보호구역의 안전성 개선을 위해서는 대기 후 통행이 이루어질 수 있도록 각 보호구역에서의 어린이 횡단특성에 기반한 차별화된 맞춤형 접근이 긴요할 것으로 판단된다.

지식 데이타베이스를 적용한 효율적인 세균 의료영상 검색 시스템의 구현 (Implementation of an Efficient Microbial Medical Image Retrieval System Applying Knowledge Databases)

  • 신용원;구봉오
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권1호
    • /
    • pp.93-100
    • /
    • 2005
  • 본 연구는 신규 임상병리사로 하여금 보다 정확한 의사결정과 효율적인 교육에 이용할 수 있는 지식 및 내용 기반 의료 세균화상 검색 시스템을 설계 및 구현하는 것이다. 이를 위해, 먼저 알고리듬방식의 검색 이전에 경험적 지식을 바탕으로 세균동정단계 중 가장 빠른 경로를 탐색하여 원인균 동정에 소요되는 시간을 줄일 수 있도록 룰 베이스를 근거로 유연성 있는 탐색경로를 설정하여 전체적인 추론을 수행한다. 다음으로, 색상 모델 중에서 HSV 컬러 모델을 이용하여 세균화상 중에서도 특히 세균화상으로부터 시각정보의 색상 특징 벡터를 추출할 수 있는 색상 특징 추출방법을 제안한다. 아울러 대용량 세균화상 데이터베이스를 기반으로 보다 빠른 검색 성능을 위해, 배지, 검체, 부서, 세균명과 같은 단순속성들에 대해서는 B+-트리, 세균화상에 대한 부가적인 설명 정보로부터 추출한 키워드들에 대해서는 역화일기법, 그리고 화상으로부터 추출한 고차원 색상 특징벡터에 대해서는 스캔-기반 필터링(Scan-Based Filtering:SBF) 기법을 결합한 통합 색인기법을 기술한다. 마지막으로 구현된 시스템은 시각적인 내용 자체의 정보와 지식을 이용하여 효과적으로 복잡한 세균화상을 검색 및 관리할 수 있는 가능성을 보인다. 아울러 구현한 지식 및 내-용기반 세균화상 검색 시스템을 통해 임상분야의 지식을 잘 구조화함으로써 초보적인 임상병리사의 학습기간을 현저히 단축시킬 수 있을 것으로 기대된다.

  • PDF

확장 베이지안망을 적용한 고위험성 HRCT 영상 분류 (Classification of Very High Concerns HRCT Images using Extended Bayesian Networks)

  • 임채균;정용규
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.7-12
    • /
    • 2012
  • 최근 의료분야에서는 방대한 양의 정보를 효과적으로 처리하기 위하여 의사결정트리, 신경망, 베이지안망 등을 비롯한 각종 데이터마이닝 기법의 적용 방안을 연구하고 있다. 또한 환자의 기본적인 신상정보나 과거력, 가족력과 같은 정보 이외에도 MRI, HRCT 등의 영상정보를 추가적으로 수집하고 진단에 활용함으로써 질병진단의 정확도 향상을 도모하는 것이 일반적인 현황이다. 하지만 실제 상황에서는 결과에 영향을 미치는 다량의 변수가 존재하므로 특정 데이터마이닝 기법을 통하여 얻을 수 있는 정보가 상당히 제한적이라고 볼 수 있다. 그뿐만 아니라 촬영된 의료영상도 부수적으로 진단에 긍정적인 영향을 줄 수는 있지만, 주관적인 판단 비중이 높아 자동화된 시스템으로 처리하기가 난해한 문제이다. 이에 따라 현실의 복잡한 상황에서 상대적으로 대처가 유리하고 다변량 확률적인 모델을 기반으로 하는 베이지안망에서 K2나 TAN 등으로 탐색 알고리즘을 개선한 확장 모델이 제안되었다. 이 때, 적용되는 탐색 알고리즘의 종류에 따라 그 성능이 크게 좌우되는 확장 베이지안망의 특성상, 각 기법에 대한 성능과 적합성의 사실적인 평가가 요구된다. 따라서 본 논문에서는 확장 베이지안망에서 질병 진단에 대한 동일한 데이터를 이용하여 실험을 수행하였으며, K2, TAN과 같은 탐색 알고리즘에 변화를 주며 분류 정확도를 측정하였다. 실험에서는 10-fold 교차검증을 수행한 결과분석을 기반으로 성능을 비교평가하고, 발병 위험성이 높은 환자에 대한 HRCT 영상을 분류하여 고위험성의 데이터를 식별 가능하도록 하였다.

PGA 투어의 골프 스코어 예측 및 분석 (Prediction of golf scores on the PGA tour using statistical models)

  • 임정은;임영인;송종우
    • 응용통계연구
    • /
    • 제30권1호
    • /
    • pp.41-55
    • /
    • 2017
  • 최근 골프는 많은 사람들의 취미 생활로서 자리를 잡아가고 있으며 골프와 관련된 연구도 다양하게 이루어지고 있다. 본 연구에서는 데이터 마이닝 기법을 사용하여 PGA 투어에 참여하는 선수들의 평균스코어를 예측하고 스코어에 유의한 영향을 미치는 변수들을 제시하고자 한다. 그리고 추가적으로 4개의 PGA 투어 플레이오프에 대해 상위 10명, 상위 25명의 선수들을 예측하는 것을 목표로 한다. 우리는 다양한 선형/비선형 회귀분석 방법을 이용하여 평균스코어를 예측하는데, 선형회귀분석 방법으로는 단계적 선택법, 모든 가능한 회귀모형, 라소(LASSO), 능형회귀, 주성분회귀분석을 사용하였으며 비선형회귀분석 방법으로는 트리(CART), 배깅, 그래디언트 부스팅, 신경망 모형, 랜덤 포레스트, 최근접이웃방법(KNN)을 사용하였다. 대부분의 모형에서 공통적으로 선택된 변수들을 살펴보면 페어웨이의 단단함와 그린의 풀의 높이, 평균최대풍속이 높을수록 선수들의 평균스코어는 높아지며 반대로 한 번에 퍼팅을 성공시키는 횟수와 그린적중률 실패 후 버디나 이글로 점수를 만드는 scrambling 변수들, 그리고 공을 멀리 보낼 수 있는 능력을 나타내는 longest drive는 그 값이 높아짐에 따라 선수들의 평균스코어가 낮아지는 경향이 있음을 알 수 있었다. 11가지 모형 모두 테스트 데이터인 2015년 경기 결과를 예측하는데 낮은 오류율을 보였으나 배깅과 랜덤 포레스트의 예측률이 가장 좋았으며 두 모형 모두 상위 10명과 상위 25명의 랭킹을 예측할 때 상당히 높은 적중률을 보였다.

생활 습관, 주거지 주변 녹지 비율 및 지하수 내 라돈 농도 따른 실내 라돈 농도 영향 모델 (Affected Model of Indoor Radon Concentrations Based on Lifestyle, Greenery Ratio, and Radon Levels in Groundwater)

  • Lee, Hyun Young;Park, Ji Hyun;Lee, Cheol-Min;Kang, Dae Ryong
    • Journal of health informatics and statistics
    • /
    • 제42권4호
    • /
    • pp.309-316
    • /
    • 2017
  • 라돈 및 그 자손은 폐암을 일으키는 환경적 위험인자로, 일상 활동 및 수면 등으로 많은 시간을 보내는 실내 라돈 농도 관리는 필수적이다. 이를 위해서는, 주거지를 둘러싼 개인적, 사회적, 환경적 요소에 대한 총체적 접근이 필요하다. 따라서 본 연구는 실내 라돈 농도에 영향을 미치는 다양한 인자를 찾아내고, 이를 활용한 포괄적 모델을 구축하고자 한다. 건축 자재 및 생활 양식을 포함한 주거 환경에 대한 자료를 얻기 위해 설문을 실시하였고, 의사결정트리 및 구조 방정식 모델링을 활용하였다. 그 결과 주거지 주변 녹지 비율, 불 투과성 층 비율, 주택과 지면의 맞닿은 상태, 매일 환기 습관, 난방 습관, 측정 장치 주위의 균열 및 침실여부는 실내 라돈 농도와 유의한 연관성을 보였다. 매일 환기 습관을 가질 경우 실내 라돈 농도가 $200Bq/m^3$ 이상인 비율이 11.6%로 줄었다. 한편 매일 환기습관이 없는 주거자의 주거지 주변 녹지 비율이 65% 이상이면 매일 환기 습관이 있는 주거자와 비교하여 15.3%의 비율이 증가하였다. 구축된 포괄적 모델의 실내 라돈 농도에 직접 영향을 미치는 인자는 주거지 주변 녹지 비율과 환기율이었다. 제시된 모델로 국내 라돈 농도에 대한 개인의 지리적 특성, 지하수 및 생활 양식 요소의 결합된 영향을 확인할 수 있었다.

A Study on the Classification of Unstructured Data through Morpheme Analysis

  • Kim, SungJin;Choi, NakJin;Lee, JunDong
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.105-112
    • /
    • 2021
  • 빅데이터 시대에 접어들며 데이터에 대한 관심이 폭발적으로 늘어나고 있다. 특히, 인터넷 및 소셜미디어의 발전은 새로운 데이터들의 생성으로 연결되어 빅데이터와 인공지능 시대의 실현과 융합 기술의 새로운 장을 열 수 있게 되었으며, 과거에는 프로그램으로 다루지 못하던 데이터에 대한 분석 요구가 많이 발생하고 있다. 본 논문에서는 빅데이터 시대에서 많이 요구되는 비정형 데이터에 대한 분류를 위하여 분석 모델을 설계하고 이를 검증하였다. 데이터는 디비피아의 논문 요약과 주제어, 그리고 부주제 어를 크롤링하였으며, 코엔엘피의 데이터 사전을 이용해 데이터베이스를 생성하고, 형태소 분석을 통하여 단어의 토큰화 과정을 수행하였다. 또한, 카이스트의 9 품사 분류 체계를 이용해 명사를 추출하고, TF-IDF 값을 생성하였으며, 학습 데이터와 Y 값을 결합하여 분석 데이터 셋을 생성하였다. 이와 같이 생성된 분석 데이터 셋에 랜덤 포레스트와 서포트 벡터 머신 그리고 의사결정트리, 이렇게 세 가지 분석 알고리즘을 적용하여 분류의 적정성을 측정하였다. 본 논문에서 제안한 분류 모델 기법은 논문 분류 외에도 민원 분류 분석 및 텍스트 관련 분석 등 다양한 분야에 유용하게 사용될 수 있다.

하이테크 공장의 효율적 건설 사업비 분석 및 예측을 위한 WBS·CBS 기반 건설정보 분류체계 구축 (Establishment of WBS·CBS-based Construction Information Classification System for Efficient Construction Cost Analysis and Prediction of High-tech Facilities)

  • 최성훈;김진철;권순욱
    • 한국콘텐츠학회논문지
    • /
    • 제21권8호
    • /
    • pp.356-366
    • /
    • 2021
  • 국가 경제를 이끌고 있는 하이테크 산업은 일반 건축물에 비해 투자비 규모가 크고 공사 기간이 짧으며 지속적인 투자가 필요한 특성으로 인하여 정확한 공사비 예측과 빠른 의사결정은 효율적인 비용 및 공정 관리를 위한 중요한 요소이다. 국외의 경우, 1980년부터 건설정보 분류체계 표준화를 시행하고 지속적인 발전을 이루어, 체계적으로 프로젝트 전 생애 주기 정보를 수집·활용하는 등 건설 생산성을 향상시키고 있다. 반면, 국내의 건설 현장에서는 건설정보 분류체계의 표준화를 위한 시도들이 있었으나, 표준화 주체의 부재, 건설사별 비용 및 공정관리 방식의 차이로 인한 지속적인 표준화 및 체계화가 이루어지는 데 어려움을 겪고 있다. 특히 하이테크 산업의 경우, 큰 규모, 수많은 공종, 복잡한 공사, 보안 등의 문제로 인하여 하이테크 공장 건설을 위한 건설정보 분류체계 표준화·체계화 수준이 매우 낮다. 따라서 본 연구의 목적은 국내 건설된 관련 프로젝트 데이터를 수집·분류·분석을 통하여 하이테크 공장 건설에 적합한 건설정보 분류체계를 구성하는 데 있다. 본 연구를 통해 분류·분석된 WBS(Work Breakdown Structure)·CBS(Cost Breakdown Structure)를 기반으로 계층적 구분을 통한 코드체계를 제안하였고, WBS와 CBS를 연계를 통한 건축물의 비용 모델을 입체화 및 활용 방법을 제시하였다. 이를 통하여, 일반적인 건설정보 구분 체계인 일 방향의 트리구조를 벗어나 상호 관계성을 기반으로 한 정보 분류체계가 가능하여, 공사 기간 단축 및 비용 절감 등 효과를 극대할 수 있을 것이다.

머신러닝을 활용한 자동차 시트용 폴리우레탄 발포공정의 불량 예측 모델 개발 (A Development of Defeat Prediction Model Using Machine Learning in Polyurethane Foaming Process for Automotive Seat)

  • 최낙훈;오종석;안종록;김기선
    • 한국산학기술학회논문지
    • /
    • 제22권6호
    • /
    • pp.36-42
    • /
    • 2021
  • 최근 4차 산업혁명으로 인해 제조업계에서는 제조업의 인공지능을 접목시켜 효율성을 극대화하는 스마트 팩토리 붐이 일어나고 있다. 특히 자동차 부품 제조 및 생산에 널리 적용되어 불량을 낮추는 연구들이 활발히 진행되고 있다. 이에 본 연구에서는 머신러닝을 통한 불량예측을 시트 폼 발포공정에 접목시켜 발포공정의 효율성을 극대화하는 연구를 진행하였다. 자동차 시트폼 에서 주로 사용되는 폴리우레탄 폼(polyurethane foam)은 폴리올(polyol, 이하 POL)과 이소시아네이트(isocyanate, 이하 ISO)를 혼합 및 발포하는 공정으로 제조되며, 각 원료의 혼합비율과 온도의 변화에 따라 제품의 특성이 변화한다. 이에 본 연구에서는 발포공정에서 수집되는 인자별 데이터값을 머신러닝에 적용하여 불량을 예측하고자 한다. 머신러닝에 사용되는 알고리즘으로는 의사결정트리, kNN, 앙상블 알고리즘을 사용하였으며 학습은 5,147개의 데이터를 사용하였으며, 학습된 결과를 1,000개의 검증용 데이터에 적용한 결과, 세 알고리즘 중 앙상블 알고리즘에서 최대 98.5 %의 정확도를 확인할 수 있었다. 이러한 결과를 통해 발포공정에서 실시간으로 수집되는 데이터를 통해 현재 생산되는 부품의 불량 여부를 확인할 수 있으며, 나아가 각 인자를 조절하여 불량률을 개선할 수 있음을 짐작할 수 있다고 사료된다.

정수장 전염소 공정제어를 위한 침전지 잔류염소농도 예측 머신러닝 모형 (Machine learning model for residual chlorine prediction in sediment basin to control pre-chlorination in water treatment plant)

  • 김주환;이경혁;김수전;김경훈
    • 한국수자원학회논문집
    • /
    • 제55권spc1호
    • /
    • pp.1283-1293
    • /
    • 2022
  • 본 연구는 정수장의 수처리 공정에서 계측되고 있는 수량 및 수질데이터의 활용과 수처리 공정제어의 지능화를 위한 것으로 정수장에서 전염소 공정이 수반되는 처리공정에서 침전지 유출수 잔류염소농도 안정화를 위하여 이를 추정할 수 있는 모형을 구축하고자 하였다. 정수장 침전지 유출수의 잔류염소농도를 예측하기 위하여 중회귀모형과 인공지능 알고리즘 중 다층퍼셉트론 신경망, 랜덤포레스트 및 장단기기억(Long Short Term Memory; LSTM) 모형을 활용하였고 그 결과를 비교, 평가하였다. 모형의 입력변수로는 전염소 공정이 도입된 정수장에서의 잔류염소농도, 수온, 탁도, pH, 전기전도도, 유량, 알칼리도 등이 사용되었고 전염소에 따른 침전지의 안정적 운영을 위해 요구되는 침전지 잔류염소농도를 출력변수로 구성하였다. 적용 결과에서는 랜덤포레스트 모형이 가장 양호한 결과를 보여 주었으며 다음으로 LSTM, 다층퍼셈트론 신경망 순으로 나타났다. 수학적 모형인 중회귀모형은 적합도 측면에서 가장 낮은 결과를 보여 주었는데, 이는 수량과 수질데이터의 수치적인 규모나 차원의 차이뿐만 아니라 계절별 수질특성에 따라 염소소비 특성이 매우 다양하게 반응하기 때문으로 판단된다. 따라서 정수장 수처리 공정에서 인공지능 알고리즘의 적용을 위해서는 랜덤포레스트와 같이 의사결정 트리구조의 도입과 적용이 타당한 것으로 나타났다. 본 연구에서 분석된 결과를 근거로 전염소 공정이 도입된 정수장 수처리 공정에서 염소주입량을 실시간으로 예측 가능하게 함으로써 침전지 유출수에서 잔류염소농도를 일정하게 유지하는데 기여할 수 있을 것으로 기대된다.

점진적 기계학습 기반의 레이더 위협체 역추정 모델 생성 및 갱신 (Managing the Reverse Extrapolation Model of Radar Threats Based Upon an Incremental Machine Learning Technique)

  • 김철표;노상욱
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권4호
    • /
    • pp.29-39
    • /
    • 2017
  • 다양한 전자전 상황에서 단위 위협체에 대하여 전자전 모델링과 시뮬레이션을 수행할 수 있는 통합 전자전 시뮬레이터의 개발 필요성이 대두되고 있다. 본 논문에서는 전자전 상황에서 전자정보 수집신호의 변수를 기반으로 전자파 신호를 발산하는 레이더 위협을 역추정하기 위한 시뮬레이션 시스템의 구성요소를 분석하고, 역추정 모델을 점진적으로 유지할 수 있는 방법을 제안한다. 또한, 실험을 통하여 점진적 역추정 모델 갱신 기법의 유효성 및 개별 역추정 결과의 통합 기법을 평가한다. 개별 역추정 모델의 생성을 위하여 의사결정트리, 베이지안 분류기, 인공신경망 및 유클리디안 거리 측정방식과 코사인 유사도 측정방식을 활용하는 군집화 알고리즘을 이용하였다. 첫 번째 실험에서 레이더 위협체에 대한 역추정 모델을 구축하기 위한 위협 예제의 크기를 점진적으로 증가시키면 역추정 모델의 정확도는 향상되었으며, 이러한 과정이 반복되면 역추정 모델에 대한 정확도는 일정한 값으로 수렴하였다. 두 번째 실험에서는 개별 역추정 모델의 결과를 통합하기 위하여 투표, 가중투표 및 뎀스터-쉐이퍼 알고리즘을 이용하였으며, 역추정 모델의 통합 결과는 뎀스터-쉐이퍼 알고리즘에 의한 역추정 정확도가 가장 좋은 성능을 보였다.