• 제목/요약/키워드: 유추 예측

검색결과 121건 처리시간 0.039초

입력 데이터 형식 및 Positive/Negative에 따른 한국어 증상 기반 질병 예측 모델 (Korean Symptom-Based Disease Prediction Model according to Input Data Format and Positive/Negative)

  • 김민정;조인휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.418-421
    • /
    • 2023
  • 본 논문은 Word2Vec를 이용하여 한국어 증상 기반 질병 예측 모델을 제시한다. 아산병원 질환 백과의 크롤링 데이터를 세 가지 형식으로 나누어, 모델에 알맞은 데이터 형식을 찾고 모델에 적용한다. 가장 모델에 맞는 데이터 형식은 증상별 질병과 질병별 증상을 합친 경우이다. 데이터의 양을 늘려 임베딩 스페이스를 넓혔고, 가장 중요한 증상과 질병의 유사도도 정확하게 출력되었다. 이는 유사도가 높은 질병과 증상들이 제대로 학습이 되었다는 것을 알 수 있다. 이렇게 만들어진 예측 모델에 positive 증상을 입력하면 유사도가 향상되고, negative에 입력하면 하락하는 결과를 확인했다. 따라서 환자의 증상을 positive에 넣으면, 그 증상을 가진 질병이 가까워지는 반면, 환자의 증상이 아닌 증상을 negative에 넣으면, 환자에게 맞지 않는 질병이 멀어진다. 그러므로 환자의 상태에 맞는 질병을 유추해, 의사나 환자가 증상에 대한 질병을 알고 싶을 때 또는 검색에 유용하게 사용할 수 있다. 더불어, 질병의 진료과 데이터를 추가하여, 환자에게 맞는 진료과를 찾는 데도 도움을 줄 수 있다.

레이블 멱집합 분류와 다중클래스 확률추정을 사용한 단백질 세포내 위치 예측 (Prediction of Protein Subcellular Localization using Label Power-set Classification and Multi-class Probability Estimates)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권10호
    • /
    • pp.2562-2570
    • /
    • 2014
  • 단백질의 기능을 유추할 수 있는 중요한 정보중의 하나는 단백질이 존재하는 세포내 위치이다. 최근에는 하나의 단백질이 동시에 존재하는 여러 세포내 위치를 예측하는 연구가 활발하다. 본 논문에서는 단백질이 존재하는 세포내의 다중위치를 예측하기 위해서 레이블 멱집합 방법을 개선한다. 레이블 멱집합 방법으로 분류한 다중위치들을 예측 확률에 따라 결합하여 최종적인 다중레이블로 분류한다. 각 다중위치에 대한 정확한 확률적 기여를 구하기 위하여 쌍별 비교와 오류정정 출력코드를 사용한 다중클래스 확률추정 방법을 적용하였다. 단백질 세포내 위치 예측 실험에 제안한 방법을 적용하여 성능이 향상됨을 보였다.

데이터기반의 신규 사업 매출추정방법 연구: 지능형 사업평가 시스템을 중심으로 (A Data-based Sales Forecasting Support System for New Businesses)

  • 전승표;성태응;최산
    • 지능정보연구
    • /
    • 제23권1호
    • /
    • pp.1-22
    • /
    • 2017
  • 사업타당성 분석이나 기업 기술가치평가 등 미래의 사업에 대한 진입이나 투자 타당성을 분석하기 위해서는 새로운 사업과 관련한 시장을 추정하고 그 안에서 확보 가능한 매출을 객관적으로 추정하는 과정이 필수 불가결하다. 이런 신규 매출이나 시장규모의 추정 방법은 다양한 방법으로 구분이 가능한데 크게 정량적인 방법과 정성적인 방법으로 구분할 수 있다. 그러나 두 가지 방법 모두 많은 자원과 시간을 필요로 한다. 그래서 우리는 신규 사업의 평가지원을 위한 데이터 기반의 지능형 매출 예측 시스템을 제안하고자 한다. 본 연구는 사업타당성 분석이나 기술가치평가를 위한 신규 사업의 매출 추정 시스템을 개발하는데, 알고리즘 기반으로 전통적인 정량 예측방법 중 하나인 유추방법에 주목했다. 동일한 국내 산업에서 최근 창업한 기업의 매출 실적을 국내 신규 사업의 매출액을 추정하는 유추 대상 변수로 활용할 수 있는지 검토한다. 여기서 유추예측 대상은 최초 매출액과 초기 성장률이며, 주요 비교 차원은 산업분류, 창업시기 등이 고려된다. 특히 본 연구는 우리나라 창업 기업이 가지는 매출 성장률의 평균회귀 현상을 활용하는 지능형 정보 지원 시스템을 제안하다. 본 연구에서는 신규 매출 추정을 위해서 역사적 자료인 창업 매출 실적을 활용하는 방법이 적절한지 판단하기 위해서 잠재성장모형 등을 활용해 산업분류에 따른 신규 사업의 초기 매출액과 연도별 성장률이 산업분류별로 차이가 있는지 분석한다. 기존 기업의 창업 후 4년간 매출 성과의 종단자료를 잠재성장모형으로 분석하는데, 특정 산업분류에서 차이를 보여주는지 분석해 산업분류가 유추 예측에서 고려해야할 유의미한 변수인지 분석하는 것이다. 본 연구의 결과는 신속하고 객관적인 신규 사업 매출 추정을 가능하게 하는 지능형 정보시스템을 개발하게 해서 사업성타당성 분석이나 기술가치평가 과정의 효율성을 개선시켜 줄 것으로 기대된다.

모바일폰에서의 멀티태스킹 사용 맥락조사 (Contextual Inquiry on Multi-tasking Using a Mobile Phone)

  • 정승은;이정윤;이신혜;류한영
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.938-943
    • /
    • 2009
  • 본 연구는 모바일폰 사용자의 멀티태스킹 니즈를 중심으로 태스크간의 이동을 유추함으로써, 각 태스크 별로 멀티태스킹이 지원되어야 하는 최소의 태스크 집단을 보여주고자 진행된, 멀티태스킹을 위한 모바일폰 인터페이스 설계의 기초 연구이다. 사용자가 여러 가지 태스크가 일어나는 상황을 예측한다는 것은 어려운 일이기 때문에, 먼저 모바일폰의 기능에서 도출된 16 가지 주요 태스크 별로 일대일로 대응되는 멀티태스킹 니즈를 조사하였다. 하나의 태스크에서 멀티태스킹 니즈가 있는 태스크가 도출되며, 다시 그 태스크에 나타난 멀티태스킹 니즈를 찾아가는 유추의 방식으로 태스크 간의 이동을 간략화하여 멀티태스킹 시나리오 다이어그램을 도출하였다. 여러 개의 태스크가 동시에 일어날 때 멀티태스킹이 어떠한 과정을 통하여 나타나는 가를 체계화하는 이러한 과정은, 향후 멀티태스킹 맥락을 고려한 사용자 중심 인터페이스 개발에 적용할 수 있을 것으로 기대된다.

  • PDF

인문사회기반 융합연구 의제 도출 연구 (A Study of Agenda Mining for Humanities-Based Convergence Research)

  • 박민수;노영희
    • 한국콘텐츠학회논문지
    • /
    • 제20권4호
    • /
    • pp.62-76
    • /
    • 2020
  • 본 연구에서는 인문사회기반 융합연구의 관점에서 미래유망기술을 분석하여 메가트렌드, 트렌드, 이슈로 정리하여 미래 환경에 대한 예측과 인간의 삶과 밀접하게 관련이 있을 것으로 예상되는 기술에 대한 탐색을 수행하고 궁극적으로 이를 통해 다양한 사회문제를 해결할 수 있는 융합연구 의제를 예측하고자 하였다. 우선 다양한 미래 유망기술에 대해 언급한 문헌을 조사하고 이를 분석하여 핵심 키워드를 분석하였고 가장 빈번하게 사용되는 핵심키워드를 정리하여 트렌드를 유추하였다. 이어서 유추된 트렌드를 계층화하여 정리하고 핵심트렌드와 파생트렌드로 분류하여 이를 바탕으로 융합연구 의제(어젠다)를 도출하였다. 이렇게 도출된 해당 의제의 필요성, 혁신성, 융합성, 실현가능성, 미래지향성, 수용가능성을 설문조사를 통하여 조사하였다. 분석결과 융합연구를 수행하는 연구자들은 가까운 미래에 실현가능한 기술로 일상생활과 밀접한 사회문제를 다루는 의제들에 높은 관심을 보이는 것으로 나타났고 반면 먼 미래에 실현가능한 기술이나 테러 혹은 국제적 분쟁과 같은 의제에 대해서는 다소 낮은 관심을 보이는 것으로 나타났다.

우리나라 근해의 해수면 온도 및 기온과 강수량과의 상관성 분석 (Correlation Analysis between Sea Surface Temperature in the near Korea and Rainfall/Temperature)

  • 권현한;오태석;안재현;문영일
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.1460-1464
    • /
    • 2006
  • 강수량의 특성 및 계절적인 양상은 지협적인 원인이기 보다는 해수면 온도(sea surface temperature)와 같은 기상 현상에 주로 영향을 받는다. 이러한 관점에서 강수량과 같은 수문변량의 장기적인 거동을 기상인자로부터 유추하고자 하는 연구는 무엇보다 중요하며 이러한 추론을 바탕으로 강수량의 장기예측 및 모의를 위한 기본적인 도구로 활용을 가능케 한다. 따라서 본 연구의 주요 목적은 해수면 온도를 기본으로 강수량과 기온의 변동성 및 상관성을 분석하고자 하며, 무엇보다 한반도 근해의 해수면 온도와의 직 간접적인 개연성을 살펴봄으로서 보다 효과적인 강수량 예측을 위한 하나의 변수로서의 가능성을 평가하고자 한다. 이를 위해 다양한 분석 방법 즉, 연주기를 제거하지 않은 자료의 선형적인 지체 상관 분석, 연주기를 제거하기 위해 표준화 된 자료의 지체 상관 분석 및 비모수적 상관분석을 수행하였다. 연주기를 제거하지 않은 자료의 경우 매우 강한 상관관계를 나타내었지만 이는 주로 계절 특성으로 인한 것으로 사료된다. 그러나 연주기를 제거한 Anomaly는 상대적으로 매우 작은 상관성을 보이고 있으나 유의성 검토를 통해 통계적으로 유의한 관계가 존재함을 확인 할 수 있었다. 따라서 강수량의 예측을 하나의 변수로서 이용이 가능할 것으로 사료되나 근해뿐만 아니라 한반도 기상의 연관성을 갖는 타 지역기상인자와의 보다 통합적인 검토가 필요하다 하겠다.

  • PDF

Multimodal 데이터에 대한 분류 에러 예측 기법 (Error Estimation Based on the Bhattacharyya Distance for Classifying Multimodal Data)

  • 최의선;김재희;이철희
    • 대한전자공학회논문지SP
    • /
    • 제39권2호
    • /
    • pp.147-154
    • /
    • 2002
  • 본 논문에서는 multimodal 특성을 갖는 데이터에 대하여 패턴 분류 시 Bhattacharyya distance에 기반한 에러 예측 기법을 제안한다. 제안한 방법은 multimodal 데이터에 대하여 분류 에러와 Bhattacharyya distance를 각각 실험적으로 구하고 이 둘 사이의 관계를 유추하여 에러의 예측 가능성을 조사한다. 본 논문에서는 분류 에러 및 Bhattacharyya distance를 구하기 위하여 multimodal 데이터의 확률 밀도 함수를 정규 분포 특성을 갖는 부클래스들의 조합으로 추정한다. 원격 탐사 데이터를 이용하여 실험한 결과, multimodal 데이터의 분류 에러와 Bhattacharyya distance 사이에 밀접한 관련이 있음이 확인되었으며, Bhattacharyya distance를 이용한 에러 예측 가능성을 보여주었다.

자연어 저장소에 기반을 둔 자연어 질의처리를 위한 데이터베이스 활용 방안에 관한 연구 (Utilization of A Data Base for Query Processing of natural language on the Repository of natural language)

  • 전익진;이병래
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1058-1061
    • /
    • 2012
  • 최근 웹을 기반으로 한 계속적인 기술 발전에 따라 의사결정에 필요한 데이터의 요구는 점점 다양해지고 있으며 다양한 요구를 효과적으로 대응하기 위해 데이터 추출 방법에 대한 연구도 지속적으로 이루어지고 있다. 이에 본 논문에서는 자연어를 통해 사용자가 쉽게 원하는 자료를 추출 할 수 있는 방법론을 연구 하였다. 자연어 처리 기술에 대한 연구는 여러 방면에서 이루어지고 있는데 그 중에서도 본 논문에서는 기존의 자연어 처리 연구를 바탕으로 크게 3가지 형태로 연구 진행 하였다. 사용자가 입력한 정보를 바탕으로 유추하여 자연어를 처리하거나 이후 진행될 검색을 선 예측 하는 방법과 사용자 별로 검색되는 자연어를 통해 연관 관계를 설정하여 사용자에게 예측검색을 유도하는 방법 그리고 의사 결정을 위해 구축된 데이터베이스 스키마 정보를 이용하여 사용자가 쉽게 질의 문을 생성할 수 있도록 하는 방법론 연구이다. 본 논문을 통해 연구된 내용은 실제 구축하여 진행 하였고, 연구결과로 생성된 질의 문이 효과적으로 시스템에서 처리 되는 과정에 대한 연구도 함께 진행하고 검증하였다.

무베어링 로터 허브 형상에 대한 요구도 분석 및 항력 예측 (Requirement Analysis and Drag Prediction for the Aerodynamic Configuration of a Bearingless Rotor Hub)

  • 강희정
    • 항공우주기술
    • /
    • 제11권1호
    • /
    • pp.19-26
    • /
    • 2012
  • 무베어링 로터 허브시스템 개발에서 할당된 공기역학적 허브 항력 요구도를 분석하여, 요구도에서 제시된 방법으로 입증 가능하도록 요구도를 구체화 시켰다. 초기 허브 형상에 대해 공력계수에 기반하여 항력 예측을 수행하였으며, 요구도 충족을 위한 설계 변경안을 제시하였다. 최종 형상에 대해 전산유체기법을 사용하여 항력 예측을 수행하였으며, 그 결과 구체화된 요구도를 만족시킴을 확인할 수 있었다. 또한 기 개발된 헬리콥터의 추세선으로부터 유추할 수 있는 허브 항력의 범위 내에 있음을 확인할 수 있다.

일기예보를 이용한 일사량 예측기법개발 (Predict Solar Radiation According to Weather Report)

  • 원종민;도근영;허나리
    • 한국항해항만학회지
    • /
    • 제35권5호
    • /
    • pp.387-392
    • /
    • 2011
  • 태양광발전은 독립전원으로써의 가치는 미미하나 도시전체의 탄소발생량 저감 및 화석연료 사용 저감을 위한 분산전원으로써 가치가 매우 높은 전력원이다. 하지만 태양광발전의 경우 기상조건에 따른 발전량 변동이 심하기에 분산전원으로써 효율적으로 사용하기 위해서는 큰 변동폭을 효과적으로 제어하기 위한 실시간 모니터링이 이루어져야 한다. 하지만 태양광발전량을 좌우하는 일사량은 예측치가 존재하지 않기에 이를 예측해야 하고 본 연구에서는 과거의 일사량을 직산분리 하여 구름의 짙은 정도나 두께 등을 유추할 수 있는 대기투과율을 일기예보에서 발표하는 날씨별로 대푯값을 산정하고 이를 일사량 예측식에 대입하여 일사량을 예측하였다. 그리고 실측 일사량 및 CRM(Cloud Cover Radiation Model)기법인 Kasten and Czeplak의 식을 통해 계산된 예측일사량과의 비교를 통해 검증하였다.