• 제목/요약/키워드: 질병 용어

검색결과 47건 처리시간 0.027초

딥러닝 기반 임상 관계 학습을 통한 질병 예측 (Disease Prediction By Learning Clinical Concept Relations)

  • 조승현;이경순
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.35-40
    • /
    • 2022
  • 본 논문에서는 임상 의사 결정 지원을 위하여 의학 지식을 통해 임상 관계를 추출하고 딥러닝 모델을 이용하여 질병을 예측하는 방법을 제안한다. 의학 사전인 UMLS(Unified Medical Language System)와 암 관련 의학 지식에 포함된 임상 용어를 5가지로 분류한다. 분류된 임상 용어들을 사용하여 위키피디아 의학 문서를 추출한다. 추출한 위키피디아 의학 문서와 추출한 임상 용어를 매칭하여 임상 관계를 구축한다. 구축한 임상 관계를 이용하여 딥러닝 학습을 진행한 후 질의에서 표현된 의학 용어를 바탕으로 질의와 연관된 질병을 예측한다. 이후, 예측한 질병과 관계가 있는 의학 용어를 확장 질의로 선택한 뒤 질의를 확장한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS), TREC Precision Medicine(PM) 테스트 컬렉션에 대해 비교 평가한다.

바이오 마커와 질병 용어의 단어 표현 분석 (Word Representation Analysis of Bio-marker and Disease Word)

  • 윤영신;남경민;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-168
    • /
    • 2015
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다.

  • PDF

당뇨병성 족부질환 - 당뇨발의 치료: 처치와 수술 및 관리

  • 배서영
    • 월간당뇨
    • /
    • 통권289호
    • /
    • pp.26-36
    • /
    • 2013
  • '당뇨발'은 '당뇨환자에서 신경학적 이상이나 말초혈관 이상 때문에 발생하는 발의 궤양으로 감염이나 심부 조직의 파괴를 동반하기도 하는 발의 질병'이라고 정의할 수 있다. 하지만 실제로는 발에 궤양이 발생한 상태가 아니더라도 매우 포괄적인 용어(umbrella term)로서 당뇨병환자에게서 발생하는 발의 만성 합병증을 총칭하는 것이 일반적이다. 왜냐하면 발의 궤양을 동반하지 않는 괴저(괴사), 심부 감염, 신경병증성 관절증(Charcot arthropathy) 등도 당뇨발의 범주에 포함시켜야 하기 때문이다. 이렇게 보면 '당뇨발'이란 의학적 진단명으로는 적절하지 않은 용어라 할 수도 있다. 다만 이미 일반화된 용어로서 환자의 교육과 설명에는 더 유용하다고 할 수 있다.

  • PDF

구성정보와 문맥정보를 이용한 용어의 전문성 측정 방법 (Determining the Specificity of Terms based on Compositional and Contextual Information)

  • 류법모;배선미;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.901-903
    • /
    • 2004
  • 어떤 용어가 전문적인 개념을 많이 내포하고 있을 때 전문성(specificity)이 높다고 말한다. 본 논문에서는 정보이론에 기반한 방법으로 전운용어가 내포하는 전문성을 정량적으로 계산하는 방법을 제안한다. 제안한 방법은 전문용어의 구성정보를 이용하는 방법과 문맥정보를 이용하는 방법으로 나눈다. 구성정보를 이용하는 방법에서는 전문용어틀 구성하는 단어의 빈도수, tf.idf 값, 내부 수식구조 등을 이용하고, 문맥정보를 이용하는 방법에서는 전문용어를 수식하는 단어들의 분포를 이용한다. 제안한 방법은 분야에 독립적으로 적용될 수 있고, 전문용어 생성 절차에 대한 특징을 잘 표현할 수 있는 장정이 있다. MeSH 트리에 포함된 질병명을 대상으로 실험한 결과 82.0%의 정확률을 보였다.

  • PDF

단어 의미 표현과 질병 중심 의학 문서 클러스터 기반 의학 문서 검색 기법 (Method of Document Retrieval Using Word Embeddings and Disease-Centered Document Clusters)

  • 조승현;이경순
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.51-55
    • /
    • 2016
  • 본 논문에서는 임상 의사 결정 지원을 위한 UMLS와 위키피디아를 이용하여 지식 정보를 추출하고 질병중심 문서 클러스터와 단어 의미 표현을 이용하여 질의 확장 및 문서를 재순위화하는 방법을 제안한다. 질의로는 해당 환자가 겪고 있는 증상들이 주어진다. UMLS와 위키피디아를 사용하여 병명과 병과 관련된 증상, 검사 방법, 치료 방법 정보를 추출하고 의학 인과 관계를 구축한다. 또한, 위키피디아에 나타나는 의학 용어들에 대하여 단어의 효율적인 의미 추정 기법을 이용하여 질병 어휘의 의미 표현 벡터를 구축하고 임상 인과 관계를 이용하여 질병 중심 문서 클러스터를 구축한다. 추출한 의학 정보를 이용하여 질의와 관련된 병명을 추출한다. 이후 질의와 관련된 병명과 단어 의미 표현을 이용하여 확장 질의를 선택한다. 또한, 질병 중심 문서 클러스터를 이용하여 문서 재순위화를 진행한다. 제안 방법의 유효성을 검증하기 위해 TREC Clinical Decision Support(CDS) 2014, 2015 테스트 컬렉션에 대해 비교 평가한다.

  • PDF

구성정보와 문맥정보를 이용한 전문용어의 전문성 측정 방법 (Determining the Specificity of Terms using Compositional and Contextual Information)

  • 류법모;배선미;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권7호
    • /
    • pp.636-645
    • /
    • 2006
  • 어떤 용어가 전문적인 개념을 많이 내포하고 있을 때 전문성이 높다고 말한다. 본 논문에서는 용어의 내부 구성정보와 외부 문맥정보를 이용하여 정보이론에 기반한 방법으로 전문용어가 내포하는 전문성을 정량적으로 계산하는 방법을 제안한다. 용어의 전문성은 용어간 상하위어 관계 설정에서 중요한 필요조건으로 사용될 수 있다. 제안한 방법은 전문용어의 내부 구성정보를 이용하는 방법, 문맥정보를 이용하는 방법 그리고 두 정보를 모두 이용하는 방법으로 나눈다. 구성정보를 이용하는 방법에서는 전문용어를 구성하는 단어의 빈도수, 가중치, 바이그램, 내부 수식구조 둥을 이용하고, 문맥정보를 이용하는 방법에서는 전문용어를 수식하는 단어들의 분포를 이용한다. 본 논문에서 제안한 방법은 분야에 독립적으로 적용될 수 있고, 전문용어 생성 절차에 대한 특정을 잘 반영할 수 있는 장점이 있다. MeSH 트리에 포함된 질병 이름의 전문성 값을 계산한 뒤 상위어의 전문성 값과 비교한 결과 82.0%의 정확률을 보였다.

작업과 관련된 근골격계 장애 조사방법에 관한 연구

  • 이미경;장성록
    • 한국산업안전학회:학술대회논문집
    • /
    • 한국안전학회 1998년도 추계 학술논문발표회 논문집
    • /
    • pp.191-197
    • /
    • 1998
  • 작업과 관련된 근골격계 장애(work-related musculoskeletal disorder)는 만성적인 근골격계 질병으로 작업과 관계되어 발생되어지는 신체 상태이다. 이와 관련되는 요인에는 반복적인 동작, 무리한 힘, 부적절한 자세, 기계적인 스트레스 및 진동, 온도 등이며 같은 의미로 자주 사용되는 용어로는 인간공학적 질병(ergonomic disorder), 누적 외상성 장애(cumulative trauma disorders), 반복 긴장성 부상(repetitive strain injuries)등이 있다. (중략)

  • PDF

POLICY & ISSUES 기획특집_1 - 화학물질 사고 예방 및 대응 정책방향

  • 류필무
    • 환경정보
    • /
    • 통권405호
    • /
    • pp.9-11
    • /
    • 2013
  • 화학물질은 현대문명에 필수적이다. 산업용 원료, 신소재, 섬유, 의약품, 농약 등 화학물질의 사용용도는 광범위하고 그 유용성은 무궁무진하다. 하지만, 언제부터인가 화학물질 유해성(有害性)이라는 용어에 익숙해지고 있다. 화학물질은 분해에 장시간이 소요되어 인체 또는 환경에 잔류하고 장기적으로는 각종 질병을 일으키기도 한다.

  • PDF

서지분석을 통한 노화 관련 유전자 정보 데이터베이스 구축 (Construction of the Aging Related Gene Database using Text-mining)

  • 유석종;박준호;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2013년도 춘계 종합학술대회 논문집
    • /
    • pp.41-42
    • /
    • 2013
  • 최근 노령화가 급속히 진행되면서 노화에 대한 연구가 활발히 진행되고 있다. 하지만 노화현상은 광범위한 표현형을 지니고 있는 생명현상으로 이에 대한 체계적인 연구를 지원하기 위한 웹포털 사이트가 필요한 실정이다. 특히 노화에 따른 질병과의 연관성 및 관련 유전자에 대한 정보를 수집하고 이를 체계적으로 분석할 수 있는 통합정보시스템은 향후 노화연구를 지원하기 위한 가장 핵심적인 요소라고 할 수 있다. 본 연구에서는 기존 노화와 관련된 461개의 유전자를 기반으로 관련된 질병과의 연관성을 OMIM 데이터베이스를 활용하여 분석하였다. 또한 관련 단백질의 기능을 GO데이터베이스 분석을 통해 유전자의 기능을 분석하였다. Pubmed에서 제공하는 노화관련 논문들의 MeSH 정보 분석을 통해서 노화와 관련된 용어를 분석하였다. 노화와 관련된 64개의 유전자를 키워드로 NCBI의 pubmed 데이터베이스로부터 관련논문을 다운로드 받아 생물학적 상호작용 정보를 추출했다. 생물학적 상호작용은 NCBI에서 제공하는 Metamap 데이터베이스를 기반으로 각각의 생물학적 용어를 정의했다. 현재 노화 유전자 64개에 대해 128,729개의 생물학적 상호작용 정보를 추출했고, 8대 노인성만성질환에 대해 301,176개의 생물학적 상호작용 정보를 추출하였다.

  • PDF

단어 표현에 기반한 연관 바이오마커 발굴 (Biomarker Detection of Specific Disease using Word Embedding)

  • 윤영신;김유섭
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.317-320
    • /
    • 2016
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다. 2차원으로 맵핑된 결과 값을 코사인 유사도를 사용하여 질병과 바이오 마커간의 유사도를 구한다. 이 유사도 결과 값 상위 20쌍의 결과를 가지고 실제 연구가 되고 있는지 구글 스콜라를 통해 관련 논문을 검색하여 확인하고, 검색 결과를 점수화 한다. 실험 결과 상위 20쌍 중에서 85%의 쌍이 실제적으로 질병과 바이오 마커 간의 관계를 파악하는 방향으로 진행 되고 있으나, 나머지 15%의 쌍에 대해서는 실질적인 연구가 잘 되고 있지 않은 것으로 파악되었다.

  • PDF