• 제목/요약/키워드: 생의학 모델

검색결과 36건 처리시간 0.041초

생의학 분야 키워드 추출 모델에 대한 비교 연구 (Comparative Study of Keyword Extraction Models in Biomedical Domain)

  • 이동희;권순찬;장백철
    • 인터넷정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.77-84
    • /
    • 2023
  • 생명 공학 및 의학 분야의 논문 수 증가에 따라 문헌 속에서 중요한 정보를 빠르게 찾아 대응하기 위한 키워드 추출의 필요성이 대두되고 있다. 본 논문에서는 생의학 분야에서의 키워드 추출에 대한 다양한 비지도 학습 기반 모델 및 BERT 기반 모델의 성능을 종합적으로 비교하였다. 실험 결과 생의학 분야에 특화된 데이터로 학습된 BioBERT 모델이 가장 높은 성능을 보였다. 이를 통해 생의학 분야의 키워드 추출 연구에서 적절한 실험 환경을 구성하고 다양한 모델을 비교 분석하여, 향후 연구에 필요한 정확하고 신뢰할 수 있는 정보를 제공하였다. 이뿐만 아니라, 다른 분야에서도 키워드 추출에 대한 비교적인 기준과 유용한 지침을 제공할 수 있을 것이라 기대한다.

생의학 분야 학술 문헌에서의 이벤트 추출을 위한 심층 학습 모델 구조 비교 분석 연구 (A Comparative Study on Deep Learning Topology for Event Extraction from Biomedical Literature)

  • 김선우;유석종;이민호;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.77-97
    • /
    • 2017
  • 최근 생의학 분야의 학술 문헌이 기하급수적으로 급증함에 따라 관련 분야 연구자들은 선행 연구 및 연구 동향 파악에 어려움을 겪고 있다. 이에 효율적인 선행 연구 및 연구 동향 파악을 위한 정보 추출 기술이 요구되며, 학술 문헌의 정보 추출을 위한 개체인식 및 개체 간의 생의학 이벤트 추출 연구가 활발히 진행되고 있다. 본 연구는 이에 심층 학습(Deep Learning)의 기법 중 하나인 컨볼루션 네트워크(Convolutional Neural Networks, CNN) 모델을 기반으로 이벤트 내의 개체 유형 정보의 적용 위치와 함께, 이벤트 식별 및 분류를 고려하여 총 8가지의 모델을 구성하여 실험하였다. 실험 결과, 본 연구에서 제안하는 모델 중 최고성능을 보인 개체 유형 완전연결 모델이 이벤트 분류 실험에서 F-점수 72.09%의 높은 성능을 보였으나, 이벤트 추출 실험에서는 학습 컬렉션의 불균형 문제 및 이벤트 식별 모델의 성능 저조 등으로 인하여 F-점수 21.81%의 비교적 저조한 성능을 보였다.

한국어 생의학 개체명 인식 성능 비교와 오류 분석 (Performance Comparison and Error Analysis of Korean Bio-medical Named Entity Recognition)

  • 이재홍
    • 한국전자통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.701-708
    • /
    • 2024
  • 딥러닝 분야에서 트랜스포머 아키텍쳐의 출현은 자연어 처리 연구가 획기적인 발전을 가져왔다. 개체명 인식은 자연어 처리의 한 분야로 정보 검색과 같은 태스크에 중요한 연구 분야이다. 생의학 분야에서도 그 중요성이 강조되나 학습용 한국어 생의학 말뭉치의 부족으로 AI를 활용한 한국어 임상 연구 발전에 제약이 되고 있다. 본 연구에서는 한국어 생의학 개체명 인식을 위해 새로운 생의학 말뭉치를 구축하고 대용량 한국어 말뭉치로 사전 학습된 언어 모델들을 선정하여 전이 학습시켰다. F1-score로 선정된 언어 모델의 개체명 인식 성능과 태그별 인식률을 비교하고 오류 분석을 하였다. 인식 성능에서는 KlueRoBERTa가 상대적인 좋은 성능을 보였다. 태깅 과정의 오류 분석 결과 Disease의 인식 성능은 우수하나 상대적으로 Body와 Treatment는 낮았다. 이는 문맥에 기반하여 제대로 개체명을 분류하지 못하는 과분할과 미분할로 인한 것으로, 잘못된 태깅들을 보완하기 위해서는 보다 정밀한 형태소 분석기와 풍부한 어휘사전 구축이 선행되어야 할 것이다.

생의학 도메인에서 약어 중의성 해결을 위한 최적 자질의 규명 (Identifying Optimum Features for Abbreviation Disambiguation in Biomedical Domain)

  • 임호건;서희철;김선호;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.173-180
    • /
    • 2004
  • 생의학 도메인에서 약어 중의성 해결이란 생의학 문서에 나타난 약어의 원래 형태(long form)를 판별하는 작업이다. 본 논문은 생의학 도메인에서 약어 중의성 해결에 적합한 자질들을 실험적으로 탐색하는데 목적이 있다. 이를 위해서 약어 중의성 해결에 사용할 문맥을 전역 문맥(topical context)과 지역 문맥(local context)으로 구분하고, 각각의 문맥에서 스테밍(stemming), 불용어 제거, 품사 부착 등의 과정을 통해서 다양한 자질들을 고려하도록 한다. 생의학 도메인에서 약어 중의성 해결을 위한 실험 자료의 부족을 해결하기 위해서, 학습 자료와 평가 자료를 자동으로 구축했으며, 평가를 위한 약어로는 기존 연구에서 사용된 두 가지 약어 목록을 사용했다. 또한 단순 베이지언 모델(Naive Bayesian Model)을 이용해서 각 자질들의 유용성을 평가하였다 실험 결과, 전역 문맥이 지역 문맥보다 더 좋은 성능을 보였으며, 전역 문맥에서는 불용어만을 제거한 경우가 각각의 평가 자료에서 94.2%와 96.2%로 가장 좋은 결과를 보였으며, 전역 문맥과 지역 문맥을 함께 사용하는 경우에 각각의 평가 자료에서 1.8%와 0.3%의 성능 향상이 있었다.

  • PDF

우리나라 의료의 생의학적 모델 어떻게 할 것인가? - 생의학적 모델에서 생물정신사회적 모델로 - (What Should We do with Korea's Biomedical Model of Medicine? - From Biomedical to Biopsychosocial Model -)

  • 이상열
    • 정신신체의학
    • /
    • 제20권1호
    • /
    • pp.3-8
    • /
    • 2012
  • 질병의 생물정신사회적 이해는 건강의 의미 있는 증진을 위해서 매우 중요한다. 건강의 유지와 증진은 신체적, 정신적, 사회적, 그리고 영적인 안녕감을 통하여 이루어진다. 건강은 단순한 상태와 삶의 목적이 아니며, 일상생활에서의 자원으로, 개인적, 사회적뿐만 아니라 신체적 능력의 긍정적 개념이다. 한편 의료 체계에서 생물정신사회적 모델의 이해 역시 매우 중요하다. Engel은 의사들의 교육 및 진료에서 생의학적 접근을 비판하고, 새로운 모델인 생물정신사회적 모델을 주장하였다. Engel은 인간을 특정한 방법으로 자신의 건강을 위해하거나 증진시킬 수 있는 생물학적, 정신적, 사회적 존재로 보았다. 질병의 생물정신사회적 모델의 중요함에도 불구하고, 우리나라의 의료는 질병의 생의학적 모델에만 중점을 두고 있다. 그 결과 한국의 의료가 기계화 되어가고 있고 비인간화 되어가고 있다. 저자는 한국 정신신체의학회 창립 20주년을 맞이함에 따라 우리나라 의료 체계 및 실제적인 임상 진료에서 질병의 생물정신사회적 모델의 중요성을 강조하고자 하였다.

  • PDF

생의학 문헌에 대한 워드 임베딩 적용 및 분석 (Word Embedding Analysis for Biomedical Articles)

  • 최윤수;전선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.394-395
    • /
    • 2016
  • 워드 임베딩(word embedding)은 정보검색이나 기계학습에서 단어를 표현하기 위하여 사용되던 기존의 one-hot 벡터 방식의 희소공간 및 단어들 간의 관계정보를 유지할 수 없는 문제를 해결하기 위한 방법이다. 워드 임베딩의 한 방법으로 word2vec은 최근 빠른 학습시간과 높은 효과를 얻을 수 있는 모델로 주목을 받고 있다. word2vec은 수행 시 주어지는 옵션인 벡터차원과 문맥크기에 의해 그 결과 품질이 상이하다. Mikolov는 구글 뉴스 문헌 집합에 대하여 word2vec을 실험하고, 적합한 옵션을 제시하였다. 본 논문에서는 구글 뉴스 문헌 같은 일반 문서가 아닌 생의학 분야에 특화된 문헌에 대하여 word2vec에 대한 다양한 옵션을 실험하고, 생의학 문헌에 적합한 최적의 조건을 분석한다.

생의학분야 PLOT 및 관계추출을 위한 테스트컬렉션 구축 (Construction of Test Collection for Extraction of Biomedical PLOT & Relations)

  • 최윤수;최성필;정창후
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2010년도 춘계 종합학술대회 논문집
    • /
    • pp.425-427
    • /
    • 2010
  • 대용량 문서에서 정보를 추출하는 작업은 크게 개체명 인식, 전문용어 인식, 관계추출 작업으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어 왔기 때문에, 이와 관련된 기계학습모델을 위한 테스트컬렉션 또한 독립적으로 구축되어 왔다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많아, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따르므로, 개체명과 전문용어를 동시에 추출 할 수 있는 기계학습 모델을 위한 테스트컬렉션이 필요하다. 본 연구에서는 생의학 분야 과학기술문헌에 대한 개체명, 전문용어를 통합한 PLOT(Person, Location, Organization, Terminology)과, PLOT 간의 관계추출을 위한 테스트컬렉션을 구축한다.

  • PDF

토픽모델링과 딥 러닝을 활용한 생의학 문헌 자동 분류 기법 연구 (A Study of Research on Methods of Automated Biomedical Document Classification using Topic Modeling and Deep Learning)

  • 육지희;송민
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.63-88
    • /
    • 2018
  • 본 연구는 LDA 토픽 모델과 딥 러닝을 적용한 단어 임베딩 기반의 Doc2Vec 기법을 활용하여 자질을 선정하고 자질집합의 크기와 종류 및 분류 알고리즘에 따른 분류 성능의 차이를 평가하였다. 또한 자질집합의 적절한 크기를 확인하고 문헌의 위치에 따라 종류를 다르게 구성하여 분류에 이용할 때 높은 성능을 나타내는 자질집합이 무엇인지 확인하였다. 마지막으로 딥 러닝을 활용한 실험에서는 학습 횟수와 문맥 추론 정보의 유무에 따른 분류 성능을 비교하였다. 실험문헌집단은 PMC에서 제공하는 생의학 학술문헌을 수집하고 질병 범주 체계에 따라 구분하여 Disease-35083을 구축하였다. 연구를 통하여 가장 높은 성능을 나타낸 자질집합의 종류와 크기를 확인하고 학습 시간에 효율성을 나타냄으로써 자질로의 확장 가능성을 가지는 자질집합을 제시하였다. 또한 딥 러닝과 기존 방법 간의 차이점을 비교하고 분류 환경에 따라 적합한 방법을 제안하였다.

우울증의 '생의학적 의료화' 형성 과정 (The Biomedical Medicalization of Depression in Korea)

  • 박혜경
    • 과학기술학연구
    • /
    • 제12권2호
    • /
    • pp.117-157
    • /
    • 2012
  • 이 글은 최근 국내에 크게 증가하고 있는 우울증(depression)이 생의학적(biomedical) 차원에서 의료화(medicalization)되는 과정을, 질병의 진료 메커니즘을 통해 고찰한 것이다. 우울증은 근래까지 병원(病原)의 실체가 명확히 규명되지 못함에 따라 다양한 요인들이 복합되어 발병하는 정신질환으로 인식되어왔다. 따라서 우울증에 대한 치료 역시 약물과 심리적 사회적 처치를 병행해왔다. 그러다 1990년대 들어 서구를 중심으로 뇌과학이 출현하고 최첨단 뇌 진단장비 및 정신질환 치료 신약의 개발 등이 급속히 진전되면서, 우울증은 일상적 관리와 완치가 가능할 뿐만 아니라 누구나 걸릴 수 있는 '뇌 신경계 질환'으로 급속히 재정의되었다. 이러한 질병 개념 및 인식과 치료법의 영향으로 최근 국내에서는, 해마다 평균 8% 이상의 우울증 환자가 정신의학계의 적극적인 치료 대상으로 '출현하고(emergent)' 있다. 그러나 정신의학계는 현재의 우울증 치료율은 10%선에 불과하며, 치료 범주에서 벗어나 있는 우울증 환자가 전체의 80% 이상이라고 추산한다. 그렇다면 이러한 추정치는 어떠한 의미를 갖는 것일까? 이 논문은 이러한 의문을 가지고 우울증의 생의학적 의료화 과정을 비판적으로 탐색하였다.

  • PDF

Zebrafish as a research tool for human diseases pathogenesis and drug development

  • Kim, Young Sook;Cho, Yong Wan;Lim, Hye-Won;Sun, Yonghua
    • 한국응용과학기술학회지
    • /
    • 제39권3호
    • /
    • pp.442-453
    • /
    • 2022
  • 다양한 동물 모델이 인간 질병, 의약품의 효능 및 작용 메커니즘을 연구하는 데 사용되고 있다. Zebrafish(Danio rerio)는 여러 가지 장점이 있어 인간 질병에 대한 중개 연구의 모델로 점점 더 폭넓게 활용되고 있다. 본 논문은 Pubmed, Google Scholar, Scopus에서 2020년 12월까지 최근 10년간 zebrafish 모델, 천연물(한약), in vivo 스크리닝의 키워드를 사용하여 저널에 게재된 논문을 검토하여 필요한 정보를 얻었다. 이 리뷰에서 우리는 천연물(한약) 연구에 대한 다양한 제브라피쉬 질병 모델의 최근 경향에 대해 논의하였다. 특히, 암, 안질환, 혈관 질환, 당뇨병 및 합병증, 피부질환에 중점을 두었고, zebrafish 배아를 사용하여 이들 질병에 대한 의약품의 분자 작용 메커니즘에 관해 언급하였다. Zebrafish는 실험실에서 임상 연구까지의 격차를 줄이는 데 중추적 역할을 할 수 있는 중요한 동물 모델이다. Zebrafish는 의약품이나 화장품 개발, 질병의 병인론을 이해하기 위해 사용되고, 이로 인해 생의학 연구에서 설치류의 사용을 줄이는 데 크게 기여하고 있다.