• 제목/요약/키워드: summary database

검색결과 82건 처리시간 0.017초

A Study on the Classification of Unstructured Data through Morpheme Analysis

  • Kim, SungJin;Choi, NakJin;Lee, JunDong
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.105-112
    • /
    • 2021
  • 빅데이터 시대에 접어들며 데이터에 대한 관심이 폭발적으로 늘어나고 있다. 특히, 인터넷 및 소셜미디어의 발전은 새로운 데이터들의 생성으로 연결되어 빅데이터와 인공지능 시대의 실현과 융합 기술의 새로운 장을 열 수 있게 되었으며, 과거에는 프로그램으로 다루지 못하던 데이터에 대한 분석 요구가 많이 발생하고 있다. 본 논문에서는 빅데이터 시대에서 많이 요구되는 비정형 데이터에 대한 분류를 위하여 분석 모델을 설계하고 이를 검증하였다. 데이터는 디비피아의 논문 요약과 주제어, 그리고 부주제 어를 크롤링하였으며, 코엔엘피의 데이터 사전을 이용해 데이터베이스를 생성하고, 형태소 분석을 통하여 단어의 토큰화 과정을 수행하였다. 또한, 카이스트의 9 품사 분류 체계를 이용해 명사를 추출하고, TF-IDF 값을 생성하였으며, 학습 데이터와 Y 값을 결합하여 분석 데이터 셋을 생성하였다. 이와 같이 생성된 분석 데이터 셋에 랜덤 포레스트와 서포트 벡터 머신 그리고 의사결정트리, 이렇게 세 가지 분석 알고리즘을 적용하여 분류의 적정성을 측정하였다. 본 논문에서 제안한 분류 모델 기법은 논문 분류 외에도 민원 분류 분석 및 텍스트 관련 분석 등 다양한 분야에 유용하게 사용될 수 있다.

인공지능 딥러닝을 이용한 갑상선 초음파에서의 갑상선암의 재발 예측 (Deep Learning in Thyroid Ultrasonography to Predict Tumor Recurrence in Thyroid Cancers)

  • 길지은;김광기;김영재;구혜령;박정선
    • 대한영상의학회지
    • /
    • 제81권5호
    • /
    • pp.1164-1174
    • /
    • 2020
  • 목적 수술 전 초음파 검사에서 갑상선 종양의 재발을 예측할 수 있는 심층 학습 모델을 개발하고자 한다. 대상과 방법 수술 전 초음파에서 병리학적으로 확진된 갑상선 수술을 받은 229명의 환자(남성:여성 = 42:187, 평균 연령, 49.6세)의 대표적인 초음파 이미지를 포함시켰다. 각각 대표적인 횡축 또는 종축 초음파 이미지가 선택되었다. 신경 네트워크용 Python 2.7.6 및 Keras 2.1.5, convolutional neural network을 사용한 심층 학습이 사용되었다. 재발한 환자와 재발이 없는 환자의 임상 및 조직학적 특징을 비교하였다. 그룹 간의 심층 학습 모델의 receiver operating characteristic curve 곡선 아래의 영역은 재발 갑상선암을 예측하기 위한 심층 학습 모델의 예측에 사용되었다. 결과 전체 환자 229명 중 49명이 종양 재발(21.4%)을 보였다. 종양의 크기, 다원성은 재발이 없는 군과 재발 군에서 유의한 차이가 있었다(p < 0.05). 재발성 갑상선암 예측을 위한 심층 학습 모델의 전반적인 평균 area under the curve (이하 AUC) 값은 0.9 ± 0.06이었다. 평균 AUC는 macrocarcinoma에서 0.87 ± 0.03, microcarcinoma에서 0.79 ± 0.16이었다. 결론 갑상선암의 초음파 이미지를 이용한 심층 학습 모델로 갑상선암 재발의 예측 모델 구축의 가능성을 보여주었다.