• 제목/요약/키워드: 뉴럴 임베딩 모델

검색결과 3건 처리시간 0.017초

부분 단어 토큰화 기법을 이용한 뉴스 기사 정치적 편향성 자동 분류 및 어휘 분석 (Automatic Classification and Vocabulary Analysis of Political Bias in News Articles by Using Subword Tokenization)

  • 조단비;이현영;정원섭;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 뉴스 기사의 정치 분야는 보수, 진보와 같이 양극화된 편향적 특성이 존재하며 이를 정치적 편향성이라고 한다. 뉴스 기사로부터 편향성 문제를 분류하기 위해 키워드 기반의 학습 데이터를 구축하였다. 대부분의 임베딩 연구에서는 미등록어로 인한 문제를 완화시키기 위해 형태소 단위로 문장을 구성한다. 본 논문에서는 문장을 언어 모델에 의해 세부적으로 분할하는 부분 단어로 문장을 구성할 경우 미등록어 수가 감소할 것이라 예상하였다. 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델을 제안하며 이를 SVM과 전방향 뉴럴 네트워크 구조에 적용하여 정치적 편향성 분류 실험을 진행하였다. 형태소 토큰화 기법을 이용한 문서 임베딩 모델과 비교 실험한 결과, 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델이 78.22%로 가장 높은 정확도를 보였으며 부분 단어 토큰화를 통해 미등록어 수가 감소되는 것을 확인하였다. 분류 실험에서 가장 성능이 좋은 임베딩 모델을 이용하여 정치적 인물을 기반한 어휘를 추출하였으며 각 성향의 정치적 인물 벡터와의 평균 유사도를 통해 어휘의 편향성을 검증하였다.

센서 레지스트리 시스템을 위한 개선된 센서 필터링 기법 (Improved Sensor Filtering Method for Sensor Registry System)

  • 천하오티엔;정현준;이석훈;온병원;정동원
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.7-14
    • /
    • 2022
  • 센서 레지스트리 시스템(Sensor Registry System, SRS)은 이기종 센서 네트워크에서 의미적 상호운용성 유지를 위해 개발되었다. SRS는 위치 정보를 기반으로 주변 센서와 모바일 기기와의 연결 여부를 확인하며, 연결이 되었을 때 센서의 메타데이터를 제공한다. 성공적으로 연결되는 주위의 센서를 식별하는 과정을 센서 필터링이라고 정의한다. 이러한 센서 필터링의 성능 개선이 SRS 연구의 핵심 주제 중 하나이다. 실제 상황에서, GPS에서 제공된 잘못된 위치 정보로 인해 센서 필터링이 실패하는 경우가 발생한다. 따라서 이 논문에서는 지리적 임베딩과 뉴럴 네트워크 기반 경로 예측을 이용한 새로운 센서 필터링 방법을 제안하고 몬테카를로 접근방법을 통해 서비스 제공률을 평가한다. 실증 연구에서, 제안 방법이 위치 정보 이상 문제를 개선하고 SRS 센서 필터링에 효과적인 모델임을 보였다.

딥러닝 기반 항생제 내성균 감염 예측 (Antibiotics-Resistant Bacteria Infection Prediction Based on Deep Learning)

  • 오성우;이한길;신지연;이정훈
    • 한국전자거래학회지
    • /
    • 제24권1호
    • /
    • pp.105-120
    • /
    • 2019
  • 세계보건기구(WHO)를 비롯해 세계 각국의 정부기관은 항생제 오남용에 따른 항생제 내성균 감염에 대해 심각하게 경고하며 이를 예방하기 위한 관리와 감시를 강화하고 있다. 하지만 감염을 확인하기 위한 감염균 배양에 수일의 시간이 소요되면서 격리와 접촉주의를 통한 감염확산 방지 효과가 떨어져 선제적 조치를 위한 신속하고 정확한 예측 및 추정방법이 요구되고 있다. 본 연구는 Electronic Health Records에 포함된 질병 진단내역과 항생제 처방내역을 neural embedding model과 matrix factorization을 통해 embedding 하였고, 이를 활용한 딥러닝 기반분류 예측 모형을 제안하였다. 항생제 내성균 감염의 주요 원인인 질병과 항생제 정보를 embedding하여 환자의 기본정보와 병원이용 정보에 추가했을 때 딥러닝 예측 모형의 f1-score는 0.525에서 0.617로 상승하였고, 딥러닝 모형은 Super Learner와 같은 기존 기계학습 모형보다 더 나은 성능을 보여주었다. 항생제 내성균 감염환자의 특성을 분석한 결과, 감염환자는 동일한 질병을 진단받은 비감염환자에 비교해 J01 계열 항생제 사용이 많았고 WHO 권고기준(DDD)을 크게 벗어나는 오남용 청구사례가 6.3배 이상 높게 나타났으며 항생제 오남용과 항생제 내성균 감염간의 높은 연관성이 발견되었다.