• 제목/요약/키워드: Bayesian model

검색결과 1,312건 처리시간 0.024초

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

탄소 및 질소 안정동위원소를 활용한 어류 가두리 양식장 내 퇴적 유기물의 기원 및 기여도 평가 (Origin and Source Appointment of Sedimentary Organic Matter in Marine Fish Cage Farms Using Carbon and Nitrogen Stable Isotopes)

  • 고영신;이대인;김청숙;심보람;김형철;이원찬;이동헌
    • 생태와환경
    • /
    • 제55권2호
    • /
    • pp.99-110
    • /
    • 2022
  • 본 연구에서는 어류 양식장 퇴적 유기물의 기원 및 기여도 평가를 위해 어류(숭어) 가두리 양식장이 이동된 후 수층 및 퇴적물 내 물리/화학적 인자들의 변화와 함께 안정 동위원소 비의 특성을 조사했다. 이를 토대로 과거 양식장 퇴적물 내 축적된 유기물의 거동을 구체적으로 파악함으로써 효과적인 어장환경평가 기법을 검토하였다. 연구정점(OFF 및 control)에서 입자성 및 침강물질은 정점 간 차이보다는 계절적 강수량 변동에 따라 차별적 분포를 보였다. 하지만 퇴적물 내 분석된 δ15N 결과는 수층 기원 질소원과는 유의한 차이를 보였으며, 과거 외부기원의 유기물 (예: 어류 배설물)의 다량 유입이 주된 요인이라 판단된다. 실제로 과거 어류 가두리 양식활동으로 인해 OFF 정점 내 어류 배설물의 우점적 기여(>50%)를 확인할 수 있었다. 따라서 본 연구정점 내 분해되지 않은 어장 양식기인 유기물의 농도가 높은 수준으로 존재할 것이라 판단되며, 어장 회복력의 체계적인 진단을 위한 중요한 고려요인이라 판단된다.