• 제목/요약/키워드: 다중 레이블 인식

검색결과 11건 처리시간 0.026초

다중 레이블 분류를 활용한 안면 피부 질환 인식에 관한 연구 (A Study on Facial Skin Disease Recognition Using Multi-Label Classification)

  • 임채현;손민지;김명호
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권12호
    • /
    • pp.555-560
    • /
    • 2021
  • 최근 안면 피부 미용에 대한 사람들의 관심이 높아짐에 따라 딥 러닝을 활용한 안면 피부 미용을 위한 피부 질환 인식 연구가 진행되고 있다. 이러한 연구들은 여드름을 비롯한 다양한 피부 질환을 인식한다. 기존의 연구들은 단일 피부 질환만을 인식하지만, 안면에 발생하는 피부 질환은 더 다양하고 복합적으로 발생할 수 있다. 따라서 본 논문에서는 Inception-ResNet V2 모델을 활용하여 다중 레이블 분류 방법으로 여드름, 블랙헤드, 주근깨, 검버섯, 일반 피부, 화이트헤드에 관한 복합적인 피부 질환을 인식한다. 사용한 평가 지표 중 정확도는 98.8%, 해밍 손실은 0.003을 달성하였고, 단일 클래스별 정밀도, 재현율, F1-점수는 모두 96.6% 이상을 달성하였다.

전이학습과 그래프 합성곱 신경망 기반의 다중 패션 스타일 인식 (Recognition of Multi Label Fashion Styles based on Transfer Learning and Graph Convolution Network)

  • 김성훈;최예림;박종혁
    • 한국전자거래학회지
    • /
    • 제26권1호
    • /
    • pp.29-41
    • /
    • 2021
  • 최근 패션업계에서는 급속도로 발전하는 딥러닝 방법론을 활용하려는 시도가 늘고 있다. 이에 따라 다양한 패션 관련 문제들을 다루는 연구들이 제안되었고, 우수한 성능을 달성하였다. 하지만 패션 스타일 분류 문제의 경우, 기존 연구들은 한 옷차림이 여러 스타일을 동시에 포함할 수 있다는 패션 스타일의 특성을 반영하지 못하였다. 따라서 본 연구에서는 동시에 존재하는 레이블 간의 종속성을 모델링하고, 이를 반영하여 패션 스타일의 다중 분류 문제를 해결하고자 한다. 패션 스타일 사이의 종속성을 포착하고 탐색하기 위해 GCN(graph convolution network) 기반의 다중 레이블 인식 모델을 적용하였다. 또한 전이학습을 통해 모델의 학습 속도 및 성능을 향상시켰다. 제안하는 모델은 웹 크롤링을 통해 수집한 SNS 이미지 데이터를 이용하여 검증하였으며, 비교 모델 대비 우수한 성능을 기록하였다.

언어 모델 다중 학습을 이용한 한국어 개체명 인식 (Korean Named Entity Recognition using Joint Learning with Language Model)

  • 김병재;박찬민;최윤영;권명준;서정연
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.333-337
    • /
    • 2017
  • 본 논문에서는 개체명 인식과 언어 모델의 다중 학습을 이용한 한국어 개체명 인식 방법을 제안한다. 다중 학습은 1 개의 모델에서 2 개 이상의 작업을 동시에 분석하여 성능 향상을 기대할 수 있는 방법이지만, 이를 적용하기 위해서 말뭉치에 각 작업에 해당하는 태그가 부착되어야 하는 문제가 있다. 본 논문에서는 추가적인 태그 부착 없이 정보를 획득할 수 있는 언어 모델을 개체명 인식 작업과 결합하여 성능 향상을 이루고자 한다. 또한 단순한 형태소 입력의 한계를 극복하기 위해 입력 표상을 자소 및 형태소 품사의 임베딩으로 확장하였다. 기계 학습 방법은 순차적 레이블링에서 높은 성능을 제공하는 Bi-directional LSTM CRF 모델을 사용하였고, 실험 결과 언어 모델이 개체명 인식의 오류를 효과적으로 개선함을 확인하였다.

  • PDF

다중 분류기 통합을 위한 퍼지 행위지식 공간 (Fuzzy Behavior Knowledge Space for Integration of Multiple Classifiers)

  • 김봉근;최형일
    • 인지과학
    • /
    • 제6권2호
    • /
    • pp.27-45
    • /
    • 1995
  • 본 논문에서는 다중 분류기의 통합을 위해 퍼지 행위지식 공간을 구성하고 이를 이용하는 방법을 제안한다.기존의 행위지식 공간은 각 분류기들이 서로 독립적일 필요가 없고 적응적 학습이 가능한 것으로 단지 하나의 클래스 레이블만 을 출력하는 분류기들의 통합에 가장 최적의 방법으로 알려졌다.그러나 행위지식 공간은 각 분류기가 출력하는 클래스 레이블에 대한 측정값과 경험적 지식을 통합과정에 반영하기 어렵다는 문제점을 갖고 있다.이러한 행위지식 공간의 문제점을 해결하기 위해 본 논문에서는 퍼지개념을 이용한 퍼지 행위지식 공간을 정의하고 이를 다중 분류기의 통합에 적용하기 위한 방법을 기술한다.또한,퍼지 행위지식 공간의 유용성을 증명하기 위해 각 분류기로 부터 얻어진 클래스 레이블들과 이에 관련된 측정값을 포함하는 분류결과들의 통합에 적용된 실험결과를 기술한다.

  • PDF

언어 모델 다중 학습을 이용한 한국어 개체명 인식 (Korean Named Entity Recognition using Joint Learning with Language Model)

  • 김병재;박찬민;최윤영;권명준;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.333-337
    • /
    • 2017
  • 본 논문에서는 개체명 인식과 언어 모델의 다중 학습을 이용한 한국어 개체명 인식 방법을 제안한다. 다중 학습은 1 개의 모델에서 2 개 이상의 작업을 동시에 분석하여 성능 향상을 기대할 수 있는 방법이지만, 이를 적용하기 위해서 말뭉치에 각 작업에 해당하는 태그가 부착되어야 하는 문제가 있다. 본 논문에서는 추가적인 태그 부착 없이 정보를 획득할 수 있는 언어 모델을 개체명 인식 작업과 결합하여 성능 향상을 이루고자 한다. 또한 단순한 형태소 입력의 한계를 극복하기 위해 입력 표상을 자소 및 형태소 품사의 임베딩으로 확장하였다. 기계 학습 방법은 순차적 레이블링에서 높은 성능을 제공하는 Bi-directional LSTM CRF 모델을 사용하였고, 실험 결과 언어 모델이 개체명 인식의 오류를 효과적으로 개선함을 확인하였다.

  • PDF

음성감정인식 성능 향상을 위한 트랜스포머 기반 전이학습 및 다중작업학습 (Transformer-based transfer learning and multi-task learning for improving the performance of speech emotion recognition)

  • 박순찬;김형순
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.515-522
    • /
    • 2021
  • 음성감정인식을 위한 훈련 데이터는 감정 레이블링의 어려움으로 인해 충분히 확보하기 어렵다. 본 논문에서는 음성감정인식의 성능 개선을 위해 트랜스포머 기반 모델에 대규모 음성인식용 훈련 데이터를 통한 전이학습을 적용한다. 또한 음성인식과의 다중작업학습을 통해 별도의 디코딩 없이 문맥 정보를 활용하는 방법을 제안한다. IEMOCAP 데이터 셋을 이용한 음성감정인식 실험을 통해, 가중정확도 70.6 % 및 비가중정확도 71.6 %를 달성하여, 제안된 방법이 음성감정인식 성능 향상에 효과가 있음을 보여준다.

Small-Scale Object Detection Label Reassignment Strategy

  • An, Jung-In;Kim, Yoon;Choi, Hyun-Soo
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.77-84
    • /
    • 2022
  • 본 논문은 객체 위치식별 알고리즘의 성능을 향상하기 위한 레이블 재할당 방법을 제안한다. 제안한 방법은 추론 단계와 재할당 단계로 구분한다. 추론 단계에서는 학습된 모델로부터 사전 지정된 크기에 따라 다중 스케일 추론을 수행한 뒤, 이를 마스킹한 영상을 다시 한번 추론하여 강인한 클래스 종류의 추론 결과를 얻는다. 재할당 단계에서는 박스간의 IoU를 계산하여 중복 박스를 제거하고, 박스와 클래스의 빈도를 계산하여 지배적 클래스를 다시 할당하였다. 제안한 방법을 검증하기 위하여 공사현장 안전장비 인식 영상 데이터 세트에 레이블 재할당 방법을 적용하고 이를 YOLOX-L 객체 탐지 모델에서 학습하였다. 실험 결과 적용 전 대비 mAP가 3.9% 향상하여 51.07%를 달성하였으며 AP_S를 3배 이상 향상하여 14.53%를 달성하였다. 실험 결과를 통해 레이블 재할당 알고리즘이 더 우수한 성능의 모델을 훈련해 냄을 확인하였다.

WiseQA를 위한 정답유형 인식 (Recognition of Answer Type for WiseQA)

  • 허정;류법모;김현기;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권7호
    • /
    • pp.283-290
    • /
    • 2015
  • 본 논문에서는 WiseQA 시스템에서 정답유형을 인식하기 위한 하이브리드 방법을 제안한다. 정답유형은 어휘정답유형과 의미정답유형으로 구분된다. 본 논문은 어휘정답유형 인식을 위해서 질문초점에 기반한 규칙모델과 순차적 레이블링에 기반한 기계학습모델을 제안한다. 의미정답유형 인식을 위해 다중클래스 분류에 기반한 기계학습모델과 어휘정답유형을 이용한 필터링 규칙을 소개한다. 어휘정답유형 인식성능은 F1-score 82.47%이고, 의미정답유형 인식성능은 정확률 77.13%이다. 어휘정답유형 인식성능은 IBM 왓슨과 비교하여, 정확률은 1.0% 저조하고, 재현율은 7.4% 높다.

타이어 분류 코드의 효율적 인식을 위한 MCBP망 (MCBP Neural Netwoek for Effcient Recognition of Tire Claddification Code)

  • 구건서;오해석
    • 한국정보처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.465-482
    • /
    • 1997
  • 본 논문은 타이어에 각인된 타이어 분류 코드인(DOT(Department of Transportation) 코드 인식 처리를 위해 타이어 문자를 영상 처리한 후 신명망을 이용하여 인식 시스템을 구축한 것이다. 타이어에 각인된 문자부분을 영상 처리시, 타이어 표면에 각인된 문자가 조명에 민감한 반응을 보일 뿐아니라 난반사로 인한 문자 경계선이 왜곡되는 현상과 인접한 두 개의 문자가 한 레이블을 갖는 현상이 발생된다. 따라서 본 논문에서는 이러한 특성을 고려한 타이어 영상 처리 알고리즘을 제안하여 실헝을 통해 유효성을 증명하였다. 또한 타이어분류 코드인DOT 코드를 효율적으로 인식하기 위해 인식기를 다중 연결한 MCBP(Multi-Chained BackPropogation)망을 제안하였다. MCBP망에서는 타이어 개별 문자영역에 대한 X, Y축 투영 값을 추출하여 문자 영역 분류를 위한 특징 값과 가로, 세로 7$\times$8 정규화를 이용한 개별 문자의 특징을 추출하여 인식 처리한다. 본 논문에서는 MCBP망에 의해 인식된 결과와 DOT 코드 데이터 베이스를 비교 처리하는 후처리를 통해서 오인식율을 3% 줄였다. 학습 및 인식 결과는 단일 역전파망에 비해 학습시간에서는 60%의 개선과 효과를 얻었으며, 인식율은 90%에서 95%로 향상었다. 또한 후처리까지 포함하면 전체 인식율을 98%까지 증가되는 높은 인식율을 얻을 수 있었다.

  • PDF

Mask R-CNN과 Dense-Net을 이용한 제조 현장에서의 작업자 행동 추출 (Extraction of Worker Behavior at Manufacturing Site using Mask R-CNN and Dense-Net)

  • 리타 리자얀티;황민태;진교홍
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.150-153
    • /
    • 2022
  • 본 논문은 작업자와 객체들이 서로 혼재되어 있는 제조 현장에서 Mask R-CNN을 이용해 객체들을 탐지한 후 이를 Dense-Net을 통해 객체 형상을 자동으로 추출하는 기술을 담고 있다. 이는 맞춤형 공장 데이터 세트를 기반으로 하며, 대상이 되는 객체는 작업자, 기계, 도구, 컨트롤 박스 및 제품들이다. Mask R-CNN은 이미 잘 알려진 객체 인식 방식으로서 다중 객체 인식을 지원하며, Dense-Net은 중첩된 객체들로 부터 개별 객체를 추출하는 데 탁월한 효과를 보여준다. 이러한 두 가지 기술을 이용한 기초구현 결과 제조 현장 모습에서 객체들을 정상적으로 추출해 이미지를 설명할 수 있으며, 향후 객체에 대한 레이블링과 객체 간의 상호 관계를 추가해 작업자의 이상 행동을 감지하는 용도로 활용할 계획이다.

  • PDF