• 제목/요약/키워드: metric learning

검색결과 128건 처리시간 0.03초

A multi-label Classification of Attributes on Face Images

  • Le, Giang H.;Lee, Yeejin
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 하계학술대회
    • /
    • pp.105-108
    • /
    • 2021
  • Generative adversarial networks (GANs) have reached a great result at creating the synthesis image, especially in the face generation task. Unlike other deep learning tasks, the input of GANs is usually the random vector sampled by a probability distribution, which leads to unstable training and unpredictable output. One way to solve those problems is to employ the label condition in both the generator and discriminator. CelebA and FFHQ are the two most famous datasets for face image generation. While CelebA contains attribute annotations for more than 200,000 images, FFHQ does not have attribute annotations. Thus, in this work, we introduce a method to learn the attributes from CelebA then predict both soft and hard labels for FFHQ. The evaluated result from our model achieves 0.7611 points of the metric is the area under the receiver operating characteristic curve.

  • PDF

메타 러닝과 방법론 연구 동향 (A Survey on Methodology of Meta-Learning)

  • 지훈;이연준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.665-666
    • /
    • 2023
  • 딥러닝은 인간이 탐지하기 어려운 데이터의 특징 및 패턴을 인지하고, 이들을 학습하여 데이터를 분류 및 예측할 수 있는 기술이다. 그러나 딥러닝 모델을 잘 학습시키기 위해서는 고품질의 대용량 데이터와 이들을 처리할 수 있는 방대한 컴퓨터 자원이 요구되는 것이 일반적이다. 따라서 소량의 데이터만이 존재하는 분야나 컴퓨터 자원이 한정되어 있는 상황에서는 딥러닝을 적용하기 어렵다. 본 논문에서는, 소량의 데이터로도 모델을 자신들의 태스크에 맞게 최적화시킬 수 있는 메타러닝에 대해 소개하고, 메타 러닝 기법들의 방향에 따른 Metric-Based, Model-Based 및 Optimization 기반 모델들에 대해 소개하고, 앞으로 나아가야 할 연구 방향에 대해 제시한다.

다양한 손실 함수를 이용한 음성 향상 성능 비교 평가 (Performance comparison evaluation of speech enhancement using various loss functions)

  • 황서림;변준;박영철
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.176-182
    • /
    • 2021
  • 본 논문은 다양한 손실 함수에 따른 Deep Nerual Network(DNN) 기반 음성 향상 모델의 성능을 비교 평가한다. 베이스라인 모델로는 음성의 위상 정보를 고려할 수 있는 복소 네트워크를 사용하였다. 손실 함수는 두 가지 유형의 기본 손실 함수, Mean Squared Error(MSE)와 Scale-Invariant Source-to-Noise Ratio(SI-SNR)를 사용하였으며 두 가지 유형의 지각 기반 손실 함수 Perceptual Metric for Speech Quality Evaluation(PMSQE)과 Log Mel Spectra(LMS)를 사용한다. 성능은 각 손실 함수의 다양한 조합을 사용하여 얻은 출력을 객관적인 평가와 청취 테스트를 통해 측정하였다. 실험 결과, 지각기반 손실 함수를 MSE 또는 SI-SNR과 결합하였을 때 전반적으로 성능이 향상되며, 지각기반 손실함수를 사용하면 객관적 지표에서 약세를 보이는 경우라도 청취 테스트에서 우수한 성능을 보임을 확인하였다.

ConvNet을 활용한 영역기반 신속/범용 영상정합 기술 (Fast and All-Purpose Area-Based Imagery Registration Using ConvNets)

  • 백승철
    • 정보과학회 논문지
    • /
    • 제43권9호
    • /
    • pp.1034-1042
    • /
    • 2016
  • 영역기반 영상정합은 미리 정의된 특징의 도움 없이 영상을 정합할 수 있기 때문에, 기계학습과 접목된다면 이론 상 다양한 영상정합 문제에 적용 가능하다. 그러나 신속한 정합을 위하여, 미리 정의된 특징을 탐지하여 패치 쌍 후보를 선정에 사용하는데, 이는 영역기반 방법의 적용성에 제약을 준다. 이를 해소하기 위하여 본 연구에서는 단순히 두 패치의 관련도 뿐만 아니라 두 패치가 어느 정도 공간 상 떨어져 있는지에 대한 정보를 제공하는 ConvNet Dart를 개발하였다. 이러한 정보를 기반으로 효율적으로 패치 쌍 탐색공간을 줄일 수 있었다. 추가로 Dart가 제대로 작동할 수 없는 영역을 식별하는 ConvNet Fad를 개발하여 정합의 정밀도를 높였다. 본 연구에서는 이들을 딥러닝으로 학습하였으며, 이를 위해 소수의 정합된 영상에서 다량의 예제를 생성하는 방법을 개발하였다. 마지막으로 단순한 영상정합 문제에 성공적으로 적용하여, 이러한 방법론이 작동하는 것을 보였다.

산업용 자율 주행 로봇에서의 격자 지도를 사용한 강화학습 기반 회피 경로 생성기 개발 (Development of Reinforcement Learning-based Obstacle Avoidance toward Autonomous Mobile Robots for an Industrial Environment)

  • 양정연
    • 한국콘텐츠학회논문지
    • /
    • 제19권3호
    • /
    • pp.72-79
    • /
    • 2019
  • 자율 주행은 이동 로봇의 핵심적 기술로써, 측정된 센서 정보를 토대로 불확실한 위치 정보를 이용한 지도 작성 및 수정 기능과, 불확실한 지도 및 센서 정보를 이용한 로봇의 위치 인식 기능으로 구성된다. 자율주행은 이러한 주행 위치의 불확실성에 기반한 확률론적 방법론과 함께 주행 시 장애물의 감지 및 회피 경로의 생성, 반복적 주행 패턴에 따른 경로 관리 기능이 필수적 요소이다. 거리 기반의 스캐너를 통해 관측된 센서 입력은, 지도 구성에 사용된 벽과 같은 정적 물체와 주행 시의 사람처럼 움직이는 동적 물체와의 구별이 필요하기 ?문에 장애물 감지에 어려움이 있다. 본 논문에서는, 이러한 자율 주행 환경에서 기존의 정적, 동적 개체의 판별 방식과 비교하여, 장애물 회피를 위한 저해상도 격자 공간의 생성 및 강화학습을 이용한 경로 생성을 다루고자 한다. 최종적으로 실험을 통해 제안된 방법론의 실효성을 검증하고자 한다.

목걸이형 센서를 이용한 머신러닝 기반 가축상태 모니터링 (Health Monitoring of Livestock using Neck Sensor based on Machine Learning)

  • 이웅섭;박성민;반태원;김성환;류종열;성길영
    • 한국정보통신학회논문지
    • /
    • 제22권11호
    • /
    • pp.1421-1427
    • /
    • 2018
  • 사물 인터넷 기술의 급속한 발전으로 다양한 종류의 스마트 센서들이 개발 보급되고 있다. 이러한 스마트 센서들은 주로 관리자의 경험에 의해서 관리되던 축산업에도 최근 적용되어 가축 개체에 웨어러블 센서를 달거나 사물인터넷 센서를 갖춘 스마트팜 사용을 통해서 가축관리의 효율성을 향상시키고 있다. 본 논문에서는 목걸이형 스마트 센서를 이용하여 젖소의 체온과 운동량을 측정하고 이를 기반으로 개체의 상태를 파악하는 방안을 개발하였다. 특히 젖소 관리에서 제일 중요한 요소인 젖소의 발정여부를 파악하는 방안을 다양한 머신러닝 방법을 이용하여 분석하였고 이를 통해서 높은 정확도로 발정여부를 예측할 수 있음을 보였다. 제안한 방안의 사용을 통해서 젖소의 발정여부를 빠르게 확인하고 이를 통해서 젖소 관리의 효율성을 향상시킬 수 있다.

터널 막장 3차원 지형모델 상에서의 불연속면 자동 매핑을 위한 딥러닝 기법 적용 방안 (Deep Learning Approach for Automatic Discontinuity Mapping on 3D Model of Tunnel Face)

  • 추엔 팜;신휴성
    • 터널과지하공간
    • /
    • 제33권6호
    • /
    • pp.508-518
    • /
    • 2023
  • 이 논문은 LiDAR 스캔 또는 사진측량 기술에 의해 재구성된 3D 디지털 모델을 기반으로 터널 벽면의 불연속면을 자동으로 매핑하는 새로운 접근 방식을 제안한다. 본 제안에서는 U-Net이라 불리는 딥러닝 시맨틱 영역분할 모델을 사용하며, 터널 막장면의 3D 지형 모델에서 불연속면 영역을 식별해 낸다. 제안된 딥러닝 모델은 투영된 RGB 이미지, 면의 깊이 이미지 및 국부적인 면의 표면 속성 이미지(즉, 법선 벡터 및 곡률 이미지)를 포함한 다양한 정보를 종합 학습하여 기본 3차원 이미지에서 불연속면 영역을 효과적으로 분할한다. 이후 영역분할 결과는 면의 깊이 맵과 투영 행렬을 사용하여 3D 모델로 다시 투영시키고, 3D 공간 내에서 불연속면의 위치 및 범위를 정확하게 표현한다. 영역분할 모델의 성능은 영역 분할된 결과를 해당 지면 실측 값과 비교함으로써 평가하였으며, IoU(intersection-over-union) 값이 약 0.8 정도로 나타나 영역분할 결과의 높은 정확성을 확인하였다. 여전히 학습데이터가 제한적 이었음에도 불구하고, 제안 기법은 3D 모델의 점군 데이터를 불연속면의 유사군으로 그룹화하기 위해 전 막장면의 법선 벡터와 클러스터링과 같은 비지도 학습기반 알고리즘에만 의존하던 기존 접근 방식의 한계의 극복 가능성을 보여주었다.

사례 기반 추론 시스템에서 적응 지식 자동 획득 모델에 관한 연구 (A Study on Adaptive Knowledge Automatic Acquisition Model from Case-Based Reasoning System)

  • 이상범;김영천;이재훈;이성주
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.81-86
    • /
    • 2002
  • In current CBR(Case-Based Reasoning) systems, the case adaptation is usually performed by rule-based method that use rules hand-coded by the system developer. So, CBR system designer faces knowledge acquisition bottleneck similar to those found in traditional expert system design. In this thesis, 1 present a model for learning method of case adaptation knowledge using case base. The feature difference of each pair of cases are noted and become the antecedent part of an adaptation rule, the differences between the solutions in the compared cases become the consequent part of the rule. However, the number of rules that can possibly be discovered using a learning algorithm is enormous. The first method for finding cases to compare uses a syntactic measure of the distance between cases. The threshold fur identification of candidates for comparison is fixed th the maximum number of differences between the target and retrived case from all retrievals. The second method is to use similarity metric since the threshold method may not be an accurate measure. I suggest the elimination method of duplicate rules. In the elimination process, a confidence value is assigned to each rule based on its frequency. The learned adaptation rules is applied in riven target Problem. The basic. process involves search for all rules that handle at least one difference followed by a combination process in which complete solutions are built.

  • PDF

국내 원격 교육 콘텐츠의 접근성 분석 사례 (A Case Study on the Accessibility of Online Learning Content in Korea)

  • 신승식
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 춘계종합학술대회논문집
    • /
    • pp.92-101
    • /
    • 2003
  • 국내의 웹기반 교육용 콘텐츠 10개를 선정하여 접근성 평가를 실시하였다. (1) 자동 분석 프로그램인 Bobby를 사용한 웹 콘텐츠 접근성 지침(WCAG) 1.0 준수 여부에 대한 기초 자료 산출 (2) SGML 표준 문법 검사 (3) 텍스트 브라우저를 포함한 여러 브라우저에서의 호환성 시험 (4) W3C가 제안한 접근성 체크포인트를 중심으로 한 직접 분석 순으로 접근성을 평가한 결과, 대부분의 콘텐츠가 모든 단계에서 매우 저조한 결과를 보여주었다. 접근성이 낮은 주된 이유는 웹 표준, 브라우저 호환성, 장치 독립성에 대해서 거의 고려를 하지 않고 콘텐츠를 개발하기 때문인 것으로 보인다. 또 검사 대상 콘텐츠들은 대부분 가장 잘 꾸며진 환경의 사용자를 중심으로 한 시청각적인 효과에 치중한 결과, 제한된 사용자 환경에서의 대안적인 접근 경로를 제공하지 않고 있었다. 보편적인 정보 취득을 포함한 점점 더 많은 학습이 온라인으로 이루어지는 현실에서 접근성이 낮은 콘텐츠들은 정보 격차를 더 심화시킬 수 있을 것이다. 따라서, 학습용 콘텐츠의 품질을 결정하는 중요한 요소로 접근성 문제를 고려해야 한다.

  • PDF

컴뮤트 타임 기반의 다양체 임베딩을 이용한 파형 신호 인식에 관한 연구 (A Study on Classification of Waveforms Using Manifold Embedding Based on Commute Time)

  • 한희일
    • 전자공학회논문지
    • /
    • 제51권2호
    • /
    • pp.148-155
    • /
    • 2014
  • 본 논문에서는 파형 신호에서 패치를 추출하고 이를 패치 그래프로 구성한 다음, 이로부터 대표적인 다양체 임베딩 방식인 컴뮤트 타임 임베딩 기법을 구현하고, 이의 특성을 분석한다. 특히 음성 신호나 악기 음 등, 시간에 따라 스펙트럼이 가변적인 신호를 임베딩하면 스펙트럼의 변화에도 불구하고 그 신호 고유의 기하 구조를 생섬함을 실험으로 확인한다. 다양체 임베딩은 비선형 공간에 놓여 있는 고차원 데이터를 저차원 공간으로의 효율적인 맵을 가능하게 하지만 그래프 구성에 이용된 데이터에 대한 정보만 알 수 있고 그렇지 않은 데이터(out-of-sample data)에 대해서는 정보를 얻기 어렵다. 따라서 다양체 임베딩은 데이터 클러스터링에 적절히 적용 가능하지만, 훈련 과정을 통해 얻은 정보를 기초로 유추 기능이 요구되는 인식 등에는 응용하기 어려운 제약이 따른다. 이를 해결하기 위하여 본 논문에서는 다양체 임베딩이 인식 분야에도 적용 가능하도록 새로운 알고리즘을 제안하고 악기 음 분류 실험을 통하여 그 특성을 분석한다.