• 제목/요약/키워드: 레이블

검색결과 532건 처리시간 0.024초

후보 레이블 정보를 반영한 멀티 디코더 모델 (Multi-decoder Model Reflecting Candidate Label Information)

  • 박원재;최기현;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.307-310
    • /
    • 2021
  • 지도 학습을 하기 위해선 레이블이 부착된 데이터셋이 필요하다. 크라우드소싱 서비스를 통해 데이터셋을 구축하는데 다수의 주석자(Annotator)가 관여한다. 다수의 주석자가 레이블을 할당하고 과반수인 레이블을 최종 정답으로 결정한다. 이 과정에서 최종 정답과 다른 후보 레이블의 정보가 누락된다. 이를 완화하고 목표 작업에 대한 성능을 높이기 위해 후보 레이블에 대한 정보를 반영하는 멀티 디코더 모델을 제안한다. KLUE-TC, SNLI, MNLI 데이터셋으로 정량적 성능 평가를 수행하였으며 실험한 데이터셋 모두 일괄적인 성능 향상을 보였다.

  • PDF

MPLS에서 F/T 분류기를 이용한 레이블 할당 방안 (A Label Assignment Scheme using F/T Classifier in MPLS)

  • 김광수;이재기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (중)
    • /
    • pp.1483-1486
    • /
    • 2002
  • MPLS(Multiprotocol Label Switching)에서 레이블은 패킷의 스위칭에 사용되는 중요한 인자이다. 할당되는 레이블 수에 따라 MPLS 네트워크의 성능에 큰 영향을 미친다. 본 논문에서는 할당되는 레이블 수를 최소화하기 위해 F/T 분류기를 이용하는 방법을 제안하였다. 이 방법은 기존의 방법에 T 시간만큼을 더 경과한 후에 유입된 플로우들을 하나의 레이블로 할당하는 방법으로, 기존의 방법 보다 할당되는 레이블 수가 감소함을 네트워크 시뮬레이션을 이용한 실험으로 확인하였다.

  • PDF

다중 레이블 분류의 정확도 향상을 위한 스킵 연결 오토인코더 기반 레이블 임베딩 방법론 (Label Embedding for Improving Classification Accuracy UsingAutoEncoderwithSkip-Connections)

  • 김무성;김남규
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.175-197
    • /
    • 2021
  • 최근 딥 러닝 기술의 발전으로 뉴스, 블로그 등 다양한 문서에 포함된 텍스트 분석에 딥 러닝 기술을 활용하는 연구가 활발하게 수행되고 있다. 다양한 텍스트 분석 응용 가운데, 텍스트 분류는 학계와 업계에서 가장 많이 활용되는 대표적인 기술이다. 텍스트 분류의 활용 예로는 정답 레이블이 하나만 존재하는 이진 클래스 분류와 다중 클래스 분류, 그리고 정답 레이블이 여러 개 존재하는 다중 레이블 분류 등이 있다. 특히, 다중 레이블 분류는 여러 개의 정답 레이블이 존재한다는 특성 때문에 일반적인 분류와는 상이한 학습 방법이 요구된다. 또한, 다중 레이블 분류 문제는 레이블과 클래스의 개수가 증가할수록 예측의 난이도가 상승한다는 측면에서 데이터 과학 분야의 난제로 여겨지고 있다. 따라서 이를 해결하기 위해 다수의 레이블을 압축한 후 압축된 레이블을 예측하고, 예측된 압축 레이블을 원래 레이블로 복원하는 레이블 임베딩이 많이 활용되고 있다. 대표적으로 딥 러닝 모델인 오토인코더 기반 레이블 임베딩이 이러한 목적으로 사용되고 있지만, 이러한 기법은 클래스의 수가 무수히 많은 고차원 레이블 공간을 저차원 잠재 레이블 공간으로 압축할 때 많은 정보 손실을 야기한다는 한계가 있다. 이에 본 연구에서는 오토인코더의 인코더와 디코더 각각에 스킵 연결을 추가하여, 고차원 레이블 공간의 압축 과정에서 정보 손실을 최소화할 수 있는 레이블 임베딩 방법을 제안한다. 또한 학술연구정보서비스인 'RISS'에서 수집한 학술논문 4,675건에 대해 각 논문의 초록으로부터 해당 논문의 다중 키워드를 예측하는 실험을 수행한 결과, 제안 방법론이 기존의 일반 오토인코더 기반 레이블 임베딩 기법에 비해 정확도, 정밀도, 재현율, 그리고 F1 점수 등 모든 측면에서 우수한 성능을 나타냄을 확인하였다.

문서 클러스터를 위한 워드넷기반의 대표 레이블 선정 방법 (Representative Labels Selection Technique for Document Cluster using WordNet)

  • 김태훈;손미애
    • 인터넷정보학회논문지
    • /
    • 제18권2호
    • /
    • pp.61-73
    • /
    • 2017
  • 본 연구에서는 문서 클러스터링 결과 도출된 개별 클러스터가 함축하고 있는 의미를 파악하는 데 필요한 어휘들의 정보량을 활용한 문서 클러스터 레이블링(Documents Cluster Labeling) 방법을 제안하였다. 이를 위해, 클러스터에 포함된 어휘들이 해당 클러스터에서 얼마나 중요한 비중을 차지하고 있는지 파악하기 위하여 각 어휘의 출현 빈도와 정보량을 이용한 어휘의 가중치를 계산한 후, 워드넷을 이용하여 클러스터에 포함된 어휘들의 최근접 공통 상위어를 후보 레이블로 식별하였다. 이상의 과정을 거쳐 식별된 후보 레이블의 정보량과 클러스터내에서의 중요도 가중치를 활용해, 해당 클러스터의 의미와 특징을 포괄적으로 표현할 수 있는 대표 레이블을 결정하였다. 본 연구의 우수성을 입증하기 위해 다음과 같은 실험을 수행하였다. 실험은 본 연구에서 제안한 방법에 따라 선정된 레이블과 후보 레이블을 워드넷에 프로젝션한 후, 워드넷상에서 이들 레이블의 위치(깊이)를 확인하였다. 또한 선정된 후보 레이블을 상위어로 갖고 있는 클러스터 내 어휘의 수를 도출하여, 휴리스틱 방법에 따라 선정된 레이블을 전문가가 찾은 대표 레이블과의 비교를 수행하였다. 평가지표로 후보 레이블의 적합성($Suitability_{cl}$)과 대표 레이블의 적절성($Appropriacy_{rl}$)을 활용하였다. 실험 결과, 본 연구에서 제안한 방법을 적용해 문서 클러스터 레이블링을 수행할 경우, 후보 레이블의 적합성의 경우 기존의 방법보다 약간 감소하지만 계산량이 기존 방법의 약 20% 정도로 감소하였으며, 대표 레이블의 적절성의 경우 기존의 방법보다 우수한 결과를 도출하는 것을 확인하였다.

광 패킷 레이블 스택구조 기반의 LSP 터널운용을 위한 머징 포인트 (Merging points for the operation of a LSP tunnel based on an optical label stack structure)

  • 김경목;오영환
    • 대한전자공학회논문지TC
    • /
    • 제42권5호
    • /
    • pp.5-12
    • /
    • 2005
  • 최근 인터넷 트래픽의 급격한 증가로 다양한 트래픽 처리를 위한 대역폭 확보 및 효율적인 트래픽 처리가 요구되게 되었다. 이러한 요구에 광대역의 대역폭을 지원하는 파장단위의 전송이 소개 되었으며 다양한 트래픽 처리를 위한 레이블 처리 절차가 연구 되었다. 본 논문에서는 기존의 MPLS 레이블 스택 처리 단위의 복잡성을 해결하고 광 신호의 정형화된 레이블 스택구조를 소개하여 LSP 터널 내 외부에서 발생하는 레이블 머징의 상관관계를 분석하였다. 적응적인 레이블 구조 및 머징 포인트를 적용함으로써 GMPLS에서 발생하는 계층적인 레이블을 획일적으로 단순화 시킬 수 있고 백본 네트워크의 요구에 따른 선택적인 레이블 선정기준은 비용 및 처리시간 측면에서 보다 유리한 장점을 가질 수 있다.

OpenMP 프로그램을 위한 효율적 병행성 정보의 생성기법 (An Efficient Scheme for Creating Concurrency Information in OpenMP Programs)

  • 하옥균;김선숙;전용기
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.534-539
    • /
    • 2010
  • OpenMP 프로그램의 수행 중에 발생하는 자료 경합과 같은 병행성 오류는 디버깅을 위하여 반드시 탐지되어야만 한다. 그러나 이를 탐지하는 것은 어려운 일이다. 접근사건의 발생 후 관계를 기반으로하는 경합 탐지 기법은 프로그램의 수행 중에 발생하는 스레드의 병행성 정보를 식별하기위한 레이블을 생성하고, 생성된 스레드의 레이블을 기반으로 공유변수에 접근하는 사건을 접근역사를 통해 감시함으로써 경합을 탐지한다. 이러한 경합 탐지의 방법에서 레이블 생성을 위한 NR 레이블링 기법은 병행성 정보생성 시에 지역자료 구조를 사용함으로써 병목현상이 발생하지 않으며, 접근역사에 저장하는 레이블의 크기가 상수 값을 갖는 공간적 효율성을 제공한다. 또한 부모스레드의 정보역사를 정렬된 리스트 형태로 가져 병행성 정보 비교 시에 이진탐색이 가능하므로 시간적 효율성을 가지는 우수한 기법이다. 그러나, NR 레이블링은 레이블의 생성시에 부모스레드의 정보역사를 유지하기 위해서 내포 병렬성의 깊이에 의존하는 시간적 비용이 요구된다. 본 논문에서는 부모스레드의 정보역사 유지를 위해 상수적인 시간 및 공간적 복잡도를 갖도록 NR 레이블링 기법을 개선한다. 합성 프로그램을 이용하여 실험한 결과에서 개선된 기법은 최대 병렬성의 증가에 따라 레이블의 생성과 유지시 기존의 기법보다 평균 4.5배 빠르고, 레이블링을 위해 평균 3배 감소된 기억공간을 요구하며, 내포 병렬성에 의존적이지 않음을 보인다.

  • PDF

준지도 학습에서 꼭지점 중요도를 고려한 레이블 추론 (A Label Inference Algorithm Considering Vertex Importance in Semi-Supervised Learning)

  • 오병화;양지훈;이현진
    • 정보과학회 논문지
    • /
    • 제42권12호
    • /
    • pp.1561-1567
    • /
    • 2015
  • 준지도 학습은 기계 학습의 한 분야로서, 레이블된 데이터와 레이블되지 않은 데이터 모두를 사용하여 모델을 학습함으로써 지도 학습에 비해 예측 정확도를 높일 수 있다. 최근 각광받고 있는 그래프 기반 준지도 학습은 입력 데이터를 그래프의 형태로 변환하는 그래프 구축 단계와 이를 사용하여 레이블되지 않은 데이터의 레이블을 예측하는 레이블 추론 단계로 나뉜다. 이 추론은 준지도 학습에서의 평활도 가정을 기본으로 한다. 본 연구에서는 추가로 각 꼭지점 중요도를 결합함으로써 개선된 레이블 추론 알고리즘을 제안한다. 이와 함께 알고리즘의 수렴성을 증명하고, 또한 실험을 통해 알고리즘의 우수성을 검증하였다.

편의점 도시락 레이블의 정보 중요성에 관한 연구 (A Study on the Importance of Information on Lunchbox Labels in Convenience Stores)

  • 이연정;김승인
    • 디지털융복합연구
    • /
    • 제18권8호
    • /
    • pp.371-376
    • /
    • 2020
  • 본 연구는 효율적인 정보전달을 위한 편의점 도시락 레이블에 관한 연구로써, 구매자들이 원하는 정보의 중요도를 파악해 도시락 구매 시 구매자들에게 도움을 줄 수 있는 레이블을 정립하는 데 그 목적이 있다. 연구방법으로는 문헌 연구와 설문조사를 통해 구매자들이 도시락을 구매할 때 중요하게 생각하는 요소와 레이블에서 확인하는 정보 및 그 정보들의 중요도 순서를 분석하였다. 연구결과 도시락 구매자들이 중요하다고 생각되는 레이블 정보는 가격, 유통기한, 칼로리, 도시락 구성요소, 제조일자 순으로 나타났다. 또한, 레이블을 확인하지 않는 구매자들은 가독성이 떨어지는 레이블을 지적했다. 본 연구는 구매자들이 중요하다고 생각하는 정보들을 레이블에 새롭게 정립한다면 구매자들이 레이블을 통해 쉽게 정보를 확인하고 구매할 수 있을 것으로 기대한다.

IP Header의 Address Field를 사용한 Shim Header 할당 알고리즘 (Allocation Algorithm of Shim Header Using Address Field of IP Header)

  • 박상준;박우출;이병호
    • 한국통신학회논문지
    • /
    • 제26권5A호
    • /
    • pp.773-778
    • /
    • 2001
  • 인터넷이 본격적으로 상업망으로 전화되고 보편화됨에 따라 인터넷 수요가 급격히 증가될 것으로 예상되고 있다. 이에 따른 빠른 전송과 서비스를 만족시키기 위한 포워딩 기술로써 MPLS에 대한 연구가 활발히 진행되고 있다. 본 논문은 MPLS 영역에서 IP 패킷의 성능이 병목 지역에서 레이블된 것과 레이블 되지 않은 패킷에 따라 어떤 성능을 보이는지를 분석하였다. 링크의 대역폭이 병목지역에서 발생된 패킷 발생률보다 더 작을 경우에는 오히려 시간이 지남에 EK라 MPLS 레이블된 경우에 레이블 오버헤드와 빠른 스위칭이 더욱 혼잡을 발생시켜 레이블 되지 않은 IP 패킷보다 성능이 저하되었다. 이러한 현상에 대한 해결책으로 본 논문은 MPLS shim header 부분에 대한 overhead를 레이블 스위칭 할 때 IP 라우팅을 사용하지 않는 동안 사용되지 않는 필드인 IP header의 주소 필드를 이용하는 새로운 MPLS shim header 할당 알고리즘을 제안하였다.

  • PDF

표상방식에 따른 아이콘과 레이블 디스플레이의 유용성 비교 (The Usefulness of Icon and Label Displays)

  • 이주환;한광희
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.92-98
    • /
    • 2002
  • 복잡한 기능이나 개념을 제한된 공간에 효과적으로 표현하는데 아이콘이 널리 이용된다. 이러한 아이콘 개발이 디자이너의 미적인 기준이나, 시스템에서 일률적으로 사용에 의해 결정되는 경향이 있다. 본 연구는 동일한 정보를 포함하는 아이콘이나 레이블같이 서로 다른 표상들이 그 표상 방식의 유용성 측면에서 다른 결과를 보일 수 있으며, 기능의 표상 방식이 다르면, 아이콘이나 레이블에 대한 이해가 서로 다른 인지 처리 체계를 거친다는 기본 가정에 근거를 두고 진행되었다. 구체적으로는 아이콘을 기존에 형성된 표상 방식들 가운데서 인지적 특성을 고려한 표상들로 분류한 기준을 이용하여, 실제 컴퓨터 사용자 환경에서 통용되고 있는 아이콘들을 수집, 분류하고, 각각의 표상 방식에 따른 아이콘의 유용성을 알아보고자 각 아이콘에 대응되는 레이블과의 수행을 비교하였다. 결과에 따르면, 새로운 기능을 익혀야하는 초기에는 아이콘보다 레이블과 같은 텍스트가 더욱 효과적이지만, 익숙해진 후 그 수행이 비슷해짐을 확인했다. 그러나 임의적 표상방식으로 디자인된 아이콘은 레이블보다 더 부정확하고 느린 수행을 지속적으로 나타냈고, 기능의 세 가지 표상방식에 따라서 아이콘에 대한 수행이 서로 다른 패턴을 보였다. 이는 아이콘과 같은 컴퓨터 사용자 인터페이스의 설계와 사용 단계에서, 표현하고자 하는 기능과 사용자의 인지적 속성인 표상 방식을 충분히 고려해야 한다는 것을 보여준다.

  • PDF