• 제목/요약/키워드: 레이블이 결정된 데이터

검색결과 23건 처리시간 0.021초

연합학습의 의료분야 적용을 위한 자기지도 메타러닝 (Self-supervised Meta-learning for the Application of Federated Learning on the Medical Domain)

  • 공희산;김광수
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.27-40
    • /
    • 2022
  • 최근 많은 발전을 이룬 의료 인공지능은 의사가 진단과 결정을 내리는 데 도움을 주는 등 중요한 역할을 수행하고 있다. 특히, 흉부 엑스레이 분야는 접근성 및 흉부질환 탐지에 유용함과 최근 COVID-19 상황이 도래함에 따라 많은 관심을 받고 있다. 그러나, 데이터의 수가 많음에도 레이블이 있는 데이터의 수가 부족하므로 효과적인 인공지능 모델을 만드는데 한계가 있다. 이러한 문제를 완화하는 방안으로 연합학습을 흉부 엑스레이 데이터에 적용한 연구가 등장했지만, 여전히 다음과 같은 문제를 내포하고 있다. 1) Non-IID 환경에서 발생할 수 있는 문제를 고려하지 않았다. 2) 연합학습 환경에서도 여전히 클라이언트의 레이블이 있는 데이터가 부족하다. 우리는 자기지도학습 모델을 연합학습의 Global 모델로 사용함으로써 위와 같은 문제를 해결하는 방법을 제안한다. 이를 위해 흉부 엑스레이 데이터를 사용한 연합학습에 알맞은 자기지도학습 방법론을 실험적으로 탐색하며, 자기지도학습 모델을 연합학습에 사용함으로써 얻을 수 있는 장점을 검증한다.

삭제된 노드의 재사용을 이용한 Fast XML 인코딩 기법 (Fast XML Encoding Scheme Using Reuse of Deleted Nodes)

  • 고혜경
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.835-843
    • /
    • 2023
  • XML 데이터의 구조를 고려할 때 경로 및 트리 패턴 매칭 알고리즘은 XML 질의 처리에 중요한 역할을 하고 있다. 노드 간의 결정 또는 관계를 용이하게 하기 위해 XML 트리의 노드는 일반적으로 두 노드 간의 조상-후손 관계를 신속하게 설정할 수 있는 방식으로 레이블링된다. 그러나 이러한 기법은 순서에 따른 업데이트로 삽입이 발생할 경우 기존 노드에 레이블을 다시 지정하거나 특정 값을 다시 계산해야 하는 단점이 발생한다. 따라서 현재 레이블링 기법들에서는 레이블을 업데이트 하는 비용이 매우 높다. 본 논문에서는 재레이블링 또는 재계산 없이 순서에 민감한 XML 문서의 업데이트를 지원하는 Fast XML 인코딩 기법이라는 새로운 레이블링을 제안한다. 또한 XML 트리의 동일한 위치에서 삭제된 레이블을 재사용하여 레이블의 길이를 제어한다. 제안한 재사용 알고리즘은 삭제된 모든 레이블을 동일한 위치에 삽입할 때 레이블의 길이를 줄일 수 있다. 실험 결과에서 제안된 기법은 순서에 민감한 질의 및 업데이트를 효율적으로 처리할 수 있다.

효율적인 레이블 스위칭을 위한 캐쉬 테이블 관리 (Cache Table Management for Effective Label Switching)

  • 김남기;윤현수
    • 한국정보과학회논문지:정보통신
    • /
    • 제28권2호
    • /
    • pp.251-261
    • /
    • 2001
  • 인터넷이 급속도로 발전되면서 트래픽이 폭발적으로 증가하여 현재 라우터에는 많은 부하가 걸리고 있으며 스위칭 기술은 라우팅 보다 빠르게 데이터를 전송하면서 라우터 병목 현상을 줄일수 있다. 따라서 IP 라우팅에 스위칭 기술을 접목한 레이블 스위칭 네트워크가 출현하게 되었다. 레이블 스위칭 기술 중 데이터 기반 레이블 스위칭에서는 흐름 분류와 캐쉬 테이블 관리가 중요하다. 흐름 분류는 패킷을 스위칭으로 전송할 것인지 그렇지 않으면 기존 라우팅으로 전송할 것인지를 결정하는 부분인데 이러한 흐름 분류를 위한 정보와 레이블 스위칭을 위한 정보를 저장하는 곳이 캐쉬 테이블이다. 이런 캐쉬 테이블이 크면 클수록 많은 패킷을 스위칭 할 수 있고 스위칭 설정 비용을 줄일 수 있기 때문에 캐쉬 테이블은 클수록 좋으나 라우터 자원에 의해 제약을 받으므로 적절한 캐쉬 테이블 관리가 필요하다. 따라서 효율적인 캐쉬 테이블 관리를 위해 인터넷 트래픽 특성을 고려한 캐쉬 대체 기법에 관한 연구가 요구되어 진다. 본 논문에서는 레이블 스위칭을 위한 여러 캐쉬 대체 기법들을 소개하고 제안한다. 첫째로 스위칭 용량에 한계가 없을 경우 FIFO, LFC, LRU,기법을 평가하고 우선순위 LRU 가중치 우선순위 LRU 기법을 제안한다. 둘째로 스위칭 용량에 한계가 있을 경우 LFC-LFC, LFC-LRU, LRU-LFC, LRU-LRU 기법이 한계가있을 경우 LRU-가중치 LRU 기법이 가장 나은 성능을 보였다

  • PDF

Input-feeding RNN Search 모델과 CopyNet을 이용한 한국어 의미역 결정 (Korean Semantic Role Labeling using Input-feeding RNN Search Model with CopyNet)

  • 배장성;이창기
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.300-304
    • /
    • 2016
  • 본 논문에서는 한국어 의미역 결정을 순차열 분류 문제(Sequence Labeling Problem)가 아닌 순차열 변환 문제(Sequence-to-Sequence Learning)로 접근하였고, 구문 분석 단계와 자질 설계가 필요 없는 End-to-end 방식으로 연구를 진행하였다. 음절 단위의 RNN Search 모델을 사용하여 음절 단위로 입력된 문장을 의미역이 달린 어절들로 변환하였다. 또한 순차열 변환 문제의 성능을 높이기 위해 연구된 인풋-피딩(Input-feeding) 기술과 카피넷(CopyNet) 기술을 한국어 의미역 결정에 적용하였다. 실험 결과, Korean PropBank 데이터에서 79.42%의 레이블 단위 f1-score, 71.58%의 어절 단위 f1-score를 보였다.

  • PDF

Input-feeding RNN Search 모델과 CopyNet을 이용한 한국어 의미역 결정 (Korean Semantic Role Labeling using Input-feeding RNN Search Model with CopyNet)

  • 배장성;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.300-304
    • /
    • 2016
  • 본 논문에서는 한국어 의미역 결정을 순차열 분류 문제(Sequence Labeling Problem)가 아닌 순차열 변환 문제(Sequence-to-Sequence Learning)로 접근하였고, 구문 분석 단계와 자질 설계가 필요 없는 End-to-end 방식으로 연구를 진행하였다. 음절 단위의 RNN Search 모델을 사용하여 음절 단위로 입력된 문장을 의미역이 달린 어절들로 변환하였다. 또한 순차열 변환 문제의 성능을 높이기 위해 연구된 인풋-피딩(Input-feeding) 기술과 카피넷(CopyNet) 기술을 한국어 의미역 결정에 적용하였다. 실험 결과, Korean PropBank 데이터에서 79.42%의 레이블 단위 f1-score, 71.58%의 어절 단위 f1-score를 보였다.

  • PDF

준지도 학습을 활용한 사용자 기반 소형 어선 충돌 경보 분류모델에대한 연구 (A Study on the User-Based Small Fishing Boat Collision Alarm Classification Model Using Semi-supervised Learning)

  • 석호준;심승;우정훈;조준래;정재룡;조득재;백종화
    • 한국항해항만학회지
    • /
    • 제47권6호
    • /
    • pp.358-366
    • /
    • 2023
  • 본 연구는 해양수산부의 '지능형 해상교통정보시스템' 서비스 중 '사고취약선박 모니터링 서비스'의 선박 충돌 경보를 개선하기 위한 것으로, 현재의 선박 충돌 경보는 대형 선박 위주의 데이터와 그 운항자에 기반한 설문조사 레이블을 가지고 지도 학습(SL)한 모델을 사용하고 있다. 이로 인해, 소형선박 데이터 및 운항자의 의견이 현재 충돌 지도학습 모델에 반영되지 않아, 소형선박 운항자가 느끼는 체감보다 먼 거리에서 경보가 제공되기 때문에 그 효과가 미비하다. 또한, 지도학습(SL) 방법은 레이블링 된 다수의 데이터가 필요하지만, 레이블링 과정에서 많은 자원과 시간이 필요하다. 본 논문은 이러한 한계를 극복하기 위해 준지도학습(SSL)의 알고리즘인 Label Propagation과 TabNet을 사용하여 레이블이 결정되지 않은 데이터를 활용하여 소형선박을 위한 충돌 경보의 분류 모델을 연구하였다. 충돌 경보의 분류 모델을 활용하여 소형선박 운항자를 대상으로 실해역 시험을 수행한 결과 운항자의 만족도가 증가하는 결과를 확인하였다.

A Study on Construction Method of AI based Situation Analysis Dataset for Battlefield Awareness

  • Yukyung Shin;Soyeon Jin;Jongchul Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.37-53
    • /
    • 2023
  • 인공지능에 기반한 지능형 지휘통체체계는 복잡하고 방대한 전장정보와 전술 데이터들을 학습모델을 통해 자동으로 융합 및 추출하여 전장상황을 분석한다. 지휘관은 지능형 지휘통제체계의 상황분석 결과를 제공받아 전장인식이 가능하여 의사결정을 지원할 수 있다. 의사결정지원에 특화된 결과를 지휘관에게 제공하기 위해서는 인공지능을 학습하기 위한 실 전장상황과 유사한 전장상황분석 데이터셋 생성이 필요하다. 본 논문은 기존 선행연구인 '인공지능 기반 전장상황분석을 위한 가상 전장상황 데이터 셋 생성 연구'의 다음 단계의 데이터셋 구축 방법 연구로 지휘관의 의사결정지원 및 미래 전장인식을 위해 최종적인 전장상황분석 결과에 필요한 데이터셋을 생성하는 방안에 대해 제안하였다. 전장상황 분석용 학습 데이터셋 생성도구 SW를 설계 및 구현하였고, 구현한 SW를 이용하여 데이터 레이블 작업을 진행하였다. Siamese Network 학습모델을 이용하여 구축한 데이터셋을 입력하고, 후처리 알고리즘을 활용한 출력 결과를 도출하여 생성한 데이터셋을 검증하였다.

심층 학습 기반의 채권 회수 판례 분석 (Analysis of Judicial Precedent Information related to Debt Recovery based on Deep-Learning)

  • 김선우;지선영;최성필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.373-377
    • /
    • 2018
  • 판례는 재판에 대한 선례로, 법적 결정에 대한 근거가 되는 핵심 단서 중 하나이다. 본 연구에서는 채권회수를 예측하는 서비스 구축을 위한 단서를 추출하기 위해 채권 회수 판례를 수집하여 이를 분석한다. 먼저 채권 회수 판례에 대한 기초 분석을 위하여, 채권 회수 사례와 비회수 사례를 각 20건씩 수집하여 분석하였으며, 이후 대법원 및 법률 지식베이스의 채권 관련 판례 12,457건을 수집하고 채권 회수 여부에 따라 가공하였다. 채권 회수 사례와 비회수 사례를 분류하기 위한 판례 내의 패턴을 분석하여 레이블링하고, 이를 자동 분류할 수 있는 Bidirectional LSTM 기반 심층학습 모델을 구성하여 학습하였다. 채권 관련 판례 가공 기준에 따라 네 가지의 데이터 셋을 구성하였으며, 각 데이터셋을 8:2의 비율로 나누어 실험한 결과, 검증 데이터에 대하여 F1 점수 89.82%의 우수한 성능을 보였다.

  • PDF

RFID 애플리케이션을 위한 2-레벨 비즈니스 프로세스 패밀리 모델 (2-Level Business Process Family Model for RFID-enabled Applications)

  • 문미경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2009년도 춘계학술대회
    • /
    • pp.422-425
    • /
    • 2009
  • RFID (Radio Frequency IDentificaiton)는 태그, 레이블, 카드 등에 저장된 데이터를 무선 주파수를 이용하여 리더에서 자동 인식하는 기술이다. RFID 애플리케이션은 RFID 태그의 실시간 정보를 기반으로 하는 업무 프로세스를 의미하는 것으로, RFID 정보를 이용하기 위해서는 기존의 비즈니스 프로세스가 변형되어져야 한다. RFID 미들웨어로부터 발생하는 저수준의 RFID 이벤트를 다양한 정보 서버들을 참조하여 고수준의 이벤트로 변환시키기 위한 일련의 활동(activity)들을 대부분의 RFID 애플리케이션에서 공통으로 수행하기 때문에 이러한 활동들을 재사용 될 수 있는 핵심자산으로 만들어놓을 필요가 있다. 본 논문에서는 다양한 유형의 RFID 애플리케이션에 재사용될 수 있는 RFID 관련 활동들을 RFID 제네릭 (generic) 활동으로 구분하고 이를 이용하여 2-레벨의 비즈니스 프로세스 패밀리 모델 (Business Process Family Model: BPFM)을 구축하는 방법을 제시한다. 상위 레벨의 RFID 제네릭 액티비티들은 두번에 걸쳐 가변치가 결정될 수 있는 가변점을 가지게 된다. 하위 레벨을 구성하는 도메인 활동들은 그 자체의 가변속성 뿐만 아니라 활동의 흐름에서 나타나는 다양한 형태의 가변요소들을 표현하게 된다. 이러한 2-레벨 BPFM을 이용함으로써 RFID 시스템 도입 시 처리해야 하는 활동들의 개발 양을 현저히 줄일 수 있다.

  • PDF

머신러닝을 활용한 선발 투수 교체시기에 관한 연구 (A Study on the Timing of Starting Pitcher Replacement Using Machine Learning)

  • 노성진;노미진;한무명초;엄선현;김양석
    • 스마트미디어저널
    • /
    • 제11권2호
    • /
    • pp.9-17
    • /
    • 2022
  • 본 연구는 야구 경기에서 선발 투수를 위기 상황 이전에 교체하기 위한 의사결정을 지원하는 예측 모델 구현을 목적으로 한다. 이를 위해 베이스볼 서번트(Baseball Savant)에서 제공하는 메이저리그 스탯캐스트 데이터를 활용하여, 선발 투수를 위기 상황 이전에 선제적으로 교체하는 예측 모델을 구현한다. 이를 위해 첫째, 데이터 탐색을 통해 선발 투수가 경기에서 직면하는 위기 상황을 도출하였다. 둘째, 선발 투수가 이닝 종료 전에 교체된 경우, 이전 이닝에서 교체하는 것으로 레이블을 구성하여 학습을 진행하였다. 학습된 모델을 비교한 결과 앙상블 기법을 기반으로 한 모델이 F1-Score가 65%로 가장 높은 예측 성능을 보였다. 본 연구의 실무적 의의는 제안하는 모델을 통해 선발 투수를 위기 상황 이전에 교체하여 팀의 승리 확률을 높이는 데 기여할 수 있으며, 경기 중 감독은 데이터 기반의 전략적 의사결정 지원을 받을 수 있을 것이다.