• 제목/요약/키워드: 동시 분류

검색결과 1,252건 처리시간 0.027초

산술 연산자 기반 유전자 프로그래밍을 이용한 효과적인 암 분류 (Effective Cancer Classification Using Genetic Programming based on Arithmetic Operators)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.1-3
    • /
    • 2003
  • 최근 생물정보 기술이 암 진단의 새로운 방법으로 관심을 모으고 있다. 다양한 기계학습 기법을 적용하여 우수한 결과를 얻고 있지만, 의학 분양에서는 정확률이 높은 분류기의 획득과 동시에 획득된 분류규칙을 분석하고 이해할 수 있어야 한다. 생물정보 기술에서 많이 사용되는 유전발현 데이터는 데이터내에 수천 내지 수만의 변수가 존재하여 직접 이들 사이의 복잡한 관계를 표현하고 이해하는 것은 매우 어렵다. 본 논문에서는 이러한 어려움을 극복하기 위해 유전발현 데이터에서 분류에 유용한 특징들을 추출하고 유전자 프로그래밍으로 추출된 특징들을 이용한 암 분류규칙을 생성한다. 림프종 유전발현 데이터에 대하여 실험해본 결과, 90% 수준의 인식 성능을 보였고, 또한 모든 샘플을 완벽하게 분류하는 산술 분류규칙을 발견하였다.

  • PDF

데이터마이닝 기법을 이용한 감정 기반 음악 분류 (Music Classification Based On Emotion Utilizing Data Mining)

  • 조우연;손태식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.941-944
    • /
    • 2015
  • 저장 장치의 급속한 발전으로 인해 기존에 서비스할 수 없었던 개인 사용자를 위한 클라우드 서비스가 활성화되고 있다. 이 중 음악을 대상으로 하는 스트리밍 및 공유 서비스는 다양한 음악의 종류를 수용하기 위해 체계적인 분류를 필요로 한다. 기존의 분류체계는 단순히 작곡가나 업로더의 의견에 의해서 일방적으로 정해지기 때문에 사용자가 중심이 되는 클라우드 서비스에는 어울리지 않는다. 따라서 본 논문은 이와 같은 문제점을 해결하기 위해 사랑의 감정을 기준으로 새로운 분류체계를 제안한다. 자동적인 분류를 위해 데이터마이닝 기법을 접목시켰으며, 원활한 마이닝을 위해 오디오 음악 파일(raw data)을 정해진 크기로 자르고 feature extraction을 통해 오디오 음악 파일에 대한 전처리를 수행하였다. 이후 feature selection을 수행하기 위해 clustering을 이용해 유효한 중요도를 지나는 feature를 선별하였으며 선별된 feature를 토대로 SVN(Support Vector Machine)을 이용해 feature의 중요도에 대한 유효성을 검증함과 동시에 분류를 수행하여 감정을 기반으로 분류한 결과를 보였다.

대화 데이터셋의 클래스 불균형 문제 보정을 위한 적대적 학습 기법 (Adversarial Training Method for Handling Class Imbalance Problems in Dialog Datasets)

  • 조수필;최용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.434-439
    • /
    • 2019
  • 딥러닝 기반 분류 모델에 있어 데이터의 클래스 불균형 문제는 소수 클래스의 분류 성능을 크게 저하시킨다. 본 논문에서는 앞서 언급한 클래스 불균형 문제를 보완하기 위한 방안으로 적대적 학습 기법을 제안한다. 적대적 학습 기법의 성능 향상 여부를 확인하기 위해 총 4종의 딥러닝 기반 분류 모델을 정의하였으며, 해당 모델 간 분류 성능을 비교하였다. 실험 결과, 대화 데이터셋을 이용한 모델 학습 시 적대적 학습 기법을 적용할 경우 다수 클래스의 분류 성능은 유지하면서 동시에 소수 클래스의 분류 성능을 크게 향상시킬 수 있음을 확인하였다.

  • PDF

개나리족 및 근연분류군(물푸레나무과)의 잎 표피 미세구조에 대한 분류학적 검토 (The systematic consideration of leaf epidermal microstructure in the tribe Forsythieae and its related genera (Oleaceae))

  • 송준호;홍석표
    • 식물분류학회지
    • /
    • 제43권2호
    • /
    • pp.118-127
    • /
    • 2013
  • 개나리족(Abeliophyllum: 1종, Forsythia: 12분류군-10종, 2변종)과 향선나무족(Fontanesia: 2 종) 및 근연 분류군인 Myxopyreae족(Myxopyrum: 5분류군-4종, 1아종)을 포함한 총 20분류군의 잎 표피 미세구조에 대한 분류학적 유용성을 검토하고자 주사전자현미경(SEM)으로 관찰하고 기재하였다. 기공복합체(stomatal complex)는 대부분의 분류군에서 배축면(abaxial side)에만 존재하는 이면기공엽(hypostomatic type)이었으나 일부 분류군에서는 잎의 양면에 모두 존재하는 양면기공엽(amphistomatic type)으로 나타났다. 공변세포의 크기는 17.14-47.58 ${\times}$ 11.59-44.25 ${\mu}m$으로 속과 종마다 다소 차이를 보이는데, Forsythia giraldiana (17.48-22.96 ${\times}$ 11.64-12.88 ${\mu}m$)가 가장 작은 공변세포를 지니고 있었고, Myxopyrum pierrei (31.50-41.75 ${\times}$ 32.53-44.25 ${\mu}m$)에서 가장 크게 나타났다. 기공복합체의 형태는 대부분 불규칙형(anomocytic)이 우세하며, 불규칙형과 불균등형(anisocytic)이모두 나타나거나 드물게 평행형(paracytic)이 나타나는 분류군이 확인되었다. 부세포의 수층벽(anticlinal wall)은 직선형과 곡선형이 동시에 관찰(straight/curved) 되거나 파상형(undulate) 또는 굴곡형(sinuate)이 나타나며, 파상형과 굴곡형이 동시에 나타나는 경우(undulate/sinuate)로 구분되었다. 연구된 분류군에서 나타나는 모용의 종류는 모두 3종류로 단세포 비선모(simple unicellular non-glandular trichome), 다세포 비선모(simple multicellular nonglandular trichome), 방패형 선모(subsessile/peltate glandular trichome)가 나타났다. 끝으로 조사된 분류군내의 속간, 종간 동정을 위한 잎 표피 미세구조학적 형질의 유용성 및 분류학적 적용 가능성을 검토하였다.

RADARSAT 위성영상과 지형정보를 이용한 산악지역의 수계지역 추출 정확도 향상 (Improved Water Area Classification from Radarsat SAR Image and Surface Informations in Mountainious Area)

  • 손홍규;유환희;송영선;장훈
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 공동 춘계학술대회 논문집
    • /
    • pp.596-601
    • /
    • 2003
  • 위성영상으로부터 수계영역을 분류하는 일은 홍수관련 분석을 위해서 매우 중요한 일이다. 본 연구에서는 홍수 발생시 취득된 RADARSAT 영상을 이용해서 산악지역의 수계영역의 분류를 목적으로 하였다. SAR 영상은 능동적 영상취득을 수행하므로 광학영상에 비해서 수계영역이 확실하게 나타나는 반면에 지형의 기복에 따른 여러 가지 왜곡현상이 발생한다. 본 연구에서는 RADARSAT 영상으로부터 수계영역의 분류를 위해 방사보정, 그림자 효과제거, 고도자료 및 경사도 자료의 활용 등의 경우로 구분하여 연구를 수행하였다. 그 결과 RADARSAT 영상만을 활용할 경우 분류의 정확도에 한계를 보였으며, RADARSAT 영상에 지형정보를 추가로 활용함으로서 정확한 수계영역을 분류할 수 있었다. 특히 RADARSAT 영상과 경사도 자료를 동시에 활용하여 수계지역을 분류하는 것이 가장 효과적임을 알 수 있었다.

  • PDF

대규모 언어 모델을 활용한 새로운 의도 발견 방법과 액티브 러닝 전략 (Novel Intent Discovery Utilizing Large Language Models and Active Learning Strategies)

  • 천창우;임송요
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.425-431
    • /
    • 2023
  • 음성 어시스턴트 시스템에서 발화의 의도를 분류하고 새로운 의도를 탐지하는 것은 매우 중요한 작업이다. 끊임없이 인입되는 새로운 발화로 인해 기존에 학습된 모델의 의도 분류 성능은 시간이 지남에 따라 점차 낮아진다. 기존 연구들에서 새로운 의도 발견을 위해 제안되었던 클러스터링 방법은 최적의 클러스터 수 결정과 명명에 어려움이 있다. 이러한 제한 사항을 보완하기 위해, 본 연구에서는 대규모 언어 모델 기반의 효과적인 의도 발견 방법을 제안한다. 이 방법은 기존 의도 분류기로 판단하기 어려운 발화에 새로운 의도 레이블을 할당하는 방법이다. 새롭게 인입되는 OOD(Out-of-Domain) 발화 내에서 오분류를 찾아 기존에 정의된 의도를 탐지하고, 새로운 의도를 발견하는 효율적인 프롬프팅 방법도 분석한다. 이를 액티브 러닝 전략과 결합할 경우, 분류 가능한 의도의 개수를 지속 증가시면서도 모델의 성능 하락을 방지할 수 있고, 동시에 새로운 의도 발견을 자동화 할 수 있다.

  • PDF

질감 분석을 이용한 유도 전동기의 기계적 결함 분류 (Mechanical Fault Classification of an Induction Motor using Texture Analysis)

  • 장원철;박용훈;강명수;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.11-19
    • /
    • 2013
  • 본 논문에서는 유도 전동기의 기계적 결함을 진단하기 위해 진동신호와 질감 분석을 이용한 알고리즘을 제안한다. 영상화된 결함 신호가 갖는 무늬, 색상 대비의 특징을 분석하고, 그레이레벨 동시발생행렬(Gray-Level Co-occurrence Model, GLCM)을통해 세 가지 질감특징을추출한다. 추출된 세 가지질감 특징을 RBF(Radial Basis Function) 커널 함수를 사용하는 다중레벨 서포터 벡터 머신(Multi-Level Support Vector Machine, MLSVM)의 입력으로 사용하여 결함 유형을 분류한다. 결함 유형을 분류하는 최적의 MLSVM을 위한 RBF 커널 함수의 매개변수를 찾기 위해 매개변수 값을 0.3부터 1.0으로 바꿔가며 분류성능을 평가한 결과, 결함 유형별로 0.3에서 0.6사이의 매개변수 값에서 100%에 가까운 분류 정확성을 보였다. 또한 15dB, 20dB의 잡음이 첨가된 진동신호를 이용한 실험에서도 평균 98%이상의 높은 분류 정확성을 보였다.

조기 위험 검출을 위한 점진적 조기 텍스트 분류 시스템 (Incremental Early Text Classification system for Early Risk Detection)

  • 배소현;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.91-96
    • /
    • 2021
  • 조기 위험 검출은 실시간으로 들어오는 텍스트를 순차적으로 처리하면서 해당 대화에 위험이 있는지 조기에 분류하는 작업으로, 정확도 저하를 최소화하는 동시에 가능한 한 빨리 대화를 분류하는 것을 목적으로 한다. 이러한, 조기 위험 검출은 온라인 그루밍 검출, 보이스 피싱 검출과 같은 다양한 영역에 활용될 수 있다. 이에, 본 논문에서는 조기 위험 검출 문제를 정의하고, 이를 평가할 수 있는 데이터 셋과 Latency F1 평가 지표를 소개한다. 또한, 점진적 문장 분류 모듈과 위험 검출 결정 모듈로 구성된 점진적 조기 텍스트 분류 시스템을 제안한다. 점진적 문장 분류 모듈은 이전 문장들에 대한 메모리 벡터와 현재 문장 벡터를 통해 현재까지의 대화를 분류한다. 위험 검출 결정 모듈은 softmax 분류 점수와 강화학습을 기반으로 하여 Read 또는 Stop 판단을 내린다. 결정 모듈이 Stop 판단을 내리면, 현재까지의 대화에 대한 분류 결과를 전체 대화의 분류 결과로 간주하고 작업을 종료한다. 해당 시스템은 micro F1과 Latency F1 지표 각각에서 0.9684와 0.8918로 높은 검출 정확성 및 검출 신속성을 달성하였다.

  • PDF

분류된 클래스 큐를 이용한 실시간 데이터베이스 시스템의 트랜잭션 관리기 (A Transaction Manager for Real-Time Database Systems Using Classified Queue)

  • 김경배;배해영
    • 한국정보처리학회논문지
    • /
    • 제5권11호
    • /
    • pp.2751-2762
    • /
    • 1998
  • 본 논문에서는 트랜잭션의 예측성과 성능을 향상시키기 위한 새로운 우선순위 할당 기법과 동시성제어 기법을 제안한다. 본 문에서 우선순위 할당 기법으로 제안한 분류된 우선순위 할당 기법은 EDF기법의 단점을 클래스와 버켓을 이용하여 해결하였고, 실시간 트랜잭션뿐만 아니라 시분할 트랜잭션까지 효과적으로 처리할 수 있다. 또한, 동시성제어 기법으로 제안된 로크를 이용한 조건부 낙관적인 동시성제어 기법은 예측성의 향상을 위해 낙관적인 기법을 사용하였으며, 시스템 자원의 낭비를 마기 위해 트랜잭션의 우선순위와 수행시간 동안 사용하는 데이터 양을 고려하여 트랜잭션의 충돌을 해결하였다.

  • PDF

동시링크를 이용한 웹 문서 클러스터링 실험 (Clustering of Web Document Exploiting with the Co-link in Hypertext)

  • 김영기;이원희;권혁철
    • 한국도서관정보학회지
    • /
    • 제34권2호
    • /
    • pp.233-253
    • /
    • 2003
  • 인간은 지식의 조직을 통해 세계를 이해한다. 정보검색분야에서 연구되고 있는 정보의 조직화에는 분류와 클러스터링이라는 두 가지 유형이 있다. 분류는 미리 정의된 범주에 각 항목을 배정하는 행위인 반면, 클러스터링은 유사하거나 관련된 항목을 집단화함으로써 정보를 조직한다. 인터넷 정보자원의 조직은 웹 문서에 출현하는 단어들에서 키워드를 추출하여 역파일을 작성함으로써 검색에 활용하는 것이 일반적인 방법이다. 그러나 키워드의 출현 위치나 단어빈도를 통한 문서유사도 기법은 사용된 언어가 다르거나 대부분이 앵커텍스트만으로 구성되어 있는 대문페이지처럼 적용하기 어려운 경우가 많다. 이 연구는 계량정보학적 분석 기법 중에서 동시인용 기법을 웹 문서의 하이퍼링크에 적용하여, 웹 문서의 클러스터링 가능성을 실험한다.

  • PDF