• 제목/요약/키워드: 의미망

검색결과 902건 처리시간 0.031초

베이지안 신경망을 이용한 유전자 발현 데이터에서의 피처 추출 기법 (Feature Extraction Method for Gene Expression Data using Bayesian Neural Network)

  • 이상근;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.235-237
    • /
    • 2004
  • Microarray 로 표현되는 유전자 발현 데이터는 일반적으로 샘플(sample) 수에 비해 많은 수의 유전자를 포함한다. 피처 추출은 이러한 데이터에 기계학습 방법론을 효과적으로 적용하기 위한 방법 중 하나로, 학습성능을 향상시키고 계산 시간을 줄일 수 있을 뿐만 아니라 중요한 피처들을 발견할 수 있다는 점에서 큰 의미를 갖는다. 본 연구에서는 베이지안 신경망(Bayesian Neural Network)에 기반 한 자동유효성탐지(Automatic Relevance Detection, ARD) 기법을 사용하여 유전자 발현 데이터에서 학습 오류를 줄이는 동시에 학습에 필요한 최소한의 유전자 집합을 추출할 수 있는 방법을 제시했다. CAMDA 2003에서 제시된 폐종양 환자의 유전자 발현 데이터에 대해 실험한 결과, 12600 개의 유전자 중에서 가장 중요하다고 여겨지는 187 개의 유전자를 발견했으며, 높은 학습성능을 달성했다.

  • PDF

데이터마이닝 기법을 활용한 스팸메일 분류 및 예측모형 구축에 관한 연구

  • 안수산;신경식
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2000년도 추계정기학술대회:지능형기술과 CRM
    • /
    • pp.359-366
    • /
    • 2000
  • 기업의 환경에서 이-메일(e-mail)은 회사내의 업무흐름을 완전히 뒤바꾸며 혁명적인 변화를 이끌고 있다. 업무 공간의 극복, 사내 커뮤니케이션의 극대화 등 이-메일이 제공하는 장점이 매우 많다. 그러나 최근 사회적 문제가 되고 있는 스팸 메일(spam mail)의 등장은 이러한 장점의 커다란 반대급부를 제공한다. 스팸메일이란 인터넷이용자들에게 원하지도 않았는데 무작위로 발송되는 광고성 이-메일을 일컫는 말로, 벌크(bulk)메일, 정크(junk)메일, 언솔리시티드(Unsolicited)메일과도 유사한 의미로 사용된다. 스팸메일은 사용자들로 하여금 스트레쓰의 요인이 되게 함은 물론, 이를 발신하고 수신하는 과정에서 이용되는 서버에 엄청난 부하를 줄 뿐만 아니라, 공공의 성격을 지니는 네트웍 자원을 아무런 비용의 지불 없이 독점하게 되는 좋지 않은 결과를 가져오게 된다. 본 연구에서는 데이터마이닝의 기법 중 분류(classification tack) 문제에 적웅이 활발한 인공신경망 (artificial neural networks)과 의사결정나무(decision tree)기법을 이용하여 스팸메일의 분류와 예측을 가능케 하는 모형을 구축한다.

  • PDF

다른 환경에서 학습된 신경망 모델의 통합 (Integration of neural network models trained in different environments)

  • 이윤호;이수항;주혜진;이종락;원일용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.796-799
    • /
    • 2020
  • 신경망은 주로 전체 데이터를 중앙에서 학습시키거나 상황에 따라 데이터나 모델을 나누어 분산학습 방법으로 처리해 왔다. 그러나 데이터의 양의 증가와 보안적 이유로 인해 모든 환경에서 기존의 방법을 쓰기에 어려움이 있다. 본 연구에서는 제한된 데이터만으로 모든 데이터로 학습한 것과 같은 학습 효과를 내기 위한 방법을 제안한다. 데이터의 구성이 다른 두 가지 환경인 V-환경과 H-환경에서 학습한 모델을 어떤 방법으로 통합해야 기존의 성능과 비슷한 성능을 낼 수 있는지 연구한다. 우리는 가중치를 합치는 방법을 avg, max, absmas 3가지 방법으로 실험하였으며, 실험 결과로 V-환경에서는 기존의 성능과 비슷한 성능을 보였으며, H-환경에서는 기존의 성능에는 부족하지만, 의미 있는 성능을 보였다.

LSTM 딥러닝 예측기법과 SWAT을 이용한 유량지속곡선 도출 및 민감도 분석 (Derivation of Flow Duration Curve and Sensitivity analysis using LSTM deep learning prediction technique and SWAT)

  • 안성욱;최정렬;김병식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.354-354
    • /
    • 2022
  • 딥러닝(Deep Learning)은 일반적으로 인공신경망(Artificial Neural Network) 를 의미하는데, 이에 따른 결과는 데이터의 양, 변수, 학습모델의 학습횟수, 은닉층(Hidden Layer)의 개수 등 여러 요소로 인해 결정된다. 본 연구에서는 물리적 장기유출 모형인 SWAT의 결과를 참값으로 LSTM모형의 매개변수인 은닉층 갯수와 학습횟수등의 시나리오를 바탕으로 검보정을 수행하였으며, 최적의 목적함수를 갖는 매개변수를 도출하였다. 이를 이용하여 유량지속곡선을 도출한결과를 SWAT의 결과와 비교해본 결과 매우 높은 상관성을 도출하였으며 이를 통해 수자원분야에서 인공신경망의 활용 가능성을 확인하였다.

  • PDF

설명 가능한 이미지 인식을 위한 채널 주의 기반 딥러닝 방법 (Deep Learning Methods for Explainable Image Recognition)

  • 백나;조인휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.586-589
    • /
    • 2024
  • 본 실험 연구에서는 주의 메커니즘과 컨볼루션 신경망을 결합하여 모델을 개선하는 방법을 탐색하는 딥 러닝 기술을 소개한다. 이 기술은 지도 학습 방식을 위해 공개 데이터 세트의 쓰레기 분류 데이터를 사용하고, Grad-CAM 기술과 채널 주의 메커니즘 SE 를 적용하여 모델의 분류 의사 결정 과정을 더 잘 이해하기 위해 히트 맵을 생성한다. Grad-CAM 기술을 사용하여 히트 맵을 생성하면 분류 중에 모델이 집중하는 영역을 시각화할 수 있다. 이는 모델의 분류 결정을 설명하는 방법을 제공하여 다양한 이미지 카테고리에 대한 모델 결정의 기초를 더 잘 이해할 수 있다. 실험 결과는 전통적인 합성곱 신경망과 비교하여 제안한 방법이 쓰레기 분류 작업에서 더나은 성능을 달성한다는 것을 보여준다. 주의 메커니즘과 히트맵 해석을 결합함으로써 우리 모델은분류 정확도를 향상시킬 수 있다. 이는 실제 응용 분야의 이미지 분류 작업에 큰 의미가 있으며 해석 가능성에 대한 딥 러닝 연구 진행을 촉진하는 데 도움이 된다.

정규문법과 동등한 일반화된 이진 이차 재귀 신경망 (Generalized Binary Second-order Recurrent Neural Networks Equivalent to Regular Grammars)

  • 정순호
    • 지능정보연구
    • /
    • 제12권1호
    • /
    • pp.107-123
    • /
    • 2006
  • 이 논문은 정규문법과 동등한 의미를 가지는 일반적인 이진 이차 재귀 신경망(Generalized Binary Second-order Recurrent Neural Networks: GBSRNN)의 구조 및 학습 방법을 제안하며 이를 이용하여 정규언어를 인식하는 어휘분석기 구현을 소개한다. GSBRNN는 성분들의 이진값 표현으로 정규문법과 동치인 모든 표현에 대하여 하드웨어로 표현할 수 있는 방법을 제공하며 정규 문법과의 구조적 관련성을 보여준다. 정규문법에서 심볼들의 개수 m, 비단말 심볼의 개수 p, 단말 심볼의 개수 q, k인 문자열이 입력된다고 할 때, GBSRNN의 크기는 $O(m(p+q)^2)$ 이고 병렬처리 시간은 O(k)이며 순차처리 시간은 $O(k(p+q)^2)$이다.

  • PDF

중심확장 알고리즘이 보강된 식별적 특징학습을 통한 얼굴인식 향상기법 (Improving Discriminative Feature Learning for Face Recognition utilizing a Center Expansion Algorithm)

  • 강명균;이상철;이인호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.881-884
    • /
    • 2017
  • 좋은 특징을 도출할 수 있는 신경망은 곧 대상을 잘 이해하고 있는 신경망을 의미한다. 그러나 얼굴과 같이 유사한 이미지를 분류하기 위해서는 신경망이 좀 더 구분되는 특징을 도출해야한다. 본 논문에서는 얼굴과 같이 유사도한 이미지를 분류하기 위해 오차함수에 중심확장(Center Expansion)이라는 오차를 추가한다. 중심확장은 도출된 특징이 밀집되면 클래스를 분류하는 매니폴드를 구하기 어려워져 분류 성능이 하락되는 문제를 해결하기 위해 제안한 것으로 특징이 밀집될 가능성이 높은 부분에 특징이 도출되지 않도록 강제하는 방식이다. 학습 시 활용하는 오차는 일반적으로 분류 문제를 위해 사용되는 softmax cross-entropy 오차와 각 클래스의 분산을 줄이는 오차 그리고 제안한 중심확장 오차를 조합해 구할 것이다. 본 논문에서는 제안한 중심확장 오차를 조합한 모델과 조합되지 않은 모델이 결과적으로 특징 도출과 분류에 어떠한 영향을 주었는지 알아볼 것이다. 중심확장을 조합해 학습한 모델이 어떤 영향을 주었는지 알기 위해 본 논문에서는 Labeled Faces in the Wild를 활용해 분류 실험을 진행할 것이다. Labeled Faces in the Wild을 활용해 실험한 결과 중심확장을 활용한 모델과 활용하지 않은 모델간의 성능을 차이를 확인할 수 있었다.

자기조직화 지도(SOM) 인공신경망 모형을 이용한 벤쳐기업의 지식경영 유형 세분화에 관한 연구-코스닥 상장기업을 대상으로- (A Self-Organizing Map Neural Network Approach to Segmenting Knowledge Management Type of Venture Businesses in KOSDAG)

  • 이건창;권순재;이광용
    • 지능정보연구
    • /
    • 제7권2호
    • /
    • pp.95-115
    • /
    • 2001
  • 본 논문에서는 우리나라 코스닥시장에 상장된 벤처기업을 대상으로 하여 지식경영 유형을 세분화 하기 위한 방법론을 제시한다. 이 방법론은 우선, 해당 벤처기업에 대하여 설문조사를 통하여 이들 회사의 지식경영 요인을 도출한 다음, 이들 요인 값을 가지고 비감독학습 인공신경망 모형인 SOM을 가지고 4개의 의미 있는 군집을 유도하였다. 이들 군집은 벤처기업이 수행하는 다양한 지식경영 유형을 나타내는 것으로 판명되었으며, 이들 유형은 각각 하이테크형, 조직지식중심형, 정보기술 중심형, 단순형으로 분류된다.

  • PDF

LANE망에서의 scalable한 broadcast traffic 관리를 위한 최적 ELAN 구성방법 (Optimal ELAN Configuration for Scaling Broadcast Traffic in a LAN Emulation Network)

  • 손종희;김도훈;차동완
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.691-694
    • /
    • 2000
  • 기존 LAN 환경에서 인터넷을 이용한 멀티미디어 실시간 전송과 같은 QoS 보장형 서비스에 대한 요구가 증대되면서, 고속의 ATM 기술을 LAN에 적용하는 기술들이 등장하였다. LANE(LAN Emulation)은 그러한 기술 대안들 중에서 campus network와 enterprise network에 많이 보급되고 있는 기술이다. 그러나 이러한 급격한 LANE 도입에 비하여 이의 효과적인 운용에 대한 연구는 많지 않은 실정이다. 본 논문에서는 LANE을 도입한 campus network의 최적 운영방안에 대하여 논한다. Broadcast 데이터 트래픽 관리에서 발생하는 규모성(Scalability) 문제로 인하여 전체 LANE망은 여러 개의 ELAN으로 나뉘어 관리된다. 이 때 하나의 ELAN은 마치 단위 LAN로써, Broadcast 데이터의 전송범위를 제한한다. 즉, 서로 다른 ELAN에 속하는 노드간에는 Broadcast 방식으로 데이터를 전송할 수 없게 된다. 그런데, IPX 등을 사용하는 대화형 시뮬레이션 게임 등과 같은 응용프로그램에서는 Broadcast 방식이 이용되므로, 서로 다른 ELAN에 속하는 노드간의 데이터 전송은 불가능하게 되거나 별도의 복잡한 과정을 개입시켜야 하는 비용이 발생한다. 따라서 규모성 문제해결을 위한 ELAN 구성(configuration)에는 위와 같은 비용이 수반된다. 본 연구에서는 LANE망을 여러 개의 ELAN으로 분할하는 경우에 블로킹(blocking) 되는 Broadcast 트래픽 규모를 해당 ELAN 구성의 비용으로 간주한다. 이 경우에 규모성을 고려한 ELAN의 최적 구현방안(optimal configuration)은 ELAN 구성을 위한 기술적 제약하에서 블로킹되는 Broadcast 트래픽을 최소화시키는 문제로 요약된다. 이는 다시 그래프 분할문제(graph partition problem)의 변형된 형태로 모형화 될 수 있다. 본 논문에서는 이러한 사항들을 고려하여 제시된 수리적 모형을 대상으로, genetic algorithm을 이용하여 최적 ELAN 구성을 위한 여러 파라미터들의 효과를 살펴보고, 이러한 결과들이 LANE 운영과 관련하여 가지는 함축적인 의미를 고찰한다.

  • PDF

러프-신경망과 $\chi$2 검정에 의한 효율적인 의사결정지원 시스템 (Efficient Decision Making Support System by Rough-Neural Network and $\chi$2)

  • 정환묵;피수영;최경옥
    • 한국정보처리학회논문지
    • /
    • 제6권8호
    • /
    • pp.2106-2112
    • /
    • 1999
  • 의사결정에 있어 정보란 의사결정자가 의사결정을 하는데 사용하도록 의미 있고 유용한 형태로 처리된 데이터이다. 이러한 정보들에 있어서 불필요한 속성들을 제거하여 처리함으로써 의사결정의 효율을 높일 수 있다. 러프 집합 이론은 불필요한 속성을 제거하고 분류화 하는데 뛰어난 능력을 가지고 있으나 속성 감축시 속성 수와 튜플 수에 따라 복잡한 계산을 요구한다. 따라서 속성들 사이의 상호연관성을 나타내는 척도로서, 두 변수간의 독립성에 관한 검정방법인 $\chi$2와 러프 집합의 종속성을 이용하여 속성들을 감축하고 이를 신경망의 입력 유니트로 사용하므로써 기존의 모든 속성을 입력으로 하여 신경망을 구성하는 것보다 간단하며 학습효율의 향상 및 정확한 의사결정을 지원할 수 있다.

  • PDF