• 제목/요약/키워드: 집합론

검색결과 279건 처리시간 0.031초

베이지안 신경망을 이용한 유전자 발현 데이터에서의 피처 추출 기법 (Feature Extraction Method for Gene Expression Data using Bayesian Neural Network)

  • 이상근;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.235-237
    • /
    • 2004
  • Microarray 로 표현되는 유전자 발현 데이터는 일반적으로 샘플(sample) 수에 비해 많은 수의 유전자를 포함한다. 피처 추출은 이러한 데이터에 기계학습 방법론을 효과적으로 적용하기 위한 방법 중 하나로, 학습성능을 향상시키고 계산 시간을 줄일 수 있을 뿐만 아니라 중요한 피처들을 발견할 수 있다는 점에서 큰 의미를 갖는다. 본 연구에서는 베이지안 신경망(Bayesian Neural Network)에 기반 한 자동유효성탐지(Automatic Relevance Detection, ARD) 기법을 사용하여 유전자 발현 데이터에서 학습 오류를 줄이는 동시에 학습에 필요한 최소한의 유전자 집합을 추출할 수 있는 방법을 제시했다. CAMDA 2003에서 제시된 폐종양 환자의 유전자 발현 데이터에 대해 실험한 결과, 12600 개의 유전자 중에서 가장 중요하다고 여겨지는 187 개의 유전자를 발견했으며, 높은 학습성능을 달성했다.

  • PDF

점진적 패턴 선택에 의한 다충 퍼셉트론의 효율적 구성 및 학습 (Efficient Construction and Training Multilayer Perceptrons by Incremental Pattern Selection)

  • 장병탁
    • 한국정보처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.429-438
    • /
    • 1996
  • 본 논문에서는 주어진 문제를 해결하기 위해 사용될 최적의 다충 퍼센트론을 구성 하기 위한 하나의 점진적 학습 방법을 제시한다. 고정된 크기의 트레이닝 패턴 집합을 반복적으로 사용하는 기존의 알고리즘들과는 달리, 제시되는 방법에서는 학습 패턴의 수를 점차 증가시키면서 전체 데이터를 학습하기 위해 필요하고도 충분한 은닉뉴런의 수를 찾는다. 이와 같이 신경망 크기의 최적화에 학습 패턴을 점차적으로 선택하여 늘려나감으로써 일반화 능력과 학습 속도가 기존의 방법에서보다 향상됨을 필기체 숫자인식 문제에 있어서 실험적으로 보여준다.

  • PDF

열역학적 데이터를 이용한 26도시 Traveling-Salesman Problem 시뮬레이션 (DNA Computing Simulation Using Thermodynamic Data For TSP With 26 Nodes.)

  • 장하영;신수용;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.316-318
    • /
    • 2004
  • DNA 컴퓨팅에 대한 연구가 진행되어 강에 따라 기존의 튜링 머신과 동등한 계산 능력을 가진 다양한 계산 모델이 제안되고 있으며, 이와 함께 DNA의 병렬성을 이용하여 NP 문제들을 풀고자 하는 시도가 계속되고 있다. 그러나 전통적인 폰 노이만 기계에서의 알고리즘이 해집합에 대한 순차적 탐색을 하는 것과는 달리 가능한 모든 해를 미리 생성해 놓고 그 중에서 해를 찾아내는 기존의 DNA 컴퓨팅 알고리즘으로는 NP 문제의 크기가 증가함에 따라 초기 해의 생성조차도 불가능하게 된다. 이에 대한 해법의 하나로 진화적인 방법론을 생각할 수 있지만, 이 경우에는 진화 연산을 위한 추가적인 연산자의 고안과 이의 적용에 따른 어려움이 생긴다. 따라서 본 논문에서는 DNA 컴퓨팅에서 가능한 초기 해를 모두 생성할 수 있는지를 열역학적인 데이터에 근거한 시뮬레이션을 통하여 검증하였다. 이러한 과정을 통해서 값비싼 실제 실험의 성공 여부나 실험 디자인의 정당성 등을 미리 예측할 수 있을 뿐만 아니라, DNA 컴퓨팅이 보다 큰 크기의 NP 문제를 해결할 수 있는 가능성을 제공할 수 있다.

  • PDF

다염기변이 및 메타유전체 염기서열 생성도구에 관한 연구 (A Study on a tool to generate polymorphic genome and metagenome sequences)

  • 김종현;김우철;박상현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.262-263
    • /
    • 2007
  • 유전체학 (genomics)의 가장 기초적인 기반이 되는 것은 염기서열을 정확하게 결정해 내는 것이다. 많은 진핵생물들 (eukaryotes)은 두개의 상동염색체를 가지며 두개의 염색체의 염기서열에는 차이가 존재한다. 현재의 유전체 염기서열 결정방법으로는 염기변이가 많이 존재할 경우 유전체의 염기서열을 결정하기 어렵다. 특정한 장소에 서식하는 무수히 많은 미생물들의 유전체의 염기서열을 동시에 결정하는 문제도 미생물학에서 중요성을 인정받는 문제이지만, 미생물들간의 염기변이의 정도는 단일개체의 경우보다 복잡하며 염기서열을 효과적으로 결정하기 힘들다. 따라서 염기변이가 많은 생물들과 미생물들 집합의 염기서열을 결정할 수 있는 방법론의 개발이 시급한 실정이다. 본 논문에서는 조립된 다염기변이 유전체및 메타유전체의 염기서열의 정확성을 평가하기 위한 유전체 서열과 시뮬레이션에 기반한 read 들을 생성하는 도구를 개발하는 것을 목표로 한다.

  • PDF

콜센터 서비스인증 심사기준의 중요도 평가 (Evaluating the Importance of Certification Criteria for Call Center Services)

  • 이미나;소순후
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2016년도 추계학술대회
    • /
    • pp.139-141
    • /
    • 2016
  • 콜센터에 국가표준(KS)이 도입되면서 고객들이 질 좋은 서비스를 이용할 수 있을 것으로 기대된다. 본 연구는 Fuzzy AHP(Analytic Hierarchy Process) 기법을 이용하여 콜센터 서비스 인증 심사기준의 상대적 중요도를 평가하기 위해서 수행되었다. Fuzzy AHP는 AHP 기법에 Fuzzy 집합 이론을 결합한 것으로, 의사결정과정에서 발생할 수 있는 애매모호함과 불확실성을 해결하기 위하여 제시된 방법이다. 본 연구에서 제시한 평가방법론은 현재 국가적으로 추진되고 있는 KS 서비스 인증제도에서도 응용될 수 있을 것으로 본다.

  • PDF

하이퍼그래프 모델을 이용한 fMRI Brain Network 의 허브 모듈 분석 (Searching for the Hub Module of fMRI Data with the Hypergraph Model)

  • 김준식;임병권;김은솔;양진산;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.2(A)
    • /
    • pp.27-31
    • /
    • 2010
  • 본 논문에서는 하이퍼그래프의 고유벡터를 척도로 하여 fMRI기반 Brain Network를 분석하여 중요한 허브노드를 찾는 방법론을 제시한다. 이 방법을 비디오게임을 수행하면서 촬영한 기능적 자기뇌영상(fMRI) 데이터인 PBAIC 2007 데이터셋에 대하여 그 유용성을 검증하였다. 이 데이터는 각 20분씩 세 세션을 촬영한 것이며 처음 두 세션에는 13가지의 감정 항목의 평가치가 각 스캔마다 주어진다. 한 피험자의 첫번째 세션 데이터로부터 13가지 감정 항목에 대하여 상관관계가 높은 각각의 복셀(voxel)들을 추출하였다. 이 13가지의 복셀들의 집합들을 각각 하이퍼에지로 보고 하이퍼그래프를 구성하였다. 하이퍼그래프로부 터 인접 행렬(adjacency matrix)를 구성한 후 고유치(eigenvalue)와 고유벡터(eigenvector)를 구하였다. 여기서 고유치가 가장 큰 고유벡터의 원소들은 각 복셀들의 중앙성(centrality), 즉 중요성을 나타내며 이로부터 감정과 관련된 중요한 허브 복셀들과 그들의 국소적 집합인 모듈을 찾았다. 모듈들은 감정 및 작업기억(working memory)과 관련된 뇌 영역들의 클러스터(cluster)로 추정된다.

  • PDF

형태론적 손짓 인식 알고리즘 (Morphological Hand-Gesture Recognition Algorithm)

  • 최종호
    • 한국정보통신학회논문지
    • /
    • 제8권8호
    • /
    • pp.1725-1731
    • /
    • 2004
  • 최근 들어 인간의 의지를 컴퓨터에 전달하기 위한 수단으로 컴퓨터 시각기반 방식으로 제스처를 인식하고자 하는 연구가 널리 진행되고 있다. 제스처 인식에서 가장 중요한 이슈는 알고리즘의 단순화와 처리시간의 감소이다. 이러한 문제를 해결하기 위하여 본 연구에서는 기하학적 집합론에 근거하고 있는 수학적 형태론을 적용하였다. 본 논문에서 제안한 알고리즘의 중요한 아이디어는 형태론적 형상 분해를 적용하여 제스처를 인식하는 것이다. 손짓 형상으로부터 얻은 원시형상요소들의 방향성은 손짓에 관한 중요한 정보를 내포하고 있다. 이러한 특징에 근거하여 본 연구에서는 주 원시형상요소와 부 원시형상요소의 중심점을 연결하는 직선으로부터 특징벡터를 이용한 형태론적 손짓 인식 알고리즘을 제안하고 실험을 통하여 그 유용성을 증명하였다. 자연스러운 손짓을 이용한 인터페이스 설계는 TV 스위치 조정이나 비디오 컨텐츠 검색용 시스템으로 널리 이용할 수 있을 것으로 판단된다.

비트겐슈타인과 힐베르트 프로그램 (Wittgenstein on Hilbert's Program)

  • 박정일
    • 논리연구
    • /
    • 제15권1호
    • /
    • pp.155-190
    • /
    • 2012
  • 힐베르트의 프로그램에 관한 한, 비트겐슈타인의 생각의 발전 과정에는 뭔가 중요한 차이가 있는 것처럼 보인다. 1929년 비트겐슈타인이 철학에 복귀하는 과정에서 빈 학파의 슐리크와 바이즈만을 만나 함께 토론한 내용을 정리한 "비트겐슈타인과 빈 학파", 또 그 과정에서 비트겐슈타인이 자신의 생각을 정리하여 쓴 "철학적 고찰"과 "철학적 문법"에서의 비트겐슈타인의 주요주장은 1939년에 행한 "수학의 기초에 관한 강의", 또 이 강의를 전후해서 비트겐슈타인이 쓴 "수학의 기초에 관한 고찰"에서의 비트겐슈타인의 생각과 중요한 차이를 보이고 있기 때문이다. 나는 그 차이가 무엇인지를 보이기 위해서 먼저 힐베르트의 프로그램과 형식주의를 간략하게 살펴보고자 한다. 다음으로 나는 비트겐슈타인이 힐베르트의 형식주의로부터 어떤 영향을 받았으며, 또 그것을 어떻게 비판했는지를 조명할 것이다. 또한 나는 힐베르트의 프로그램에 대해서 중기 비트겐슈타인이 어떻게 비판했는지를 조명하고자 한다. 우리는 중기 비트겐슈타인이 힐베르트 프로그램에 대해서 칸토어의 집합론에 대해 했던 전기 비트겐슈타인의 주장만큼이나 과격한 주장을 했다는 것을 확인하게 될 것이다. 그러나 후기 비트겐슈타인은 더 이상 그러한 과격한 주장을 하지 않는데, 나는 중기 비트겐슈타인의 주장을 직접 비판함으로써, 또 비트겐슈타인 자신이 스스로 어떤 비판을 했을지를 논의하면서, 후기 비트겐슈타인이 왜 더 이상 그러한 주장을 하지 않는지 그 이유를 조명하고자 한다.

  • PDF

네트워크 분할 기법을 이용한 도로 네트워크 데이터 정합 (Road network data matching using the network division technique)

  • 허용;손화민;이재빈
    • 한국측량학회지
    • /
    • 제31권4호
    • /
    • pp.285-292
    • /
    • 2013
  • 본 연구는 도로 네트워크를 분할한 뒤 네트워크 정합을 수행하는 방법론을 제안한다. 네트워크의 링크에 의해 둘러싸인 공간으로부터 폴리곤 객체를 생성하고 중첩기반 그래프 군집화 기법을 적용하여 이들 폴리곤 객체들의 대응 집합 쌍을 탐색하고, 이로부터 독립적인 정합을 수행하는 하위 네트워크 쌍을 얻었다. 이후 분할된 네트워크 데이터 쌍의 노드 집합에 Iterative Closest Point 알고리즘을 적용하여 기하보정을 수행한 후 하우스도르프 거리를 이용하여 1:N 링크 정합을 수행하였다. 제안된 방법의 효용성을 평가하기 위해 국가교통 DB센터에서 관리하는 KTDB의 네트워크 데이터와 국내 상용 차량 내비게이션 업체의 네트워크 데이터를 대상으로 알고리즘을 적용하고 결과를 평가하였다. 3m에서 18m까지 3m 간격으로 하우스도르프 거리에 임계값을 적용하여 네트워크를 정합한 결과 15m의 임계값에서 F-measure 기준 0.99의 정확도를 얻을 수 있었다.

데이터 스트림 상에서 다중 연속 질의 처리를 위한 속성기반 접근 기법 (Attribute-based Approach for Multiple Continuous Queries over Data Streams)

  • 이현호;이원석
    • 정보처리학회논문지D
    • /
    • 제14D권5호
    • /
    • pp.459-470
    • /
    • 2007
  • 데이터 스트림은 빠르게 연속적으로 발생하는 무제한의 데이터 튜플의 집합이다. 이러한 데이터 스트림에 대한 질의 처리 또한 연속적이고 신속해야 하며 엄격한 시공간적 제약이 요구된다. 대부분의 데이터 스트림 관리시스템(DSMS)에서는 시공간적 제약사항을 효과적으로 지키기 위해서 등록된 연속 질의들의 선택 조건(selection predicate)들을 그룹화하거나 색인처리 한다. 본 논문에서는 연속 질의들의 선택 조건들을 속성별로 그룹화한 새로운 구조체인 속성 선택체(Attribute Selection Construct)를 제안한다. 속성 선택체에는 해당 속성이 특정 질의조건에 사용되는지 여부, 부분적으로 미리 계산된 질의결과 정보, 그리고 해당 속성의 선택률 통계 등 효율적인 질의 처리를 위한 유용한 정보들이 포함된다. 또한, 대상 질의집합을 구현한 속성 선택체들 간의 처리 순서는 전체적인 질의성능에 많은 영향을 미칠 수 있기 때문에 효과적으로 속성 선택체 처리 순서를 결정할 수 있는 전략도 함께 제안된다. 마지막으로, 기존의 방법들이 포함된 다양한 실험을 통하여 제안된 방법론의 성능을 여러 각도에서 비교 검증한다.