• 제목/요약/키워드: 상호정보량 기법

검색결과 159건 처리시간 0.024초

암 예후를 효과적으로 예측하기 위한 Node2Vec 기반의 유전자 발현량 이미지 표현기법 (A Node2Vec-Based Gene Expression Image Representation Method for Effectively Predicting Cancer Prognosis)

  • 최종환;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권10호
    • /
    • pp.397-402
    • /
    • 2019
  • 암 환자에게 적절한 치료계획을 제공하기 위해 암의 진행양상 또는 환자의 생존 기간 등에 해당하는 환자의 예후를 정확히 예측하는 것은 생물정보학 분야에서 다루는 중요한 도전 과제 중 하나이다. 많은 연구에서 암 환자의 유전자 발현량 데이터를 이용하여 환자의 예후를 예측하는 기계학습 모델들이 많이 제안되어 오고 있다. 유전자 발현량 데이터는 약 17,000개의 유전자에 대한 수치값을 갖는 고차원의 수치형 자료이기에, 기존의 연구들은 특징 선택 또는 차원 축소 전략을 이용하여 예측 모델의 성능 향상을 도모하였다. 그러나 이러한 접근법은 특징 선택과 예측 모델의 훈련이 분리되어 있어서, 기계학습 모델은 선별된 유전자들이 생물학적으로 어떤 관계가 있는지 알기가 어렵다. 본 연구에서는 유전자 발현량 데이터를 이미지 형태로 변환하여 예후 예측이 효과적으로 특징 선택 및 예후 예측을 수행할 수 있는 기법을 제안한다. 유전자들 사이의 생물학적 상호작용 관계를 유전자 발현량 데이터에 통합하기 위해 Node2Vec을 활용하였으며, 2차원 이미지로 표현된 발현량 데이터를 효과적으로 학습할 수 있도록 합성곱 신경망 모델을 사용하였다. 제안하는 모델의 성능은 이중 교차검증을 통해 평가되었고, 유전자 발현량 데이터를 그대로 이용하는 기계학습모델보다 우월한 예후 예측 정확도를 가지는 것이 확인되었다. Node2Vec을 이용한 유전자 발현량의 새로운 이미지 표현법은 특징 선택으로 인한 정보의 손실이 없어 예측 모델의 성능을 높일 수 있으며, 이러한 접근법이 개인 맞춤형 의학의 발전에 이바지할 것으로 기대한다.

단백질 기능 흐름 모델 구성 및 평가 기법 (A Method for Protein Functional Flow Configuration and Validation)

  • 장우혁;정석훈;한동수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권4호
    • /
    • pp.284-288
    • /
    • 2009
  • 단백질 상호작용의 예측 및 실험 결과가 대용량으로 배포되면서 바이오 정보 기술 연구자들은 생명체 내의 단백질 상호작용 네트워크를 구성하기 위해 노력하여 왔다. 일반적으로 대용량의 상호작용 데이터들은 많은 오류를 포함한다고 알려져 있으나, 최근 단백질의 물리 화학적 특성 및 구조를 기반으로 한 방법들이 실제 실험과 병행되어 고화질(High resolution)의 결과를 제공하게 되면서, 특정 종에 대한 단백질 상호작용 네트워크가 점차 완성되고 있다. 그러나, 단순 물리적 링크 수준의 단백질 상호작용 네트워크만으로는 특정 병원체의 발병 메커니즘 규명 등과 같은 응용분야의 활용에 한계가 있다. 본 논문에서는 실험을 통하여 보고된 신호 전달 경로(signaling transduction pathway)를 이용하여 단백질 기능 간의 관계를 방향성이 있는 그래프로 표현한 단백질 기능 흐름 모델을 제시한다. 제안하는 모델은 Gene Ontology에서 정의된 molecular function을 정점(vertex)으로 가지고 이들 사이의 관계를 간선(edge)으로 표현함으로써 특정 기능의 전이를 살펴볼 수 있다. 이러한 기능 흐름 모델은 수 만개의 정점(vertex)으로 구성된 단백질 상호작용 네트워크에서 의미 있는 경로를 추출하는 데에 제약 혹은 참조 조건으로 사용될 수 있어 향후 활용도가 클 것으로 기대한다. 평가는 KEGG에서 제공되는 11개의 인간 신호 전달 경로 각각에 대하여 대상 경로를 제외한 나머지로부터 생성된 모델과의 크론바하 알파 계수(Cronbach's alpha)를 측정하였고(${\alpha}=0.67$), 총 1023개의 흐름 중 ${\alpha}=0.6$ 이상의 신뢰도에 대하여 총 765개의 흐름을 가지는 기능 흐름 모델을 최종 구성하였다.

연역적 유전자 알고리즘을 이용한 연관 단어 지식베이스의 최적화 (Optimization of Associative Word Knowledge Base using Apriori-Genetic Algorithm)

  • 고수정;최준혁;이정현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권8호
    • /
    • pp.560-569
    • /
    • 2001
  • 지식 기반 정보검색 시스템에서의 질의 확장은 단어간의 의미 관계를 고려한 지식베이스를 필요로 한다. 기존의 단순 마이닝 기법은 사용자의 선호도를 고려하지 않은 채 연관 단어를 추출하므로 재현율은 향상되나 정확도는 저하된다. 본 논문에서는 단어간의 의미 관게를 고려한 연관 단어 중에서 사용자가 선호하는 연관 단어만을 포함하는 정확도가 향상된 최적화된 연관 단어 지식베이스 구축을 위한 방법을 제안한다. 이를 위해 컴퓨터 분야의 웹문서를 8개의 클래스로 분류하고, 각 클래스별 웹문서에서 명사를 추출한다. 추출된 명사를 대상으로 Apriori 알고리즘을 이용하여 연관 단어를 추출하고, 유전자 알고리즘을 이용하여 사용자가 선호하지 않은 연관 단어를 지식베이스의 구축 대상에서 제외시킨다. 본 논문에서 제안된 Apriori 알고리즘과 유전자 알고리즘의 성능을 평가하기 위하여 Apriori 알고리즘은 상호 정보량과 Rocchio 알고리즘과 비교하며, 유전자 알고리즘은 TF.IDF를 이용한 단어 정제 방법과 비교한다.

  • PDF

빅 데이터 환경에서 다중 속성 기반의 데이터 관리 기법 (Multi-Attribute based on Data Management Scheme in Big Data Environment)

  • 정윤수;김용태;박길철
    • 디지털융복합연구
    • /
    • 제13권1호
    • /
    • pp.263-268
    • /
    • 2015
  • IT 기술이 발달함에 따라 센서 모바일을 기반으로 사물에 정보를 담아 네트워크로 상호연계되는 유비쿼터스 정보기술이 발달하고 있다. 그러나 서버에 저장되어 있는 데이터를 손쉽게 사용하기 위한 보안 해결책이 미미한 상태이다. 본 논문에서는 빅 데이터 서비스에서 제공되고 있는 대용량 데이터를 사용자가 안전하게 처리하기 위해서 빅 데이터 서비스에 사용되는 데이터에 다중의 속성을 해쉬 체인 기법에 적용한 데이터 관리 기법을 제안한다. 제안기법은 빅 데이터 서비스에 사용한 데이터의 종류, 기능, 특성에 따라 데이터의 속성을 분류하여 분류된 속성 정보를 해쉬 체인으로 묶어 데이터의 안전성을 향상시켰다. 또한, 제안 기법은 여러 지역에 분산된 데이터를 손쉽게 접근하기 위해서 데이터 속성 정보를 해쉬 체인의 연결 정보로 활용하여 빅 데이터의 접근 제어를 분산 처리하였다.

Spark 프레임워크를 적용한 대용량 SHIF 온톨로지 추론 기법 (An Approach of Scalable SHIF Ontology Reasoning using Spark Framework)

  • 김제민;박영택
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1195-1206
    • /
    • 2015
  • 지식 관리 시스템을 운영하기 위해서는 대량의 지식 정보를 자동으로 추론 및 관리하는 기술이 필요하다. 현재, 이러한 시스템의 대다수는 컴퓨터간의 지식 정보를 자동으로 교환하고 스스로 새로운 지식을 추론하기 위해 온톨로지를 적용하고 있다. 따라서 대용량의 온톨로지를 대상으로 새로운 정보를 추론하는 효율적인 기술이 요구되고 있다. 본 논문은 분산 클러스터의 메모리상에서 MapReduce와 유사한 작업을 수행하는 Spark 프레임워크를 적용하여, SHIF 수준으로 작성된 대용량의 온톨로지를 규칙 기반으로 추론하는 기술에 대해서 제안한다. 이에 본 논문은 다음 3 가지에 초점을 맞추어 설명을 한다. 클러스터내의 분산된 메모리상에서 대용량 추론을 실시하기 위해서, 먼저 각 추론 규칙에 따라 대용량의 온톨로지 트리플을 효과적으로 분류하여 적재하기 위한 자료구조, 두 번째 규칙간의 종속 관계와 상호 연관성에 따른 규칙 실행 순서와 반복 조건 정의, 마지막으로 규칙 실행에 필요한 명령을 정의하고 이러한 명령어를 실행하여 추론을 수행하는 알고리즘에 대해 설명한다. 제안하는 기법의 효율성을 검증하기 위해, 온톨로지 추론과 검색 속도를 평가하는 공식 데이터인 LUBM을 대상으로 실험을 수행하였다. 대표적인 분산클러스터 기반 대용량 온톨로지 추론 엔진인 WebPie와 비교 실험한 결과, LUBM에 대해서 WebPie의 추론 처리량이 553 트리플/초 인데 비해 284배 개선된 157k 트리플/초의 성능 향상이 있었다.

Fuzzy Elastic Bunch Graph Matching 방법을 이용한 얼굴인식 (Face Recognition using Fuzzy-EBGM(Elastic Bunch Graph Matching) Method)

  • 권만준;고현주;전명근
    • 한국지능시스템학회논문지
    • /
    • 제15권6호
    • /
    • pp.759-764
    • /
    • 2005
  • 본 논문은 EBGM(Elastic Bunch Graph Matching)기법을 이용한 얼굴인식에 대해 다룬다. 대용량 영상 정보에 대해 차원 축소를 이용한 얼굴인식 기법인 주성분기법이나 선형판별기법에서는 얼굴 영상 전체의 정보를 이용하는 반면 본 연구에서는 얼굴의 눈 코 입 등과 같은 얼굴 특징점에 대해 주파수와 방향각이 다른 여러 개의 가버 커널과 영상 이미지의 컨볼루션(Convolution)의 계수의 집합(Jets)을 이용한 특징 데이터를 이용한다. 하나의 얼굴 영상에 대해서 모든 영상이 같은 크기의 특질 데이터로 표현되는 Face Graph가 생성되며, 얼굴인식 과정에서는 추출된 제트의 집합에 대해서 상호 유사도(Similarity)의 크기를 비교하여 얼굴인식을 수행한다. 본 논문에서는 기존의 EBGM 방법의 Face Graph 생성 과정을 보다간략화 한 방법을 이용하여 얼굴인식 과정에서 계산량을 줄여 속도를 개선하였으며, 퍼지 매칭법을 이용한 유사도 계산을 하였다.

비정규 충격성 잡음 환경에서 부호 순위 통계량에 바탕을 둔 직접수열 대역확산 부호 획득기법 (DS/SS Code Acquisition Scheme Based on Signed-Rank Statistic in Non-Gaussian Impulsive Noise Environments)

  • 김상훈;안상호;이영윤;유승수;윤석호
    • 한국통신학회논문지
    • /
    • 제33권2C호
    • /
    • pp.200-207
    • /
    • 2008
  • 본 논문에서는 수신된 신호 표본의 실제 간 대신 신호 표본의 부호와 (sign) 순위를 (rank) 사용하기에, 비정규 충격성 잡음 (non-Gaussian impulsive noise) 분산의 (dispersion) 정보를 필요로 하지 않는 새로운 부호 획득을 위한 검파기를 제안하였다. 제안한 검파기의 평균 부호 획득 성능을 $^{[1]}$의 검파기와 비교하였다. 모의실험을 통해 제안한 기법의 성능을 살펴보면, 비정규 충격성 잡음 분산의 편차에도 (deviation) 강인한 성능을 지니며, 비정규 충격성 잡음의 정확한 분산 정보를 이용한 $^{[1]}$의 기법과 대등한 성능을 지니고 있음을 알 수 있다.

교통정보 수집 및 감시 동시운영을 위한 CCTV 카메라 자율자세 보정 알고리즘 개발에 관한 연구 (A Study on the Development of CCTV Camera Autonomous Posture Calibration Algorithm for Simultaneous Operation of Traffic Information Collection and Monitoring)

  • 김준규;정준호;한학용;신치현
    • 한국ITS학회 논문지
    • /
    • 제22권1호
    • /
    • pp.115-125
    • /
    • 2023
  • 본 논문은 교통상태 감시 등 교통관제를 위해 설정한 CCTV 카메라의 화각 상태에서 교통량, 속도 등 교통정보 수집을 동시에 수행할 수 있는 CCTV 카메라 자세보정 알고리즘 개발에 관한 것이다. 개발한 자율자세보정 알고리즘은 차량인식 및 추적기법을 이용하여 도로를 식별하고, 운영자의 교통감시 및 교통정보 수집을 위한 화각을 결정한다. 제안 알고리즘의 성능검증은 현장에 설치한 CCTV를 이용하였으며, 교통감시 및 교통정보 수집을 위해 각각 설정한 화각에 대해 자율자세보정 알고리즘이 자동 산출한 화각의 결과와 비교하였다. 분석결과 운영자 감시를 위한 화각은 상호 96%의 일치성을 보였다. 교통정보의 경우는 교통량 및 속도의 정확도가 각각 96%, 95%로 산출됐으며 수동 설정한 화각과 비교할 때 약 2%의 오차가 발생하는 것으로 나타났다. 결과적으로 제안 알고리즘을 통해 관제용 CCTV를 이용하여 교통정보 수집 및 교통상황 감시를 동시에 수행할 수 있음을 확인하였다.

도플러 스캐닝 기법을 이용한 이동하는 다중 음원의 상대 위치 추적 기법 (The Relative Position Estimate of the Moving Distributed Sources Using the Doppler Scanning Technique)

  • 노용주;윤종락;전재진
    • 한국음향학회지
    • /
    • 제21권5호
    • /
    • pp.446-454
    • /
    • 2002
  • 본 연구는 이동 표적체에서 주파수가 서로 다른 신호가 서로 다른 위치에서 발생할 때 도플러 주파수 편이량을 추정하여 이들의 상대적인 신호 발생 위치를 추적하는 도플러 스캐닝 기법에 관한 연구이다. 예를 들어 선박의 발전기와 프로펠러 등과 같은 탑재 기계장치들의 진동에 의해 야기되는 기계적 소음의 각 특징 주파수들의 도플러 주파수 편이는 최단근접거리 (CPA: Closest Point of Approach)에 따라 유일한 시간 정보를 갖고 각 소음원들의 위치에 관련되는 함수이다. 따라서 도플러 스캐닝 기법을 적용하면 이동 선박의 각 기계적 소음원들간의 공간적인 상대 위치 추정이 가능하다. 그러나 일반적으로 기계류 소음의 주파수는 저주파수대역이므로 도플러 주파수 편이량을 추정하기 위해서는 주파수 분해능이 높아야 하고 아울러 탑재장치의 공간분해능을 높이기 위해서는 동시에 시간 분해능이 높아야 한다. 따라서 상호 역비례 관계에 있는 이들 분해능을 동시에 높이기 위해 확장 칼만 필터 알고리즘을 적용하여 특징 신호들의 도플러 주파수 편이량을 추정하여 기계류의 상대적인 탑재 위치를 규명할 수 있음을 보인다. 먼저 수치모의 실험으로 그 가능성을 검증하고 자동차에 탑재된 스피커 음원을 사용한 실험 결과를 통해 그 성능을 확인하도록 한다.

일회성 암호를 이용한 효율적이고 안전한 SIP 사용자 인증 및 SDP 암호화 기법 (Efficient and Secure User Authentication and SDP Encryption Method in SIP)

  • 김정제;정만현;조재익;손태식;문종섭
    • 정보보호학회논문지
    • /
    • 제22권3호
    • /
    • pp.463-472
    • /
    • 2012
  • 본 논문에서는 일회성 암호를 이용한 SIP UA와 서버 사이의 상호 인증 및 SDP 암호화 기법을 제안한다. 기존의 HTTP Digest 인증 기법의 취약성을 해결하기 위해 다양한 SIP 인증 기법이 연구되었지만, 여전히 취약성이 존재하거나 암호학적 연산량에 대한 부담이 존재한다. 제안 기술은 매 인증마다 해쉬함수를 사용하여 갱신되는 일회성 암호를 사용하여 복잡한 암호학적 연산을 필요로 하지 않으면서 효율적으로 사용자 인증을 수행한다. 또한 사용자 인증에 사용되는 일회성 암호를 통해 SIP 메시지의 무결성 검증 및 SDP 암/복호화를 수행하기 때문에 메시지 교환 과정에서 S/MIME, TLS 적용 시 발생하는 오버헤드를 줄일 수 있다.