• Title/Summary/Keyword: 선별 알고리즘

검색결과 292건 처리시간 0.029초

바이오 디지털 콘텐츠를 이용한 독성의 분석 (Analysis of toxicity using bio-digital contents)

  • 강진석
    • 디지털콘텐츠학회 논문지
    • /
    • 제11권1호
    • /
    • pp.99-104
    • /
    • 2010
  • 화학물질은 생체에 들어오면 여러 가지 독성반응을 나타내는데, 독성반응에 따른 유전자 발현을 분석하기 위해 바이오 칩 등을 이용한 신기술이 확산되면서 바이오 디지털 콘텐츠가 다량으로 생성되고 있다. 이 콘텐츠는 그 자체로는 의미가 적고 컴퓨터를 이용한 분석과 보정과정을 거쳐 생물학적으로 의미 있는 값들을 선별하여야 한다. 이런 콘텐츠에는 유전자들의 발현 양상 측정을 목적으로 하는 유전체학(genomics), 유전자의 발현 양상을 측정하는 전사체학(transcriptomics), 단백질의 발현을 측정하는 단백체학(proteomics), 대사체의 발현을 측정하는 대사체학(metabolomics) 등이 있으며, 이를 통칭하여 오믹스(omics)라고 부른다. 오믹스 기술을 독성을 연구하는 분야에 접목한 것이 독성유전체학(toxicogenomics)이며, 이에 대한 콘텐츠를 분석함으로써 독성을 예측하고 독성기전을 규명할 수 있다. 독성분석에 있어서 초기 단계의 분석은 향후 만성독성의 예측에 있어서 중요한 부분을 차지하고 있다. 바이오 디지털 콘텐츠를 이용하여 독성을 예측함에 있어 기존의 방법보다 더 빠르고 정확하게 예측하기 위해서는 많은 정보에 대한 분석기술의 진보가 필요하다. 또, 바이오 디지털 콘텐츠를 이용한 독성예측에 있어서 전체세포보다는 생물학적 현상을 일으키는 특이세포에서 이런 정보를 얻는 것이 중요하다고 생각된다. 또, 향후 바이오 디지털 콘텐츠 분석은 전략적 실험설계에 의한 데이터가 분석되고 축적되어야 하고, 분석알고리즘을 통한 네트워크 분석이 이루어져야 하며, 통합적 데이터 구축을 통해 이루어져야 할 것으로 생각된다.

특징선택과 특징가중의 융합을 통한 웹문서분류 성능의 개선 (Performance Improvement of Web Document Classification through Incorporation of Feature Selection and Weighting)

  • 이아람;김한준;현만
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.141-148
    • /
    • 2013
  • 기계학습을 이용한 자동분류시스템은 학습과정을 통해 분류모델을 구축하고 이를 기반으로 미분류 데이터를 특정 카테고리로 분류한다. 기계학습 기반 자동분류 시스템의 성능은 분류모델의 구성 인자인 특징의 품질에 크게 의존한다. 문서 데이터의 경우 특징 집합을 생성하기 위해 문서내의 출현단어와 문서의 구조적 정보를 활용한다. 특히 웹문서로부터 특징을 추출하기 위해 단어뿐만 아니라 태그, 하이퍼링크 정보를 분석할 수 있다. 최근 웹문서의 분류 기법에 대한 연구는 기계학습 알고리즘보다 특징 생성 및 가공 기술에 초점을 맞추고 있다. 이에 본 논문은 웹문서의 분류모델을 개선하기 위해 단어, 태그, 하이퍼링크 정보로부터 고품질의 특징을 선별 추출하여 가중치를 자동으로 부여하는 기법을 제안한다. Web-KB 문서집합을 이용한 다양한 실험을 통해 제안 기법의 우수성을 보인다.

동영상 동기화 알고리즘을 이용한 수업 분석 방법 (Class Analysis Method Using Video Synchronization Algorithm)

  • 권오성
    • 정보교육학회논문지
    • /
    • 제19권4호
    • /
    • pp.441-448
    • /
    • 2015
  • 본 논문은 기 촬영된 수업 동영상을 분석 결과와 동기화하여 재생시키고 확인할 수 있는 소프트웨어 구현에 관한 것이다. 이를 위하여 본 논문에서는 동영상 재생 구간과 분석 내용이 동기화 될 수 있도록 하는 동영상 인덱싱 방법, 자료구조, 그에 따른 선별적 재생 방안을 제시한다. 사용자는 제안하는 방식을 이용하여 동영상 재생 내용을 구간별로 확인할 수 있고 역으로 분석 결과를 입력으로 원하는 지점의 동영상 구간을 검색할 수 있다. 본 논문에서는 수업 분석을 도입, 전개, 정리의 시간 흐름 단계로 구분하여 진행하였고, 단계별 재생에 맞게 일정 간격으로 분석 필터를 적용하였다. 구현된 수업 분석 소프트웨어를 사용하여 몇 가지 수업 사례를 적용한 결과, 성공적으로 필요한 수업 분석을 진행할 수 있었고 동기화 성능 실험에서도 그 효율성을 확인할 수 있었다.

효율적인 비디오 프록시 서버를 위한 캐시 관리 방법 (A Cache Management Technique for an Efficient Video Proxy Server)

  • 이준표;박성한
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.82-88
    • /
    • 2009
  • 사용자와 근거리에 위치한 비디로 프록시 서버는 자주 요청되는 동영상 데이터들을 저장하고 사용자에게 직접 전송함으로써 초기 전송 지연과 네트워크 트래픽을 효과적으로 감소시킨다. 그러나 비디오 프록시 서버는 원격지의 중앙 비디오 서버에 비해 비교적 제한된 저장 공간을 가진다. 따라서 사용자들이 계속 요청하는 동영상만을 선별하여 저장하도록 하는 방법이 필요하다. 이를 위해 본 논문에서는 비디오 프록시 서버에서의 가상 메모리에 바탕을 둔 가상 캐싱 기법을 제안한다. 제안하는 알고리즘은 사용자가 요청한 동영상 데이터가 비디오 프록시 서버에 존재하지 않는 경우 원격지의 중앙 비디오 서버로부터 요청된 동영상 데이터를 전송받아 사용자에게 전송하고 가상 메모리에 저장한다. 저장된 동영상 데이터는 이후 사용자의 요청이 있는 경우 사용자에게 전송된다. 이때 가상 메모리에 저장된 동영상 데이터는 사용자의 요청의 상태에 따라 가상 메모리로부터 삭제되거나 비디오 프록시 서버에 저장된다. 또한 가상 메모리에서의 단편화를 막기 위하여 가상 메모리를 세그먼트 별로 영역을 구분한다. 실험을 통해 제안하는 방법이 기존의 방법들 보다 높은 적중률을 보이는 동시에 보다 적은 삭제 횟수를 보인다는 것을 확인한다.

선별 시스템 기반 표지 유전자를 포함한 난소암 마이크로어레이 데이터 분류 (Classification of Ovarian Cancer Microarray Data based on Intelligent Systems with Marker gene)

  • 박수영;정채영
    • 한국정보통신학회논문지
    • /
    • 제15권3호
    • /
    • pp.747-752
    • /
    • 2011
  • 마이크로어레이 분류는 전형적으로 분류기 디자인과 에러 추정이 현저하게 작은 샘플에 기반한다는 것과 교차 검증 에러 추정이 대다수의 논문에 사용된다는 주목할 만한 두 가지 특징을 소유한다. 마이크로어레이 난소 암 데이터는 수 만개의 유전자 발현으로 구성되어 있고, 이러한 정보를 동시에 분석하기 위한 어떤 체계적인 절차도 없다. 본 논문에서는, 통계에 따라 유전자의 우선순위를 정함으로써 표지유전자를 선택하였고, 널리 보급되어 있는 분류 규칙인 선형 분류 분석, 3-nearest-neighbor와 결정 트리 알고리즘은 표지 유전자를 선택한 데이터와 선택하지 않는 데이터의 분류 정확도 비교를 위해 사용되어졌다. ANOVA를 이용하여 선택된 표지 유전자를 포함하는 마이크로어레이 데이터 셋에 선영 분류분석 규칙을 적용한 결과 97.78%의 가장 높은 분류 정확도와 가장 낮은 예측 에러 추정치를 나타내었다.

CCTV 개인영상 정보보호를 위한 오프라인 객체추적 (Offline Object Tracking for Private Information Masking in CCTV Data)

  • 이석호
    • 한국정보통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.2961-2967
    • /
    • 2014
  • 최근 CCTV의 영상정보 공개시 타인의 영상에 대해서는 모자이크 처리하여 식별이 불가능하도록 하는 개인정보 보호법이 발표되었다. 반면에 CCTV를 통하여 획득된 영상 데이터를 활용한 범죄 수사는 점차 더 많이 활용되고 있는 추세이다. 이렇게 상반된 2가지의 요구사항에 의해 촬영된 CCTV 동영상을 수사기관 등의 기관에서 요청할 경우 개인정보(개인 얼굴 이미지 등)을 마스킹(Masking)해 배포함으로써 개인정보 유출을 차단하는 마스킹/ 언마스킹 솔루션에 대한 시장의 요구가 크게 성장할 것으로 예측된다. 정보주체가 정보열람 의뢰기관에 정보를 요구하기 전에 객체에 대한 선별 마스킹을 하기 위한 정보보호 솔루션에 있어서 가장 핵심되는 기술은 객체에 대한 추적기술이다. 본 논문에서는 CCTV영상에 대한 후처리로써의 정보보호 솔루션에 적합한 객체추적 알고리즘을 제안한다. 안정적인 추적이 가능하도록 하기 위해 움직임정보와 색상정보를 함께 사용하였다. 그러면서도 시간이 많이 걸리지 않는 컬러 중심점 이동(Color Centroid Shifting) 기반의 방법을 사용하여 추적의 속도 성능을 높였다.

인공신경망을 이용한 터널시공에서 현장 적용성 (Site Application of Artificial Neural Network for Tunnel Construction)

  • 송주현;채휘영;천병식
    • 한국지반환경공학회 논문집
    • /
    • 제13권8호
    • /
    • pp.25-33
    • /
    • 2012
  • 터널 설계 시 해당지반에 관한 정보를 정확히 반영하는 것은 대단히 중요하다. 하지만 다양한 지형 및 지질조건을 모두 고려한 지반조사 및 시험 등은 경제적, 기술적으로 인하여 현실적으로 실시하기 어렵기 때문에 한정된 정보에 의하여 해석 및 설계를 하고 있는 실정이다. 본 연구는 도심지 및 산악지역 터널공사 시, 보다 정확한 안정성 검토 및 거동 예측을 수행하여 선정 결과에 대한 현장 적용성 여부를 판단하기 위해 인공신경망 이론의 적용을 통하여 기존 거동예측의 한계성을 극복하고자 하였다. 먼저, 현장 데이터를 확보하여 인공신경망 중 다층퍼셉트론을 연구에 적합한 구조로 구축하고, 역전파 알고리즘으로 학습시켜 적용하였다. 인공신경망을 이용한 현장적용성의 학습을 위한 자료는 터널의 지보패턴, RMR, Q, 암종, 굴진장, 굴착형태, 굴착경과일 등 터널거동에 영향을 미치는 영향인자를 고려하여 신뢰성 분석을 실시하고 선별된 계측자료의 결과를 데이터베이스화하여 사용하였다. 학습이 완료된 인공신경망 모델을 이용하여 터널시공현장의 굴착경과일에 따른 천단변위, 내공변위, 지중변위, 록볼트축력을 예측하고 현장 계측치와 비교분석을 통하여 인공신경망을 이용한 터널 시공 시 현장적용성을 확인하였다.

N-Block substring 가중 선형모형을 이용한 단백질 CDS의 특징 추출 및 분류 (Feature Selection and Classification of Protein CDS Using n-Block substring weighted Linear Model)

  • 최성용;김진수;한승진;최준혁;임기욱;이정현
    • 한국지능시스템학회논문지
    • /
    • 제19권5호
    • /
    • pp.730-736
    • /
    • 2009
  • 방대한 유전 정보를 분석, 가공하는 생명정보학의 중요성은 더욱 높아지고 있다. 본 논문에서는 단백질의 1차 구조만으로 단백질의 구조와 기능을 예측하는 새로운 데이터마이닝 방법을 제안한다. 단백질 서열만으로 특징 추출시 발생할 수 있는 문제점인 방대한 탐색공간을 효과적으로 축소하기 위해 n-Block substring 탐색 알고리즘을 제안한다. 또한 선별된 각 substring의 도메인 연관도를 결정하는 가중치를 구하여 가중 선형모형을 구축함으로써 구조와 기능에 관련이 있을 것으로 예상되는 단백질 도메인의 특징을 추출하고 분류에 효과적임을 보인다. 도메인에 포함되는 각각의 CDS(coding sequence)에 대해 모형으로부터 구한 점수를 통해 해당 도메인과의 연관성의 정도를 추정하며, 분류 효율을 더욱 향상시킬 수 있음을 보인다.

북한지역 수자원 감시예측을 위한 수문기상정보 활용기술개발 (Development of Hydrometeorological Information and Application Technology for Monitoring Water Resources in North Korea)

  • 김지인;이성진;강재원;김규문;서애숙
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.531-535
    • /
    • 2015
  • 본 연구에서는 한반도 관측 공백지역인 북한지역에 대하여 레이더와 위성 원격탐사자료를 활용하여 강수량과 토양수분 등 수문기상정보를 생산 및 검증하고 효율적인 수문 모니터링 및 수문 기상 재해 감시와 평가 방안을 수립하고자 한다. 또한, 북한지역의 수문 기상 정보 수집 및 통합 DB를 마련하고 북한 수문기상 포털시스템을 구축함으로써 부처 간 자료를 공유할 수 있는 매개체를 마련하여 일관된 정책 수립과 효율적인 물관리를 도모하고자 한다. WPMM(Window Probability Matching Method)방법을 기반으로 구성된 RAD-RAR(Rain rate system) 산정 알고리즘(Rosenfeld et al., 1993)을 활용하여 산출된 합성 강우장 데이터의 정확성을 비교 분석하기 위해 접경지역 AWS 강수량과 세계기상통신망(GTS)기반 강수량을 산출하여 각각 레이더 강수량과 검증분석을 실시하였다. 연구기간은 2012년과 2013년 여름철 기간 중 5개의 기간을 선별하였다. 연구 기간 동안의 RAR 합성 강우장 데이터를 이용하여, 기간 중 1시간 동안 누적된 강수량을 산출하고 접경지역 AWS 강수량과 비교하였고 12시간 누적 강수량을 산출하여 GTS 강수량과 비교 분석을 실시하였다. 전반적으로 레이더 강수량에 비해 AWS 강수량이 더 높게 나타났으며 마찬가지로 레이더 강수량과 GTS 강수량의 비를 통해 레이더 자료가 상대적으로 과소추정되고 있음을 확인 할 수 있었다. 미항공우주국(NASA)과 일본항공우주국(JAXA)을 중심으로 진행된 GPM(Global Precipitation Measurement)미션은 한 개의 핵심위성과 마이크로파 복사계를 탑재한 10여개의 보조위성으로 구성되어 있으며, 매 3시간 간격의 전구 강수량 자료 생산에 목적이 있다. 이는 홈페이지를 통해 Level 1, 2, 3의 GPM 데이터를 배포하고 있다. 특히 Level 2 데이터는 언급된 3시간 간격의 전구 강수량 데이터를 제공한다. 이 경우 복사량을 강수량으로 변환하는 번거로움을 덜 수 있으며 NASA가 제공하는 Panoply라는 프로그램을 이용하여 한반도 강수 자료 가시화가 가능하다.

  • PDF

인공신경망을 이용한 상수관망 내 무수율 산정 (Calculation of Non-revenue Water Ratio through the Artificial Neural Network of Water Distribution System)

  • 장동우;최계운;박효선;조형근
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.120-120
    • /
    • 2017
  • 인천지역의 상수도공급은 팔당댐을 취수원으로 하여 도수, 송수관을 거쳐 인천지역 내 정수장을 통하여 각 급수지역까지 일원화된 관로시스템으로 공급되고 있다. 관망에서의 적절한 수압관리, 노후관로 교체사업 등은 급수관망 내 관로 사고위험을 줄일 수 있고, 누수량을 저감하여 무수율의 감소로 이어질 수 있다. 상수관망 내 누수에 영향을 주는 물리적, 운영적 요소를 파악하고, 이를 이용하여 누수해결을 위한 방법론을 제시하는 것은 매우 중요하다. 본 연구에서는 인천시 배수관망 데이터를 활용하여 통계분석 및 인공신경망을 통하여 무수율에 영향을 미치는 인자를 선별하고, 무수율과의 연관성을 분석하고자 하였다. 이를 위해 대상지역에 대한 시설현황 및 운영자료를 취득하고, 무수율 분석에 활용하였다. 인천시의 소블럭을 대상으로 관로노후도, 배수관연장, 평균관경, 급수전당 공급량, 누수발생 횟수, 용도지역, 관망구성 형태 등을 고려하여 무수율과의 관계분석을 위한 통계분석을 수행하였다. 특히 급수에 필요한 최소에너지와 관망에서 공급되는 에너지를 비교하기 위하여 관망해석 프로그램인 EPANET을 이용하여 관망내 절점에서의 수압과 수요량이 적용된 최소공급에너지를 활용하였고, 이를 통하여 블록 내 과잉공급에너지와 무수율의 영향성을 비교하였다. 최종적으로 산출된 주요인자에 대한 주성분분석, 분산분석, 다중회귀분석 등의 통계분석과 인공신경망에 의해 학습된 알고리즘을 통하여 산정된 무수율을 실측 무수율과 비교, 분석하였다. 인공신경망에 의해 산정된 무수율과 실측 무수율의 정확도를 평가하기 위하여 MAE, MSE, PBIAS 등의 정확도 평가와 산점도 분석을 수행하고, 상관계수를 도출하여 가장 정확한 방법을 결정하였다. 분석 결과 통계분석에 의한 다중회귀식으로 산출된 무수율 보다 인공신경망에 의한 무수율이 실측값에 더욱 근접한 것으로 나타났으며 이용된 뉴런의 수의 따라 산출결과가 상이하기 때문에 최적 뉴런의 수를 산정해야 할 필요가 있음을 확인하였다. 특히 사용된 상수관망 주요인자 중 주성분분석을 통하여 선정된 각 성분을 인공신경망에 적용시 더욱 정확한 무수율 예측이 가능한 것으로 나타났다.

  • PDF