• 제목/요약/키워드: 랜덤 점 패턴

검색결과 19건 처리시간 0.047초

정보병목기법에 기반한 유전자 발현 데이터의 이중 클러스터링 (Double Clustering of Gene Expression Data Based on the Information Bottleneck Method)

  • 김병희;황규백;장정호;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.362-364
    • /
    • 2003
  • 기능 유전체학에서 클러스터링 기법은 고차원의 마이크로 어레이 데이터 분석을 위한 주된 도구 중의 하나이다. 본 논문에서는 정보병목(information bottleneck)기법 기반의 이중 클러스터링에 의한, 유전자 발현 데이터의 계층적 병합방식 클러스터링 기법을 제안한다. 정보병목기법은, 두 랜덤변수의 결합확률분포가 주어진 경우 두 변수의 상호 정보량을 최대한 보존하면서 한 변수를 압축하는 기법이며, 두 변수를 차례로 압축하는 것이 이중 클러스터링이다. 실제 마이크로 어레이 데이터인 NC160 데이터(암세포 내 유전자 발현 데이터)에 대한 실험에서, 먼저 유전자를 그 발현패턴에 따라 클러스터링 한 후 이를 이용하여 표본들을 클러스터링하고 그 성능을 다각도로 분석하였다. 상호 정보량과 유전자 및 표본 클러스터 수와 엔트로피 척도에 의한 성능을 검토해 본 결과, 표본이 추출 조직에 따라 구분 가능할 것이라는 가정을 검증할 수 있었으며, 적절한 클러스터의 수를 결정할 수 있는 임계점의 기준을 설정할 수 있었다.

  • PDF

카오스 이론 기반 시계열의 내재적 패턴분석: 룰렛과 KOSPI200 지수선물 데이터 대상 (Analysis of Intrinsic Patterns of Time Series Based on Chaos Theory: Focusing on Roulette and KOSPI200 Index Future)

  • 이희철;김홍곤;김희웅
    • 지식경영연구
    • /
    • 제22권4호
    • /
    • pp.119-133
    • /
    • 2021
  • 각 산업에서 대량의 데이터가 생산되면서, 빠른 경영 의사결정을 위해 시계열 패턴 예측 연구가 수많이 진행되고 있다. 하지만 데이터에 내재된 불확실성으로 인해 비선형 시계열 데이터의 특정 패턴을 예측하는 데 한계가 존재하고, 기업경영의 전략적 의사결정 어려움이 존재한다. 또한, 최근 수십 년간 불규칙한 랜덤워크 모형의 시계열 데이터 예측을 위해 산업의 목적에 맞는 금융시장 데이터를 대상으로 다양한 연구가 진행되고 있지만, 특정 규칙을 예측하고 지속가능의 기업목적 달성 어려움이 있다. 본 연구에서는 룰렛 데이터와 금융시장 데이터를 Chaos 분석기법을 이용하여 예측 결과를 비교분석하고 유의미한 결과를 도출하였다. 그리고, 본 연구는 카오스 분석이 시계열 자료를 분석하는데 있어 새로운 방법을 모색하는데 유용함을 확인하였다. 룰렛 게임의 특성을 한국 주가지수 선물의 시계열과 비교 분석하여 추세가 확인되는 경우 예측력을 높일 수 있다는 점을 도출하였으며, 불확실성이 높고 랜덤워크가 존재하는 비선형 시계열 데이터가 특정한 패턴을 가지고 있는지 판단하는데 의의가 있다.

DNA사슬 내에서 다양한 길이의 팰린드롬쌍 검색 연구 (Identifying Variable-Length Palindromic Pairs in DNA Sequences)

  • 김형래;정경희;전도홍
    • 정보처리학회논문지B
    • /
    • 제14B권6호
    • /
    • pp.461-472
    • /
    • 2007
  • 게놈 프로젝트 연구는 DNA사슬 내에서 생물학적 의미(예, molecule의 진화역사 또는 그 기능)를 추출하기위한 사슬분석 쪽으로 강조가 되어가고 있다. 특히, DNA사슬 내에서 상보적 또는 반복되는 패턴은 생물학적 의미를 가지고 있다. 문제는 상보적 단어가 만들어내는 흥미 있는 패턴과 단어 구성을 찾아 내는 것이다. 본 논문은 다양한 길이의 팰린드롬 쌍을 검색하는 알고리즘에 관한 연구이다. 다양한 길이의 팰린드롬 쌍 내에는 빈 공백을 또한 허용한다. 알고리즘은 팰린드롬 알고리즘이라고 명명하며 O(N)의 계산 시간을 가진다. 하나의 팰린드롬 쌍은 머리핀 형태로 구성되어 있다. 검출된 여러 팰린드롬 쌍을 활용하여 n-쌍 팰린드롬 형태를 구성하였다. 더욱이 발견된 가장 긴 팰린드롬 쌍을 DNA 사슬 원형 구조에 점으로 표현하여 가시성을 제고하였다. 본 알고리즘은 여러 게놈 상에서 실시되었으며 E.coli K12의 결과를 나타내었다. 실험결과 DNA 안에는 랜덤한 경우에는 확률상 매우 발생하기 힘든 긴 팰린드롬 패턴들이 존재 한다는 것을 발견할 수 있었다.

머신러닝을 이용한 침수 깊이와 위치예측 모델 개발 (Development of Machine Learning based Flood Depth and Location Prediction Model)

  • 강지욱;박종혁;한수희;김경준
    • 한국전자통신학회논문지
    • /
    • 제18권1호
    • /
    • pp.91-98
    • /
    • 2023
  • 최근 국지성 폭우로 인한 침수 피해가 빈번하게 발생함에 따라 침수 피해를 사전 예방하기 위한 침수 예측 연구가 진행되고 있다. 본 논문에서는 머신 러닝 기반으로 강우 데이터를 이용해 침수 깊이와 침수 위치를 예측하는 모델을 개발하는 방법을 연구한다. 실시간 강우량을 입력으로 사용하여 다양한 강우 분포 패턴에 강건하게 구성하고 적은 메모리로 모델을 학습시킬 수 있는 2가지 데이터 셋(set) 구성 방법을 제시하였다. 침수에 유의미한 영향을 미치는 valid total 데이터는 침수 위치는 잘 예측했지만, 특정 강우 패턴에 대해 값이 다르게 나타나는 경향을 띠었다. 부분적이지만 침수에 영향을 미치는 영역을 valid local이라 한다. Valid local은 고정점 방법에 대해서는 잘 학습되었지만, 임의점 방법에 대해서는 침수 위치를 정확하게 나타내지 못했다. 본 연구를 통해 실시간으로 침수 깊이와 위치를 예측할 수 있게 되어 큰 피해를 예방할 수 있을 것으로 예상된다.

사용자 지정 시나리오에 기반 한 차량 위치 데이터 생성기 설계 (Design of Vehicle Location Data Generator based on a User defined Scenario)

  • 정홍진;정영진;류근호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.142-144
    • /
    • 2004
  • 다양한 지리 관측 기술 및 GPS 그리고 무선통신 기술의 발달로 인해, 해수의 흐름 변화 관측이나 PDA를 장착한 물류 차량 관리와 같이 시간에 따라 이동하는 여러 객체들의 변화를 추적하고 관리하는 것이 용이해지고 있다. 그리고. 이로 인해 지능형 교통 시스템. 물류 차량 관리 시스템 등이 활발히 개발되고 있다. 그러나 개발된 시스템에서 차량 운송 계획 평가 및 테스트를 할 경우 차량의 실제 데이터가 부족하기 때문에 적절한 평가 및 다양한 테스트를 하기 힘들고, 실생활에 알맞은 시스템을 만들기 어려움 점이 있다. 이렇게 부족한 차량 데이터를 보충하기 위해, 대부분의 연구에서는 몇몇의 이동 객체 위치 데이터 생성기를 활용하고 있다. 그러나 기존의 이동 객체 데이터 생성기는 단순히 정규 분포, 가우스 분포. 랜덤 데이터. 도로 정보 등을 고려하여 데이터를 생성하기 때문에. 사용자가 물류 수송 계획 등에 활용하기 위해 의도한 시나리오에 따른 데이터를 생성하지 못하고 있다. 따라서, 이 논문에서는 차량 위치 데이터 생성기에 사용자가 지정한 시나리오를 생성, 저장하는 이동 객체 패턴 제공기를 추가하여. 사용자 지정 시나리오를 지원하는 차량 위치 데이터 생성기를 설계한다 이 논문에서 설계된 차랑 위치 데이터 생성기는 사용자가 원하는 계획대로 차량의 위치 정보를 생성함으로써, 물류 수송 및 도로 건설계획 등을 검토할 때 도움이 될 수 있을 것이다.

  • PDF

ESPI법에 의한 스폿 용접부의 비파괴적 응력측정 기술 (Technology of Non-destructive Stress Measurement in Spot Welded Joint using ESPI Method)

  • 김덕중;국정한;오세용;김봉중;유원일;김영호
    • 한국산학기술학회논문지
    • /
    • 제1권1호
    • /
    • pp.23-26
    • /
    • 2000
  • 스폿용접은 겹침판을 끼우고 가압상태의 전극 사이에 단시간의 대전류를 흘려, 전류가 집중하는 전극 직하의 모재 저항발열과 전극 및 모재의 열전도를 이용해서 판과 판의 접촉부에 안정한 용융부를 형성하는 압접법이다. 스폿용접으로 대표되는 저항용접법의 특징은 작업속도가 빠르고. 대량 생산적인 성격이 강하다는 점이다. 그러나, 용접부의 점검이 중요함에도 불구하고 용접부의 직접 감시가 곤란하여 적절한 검사 방법이 확립되지 않은 결점이 있다. 최근 제조공정 중에 실시간으로 스폿 용접부를 비파괴적인 방법을 이용하여 응력 및 변형상태를 체크하고. 결합을 검출할 수 있는 방법이 강력히 요구되고 있는 실정이다. 스폿 용접부페 광학적으로 레이저 빔을 조사하여 렌즈에 의해 결상되면 결상면상에 작은 입자모양의 반점이 생긴다. 이 반점을 스페클이라 하며 이 스페클에 의해 만들어진 불규칙한 반점모양을 스페클 패턴이라 한다. 이러한 현상은 레이저 빔이 가간섭의 성질을 지니고 있으므로 조사영역에서는 랜덤하지만 시간적으로 정상적인 위상관계에 있는 다수의 광파가 간섭함으로서 발생하는데 이와 같은 줄무늬 간격을 PC 프로그램으로 계산하여 응력을 측정한다. 따라서 본 연구에서는 레이저를 이용한 전자처리식 스페클 패턴 간섭법(ESPI)으로 스폿 용접부의 응력 및 변형률을 측정하여 스트레인 게이지법과 비교 고찰한 결과, ESPI법이 유용함을 알 수 있었으며. 이 방법을 생산 공정에 적용함으로서 생산성 및 품질 향상을 기할 수 있다고 판단된다.

  • PDF

거주지 분화에 대한 공간통계학적 접근 (II): 국지적 공간 분리성 측도를 이용한 탐색적 공간데이터 분석 (A Spatial Statistical Approach to Residential Differentiation (II): Exploratory Spatial Data Analysis Using a Local Spatial Separation Measure)

  • 이상일
    • 대한지리학회지
    • /
    • 제43권1호
    • /
    • pp.134-153
    • /
    • 2008
  • 이 논문의 주된 목적은 국지적 공간 분리성 측도를 이용한 탐색적 공간데이터 분석을 통해 거주지 분화 연구에서 공간통계학적 접근이 가지는 의의를 논증하는 것이다. 탐색적 공간데이터 분석은 공간 데이터를 다양한 과학적 지도학적 시각화 방식을 통해 탐색함으로써 패턴을 발견해 내고, 의미 있는 가설을 수립하며, 더 나아가 공간 데이터에 대한 통계학적 모델을 평가하는 것을 주목적으로 한다. 이 연구는 국지 통계량에 기반한 탐색적 공간데이터 분석이 구체적인 연구 수행에서 실질적인 도움을 줄 수 있다는 믿음에 기반을 두고 진행된 것이다. 중요한 결과는 다음과 같다. 첫째, 이미 개발된 전역적 공간 분리성 측도로부터 국지적 공간 분리성 측도를 도출하였다. 둘째, 두 가지 유의성 검정을 위한 가정, 즉 총체적 랜덤화 가정과 조건적 랜덤화 가정에 기반한 가설검정 방법을 제시하였다 셋째, 측도와 유의성 검정을 바탕으로 한 탐색적 공간데이터 분석 기법으로 '공간 분리성 산포도 지도'와 '공간 분리성 이례치 지도'를 제시하였다. 부가적으로 각 인구 집단 별 집중도에 대한 표준화 지표도 제시되었다. 넷째, 개발된 기법을 우리나라 7대 도시의 고학력 집단과 저학력 집단간 거주지 분화에 적용한 결과, 특히, 이변량 공간적 클러스터와 공간적 특이점을 확인하는 데 유용성이 있는 것으로 드러났다.

머신러닝을 활용한 가짜리뷰 탐지 연구: 사용자 행동 분석을 중심으로 (A Study on Detecting Fake Reviews Using Machine Learning: Focusing on User Behavior Analysis)

  • 이민철;윤현식
    • 지식경영연구
    • /
    • 제21권3호
    • /
    • pp.177-195
    • /
    • 2020
  • 소비자 구전은 정보통신기술의 발전과 모바일 기기의 보급 가속화로 그 영향력 또한 급속도로 커지고 있다. 그러나 과도한 마케팅 경쟁은 가짜리뷰와 같은 거짓 온라인 구전을 확산시켰고, 이로 인해 소비자들은 온라인 구전에 대한 피로감과 함께 온라인을 통해 얻게 되는 정보를 불신하는 결과를 초래하고 있으며, 이는 소비자의 합리적 구매 결정 행위에 부정적인 영향을 미치기도 한다. 이에 대한 문제 인식의 확산으로 가짜리뷰의 형태적 특성에 대한 연구를 비롯해 가짜리뷰를 효과적으로 분류하기 위한 다양한 탐지 방법에 대한 연구가 증가하고 있다. 이에 본 연구에서는 네이버 블로그에 작성된 포스트를 대상으로 데이터를 수집하고, 사용자의 무의식에 기반한 습관적 패턴을 머신러닝 모형을 통해 분석해 보았다. 게시물이 작성된 블로그와 그 게시물에서 추출한 변수를 분석하여 향후 가짜리뷰 예측에 활용하고자 하였다. 연구 결과, 광고성 리뷰 예측에 있어 해당 글 작성자의 블로그에 등록된 전체 포스트의 개수와 포스트의 등록 날짜는 매우 높은 상관관계를 보였으며, 해당 포스트가 속한 분류에 등록된 포스트의 개수, 포스트 본문에 사용된 이미지의 개수, 블로그에 포함된 메뉴 개수, 포스트 제목 및 본문의 길이, 포스트가 획득한 '좋아요'의 개수 또한 높은 상관관계를 보였다. 또한 광고성 리뷰 여부를 판단하기 위한 머신러닝 모형에 있어서 랜덤포레스트를 활용한 모형이 가장 우수한 모형으로 확인되었다. 본 연구에서는 블로그에 작성된 리뷰 내용에 대한 형태소 분석을 시행하는 대신 리뷰를 작성한 사람의 행위를 분석하기 위한 시도를 하였다. 이를 위해 블로그와 포스트의 특성 데이터를 수작업이 아닌 웹 크롤링 기법으로 수집하고 머신러닝 모형을 통해 광고성 리뷰 여부를 판별할 가능성을 확인한 점은 향후 가짜리뷰의 빠른 탐지를 위한 효율성 및 효과성 향상에 기여할 수 있을 것이다.

딥뉴럴네트워크에서의 적대적 샘플에 관한 앙상블 방어 연구 (Detecting Adversarial Example Using Ensemble Method on Deep Neural Network)

  • 권현;윤준혁;김준섭;박상준;김용철
    • 융합보안논문지
    • /
    • 제21권2호
    • /
    • pp.57-66
    • /
    • 2021
  • 딥뉴럴네트워크는 이미지 인식, 음성 인식, 패턴 인식 등에 좋은 성능을 보여주고 있는 대표적인 딥러닝모델 중에 하나이다. 하지만 이러한 딥뉴럴네트워크는 적대적 샘플을 오인식하는 취약점이 있다. 적대적 샘플은 원본 데이터에 최소한의 노이즈를 추가하여 사람이 보기에는 이상이 없지만 딥뉴럴네트워크가 잘못 인식 하게 하는 샘플을 의미한다. 이러한 적대적 샘플은 딥뉴럴네트워크를 활용하는 자율주행차량이나 의료사업에서 차량 표지판 오인식이나 환자 진단의 오인식을 일으키면 큰 사고가 일어나기 때문에 적대적 샘플 공격에 대한 방어연구가 요구된다. 본 논문에서는 여러 가지 파라미터를 조절하여 적대적 샘플에 대한 앙상블 방어방법을 실험적으로 분석하였다. 적대적 샘플의 생성방법으로 fast gradient sign method, DeepFool method, Carlini & Wanger method을 이용하여 앙상블 방어방법의 성능을 분석하였다. 실험 데이터로 MNIST 데이터셋을 사용하였으며, 머신러닝 라이브러리로는 텐서플로우를 사용하였다. 실험방법의 각 파라미터들로 3가지 적대적 샘플 공격방법, 적정기준선, 모델 수, 랜덤노이즈에 따른 성능을 분석하였다. 실험결과로 앙상블 방어방법은 모델수가 7이고 적정기준선이 1일 때, 적대적 샘플에 대한 탐지 성공률 98.3%이고 원본샘플의 99.2% 정확도를 유지하는 성능을 보였다.