• 제목/요약/키워드: interval-valued data

검색결과 13건 처리시간 0.016초

의학진단에 이용되는 해밍 거리의 특성 탐색 (On the characteristics of the Hamming distances in medical diagnosis)

  • 안정용
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권2호
    • /
    • pp.227-234
    • /
    • 2012
  • 의학진단을 위해 여러 증상과 질병 사이의 거리를 이용하는 연구가 많이 진행되고 있다. 그러나 거리들이 비슷한 값을 가지는 경우가 많이 발생하며, 이들 거리의 차이값은 정규분포 또는 카이제곱분포 등과 같은 일반적인 통계분포를 따르지 않는다. 본 연구에서는 의학진단에 사용되는 해밍 거리들의 차이값에 대한 분포적 특성에 대해 살펴보고, 이 차이값의 유의성 검정에 대해 탐색해보고자 한다.

혼합형태 심볼릭 데이터의 군집분석방법 (A Divisive Clustering for Mixed Feature-Type Symbolic Data)

  • 김재직
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1147-1161
    • /
    • 2015
  • 오늘날 데이터는 p-차원의 공간에서 점들로써 표현되는 전통적인 형태를 벗어나 시그널(signal), 함수, 이미지(image), 모양(shape) 등과 같은 다양한 형태의 자료들이 데이터로써 고려되고 분석되고있다. 그러한 종류의 새로운 종류의 데이터 중 하나로 심볼릭 데이터(symbolic data)를 고려할 수 있다. 심볼릭 데이터는 구간(interval), 히스토그램(histogram), 목록(list), 통계표, 분포, 또는 모형 등과 같은 다양한 형태들을 가질 수 있다. 지금까지의 연구가 주로 심볼릭 데이터의 각각의 형태별 자료를 고려했다면, 본 연구에서는 이를 확장하여 수집된 히스토그램과 멀티모달의 혼합된 형태로 이루어진 자료에 대한 계층 분할적 군집분석방법을 소개하고 이를 업종별 산업재해자료의 분석을 위해 이용한다.

퍼지 시그너쳐 집합을 이용한 마이크로어레이 데이터 검색 (Microarray Data Retrieval Using Fuzzy Signature Sets)

  • 이선아;이건명;류근호
    • 한국지능시스템학회논문지
    • /
    • 제19권4호
    • /
    • pp.545-549
    • /
    • 2009
  • 마이크로어레이 데이터는 수천가지 유전자의 발현정보를 포함할 수 있으며, 여기에서 의미있는 패턴을 추출하여 추가적인 분석을 위한 목적으로 활용되고 있다. 다수의 샘플 또는 실험에 대해서 마이크로어레이 데이터가 수집된 경우에 분석자가 관심을 갖는 유전자들이나 샘플들을 효과적으로 검색하는 것이 필요한 경우가 있다. 이 논문에서는 단순한 조건뿐만 아니라 복잡한 조건을 정의하여 원하는 특성을 만족하는 유전자나 샘플을 추출하는 방법으로 퍼지 시그너쳐 집합을 활용하는 방법을 제안한다. 퍼지 시그너쳐는 벡터값을 값을 갖는 퍼지 집합을 확장한 것으로, 벡터의 각 요소가 다시 벡터가 되는 것을 허용하는 재귀적인 구조이다. 퍼지 시그너쳐 집합은 단말 원소가 구간 [0,1] 사이에서 정의된 퍼지집합이라는 것을 제외하면 퍼지 시그너쳐와 같은 구조를 가진다. 이 논문에서는 각 내부 노드에 대해서 명시적으로 결합 연산자를 지정하도록 하고, 결합 연산을 위해 비교연산자를 사용할 수 있도록 확장한 퍼지 시그너쳐 집합을 소개한다. 또한 확장된 퍼지 시그너쳐 집합을 마이크로어레이 데이터 검색을 위해 사용하는 방법과 이를 사용한 예를 보인다.