• 제목/요약/키워드: Interval partitioning

검색결과 27건 처리시간 0.026초

정보이득 분할을 이용한 분류기법의 지배적 초월평면 생성기법 (A dominant hyperrectangle generation technique of classification using IG partitioning)

  • 이형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권1호
    • /
    • pp.149-156
    • /
    • 2014
  • 중첩형 일반화 사례 (NGE, Nested Generalized Exemplar) 기법은 거리 기반 분류를 최적 일치 규칙으로 사용하며, 노이즈에 대한 내구력을 증가시켜 주는 동시에 모델 크기를 감소시키는 장점이 있다. NGE 학습 중 생성된 교차(cross)나 중첩(overlap) 현상은 분류성능을 저해하는 요인으로 작용한다. 따라서 본 논문은 NGE 학습 중 생성된 교차나 중첩 현상이 발생한 초월 평면에대해 상호정보가 가장 큰 구간을 분리하여, 새로운 초월평면을 구성하게 하여, 분류성능 향상시키고 초월평면의 개수를 감소시키는 기법인 DHGen(Dominant Hyperrectangle Generation) 알고리즘을 제안하였다. 제안한 DHGen은 분류성능면에서 kNN과 유사하고 NGE이론으로 구현한 EACH보다 우수함을 UCI Machine Learning Repository에서 벤치마크데이터를 발췌한 실험자료로 입증하였다.

케이블 TV 망에서 노드 선택을 위한 휴리스틱 연구 (Heuristics for Selecting Nodes on Cable TV Network)

  • 정균락
    • 한국컴퓨터정보학회논문지
    • /
    • 제13권4호
    • /
    • pp.133-140
    • /
    • 2008
  • 케이블 TV망은 분배센터에서 가입자에게 방송 신호를 내려보내는데, 하이브리드 파이버 동축케이블(HFC)이 사용된 뒤로는 상향채널을 인터넷 같은 광대역 서비스로 확장해 활용하고 있다. 그런데 이 상향채널은 잡음에 취약한데 한 노드의 증폭기에 누적된 자식노드로부터의 잡음이 어떤 수준을 넘게 되면, 잡음이 더 이상 전파되는 것을 막기 위해 해당되는 노드를 분리하는 것이 필요하게 된다. 각 노드에 이익이 주어질 때 노드 선택 문제(NSP)는 각 노드에 누적된 잡음이 주어진 임계값을 넘지 않으면서 선택된 노드의 이익의 합이 최대가 되게 노드들을 선택하는 문제인데 NP-hard임이 증명되어 있다. 본 논문에서는 NSP의 근사해를 구하는 휴리스틱들을 제안하고 비교 분석하였는데, 구간 분할 휴리스틱이 greedy 휴리스틱보다 더 우수한 결과를 보였다. 이 휴리스틱들은 HFC 운영 시스템에 구현되어, 사용료를 더 많이 지불하는 우수 고객들에 해당하는 노드를 케이블 TV망에서 가능한 분리하지 않음으로써 더 좋은 질의 서비스를 제공하는 데 사용할 수 있다.

  • PDF

집단화된 통계자료의 도수다각형에 근거한 새로운 분위수 계산법 (A new method for calculating quantiles of grouped data based on the frequency polygon)

  • 김혁주
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권2호
    • /
    • pp.383-393
    • /
    • 2017
  • 집단화되어 있는 통계자료의 통계량을 구하고자 하는 경우 통계량의 참값에 보다 가까운 값을 얻게 해주는 계산 방법을 사용하는 것이 바람직하다. 본 논문에서는 집단화된 자료의 분위수들을 계산하는 새로운 방법을 제시하였다. 제시된 방법의 주된 아이디어는, 히스토그램에 따라 그려지는 도수다각형에서 각 계급구간에 대응하는 오각형의 넓이를 그 계급구간의 도수보다 하나 많은 개수의 부분으로 등분함으로써 자룟값들을 계산하는 것이다. 제시된 방법을 모의실험을 통해 기존의 방법들과 비교하였는데, 통계학개론 교재에 주어져 있는 몇 가지의 자료를 대상으로 하였다. 모의자료의 생성 방법은, 각 계급구간에서 도수다각형에 의해 주어진 모양의 확률밀도함수를 갖는 분포를 찾아낸 뒤 역변환 방법을 이용하여, 이 분포를 따르는 모의자룟값들을 각 계급구간에서 주어진 도수와 같은 개수만큼 발생시키는 방식이다. 모의자료의 분위수와의 차의 제곱합을 기준으로 할 때 제시된 방법이 기존의 방법들보다 거의 모든 사분위수와 십분위수에서 우세한 결과를 주는 것을 볼 수 있었다.

Age-related Reference Intervals for Total Collagen-I-N-terminal Propeptide in Healthy Korean Population

  • Yoo, Jun-Il;Park, Ae-Ja;Lim, Yong Kwan;Kweon, Oh Joo;Choi, Jee-Hye;Do, Jae Hyuk;Kim, Sunjoo;Kim, Youngri;Ha, Yong-Chan
    • 대한골대사학회지
    • /
    • 제25권4호
    • /
    • pp.235-241
    • /
    • 2018
  • Background: Procollagen type I N-terminal propeptide (PINP) is one of the most clinically useful bone formation biomarkers. Therefore, the purpose of this study was to independently evaluate the performance of automated total PINP assay and established age- and gender- specific reference intervals for PINP in healthy Korean population. Methods: The imprecision, linearity, and detection capability of Elecsys total PINP assay was determined and reference interval was established using 599 serums from Korean population with normal bone mineral densities based on bone densitometry. Age groups were divided into 20s, 30s, 40s, 50s, 60s and over. Results: Elecsys total PINP had excellent performance in imprecision, linearity, and detection capability. When partitioning age groups in Korean male and female populations, there was significant difference in total PINP between different age groups. In male populations, PINP level was decreased with increasing age, then it remained steady after middle-age. In female populations, there was a decreasing tendency similar to that in the male population with a sharp increase in the 50 to 59 age group. Conclusions: Elecsys total PINP assay showed precise and reliable performance in our study. We established age-related PINP reference intervals for Korean male and female population with normal bone mineral densities.

RFID 태그 데이타의 연속질의 처리를 위한 질의 색인 (A Query Index for Processing Continuous Queries over RFID Tag Data)

  • 석수욱;박재관;홍봉희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제34권2호
    • /
    • pp.166-178
    • /
    • 2007
  • RFID 기술 표준화를 추진하고 있는 EPCglobal의 ALE(Application Level Event)는 응용 애플리케이션과 RFID 미들웨어 사이의 인터페이스로서 ECSpec(Event Cycle Specification)과 ECReports(Event Cycle Reports)를 정의하고 있다. ECSpec은 애플리케이션이 원하는 태그 데이타에 대한 명세이며, ECReports는 ECSpec이 제시한 조건에 적합한 결과를 보고하기 위한 것이다. ECSpec은 애플리케이션이 미들웨어에 등록하는 이벤트 여과를 위한 명세로서 일정 시간 동안 반복적으로 수행되는 연속질의(continuous query)와 유사한 특성을 가진다. ECSpec을 연속질의로 변환할 때 해당 질의가 가지는 술어(Predicate)는 매우 긴 길이를 가지는 간격이 된다. 기존 질의색인들은 긴 간격 데이타에 의해 삽입과 검색 성능이 저하되는 문제점이 있다. 이 논문에서는 ECSpec을 연속질의의 형태로 변환하고 해당 질의가 가지는 술어인 2차원 간격의 특성을 반영한 새로운 질의 색인 구조로써 TLC-Index를 제안한다. 색인 구조는 그리드 방식의 큰 크기를 가지는 셀 분할 구조와 선분 모양의 가상 분할 구조를 병행하는 하이브리드 구조이다. TLC-index는 긴 간격을 큰 크기를 가지는 셀 분할 구조로 분할 삽입함으로써 저장 공간의 소모를 줄이고 삽입 성능을 향상 시킨다. 또한 짧은 간격들을 짧은 길이를 가지는 가상 분할 구조들로 분할 삽입함으로써 그리드 방식이 가질 수 있는 부분적 겹침을 제거하여 검색 성능을 향상시킨다.

수도의 건물 생산 및 배분의 수리적연구 II. 이앙기에 따른 부위별 건물배분 (Quantitative Analysis of Dry Matter Production and its Partition in Rice II. Partitioning of Dry Matter Affected by Transplanting Date)

  • 조동삼;정승근;허훈;육창수
    • 한국작물학회지
    • /
    • 제35권3호
    • /
    • pp.273-281
    • /
    • 1990
  • 수도의 생육시기별로 건물의 부위별 배분을 추적하고 이의 예측가능성을 검토하고자 통일계의 삼강벼와 일반계인 상풍벼를 1987년 5월 11일부터 10일 간격으로 4회 포장에 이앙재배하여 부위별 건물중을 조사 분석한 결과를 요약하면 다음과 같다. 1. 수도의 부위별 건물중은 이앙기가 늦어질수록 저하하였는데 특히 6월 1일 이후의 이앙에서 그 정도가 심하였다. 품종별로는 상풍벼 보다는 삼강벼의 총건물중 및 부위별 건물중이 더 컸다. 2. 간과 엽소의 건물배분율은 6월 11일 이전의 이앙에서는 이앙후 70일 전후 그리고 6월 21일 이후의 이앙에서는 이앙후 60일 전후까지 계속하여 증가하다가 출수후에 저하하였으며, 엽신의 건물 배분율은 이앙후 계속하여 저하하였다. 3. 간과 엽소의 최대 건물배분율은 폿트와 포장에서 모두 이앙기와 품종에 관계없이 60-70%의 범위였으나, 수확기의 건물배분율은 폿트에서 37-43% 그리고 포장에서는 27-33%로 낮아졌으며, 엽신의 수확기 건물배분율은 11-17%의 범위였다. 4. 이삭의 건물배분율은 출수후부터 급격히 증가하기 시작하여 폿트에서는 42-49% 그리고 포장에서는 52-62%에 달하여 생육환경에 따른 건물배분율의 차이가 있는 것으로 나타났다. 5. 품종별로 이앙기에 관계없이 이앙후의 일수에 따른 부위별 건물배분율의 추정을 위한 회귀식은 시험별로는 결정계수가 71-95%로서 만족한 정도였으나 한 시험에서 얻은 추정식으로 다른 시험의 건물배분율을 추정하기에는 부적합하였다.

  • PDF

러프집합분석을 이용한 매매시점 결정 (Rough Set Analysis for Stock Market Timing)

  • 허진영;김경재;한인구
    • 지능정보연구
    • /
    • 제16권3호
    • /
    • pp.77-97
    • /
    • 2010
  • 매매시점결정은 금융시장에서 초과수익을 얻기 위해 사용되는 투자전략이다. 일반적으로, 매매시점 결정은 거래를 통한 초과수익을 얻기 위해 언제 매매할 것인지를 결정하는 것을 의미한다. 몇몇 연구자들은 러프집합분석이 매매시점결정에 적합한 도구라고 주장하였는데, 그 이유는 이 분석방법이 통제함수를 이용하여 시장의 패턴이 불확실할 때에는 거래를 위한 신호를 생성하지 않는다는 점 때문이었다. 러프집합은 분석을 위해 범주형 데이터만을 이용하므로, 분석에 사용되는 데이터는 연속형의 수치값을 이산화하여야 한다. 이산화란 연속형 수치값의 범주화 구간을 결정하기 위한 적절한 "경계값"을 찾는 것이다. 각각의 구간 내에서의 모든 값은 같은 값으로 변환된다. 일반적으로, 러프집합 분석에서의 데이터 이산화 방법은 등분위 이산화, 전문가 지식에 의한 이산화, 최소 엔트로피 기준 이산화, Na$\ddot{i}$ve and Boolean reasoning 이산화 등의 네 가지로 구분된다. 등분위 이산화는 구간의 수를 고정하고 각 변수의 히스토그램을 확인한 후, 각각의 구간에 같은 숫자의 표본이 배정되도록 경계값을 결정한다. 전문가 지식에 의한 이산화는 전문가와의 인터뷰 또는 선행연구 조사를 통해 얻어진 해당 분야 전문가의 지식에 따라 경계값을 정한다. 최소 엔트로피 기준 이산화는 각 범주의 엔트로피 측정값이 최적화 되도록 각 변수의 값을 재귀분할 하는 방식으로 알고리즘을 진행한다. Na$\ddot{i}$ve and Boolean reasoning 이산화는 Na$\ddot{i}$ve scaling 후에 그로 인해 분할된 범주값을 Boolean reasoning 방법으로 종속변수 값에 대해 최적화된 이산화 경계값을 구하는 방법이다. 비록 러프집합분석이 매매시점결정에 유망할 것으로 판단되지만, 러프집합분석을 이용한 거래를 통한 성과에 미치는 여러 이산화 방법의 효과에 대한 연구는 거의 이루어지지 않았다. 본 연구에서는 러프집합분석을 이용한 주식시장 매매시점결정 모형을 구성함에 있어서 다양한 이산화 방법론을 비교할 것이다. 연구에 사용된 데이터는 1996년 5월부터 1998년 10월까지의 KOSPI 200데이터이다. KOSPI 200은 한국 주식시장에서 최초의 파생상품인 KOSPI 200 선물의 기저 지수이다. KOSPI 200은 제조업, 건설업, 통신업, 전기와 가스업, 유통과 서비스업, 금융업 등에서 유동성과 해당 산업 내의 위상 등을 기준으로 선택된 200개 주식으로 구성된 시장가치 가중지수이다. 표본의 총 개수는 660거래일이다. 또한, 본 연구에서는 유명한 기술적 지표를 독립변수로 사용한다. 실험 결과, 학습용 표본에서는 Na$\ddot{i}$ve and Boolean reasoning 이산화 방법이 가장 수익성이 높았으나, 검증용 표본에서는 전문가 지식에 의한 이산화가 가장 수익성이 높은 방법이었다. 또한, 전문가 지식에 의한 이산화가 학습용과 검증용 데이터 모두에서 안정적인 성과를 나타내었다. 본 연구에서는 러프집합분석과 의사결정 나무분석의 비교도 수행하였으며, 의사결정나무분석은 C4.5를 이용하였다. 실험결과, 전문가 지식에 의한 이산화를 이용한 러프집합분석이 C4.5보다 수익성이 높은 매매규칙을 생성하는 것으로 나타났다.