• 제목/요약/키워드: Binary data

검색결과 1,661건 처리시간 0.029초

Bayesian estimation for finite population proportion under selection bias via surrogate samples

  • Choi, Seong Mi;Kim, Dal Ho
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1543-1550
    • /
    • 2013
  • In this paper, we study Bayesian estimation for the finite population proportion in binary data under selection bias. We use a Bayesian nonignorable selection model to accommodate the selection mechanism. We compare four possible estimators of the finite population proportions based on data analysis as well as Monte Carlo simulation. It turns out that nonignorable selection model might be useful for weekly biased samples.

핫스팟 접근영역 인식에 기반한 바이너리 코드 역전 기법을 사용한 저전력 IoT MCU 코드 메모리 인터페이스 구조 연구 (Low-Power IoT Microcontroller Code Memory Interface using Binary Code Inversion Technique Based on Hot-Spot Access Region Detection)

  • 박대진
    • 대한임베디드공학회논문지
    • /
    • 제11권2호
    • /
    • pp.97-105
    • /
    • 2016
  • Microcontrollers (MCUs) for endpoint smart sensor devices of internet-of-thing (IoT) are being implemented as system-on-chip (SoC) with on-chip instruction flash memory, in which user firmware is embedded. MCUs directly fetch binary code-based instructions through bit-line sense amplifier (S/A) integrated with on-chip flash memory. The S/A compares bit cell current with reference current to identify which data are programmed. The S/A in reading '0' (erased) cell data consumes a large sink current, which is greater than off-current for '1' (programmed) cell data. The main motivation of our approach is to reduce the number of accesses of erased cells by binary code level transformation. This paper proposes a built-in write/read path architecture using binary code inversion method based on hot-spot region detection of instruction code access to reduce sensing current in S/A. From the profiling result of instruction access patterns, hot-spot region of an original compiled binary code is conditionally inverted with the proposed bit-inversion techniques. The de-inversion hardware only consumes small logic current instead of analog sink current in S/A and it is integrated with the conventional S/A to restore original binary instructions. The proposed techniques are applied to the fully-custom designed MCU with ARM Cortex-M0$^{TM}$ using 0.18um Magnachip Flash-embedded CMOS process and the benefits in terms of power consumption reduction are evaluated for Dhrystone$^{TM}$ benchmark. The profiling environment of instruction code executions is implemented by extending commercial ARM KEIL$^{TM}$ MDK (MCU Development Kit) with our custom-designed access analyzer.

한글 유니코드 텍스트의 효율적인 탐색을 위한 컴팩트 바이너리 트라이의 재구성 (Reconstitution of Compact Binary trie for the Efficient Retrieval of Hangul UniCODE Text)

  • 정규철;이종찬;박상준;김병기
    • 디지털산업정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.21-28
    • /
    • 2009
  • This paper proposes RCBT(Reduced Compact Binary trie) to correct faults of CBT (Compact Binary trie). First, in the case of CBT, a compact structure was tried for the first time, but as the amount of data was increasing, that of inputted data gained and much difficulty was experienced in insertion due to the dummy nodes used in balancing trees. On the other hand, if the HCBT realized hierarchically, given certain depth to prevent the map from increasing onthe right, reached the depth, the method for making new trees and connecting to them was used. Eventually, fast progress could be made in the inputting and searching speed, but this had a disadvantage of the storage space becoming bigger because of the use of dummy nods like CBT and of many tree links. In the case of RCBT in this thesis, a capacity is increased by about 60% by completely cutting down dummy nods.

랜덤 위상변조가 가미된 이진 진폭 데이터 영상의 홀로그래픽 저장 특성 (Characteristics of holographic storage of random-phase-modulation-added binary amplitude data)

  • 오용석;신동학;장주석
    • 한국정보통신학회논문지
    • /
    • 제5권2호
    • /
    • pp.289-296
    • /
    • 2001
  • 본 논문에서는 뒤틀린 니매틱 액정디스플레이를 가변적인 위상마스크로 사용하여 기존의 2진 데이터 영상에 위상변조를 추가하는 방법을 제안한다 이를 위해 액정디스플레이의 위상변조특성을 이론 및 실험적으로 조사하였고, 입사빔 세기가 매우 커지면 위상변조 특성이 변하는 현상이 존재함을 실험적으로 보였다. 위상변조가 가미된 2진 데이터 영상의 저장특성을 실험적으로 조사하기 위해 여덟 장의 홀로그램을 각다중 을 사용해서 Dupont 사의 광폴리머의 한 지점에 기록하였다. 위상변조를 사용하여 Fourier 면 홀로그램을 기록할 경우, 기존의 진폭변조방식만 사용하는 경우에 비해 빔세기 균일도를 높일 수 있어서, 같은 조건에서 더 많은 홀로그램을 기록할 수 있음을 보였다.

  • PDF

오류 학습 문서 제거를 통한 문서 범주화 기법의 성능 향상 (A Text Categorization Method Improved by Removing Noisy Training Documents)

  • 한형동;고영중;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권9호
    • /
    • pp.912-919
    • /
    • 2005
  • 문서 범주화에서 이진 분류를 다중 분류에 적용할 때 일반적으로 '한 범주에 적합-다른 모든 범주에서는 부적합(One-Against-All) 판정 방법'을 사용한다. 하지만, 이러한 '한 범주에 적합-다른 모든 범주에서는 부적합 판정 방법'은 한 가지 문제점을 가지는데, 적합(positive) 집합의 문서들은 사람이 직접범주를 할당한 것이지만 부적합(negative) 집합의 문서들은 사람이 직접 범주를 할당한 것이 아니기 때문에 오류 문서들이 많이 포함될 수 있다는 것이다. 본 논문에서는 이러한 문제점을 해결하기 위해서 슬라이딩 원도우(sliding window) 기법과 EM 알고리즘을 이진 분류 기반의 문서 범주화에 적용할 것을 제안한다. 제안된 기법은 먼저 슬라이딩 윈도우 기법을 사용하여 오류 문서들을 추출하고 이들을 EM알고리즘을 사용해서 다시 범주를 할당함으로써 이진 분류 기반의 문서 범주화 기법의 성능을 향상시킨다.

불균형적인 이항 자료 분석을 위한 샘플링 알고리즘들: 성능비교 및 주의점 (On sampling algorithms for imbalanced binary data: performance comparison and some caveats)

  • 김한용;이우주
    • 응용통계연구
    • /
    • 제30권5호
    • /
    • pp.681-690
    • /
    • 2017
  • 파산감지, 스팸메일 감지, 불량품 감지 등 일상생활에서 불균형적인 이항 분류 문제를 다양하게 접할 수 있다. 반응변수의 클래스의 비율이 상당히 불균형한 경우 이항 분류 모형의 예측 성능이 좋지 않다는 점은 이미 잘 알려진 사실이다. 이러한 문제점을 해결하기 위해 그 동안 오버 샘플링, 언더 샘플링, SMOTE와 같은 여러 샘플링 기법이 개발되어 왔다. 본 연구에서는 분류 모형으로 많이 사용되는 기계학습모형으로 로지스틱 회귀모형, Lasso, 랜덤포레스트, 부스팅, 서포트 벡터 머신을 위의 샘플링 기법들과 결합하여 사용했을 때의 예측 성능을 살펴보았다. 실질적인 예측 성능의 개선 여부를 확인하기 위해 네 개의 실제 자료를 분석하였다. 이와 더불어, 샘플링 방법이 사용될 때 주의해야 할 점에 대해서 강조하였다.

엑셀 VBA를 이용한 이분형 로지스틱 회귀모형 교육도구 개발 (An educational tool for binary logistic regression model using Excel VBA)

  • 박철용;최현석
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.403-410
    • /
    • 2014
  • 이분형 로지스틱 회귀분석은 양적 혹은 질적 설명변수를 이용해서 이분형 반응변수를 설명하는 하나의 통계적인 기법이다. 이 모형에서는 반응변수가 1이 될 확률을 설명변수들의 선형결합의 변환(혹은 함수)으로 설명하고자 한다. 이 개념에 대한 이해가 비통계학자들이 이분형 로지스틱 회귀모형을 이해하는데 있어서 넘어야 할 커다란 장벽 중의 하나이다. 이 연구에서는 이분형 로지스틱 회귀모형의 필요성을 엑셀 VBA를 이용하여 설명하는 교육도구를 개발하고자 한다. 반응변수가 1이 될 확률을 설명변수의 선형함수로 모형화 할 때의 문제점과 선형결합에 대한 변환을 통해 이 문제점이 어떻게 해소되는지 보여준다.

차세대 T-DMB 방송의 부가 서비스 제공을 위한 비트 분리 방법 및 Double Binary Turbo 부호 적용 연구 (The Study of Bit Split Methods and Double Binary Turbo Code for Additional Service of Advanced T-DMB)

  • 김남수;배종태;김민혁;정지원
    • 한국전자파학회논문지
    • /
    • 제19권10호
    • /
    • pp.1065-1074
    • /
    • 2008
  • Eureka-147 표준안을 기반으로 하는 지상파 DMB 방송은 현재 다양한 멀티미디어 서비스를 제공하고 있다. 하지만 지상파 DMB 방송에 대한 다양하고 질 좋은 서비스의 제공이 요구되었고, 이에 본 논문에서는 기존의 시스템과의 역호환성을 유지하면서도, UEP와 계층 변조 기법이 적용된 차세대 지상파 DMB 시스템을 본 논문에서 제안하였다. 차세대 지상파 DMB 방송 시스템에서 비균일 16 QAM의 멀티 레벨 변조 방식이 적용되면서 복잡도와 성능의 관점이 고려된 비트 분리 방법을 제안하였고, 기존의 DMB 시스템에서 추가적으로 구성한 부가 서비스 스트림에 DVB-RCS 규격에서 사용하고 있는 double binary turbo 부호를 적용하여 그 성능을 시뮬레이션 하였다. 시뮬레이션 결과, 기존의 지상파 DMB 방송 시스템에 비해 double binary turbo code를 사용한 차세대 지상파 DMB 시스템은 2 dB 이상의 성능의 향상을 확인할 수 있다.

Confounding of Time Trend with Dropout Process in Longitudinal Data Analysis

  • Kim, Ji-Hyun;Choi, Hye-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제9권3호
    • /
    • pp.703-713
    • /
    • 2002
  • In longitudinal studies, outcomes are repeatedly measured over time for each subject. It is common to have missing values or dropouts for longitudinal data. In this study time trend in longitudinal data with dropouts is of concern. The confounding of time trend with dropout process is investigated through simulation studies. Some simulation results are reported for binary responses as well as continuous responses with patterns of dropouts varying. It has been found that time trend is not confounded with random dropout process for binary responses when it is estimated using GEE.

Discriminant Analysis of Binary Data with Multinomial Distribution by Using the Iterative Cross Entropy Minimization Estimation

  • Lee Jung Jin
    • Communications for Statistical Applications and Methods
    • /
    • 제12권1호
    • /
    • pp.125-137
    • /
    • 2005
  • Many discriminant analysis models for binary data have been used in real applications, but none of the classification models dominates in all varying circumstances(Asparoukhov & Krzanowski(2001)). Lee and Hwang (2003) proposed a new classification model by using multinomial distribution with the maximum entropy estimation method. The model showed some promising results in case of small number of variables, but its performance was not satisfactory for large number of variables. This paper explores to use the iterative cross entropy minimization estimation method in replace of the maximum entropy estimation. Simulation experiments show that this method can compete with other well known existing classification models.