• 제목/요약/키워드: count model

검색결과 503건 처리시간 0.029초

A New Mail Survey Method for Sensitive Character without Using Randomization Device

  • Ki Hak Hong
    • Communications for Statistical Applications and Methods
    • /
    • 제4권3호
    • /
    • pp.735-741
    • /
    • 1997
  • In the present paper, we propose a new randomization device free mail survey method. The estimator based on proposed model is unbiased and more efficient than the estimator based on SIngh, Mangat and Singh model (SMS-model)(1993) when $\pi$<1/2, and more protective than SMS-model in view of the protection of privacy regardless of the values of $\pi$ and $\pi_Y$ only if we count the number of say 'Yes' from the respondents. However, If we consider the respondents that say 'No', the SMS-model is more protective than our model.

  • PDF

AN ALTERNATIVE COSMOLOGY

  • NARLIKAR JAYANT V.
    • 천문학회지
    • /
    • 제29권spc1호
    • /
    • pp.1-5
    • /
    • 1996
  • Recent discussions of observational constraints on the standard hot big bang model are reviewed and it is argued that now there is room for considering alternative cosmologies. The quasi-steady state cosmology is briefly described. This model seems to explain most of the observed features of the universe, including the m-z relation, radio source count, the light nuclear abundances and the microwave background.

  • PDF

Spatial Selectivity Estimation for Intersection region Information Using Cumulative Density Histogram

  • Kim byung Cheol;Moon Kyung Do;Ryu Keun Ho
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2004년도 Proceedings of ISRS 2004
    • /
    • pp.721-725
    • /
    • 2004
  • Multiple-count problem is occurred when rectangle objects span across several buckets. The Cumulative Density (CD) histogram is a technique which solves multiple-count problem by keeping four sub-histograms corresponding to the four points of rectangle. Although it provides exact results with constant response time, there is still a considerable issue. Since it is based on a query window which aligns with a given grid, a number of errors may be occurred when it is applied to real applications. In this paper, we proposed selectivity estimation techniques using the generalized cumulative density histogram based on two probabilistic models: (1) probabilistic model which considers the query window area ratio, (2) probabilistic model which considers intersection area between a given grid and objects. In order to evaluate the proposed methods, we experimented with real dataset and experimental results showed that the proposed technique was superior to the existing selectivity estimation techniques. The proposed techniques can be used to accurately quantify the selectivity of the spatial range query on rectangle objects.

  • PDF

Comparison of Machine Learning Techniques for Cyberbullying Detection on YouTube Arabic Comments

  • Alsubait, Tahani;Alfageh, Danyah
    • International Journal of Computer Science & Network Security
    • /
    • 제21권1호
    • /
    • pp.1-5
    • /
    • 2021
  • Cyberbullying is a problem that is faced in many cultures. Due to their popularity and interactive nature, social media platforms have also been affected by cyberbullying. Social media users from Arab countries have also reported being a target of cyberbullying. Machine learning techniques have been a prominent approach used by scientists to detect and battle this phenomenon. In this paper, we compare different machine learning algorithms for their performance in cyberbullying detection based on a labeled dataset of Arabic YouTube comments. Three machine learning models are considered, namely: Multinomial Naïve Bayes (MNB), Complement Naïve Bayes (CNB), and Linear Regression (LR). In addition, we experiment with two feature extraction methods, namely: Count Vectorizer and Tfidf Vectorizer. Our results show that, using count vectroizer feature extraction, the Logistic Regression model can outperform both Multinomial and Complement Naïve Bayes models. However, when using Tfidf vectorizer feature extraction, Complement Naive Bayes model can outperform the other two models.

Genetic Parameter Estimation with Normal and Poisson Error Mixed Models for Teat Number of Swine

  • Lee, C.;Wang, C.D.
    • Asian-Australasian Journal of Animal Sciences
    • /
    • 제14권7호
    • /
    • pp.910-914
    • /
    • 2001
  • The teat number of a sow plays an important role for weaning pigs and has been utilized in selection of swine breeding stock. Various linear models have been employed for genetic analyses of teat number although the teat number can be considered as a count trait. Theoretically, Poisson error mixed models are more appropriate for count traits than Normal error mixed models. In this study, the two models were compared by analyzing data simulated with Poisson error. Considering the mean square errors and correlation coefficients between observed and fitted values, the Poisson generalized linear mixed model (PGLMM) fit the data better than the Normal error mixed model. Also these two models were applied to analyzing teat numbers in four breeds of swine (Landrace, Yorkshire, crossbred of Landrace and Yorkshire, crossbred of Landrace, Yorkshire, and Chinese indigenous Min pig) collected in China. However, when analyzed with the field data, the Normal error mixed model, on the contrary, fit better for all the breeds than the PGLMM. The results from both simulated and field data indicate that teat numbers of swine might not have variance equal to mean and thus not have a Poisson distribution.

지향각 명령 오차를 고려한 망원경 탐지 성능 분석 (Detection Performance Analysis of the Telescope considering Pointing Angle Command Error)

  • 이호진;이상욱
    • 한국정보통신학회논문지
    • /
    • 제21권1호
    • /
    • pp.237-243
    • /
    • 2017
  • 본 논문에서는 인공위성을 비롯한 우주물체 관측 및 감시를 위한 전자광학 관측 장비인 망원경의 탐지 성능에 대한 분석을 수행한다. M&S(Modeling & Simulation)를 통한 분석을 위해, 위성 궤도 모델, 망원경 모델, 그리고 지구 대기 모델을 구현하고, 위성을 관측하는 탐지 시나리오를 구성한다. 탐지 시나리오를 바탕으로 지향각 명령 오차를 적용하여 망원경 주요 사양인 시야각(Field of View, FOV)에 따른 지향 성능을 분석하고, 신호대잡음비(Signal-to-Noise Ratio, SNR)를 통해 탐지 여부를 판별하여 검출기 화소수와 시야각(FOV)에 따른 탐지 성능을 분석한다. 본 논문의 M&S 분석 결과는 망원경 시야각(FOV)이 상대적으로 클수록 지향각 명령 오차가 존재하더라도 지향 성능은 좋지만, 대기 환경의 영향으로 화소수가 높고 망원경 시야각(FOV)이 작을수록 탐지 성능이 높아짐을 보여준다. 그래서 시야각(FOV)과 화소수 등의 망원경 주요 사양은 본 논문에서 수행한 M&S 분석 결과 및 종합적인 운용 상황을 고려하여 결정해야 한다.

무선 랜 트래픽의 분석과 모델링 (Modeling and Analysis of Wireless Lan Traffic)

  • 대쉬도즈얌힌;이성진;원유집
    • 한국통신학회논문지
    • /
    • 제33권8B호
    • /
    • pp.667-680
    • /
    • 2008
  • 본 논문에서는 802.11 무선 랜 네트워크 트래픽의 실제 관측 자료에 대한 연구 결과를 보인다. 패킷 트레이스는 대학 캠퍼스의 무선 랜 시설에서 얻은 자료로서 총합된 트래픽(aggregate traffic), 업스트림 트래픽(upstream traffic), 다운스트림 트래픽(downstream traffic), 그리고 TCP 패킷으로만 구성된 통합된 트래픽으로 이 4개의 트래픽 데이터를 수집하였다. 수집한 데이터에서 byte count 프로세스와 packet count 프로세스로 구성된 트래픽의 시계열과 시계열의 주변분포, 그리고 패킷 크기 분포에 대한 분석을 한다. 4개의 모든 데이터의 byte count 프로세스와 packet count 프로세스에서 장기 의존성 성질이 나타났다. 사용자가 인터넷으로 접속하는 없트�� 트래픽의 평균 패킷 크기는 151.7 byte였는데 다른 데이터의 평균 패킷 크기는 모드 260 byte 이상이었다. 최대 크기를 갖는 패이로드(payload)는 업스트림에서 3%, 그리고 나온트림에서 10%로 나타났다. 이런 분명한 패킷 크기 분포의 차이에도 불구하고 모든 4개의 데이터에서는 허스트(Hurst) 값이 모두 유사하게 나왔다. 허스트 값만으로는 트래픽의 확률적 특성을 충분히 설명할 수가 없다. 트래픽의 특성을 fractional-ARIMA(FARINA) 그리고 fractional Gaussian noise(FGN)으로 모델링을 한다. FGN은 연산을 하는데 있어서는 더 효율적이었고, FARINA는 트래픽 특성을 정확하게 모델링하는데 더 좋은 결과를 얻었다.

웹게시판에서 가상온도를 이용한 게시글의 인기 예측 (Predicting the Popularity of Post Articles with Virtual Temperature in Web Bulletin)

  • 김수도;김소라;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제11권10호
    • /
    • pp.19-29
    • /
    • 2011
  • 블로그는 사용자에게 자신의 의견을 표현하고 다른 사람들의 의견을 수렴할 수 있는 자유로운 의사표현 네트워크를 제공한다. 어떤 글은 사회적, 정치적 이슈를 몰고 다니기도 하며 또 어떤 글은 사용자의 관심을 끌지 못하고 지나가기도 한다. 글이 작성된 초기에 향후 얼마나 인기를 얻을지 예측한다는 것은 글의 저자, 블로거, 광고회사 그리고 웹호스팅 모두에게 흥미로울 것이다. 인기를 예측하기 위한 다양한 연구들이 진행되어 왔지만 대부분의 연구들이 사용자간의 상호연관성에 기반하고 있고 정확한 값으로 표현하는데 높은 에러율을 발생하고 있다. 본 논문에서는 블로그에 글이 작성된 초기에 향후 글의 인기를 예측하기 위해 조회수를 사용하여 글의 인기를 4타입(explosion, hot, warm, cold)의 가상 온도로 예측하는 방법을 제안한다. 먼저 글의 포화시점을 정의하고, 초기 조회수와 포화시점 조회수의 관계를 통해 포화시점 조회수를 예측하는 모델링 공식을 유도하였다. 예측된 포화시점 조회수를 이용하여 글의 인기를 4타입의 가상 온도로 표현하였다. 초기 관찰기간에 따라 예측 정확률이 결정되고 있다. 실험결과 30분 이후부터 MAPE(Mean Absolute Percentage Error)가 30%이하로 낮아졌지만, explosive 타입의 경우 초기 조회수로 예측하기 힘들었다. explosive를 제외한 hot, warm, cold 타입에서는 30분후부터 86%이상의 평균 예측 정확률을 보여주며, 70분후부터는 90%이상의 평균 예측 정확률을 보여주고 있었다.

Monocyte Count and Systemic Immune-Inflammation Index Score as Predictors of Delayed Cerebral Ischemia after Aneurysmal Subarachnoid Hemorrhage

  • Yeonhu Lee;Yong Cheol Lim
    • Journal of Korean Neurosurgical Society
    • /
    • 제67권2호
    • /
    • pp.177-185
    • /
    • 2024
  • Objective : Delayed cerebral ischemia (DCI) is a major cause of disability in patients who survive aneurysmal subarachnoid hemorrhage (aSAH). Systemic inflammatory markers, such as peripheral leukocyte count and systemic immune-inflammatory index (SII) score, have been considered predictors of DCI in previous studies. This study aims to investigate which systemic biomarkers are significant predictors of DCI. Methods : We conducted a retrospective, observational, single-center study of 170 patients with SAH admitted between May 2018 and March 2022. We analyzed the patients' clinical and laboratory parameters within 1 hour and 3-4 and 5-7 days after admission. The DCI and non-DCI groups were compared. Variables showing statistical significance in the univariate logistic analysis (p<0.05) were entered into a multivariate regression model. Results : Hunt-Hess grade "4-5" at admission, modified Fisher scale grade "3-4" at admission, hydrocephalus, intraventricular hemorrhage, and infection showed statistical significance (p<0.05) on a univariate logistic regression. Lymphocyte and monocyte count at admission, SII scores and C-reactive protein levels on days 3-4, and leukocyte and neutrophil counts on days 5-7 exhibited statistical significance on the univariate logistic regression. Multivariate logistic regression analysis revealed that monocyte count at admission (odds ratio [OR], 1.64; 95% confidence interval [CI], 1.04-2.65; p=0.036) and SII score at days 3-4 (OR, 1.55; 95% CI, 1.02-2.47; p=0.049) were independent predictors of DCI. Conclusion : Monocyte count at admission and SII score 3-4 days after rupture are independent predictors of clinical deterioration caused by DCI after aSAH. Peripheral monocytosis may be the primer for the innate immune reaction, and the SII score at days 3-4 can promptly represent the propagated systemic immune reaction toward DCI.