• Title/Summary/Keyword: 선택 빈도

Search Result 857, Processing Time 0.03 seconds

Application of Cluster Analysis using Mutual Information (상호정보량 기법을 이용한 군집분석의 적용성 연구)

  • Jung, Young-Hun;Kim, Wan-Su;Jeong, Chang-Sam;Heo, Jun-Haeng
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2011.05a
    • /
    • pp.414-414
    • /
    • 2011
  • 우리나라 뿐만 아니라 전 세계적으로 기후변화로 인한 집중호우, 폭설 등이 빈번하게 일어나고 있으며 수공구조물 설계에 필요한 확률강우량도 증가하고 있다. 확률강우량을 산정하는 빈도해석의 경우 지점빈도해석의 문제점을 보완한 지역빈도해석에 대한 연구가 꾸준히 진행되고 있다. 지역빈도해석을 적용하기 위해서는 수문학적 동질성을 가지는 지역 구분이 무엇보다 중요하다. 군집 분석은 개체들이 지니고 있는 다양한 속성의 유사성을 동질적인 집단으로 군집화하는 방법을 말한다. 군집분석의 기본원리는 분석하고자 하는 여러 특성등을 유사성(similaruty) 거리(distance)로 환산하고 거리가 상대적으로 가까운 개체들을 동질적으로 군집화하는 것이다. 군집분석을 적용하기 위해서는 기상학적 인자와 지형학적 인자를 이용하여 군집분석을 실시한다. 군집분석을 실시할 때 가장 중요한 것은 입력변수의 선택으로 입력 변수의 적절한 선택이 결과값에 큰 영향을 준다. 상호정보량(Mutual Information, MI) 기법은 두 무작위 변수간의 관련성을 측정하는 방법이며 (Cover and Tomas, 2006), 두 변수간의 독립성 구조에 관한 가정이 없고 데이터 변형이나 잡음(noise)에 대한 영향이 적어 다른 기법보다 신뢰도가 높다고 알려져 있다(Peng et al., 2005). 본 연구에서는 상호정보량 기법을 이용하여 군집된 지점들의 종속성과 독립성의 관계를 정량적으로 산정하여 비교하고자 한다.

  • PDF

rainfall pattern generation method by johnson distribution (Johnson 분포를 활용한 강우양상 생성 기법에 관한 연구)

  • Han, Kun-Yeun;Ahn, Ki-Hong;Lee, Jin-Young;Ryu, Jong-Hyun
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2009.05a
    • /
    • pp.144-148
    • /
    • 2009
  • 지구온난화로 인한 홍수빈도 및 강우강도의 증가로 홍수피해의 규모는 더욱 증가하고 있다. 그리고 방재대책도 발생한 피해에 대한 복구를 주된 정책으로 하던 소극적 자세에서 벗어나 과학적 공학적 접근을 통해 재해에 대응할 수 있는 기술을 개발하는 적극적 홍수방어 체계를 구축하고 있다. 또한, 설계빈도의 무조건적인 상향조정에 따른 확정론적인 방법에 의존하기 보다는 추계학적 방법을 도입한 수문량 확충 및 매개변수의 불확실성 분석이 필요성이 대두되고 있는 실정이다. 일반적으로 수공구조물의 설계 시에는 설계홍수량을 사용하는데 이는 홍수특성, 홍수발생빈도, 홍수발생 가능성 등을 수공구조물의 규모와 파괴 시 예상되는 피해 정도에 따라 요구되는 안전성을 함께 고려해 수공구조물의 설계기준으로 활용된다. 설계홍수량은 지속시간과 재현기간을 사전에 지정하여 빈도분석을 통해 설계강우량을 산정하고 이를 강우-유출 분석을 함으로써 산정된다. 설계강우량은 빈도분석을 위해 선택된 강우형태에 따른 수문학적 무작위성을 포함하고 있다. 따라서 시간적 변동을 고려한 적절한 강우양상 형태의 선택은 수문학적으로 안전한 수공구조물의 설계 및 평가에 매우 큰 영향을 미친다. 현재의 경우는 강우형태에 대한 선택이 경험에 의해 임의로 이루어지므로, 토목공학자는 여러 가지 발생 가능한 강우형태에 따른 시간적 분포에 대해 고려해야 한다. 본 연구에서는 Huff분위에 따른 무차원 누가 강우곡선을 이용해 강우변동양상 생성을 위한 제약조건을 log-ratio 변환을 이용해 극복하였으며, 결과의 통계 특성치를 Johnson 분포를 통해 표준정규분포로 변환시켰다. 무작위 변수 발생 후 강우양상별 표준정규값의 상관행렬을 이용하여 상관성이 있는 무작위변수로 변환하였다. 얻어진 상관성을 갖는 무작위변수는 log-ratio 역변환을 통해 상관성을 갖는 변수로 재변환해서 무차원화된 강우곡선을 얻을 수 있었다.

  • PDF

Analysis of Achievement and College Major Choice According to Longitudinal Pattern of Awareness of ICT Literacy and Frequency of Computer Use (컴퓨터 활용능력과 빈도의 종단적 패턴에 따른 학업성취도와 대학전공 선택 분석)

  • Shim, Jaekwoun
    • The Journal of Korean Association of Computer Education
    • /
    • v.23 no.1
    • /
    • pp.53-61
    • /
    • 2020
  • In the information society, the ability of learners to use computers to conduct self-directed learning is important. Indeed, the higher the computer's ability to use computers, the more the academic achievement needs to be analyzed. The purpose of this study was to identify longitudinal trajectories of student awareness of ICT literacy and frequency of computer use. We also examined the effects of the longitudinal patterns on academic achievement and college major choice. A non-parametric approach, K-means for longitudinal data(KML) algorithm, was conducted using 9-year longitudinal data from Seoul Education Longitudinal Study (2010-2018). Findings indicated that a pattern presenting a higher awareness of ICT literacy and frequency of computer use showed better academic achievements and was likely to prefer to choose engineering-related majors.

Automatic Classification of Blog Posts Considering Category-specific Information (범주별 고유 정보를 고려한 블로그 포스트의 자동 분류)

  • Kim, Suah;Oh, Sungtak;Lee, Jee-Hyong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.11-14
    • /
    • 2015
  • 많은 블로그 제공 사이트는 블로그 포스트 작성자에게 미리 정의된 범주 (category)에 따라 포스트의 주제에 대하여 범주를 선택할 수 있는 환경을 제공한다. 그러나 블로거들은 작성한 포스트의 범주를 매번 수동으로 선택해야 하는 불편함이 있다. 이러한 불편함의 해결을 위해 블로그 포스트를 자동으로 분류해주는 기능을 제공한다면 블로그의 활용성이 증가할 것이다. 기존의 블로그 문서 분류의 연구는 각 범주의 고유 정보를 반영하는 것에 한계가 있었다. 이러한 문제를 해결하기 위해, 본 논문에서는 범주별 고유 정보를 반영한 어휘 가중치를 제안한다. 어휘 가중치의 분석을 위하여 범주별로 블로그 문서를 수집하고, 수집한 문서에서 어휘의 빈도와 문서의 빈도, 범주별 어휘빈도 등을 고려하여 새로운 지표인 CTF, CDF, IECDF를 개발하였다. 이러한 지표를 기반으로 기존의 Naive Bayes 알고리즘으로 학습하여, 블로그 포스트를 자동으로 분류하였다. 실험에서는 본 논문에서 제안한 가중치 방법인 TF-CTF-CDF-IECDF를 사용한 분류가 가장 높은 성능을 보였다.

  • PDF

Perinatal outcomes according To chorionicity in Twin Gestations (쌍생아 임신의 융모막과 주산기 결과)

  • Choi, Eun-Jin;Yun, Hyun-Jin;Hyh, Jae-Won;Hong, Yong-Hong
    • Neonatal Medicine
    • /
    • v.15 no.1
    • /
    • pp.67-74
    • /
    • 2008
  • Purpose : The purpose of this study was to assess the natural history and perinatal outcomes of twin gestations according to chorionicity. Methods : We retrospectively reviewed the medical records of 99 monochorionic (MC) and 206 dichorionic (DC) twin gestations delivered at Il Sin Christian Hospital in Busan between January 2002 and December 2007. The incidences of twin-to-twin transfusion syndrome (TTS) and selective intrauterine growth restriction (sIUGR), as well as perinatal morbidity and mortality, were evaluated. Results : MC twins had a lower gestational age (35.7 vs. 36.6 weeks, P=0.03) at birth and a higher incidence of intrauterine fetal loss (10% vs. 1.5%, P<0.001) than DC twins. The incidence of intrauterine fetal loss was higher in MC sIUGR than in DC sIUGR (19% vs. 2.5%, P=0.025) twins. The number of admissions to the neonatal intensive care unit (NICU; 31% vs. 16%, P=0.042), and the incidence of periventricular leukomalacia (7% vs. 0%, P=0.031), and respiratory distress syndrome with surfactant treatment (27% vs. 11%, P=0.049) were higher in MC than DC twins. The incidences of sIUGR and TTS were 21 and 9% among the MC twins. The incidences of intrauterine fetal loss were higher in MC twins with TTS [6 of 9 (67%)] or sIUGR [4 of 21 (19%)] than uncomplicated MC twins (P<0.001). The frequency of admission to the NICU (P=0.001), the length of hospital stay (P=0.033), the prevalence of periventricular leukomalacia (P=0.011), and intraventricular hemorrhage (P=0.007) were also higher in MC with TTS or sIUGR than in uncomplicated MC twins. Conclusion : The incidence of neonatal complications was higher in MC twins, especially those gestations complicated by TTS or sIUGR.

A Development of Noparamtric Kernel Function Suitable for Extreme Value (극치값 추정에 적합한 비매개변수적 핵함수 개발)

  • Cha Young-Il;Kim Soon-Bum;Moon Young-Il
    • Journal of Korea Water Resources Association
    • /
    • v.39 no.6 s.167
    • /
    • pp.495-502
    • /
    • 2006
  • The importance of the bandwidth selection has been more emphasized than the kernel function selection for nonparametric frequency analysis since the interpolation is more reliable than the extrapolation method. However, when the extrapolation method is being applied(i.e. recurrence interval more than the length of data or extreme probabilities such as $200{\sim}500$ years), the selection of the kernel function is as important as the selection of the bandwidth. So far, the existing kernel functions have difficulties for extreme value estimations because the values extrapolated by kernel functions are either too small or too big. This paper suggests a Modified Cauchy kernel function that is suitable for both interpolation and extrapolation as an improvement.

The Comparison of Indicators for Selecting Familiar Labels of Information Items in Web Pages (친숙한 웹 페이지 정보 항목명 선택을 위한 지표 비교)

  • Cho, In-Ho;Kim, Hyoung-Rae
    • Journal of Internet Computing and Services
    • /
    • v.12 no.1
    • /
    • pp.111-118
    • /
    • 2011
  • While sharing information through Internet by Web page or XML, familiar labels of information items will reduce the confusion among users. The advises of the language experts for choosing familiar terms may cost money and time, but an automated Indicator can help a user select right terms without any cost. This paper collects Indicators that can be easily found over Internet and compares the efficiency of them for selecting familiar terms. The collected indicators are the number of words in a term, the frequency used in a related Web sites, and the number of search results in portal sites. The results conclude that the found terms by the frequency matches 76% for women's and 71% for men's, which tells that the frequency can be a reference for selecting familiar terms.

Selection of controller based on frequency of use using Apriori algorithm in SDN environment (SDN 환경에서 Apriori 알고리즘을 이용한 사용 빈도에 기반을 둔 컨트롤러 선택)

  • Yoo, Seung-Eon;Kim, Se-Jun;Lee, Byung-Jun;Kim, Kyung-Tae;Youn, Hee-Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2018.07a
    • /
    • pp.149-150
    • /
    • 2018
  • 본 논문에서는 연관 규칙 마이닝 알고리즘인 Apriori을 이용하여 컨트롤러를 선택하는 모델을 제안하였다. 제안 모델은 모든 컨트롤러 정보를 수집한 다음 발생 지지도(Transaction support)를 이용하여 컨트롤러의 실행 빈도를 측정한다. 이를 통해 연관된 컨트롤러를 동시에 실행함으로써 효율적인 컨트롤러 선택을 기대한다.

  • PDF

Covid 19 news data analysis (코로나 19 뉴스데이터 분석 및 시각화)

  • Hur, Tai-seong;Hwang, In Yong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.07a
    • /
    • pp.241-242
    • /
    • 2021
  • 본 논문에서는 2020년 1월부터 2020년 8월까지 8개월간의 유통되었던 코로나 19와 관련된 뉴스 데이터를 이용하여 기간 및 지역별 단어의 빈도수를 구하고, 그 결과를 활용해 코로나 19와의 상관관계를 분석하고, 시각화하였다. 뉴스데이터는 한국언론진흥재단에서 운영하는 뉴스 빅데이터 시스템인 '빅카인즈'에서 수집된 데이터를 이용하였다. 본 논문에서 웹서비스를 활용해 시각화하였으며 지역과 기간을 선택하면 분석한 결과를 불러와 전체 지역대비 선택한 지역의 뉴스 빈도수, 선택한 지역의 주요 키워드, 주요 키워드의 지역별 일자별 변화 등을 보여주고 있다. 이러한 시각화를 통해 이전에 발생되었던 사건에 대해 주요 키워드와 코로나 19의 상관관계를 쉽게 파악을 할 수 있다.

  • PDF

Deveolping clinical pathways of acute appendicitis patients in emergency room (응급실 급성 충수염 환자의 임상경로 개발)

  • Park, Cheol-Yong;Kim, Yoon-Nyun;Choi, Hyun-Seok;Shin, A-Mi
    • Journal of the Korean Data and Information Science Society
    • /
    • v.21 no.3
    • /
    • pp.427-435
    • /
    • 2010
  • In this study, we develop clinical pathways for test and medical treatment items of acute appendicitis patients in emergency room. In order to develop the clinical pathways, we first employ the order selection method by Park et al. (2010), and then display the selected orders in such a way that associated orders are tied together. More specifically the order selection method that we employ is based on lift and, starting from the orders with higher frequencies, sequentially removes the negatively associated orders with lift values less than 0.9. The way associated orders are selected and tied together is similar to that of the order selection method. More specifically, starting from the selected orders with higher frequencies, the orders with lift values greater than 1.1 are considered associated and displayed to the right of the corresponding order. Therefore, in the diagram of clinical pathways, the orders at the left hand side, in principle, are not associated with each other and upper orders have higher frequencies, and associated orders are located to the right of corresponding order at the left hand side and more left orders, in principle, have higher frequencies.