• 제목/요약/키워드: 선택 빈도

검색결과 857건 처리시간 0.03초

상호정보량 기법을 이용한 군집분석의 적용성 연구 (Application of Cluster Analysis using Mutual Information)

  • 정영훈;김완수;정창삼;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.414-414
    • /
    • 2011
  • 우리나라 뿐만 아니라 전 세계적으로 기후변화로 인한 집중호우, 폭설 등이 빈번하게 일어나고 있으며 수공구조물 설계에 필요한 확률강우량도 증가하고 있다. 확률강우량을 산정하는 빈도해석의 경우 지점빈도해석의 문제점을 보완한 지역빈도해석에 대한 연구가 꾸준히 진행되고 있다. 지역빈도해석을 적용하기 위해서는 수문학적 동질성을 가지는 지역 구분이 무엇보다 중요하다. 군집 분석은 개체들이 지니고 있는 다양한 속성의 유사성을 동질적인 집단으로 군집화하는 방법을 말한다. 군집분석의 기본원리는 분석하고자 하는 여러 특성등을 유사성(similaruty) 거리(distance)로 환산하고 거리가 상대적으로 가까운 개체들을 동질적으로 군집화하는 것이다. 군집분석을 적용하기 위해서는 기상학적 인자와 지형학적 인자를 이용하여 군집분석을 실시한다. 군집분석을 실시할 때 가장 중요한 것은 입력변수의 선택으로 입력 변수의 적절한 선택이 결과값에 큰 영향을 준다. 상호정보량(Mutual Information, MI) 기법은 두 무작위 변수간의 관련성을 측정하는 방법이며 (Cover and Tomas, 2006), 두 변수간의 독립성 구조에 관한 가정이 없고 데이터 변형이나 잡음(noise)에 대한 영향이 적어 다른 기법보다 신뢰도가 높다고 알려져 있다(Peng et al., 2005). 본 연구에서는 상호정보량 기법을 이용하여 군집된 지점들의 종속성과 독립성의 관계를 정량적으로 산정하여 비교하고자 한다.

  • PDF

Johnson 분포를 활용한 강우양상 생성 기법에 관한 연구 (rainfall pattern generation method by johnson distribution)

  • 한건연;안기홍;이진영;류종현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.144-148
    • /
    • 2009
  • 지구온난화로 인한 홍수빈도 및 강우강도의 증가로 홍수피해의 규모는 더욱 증가하고 있다. 그리고 방재대책도 발생한 피해에 대한 복구를 주된 정책으로 하던 소극적 자세에서 벗어나 과학적 공학적 접근을 통해 재해에 대응할 수 있는 기술을 개발하는 적극적 홍수방어 체계를 구축하고 있다. 또한, 설계빈도의 무조건적인 상향조정에 따른 확정론적인 방법에 의존하기 보다는 추계학적 방법을 도입한 수문량 확충 및 매개변수의 불확실성 분석이 필요성이 대두되고 있는 실정이다. 일반적으로 수공구조물의 설계 시에는 설계홍수량을 사용하는데 이는 홍수특성, 홍수발생빈도, 홍수발생 가능성 등을 수공구조물의 규모와 파괴 시 예상되는 피해 정도에 따라 요구되는 안전성을 함께 고려해 수공구조물의 설계기준으로 활용된다. 설계홍수량은 지속시간과 재현기간을 사전에 지정하여 빈도분석을 통해 설계강우량을 산정하고 이를 강우-유출 분석을 함으로써 산정된다. 설계강우량은 빈도분석을 위해 선택된 강우형태에 따른 수문학적 무작위성을 포함하고 있다. 따라서 시간적 변동을 고려한 적절한 강우양상 형태의 선택은 수문학적으로 안전한 수공구조물의 설계 및 평가에 매우 큰 영향을 미친다. 현재의 경우는 강우형태에 대한 선택이 경험에 의해 임의로 이루어지므로, 토목공학자는 여러 가지 발생 가능한 강우형태에 따른 시간적 분포에 대해 고려해야 한다. 본 연구에서는 Huff분위에 따른 무차원 누가 강우곡선을 이용해 강우변동양상 생성을 위한 제약조건을 log-ratio 변환을 이용해 극복하였으며, 결과의 통계 특성치를 Johnson 분포를 통해 표준정규분포로 변환시켰다. 무작위 변수 발생 후 강우양상별 표준정규값의 상관행렬을 이용하여 상관성이 있는 무작위변수로 변환하였다. 얻어진 상관성을 갖는 무작위변수는 log-ratio 역변환을 통해 상관성을 갖는 변수로 재변환해서 무차원화된 강우곡선을 얻을 수 있었다.

  • PDF

컴퓨터 활용능력과 빈도의 종단적 패턴에 따른 학업성취도와 대학전공 선택 분석 (Analysis of Achievement and College Major Choice According to Longitudinal Pattern of Awareness of ICT Literacy and Frequency of Computer Use)

  • 심재권
    • 컴퓨터교육학회논문지
    • /
    • 제23권1호
    • /
    • pp.53-61
    • /
    • 2020
  • 정보사회에서 학습자가 자기주도적으로 학습을 수행하기 위해서 컴퓨터를 활용할 수 있는 능력은 중요하다. 실제로 컴퓨터를 활용할 수 있는 능력이 높은 학습자의 학업성취도가 어떠할지 분석할 필요가 있다. 본 연구는 2010년-2018년에 시행한 서울교육종단연구의 1-9차년도 자료를 활용하여 컴퓨터 활용에 대한 인식과 빈도의 종단적 변화 패턴을 비모수 통계방식인 종단적 K-평균 군집(KML)을 통해 도출하고, 종단적 패턴에 따른 학업성취도를 분석하였다. 분석결과 컴퓨터 활용과 사용 빈도가 높은 종단적 패턴이 그렇지 않은 패턴에 비해 학업성취도가 높은 것으로 분석되었고, 고등학교 3학년의 대학전공 선택에서 컴퓨터 활용과 빈도가 높은 종단적 패턴이 공학계열을 선호하는 것으로 분석되었다.

범주별 고유 정보를 고려한 블로그 포스트의 자동 분류 (Automatic Classification of Blog Posts Considering Category-specific Information)

  • 김수아;오성탁;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.11-14
    • /
    • 2015
  • 많은 블로그 제공 사이트는 블로그 포스트 작성자에게 미리 정의된 범주 (category)에 따라 포스트의 주제에 대하여 범주를 선택할 수 있는 환경을 제공한다. 그러나 블로거들은 작성한 포스트의 범주를 매번 수동으로 선택해야 하는 불편함이 있다. 이러한 불편함의 해결을 위해 블로그 포스트를 자동으로 분류해주는 기능을 제공한다면 블로그의 활용성이 증가할 것이다. 기존의 블로그 문서 분류의 연구는 각 범주의 고유 정보를 반영하는 것에 한계가 있었다. 이러한 문제를 해결하기 위해, 본 논문에서는 범주별 고유 정보를 반영한 어휘 가중치를 제안한다. 어휘 가중치의 분석을 위하여 범주별로 블로그 문서를 수집하고, 수집한 문서에서 어휘의 빈도와 문서의 빈도, 범주별 어휘빈도 등을 고려하여 새로운 지표인 CTF, CDF, IECDF를 개발하였다. 이러한 지표를 기반으로 기존의 Naive Bayes 알고리즘으로 학습하여, 블로그 포스트를 자동으로 분류하였다. 실험에서는 본 논문에서 제안한 가중치 방법인 TF-CTF-CDF-IECDF를 사용한 분류가 가장 높은 성능을 보였다.

  • PDF

쌍생아 임신의 융모막과 주산기 결과 (Perinatal outcomes according To chorionicity in Twin Gestations)

  • 최은진;윤현진;허재원;홍수영
    • Neonatal Medicine
    • /
    • 제15권1호
    • /
    • pp.67-74
    • /
    • 2008
  • 목 적 : 융모막의 종류에 따른 주산기에 미치는 영향과 쌍태아간 수혈 증후군이나 선택적 태아 발육부전이 있는 단일 융모막의 주산기 영향을 평가하였다. 방 법 : 2002년 1월부터 2007년 12월까지 일신기독병원에서 재태 연령 12주에서부터 분만과정까지 산전 진찰을 받고 분만을 한 단일 융모막 산모 99명, 이 융모막 산모 206명, 그리고 이들에게서 태어난 188명의 단일 융모막 쌍생아와 411명의 이 융모막 쌍생아를 대상으로 외래 및 입원 병력 기록지를 후향적으로 조사하였다. 쌍태아간 수혈 증후군과 선택적 태아 발육부전의 빈도 및 융모막 종류에 따른 주산기 영향 및 신생아 이환을 평가하였다. 결 과 : 단일 융모막군은 이 융모막군보다 재태 연령이 작고(35.7 vs 36.6, P=0.03) 태아 사망이 많았다(10% vs 1.5%, P<0.001). 그리고 단일 융모막군의 선택적 발육부전이 이 융모막의 선택적 발육부전보다 태아 사망이 높았다(19% vs 2.5%, P=0.025). 신생아 집중 치료실에 입원한 쌍생아는 단일 융모막 쌍생아가 이 융모막 쌍생아보다(31% vs 16%, P=0.042) 빈도가 높았다. 그리고 단일 융모막 쌍생아가 뇌실 주변 백색 연화증(7% vs 0%; P=0.031), Surfactant를 투여한 신생아호흡곤란 증후군(27% vs 11%; P=0.049)의 빈도가 높았다. 단일 융모막군에서 선택적 자궁 내 발육지연의 빈도는 21%였고 태아 간 수혈 증후군의 빈도는 9%이었다. 일측성 태아 사망은 쌍태아간 수혈 증후군에서는 9명중 6명(67%)이고 선택적 태아 발육부전군에서는 21명중에 4명(19%)으로 단순 단일 융모막군보다 유의하게 높았다(P<0.001). 신생아실에 입원한 빈도는 쌍태아 간 수혈증후군에서 92%, 선택적 태 아발육부전에서 42%로 단순 단일 융모막군의 22%보다 유의하게 높았으며(P=0.001) 입원기간 또한 유의하게 길었다(P=0.033). 그리고 뇌실 주변 백색 연화증 및 뇌실 내 출혈빈도인 경우에도 쌍태아간 수혈 증후군과 선택적 태아 발육부전군이 단순 단일 융모막군보다 유의하게 많았다(각각 P=0.011, P=0.007). 결 론 : 쌍태아 간 수혈 증후군이나 선택적 태아 발육부전이 있는 단일 융모막 쌍생아에서 신생아의 합병증이 높다.

극치값 추정에 적합한 비매개변수적 핵함수 개발 (A Development of Noparamtric Kernel Function Suitable for Extreme Value)

  • 차영일;김순범;문영일
    • 한국수자원학회논문집
    • /
    • 제39권6호
    • /
    • pp.495-502
    • /
    • 2006
  • 비매개변수적 빈도해석을 위해 제시되는 핵밀도함수 방법에서 내삽법은 외삽법보다 더 신뢰적이기 때문에 내삽법과 관련된 광역폭의 선택이 외삽 문제와 연관되는 핵함수의 선택보다 중요하다. 그러나, 재현기간이 자료구간보다 커지거나 또는 $200{\sim}500$년 빈도 발생과 같은 확률 값에 대한 추정을 하는 경우는 자료의 외삽이 중요한 문제이며 따라서 이에 따른 핵함수의 선택도 중요시된다. 핵함수에 따라서는 외삽에 대해 상대적으로 작거나 큰 값이 제시 될 수 있으므로 극치값 추정에는 어려운 점이 있다. 따라서 본 논문에서는 일반적으로 내삽 및 외삽에도 적합한 핵함수로 Modified Cauchy 핵함수를 제시하였다.

친숙한 웹 페이지 정보 항목명 선택을 위한 지표 비교 (The Comparison of Indicators for Selecting Familiar Labels of Information Items in Web Pages)

  • 조인호;김형래
    • 인터넷정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.111-118
    • /
    • 2011
  • 인터넷 웹페이지나 XML 등을 통해 정보를 공유할 때, 친숙한 정보항목 명칭은 사용자 간에 혼동을 최소화한다. 친숙한 단어를 선택하기 위해 언어 전문가의 의견을 구하는 경우 비용과 시간이 소모되지만, 자동화된 지표는 별도의 비용 없이 참고정보를 제공하여 사용자가 친숙한 단어를 선택하도록 돕는다. 본 논문은 사용자가 인터넷에서 쉽게 접할 수 있는 지표를 수집하여, 친숙한 단어를 선택하는데 사용 효과를 비교 조사하였다. 수집된 지표는 단어 길이, 관련 사이트에 사용되는 빈도, 검색 사이트에서 결과 건수이다. 관련 사이트에 사용되는 빈도에 의해 선택된 단어가 여성의 것과 최고 76%, 남성의 것과 최고 71% 매칭 되는 것으로 나타나, 참고 지표로 사용 가능한 것으로 결과가 나타났다.

SDN 환경에서 Apriori 알고리즘을 이용한 사용 빈도에 기반을 둔 컨트롤러 선택 (Selection of controller based on frequency of use using Apriori algorithm in SDN environment)

  • 유승언;김세준;이병준;김경태;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.149-150
    • /
    • 2018
  • 본 논문에서는 연관 규칙 마이닝 알고리즘인 Apriori을 이용하여 컨트롤러를 선택하는 모델을 제안하였다. 제안 모델은 모든 컨트롤러 정보를 수집한 다음 발생 지지도(Transaction support)를 이용하여 컨트롤러의 실행 빈도를 측정한다. 이를 통해 연관된 컨트롤러를 동시에 실행함으로써 효율적인 컨트롤러 선택을 기대한다.

  • PDF

코로나 19 뉴스데이터 분석 및 시각화 (Covid 19 news data analysis)

  • 허태성;황인용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.241-242
    • /
    • 2021
  • 본 논문에서는 2020년 1월부터 2020년 8월까지 8개월간의 유통되었던 코로나 19와 관련된 뉴스 데이터를 이용하여 기간 및 지역별 단어의 빈도수를 구하고, 그 결과를 활용해 코로나 19와의 상관관계를 분석하고, 시각화하였다. 뉴스데이터는 한국언론진흥재단에서 운영하는 뉴스 빅데이터 시스템인 '빅카인즈'에서 수집된 데이터를 이용하였다. 본 논문에서 웹서비스를 활용해 시각화하였으며 지역과 기간을 선택하면 분석한 결과를 불러와 전체 지역대비 선택한 지역의 뉴스 빈도수, 선택한 지역의 주요 키워드, 주요 키워드의 지역별 일자별 변화 등을 보여주고 있다. 이러한 시각화를 통해 이전에 발생되었던 사건에 대해 주요 키워드와 코로나 19의 상관관계를 쉽게 파악을 할 수 있다.

  • PDF

응급실 급성 충수염 환자의 임상경로 개발 (Deveolping clinical pathways of acute appendicitis patients in emergency room)

  • 박철용;김윤년;최현석;신아미
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권3호
    • /
    • pp.427-435
    • /
    • 2010
  • 이 논문에서는 응급실 급성 충수염 환자의 치료와 검사 항목에 대한 임상경로를 개발하였다. 임상경로 개발을 위해 먼저 Park과 Kim (2010)에 의해 제시된 처방 선택 방법을 이용하였으며, 그 다음에 이렇게 선택된 처방들을 연관성이 있는 처방끼리 묶어서 그림으로 표시하였다. 구체적으로 사용된 처방 선택 방법은 향상도에 근거하고 있으며 빈도가 높은 처방부터 출발하여 이것과의 향상도가 0.9에 못 미치는 음의 연관성 처방들을 순차적으로 제거하였다. 이렇게 선택된 처방들에 대해 연관성이 있는 처방들을 묶는 방법도 처방 선택 방법과 비슷하다. 구체적으로 선택된 처방 중 빈도가 높은 처방부터 출발하여 순차적으로 이것과의 향상도가 1.1을 넘는 처방들을 연관성 있는 처방으로 고려하여 해당 처방 오른쪽에 표시하였다. 따라서 임상경로 그림에는 제일 왼쪽에는 연관성이 낮은 처방들을 빈도순으로 위에서 아래로 배치하고, 제일 왼쪽에 있는 각 처방의 오른쪽에는 이것과 연관성이 높은 처방들을 왼쪽에서 오른쪽으로 역시 빈도순으로 배치하는 것을 원칙으로 하였다.