• 제목/요약/키워드: 이용빈도

검색결과 6,593건 처리시간 0.04초

문헌빈도와 장서빈도를 이용한 kNN 분류기의 자질선정에 관한 연구 (A Study on Feature Selection for kNN Classifier using Document Frequency and Collection Frequency)

  • 이용구
    • 한국도서관정보학회지
    • /
    • 제44권1호
    • /
    • pp.27-47
    • /
    • 2013
  • 이 연구에서는 자동 색인을 통해 쉽게 얻을 수 있는 자질의 문헌빈도와 장서빈도를 이용하여 자동분류에서 자질 선정 기법을 kNN 분류기에 적용하였을 때, 어떠한 분류성능을 보이는지 알아보고자 하였다. 실험집단으로 한국일보-20000(HKIB-20000)의 일부를 이용하였다. 실험 결과 첫째, 장서빈도를 이용하여 고빈도 자질을 선정하고 저빈도 자질을 제거한 자질선정 방법이 문헌빈도보다 더 좋은 성능을 가져오는 것으로 나타났다. 둘째, 문헌빈도와 장서빈도 모두 저빈도 자질을 우선으로 선정하는 방법은 좋은 분류성능을 가져오지 못했다. 셋째, 장서빈도와 같은 단순빈도에서 자질 선정 구간을 조정하는 것이 문헌빈도와 장서빈도의 조합보다 더 좋은 성능을 가져오는 것으로 나타났다.

빈도해석에 따른 홍수량 비교 검토

  • 박기범;황성환;권혁현;한주헌
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.1449-1453
    • /
    • 2007
  • 빈도해석에 따른 홍수량 산정에 있어서 일반적으로 강우빈도 해석에 의해 유출해석을 통하여 빈도별 유출량을 산정하여 빈도별 홍수량을 산정하는 것이 일반적인 방법이다. 그러나 기왕의 자료가 충분하다면 유출량 자료를 이용하여 빈도별 유출빈도해석을 통하여 빈도별 홍수량을 산정하는 것이 가장 좋을 것이다. 그러나 현재의 자료는 대부분이 절대적으로 부족하며 특히 미계측 유역의 경우 자료가 전무한 실정으로 유출량자료를 이용한 빈도별 해석은 불가능한 실정이다. 따라서 본 연구에서는 미계측 유역의 강우자료를 수집하여 각 년의 일 최대강우자료를 이용하여 유출해석을 실시하여 유출량을 산정하여 그 자료를 빈도해석한 홍수량과 강우자료를 빈도해석하여 유출량을 산정한 빈도별 홍수량 자료를 비교 검토 하였다.

  • PDF

강우강도식을 이용한 Copula 모형의 이변량 빈도해석 적정성 검토 (Applicability Evaluation of Bivariate Frequency Analysis using Rainfall Intensity Formula)

  • 조은샘;송성욱;유철상
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.420-420
    • /
    • 2015
  • 일반적으로 호우사상의 특성은 강우강도, 지속기간, 총 강우량으로 정량화된다. 주어진 호우 사상에 대한 재현기간은 보통 위 세 개 변량 중 두 개의 변량에 대한 이변량 빈도해석을 통해 결정된다. 따라서 3 가지의 다른 빈도해석이 가능하며, 원칙적으로 이 세 가지 빈도해석 결과는 같아야 한다. 그러나, 문제는 어떤 변량을 선택하느냐에 따라 빈도해석 결과가 달라진다는 점이다. 본 연구에서는 이 문제를 해결하고자 다음과 같은 연구를 수행하였다. 첫 번째로 1961-2010년에 관측된 서울지점 연최대치 호우사상에 대한 이변량 빈도해석을 수행하였다. 이변량 빈도해석은 Frank, Gumbel-Hougaard, Clayton, ali-Mikhail-Haq copula 모형을 이용하여 수행하였으며, 모형의 매개변수는 두 변량의 상관관계를 나타내는 Kendall's tau를 이용하여 추정하였다. 호우사상에 대한 이변량 빈도해석을 수행한 결과, 결과가 일관되지 않고 고려한 두 가지 강우변량에 따라 다르게 나타난 것을 확인하였다. 두 번째로 보편적인 강우강도식을 이용하여 호우사상을 이루는 세변량의 특성을 분석하였다. 본 연구에서 고려한 강우강도식은 Talbot 형, Sherman 형, Japanese 형, Grunsky 형이다. 일반적인 강우강도식에서 지속기간과 강우강도의 관계는 I~t^a와 같이 나타나며, 이 때 a의 범위는 -0.5부터 -1까지 값으로 정해진다. 마지막으로, 호우사상을 이루는 세 변량의 상관관계를 이용하여 가장 적절한 이변량 빈도해석결과를 도출하는 강우 변량의 조합을 결정하였다. 결론적으로, 본 연구에서는 지속기간과 강우강도를 copula 모형을 이용한 이변량 빈도 해석의 가장 적절한 것으로 판단되었다.

  • PDF

빈도해석과 지역 스케일 모델을 이용한 확률강우량 추정에 대한 연구 (A Study on Estimation of Quantile using Regional Scaling Model and Frequency Analysis)

  • 정영훈;김성훈;김한빈;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.301-301
    • /
    • 2016
  • 국내의 경우 수공구조물을 설계하기 위해서는 빈도해석을 통해 설계수문량을 산정한다. 일반적으로 실무에서는 지점빈도해석을 수행하게 되는데 설계빈도보다 대부분 짧은 기간의 자료를 이용하여 산정한다. 지역빈도해석은 이러한 자료기간이 가지는 문제점을 극복하기 위하여 확률수문량의 정확도와 신뢰도를 향상시키는 기법이다. 스케일 모델은 지속기간별로 관측된 강우자료를 이용하여 재현기간에 대한 지속기간의 함수로 표현이 가능하며, 이를 통해 강우의 IDF곡선을 제시할 수 있는 수학적 모델이다. 대상지역의 강우관측소에서 관측된 강우자료가 일단위이면, 기준지속기간이 24시간이 되며, 기준지속기간에 대한 확률강우량으로부터 임의의 지속기간에 대한 확률강우량을 스케일 모델을 이용하여 추정할 수 있다. 따라서 짧은 자료를 보유한 지역이거나 미계측 지역에 대한 확률강우량을 추정을 위해 지역빈도해석과 지역 스케일 모델을 이용하여 확률강우량을 추정하여 지점빈도해석과 비교하고자 한다. 본 연구를 위해 한강유역의 강우 관측소를 이용하였으며, 군집분석 중 k-means방법을 적용하여 수문학적 동질성을 확보한 후 지역을 구분하였다. 구분된 지역은 지점 및 지역빈도해석을 수행한 후 상대평균제곱근오차(relative root mean square error, RRMSE)를 비교하여 정확도를 판단하였고, 정확도가 높은 빈도해석에 지역 스케일 모델을 적용하여 미계측 지점에 대한 임의의 시간에 대한 확률강우량을 추정하고자 한다.

  • PDF

인공신경망 군집분석을 이용한 지역빈도해석에 관한 연구 - 한강유역을 중심으로 (Regional Frequency Analysis using the Artificial Neural Network Method - the Han River Basin)

  • 안현준;김성훈;신홍준;허준행
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2016년도 학술발표회
    • /
    • pp.300-300
    • /
    • 2016
  • 지점빈도해석은 해당 지점에서 기록된 수문자료를 바탕으로 확률론적 방법을 이용하여 해당 지역의 수문학적 현상을 해석하는 방법이다. 최근 이상 기후현상을 통해 극치 사상이 발생하고 있다. 이러한 극치 사상은 지점빈도해석을 이용하여 확률수문량을 추정하는데 많은 영향을 미친다. 특히 해당 지점의 표본 크기가 작을수록 이러한 영향은 좀 더 크게 반영 될 수 있다. 반면 지역빈도해석은 지점의 표본 수가 적거나 수문자료의 수집이 불가능한 미계측지점인 경우, 해당 지점과 수문학적으로 동질하다고 여겨지는 주변 지점들의 자료를 확보하여 확률수문량을 추정함으로써 상대적으로 지점빈도해석 보다 roubst한 추정값을 얻을 수 있다. 따라서 최근 확률수문량 산정 기법으로 지역빈도해석 방법에 관한 관심이 높아지고 있는 실정이다. 지역구분은 지역빈도해석이 지점빈도해석과 구분 될 수 있는 큰 특징이고 지역구분 결과 따라 지역의 표본 크기가 결정되기 때문에 수문학적으로 동질한 지역을 나누는 방법은 매우 중요하다고 볼 수 있다. 본 연구에서는 한강유역을 대상으로 인공신경망을 이용한 군집분석을 수행하고 구분된 지역을 이용하여 지역빈도 해석을 수행하였다.

  • PDF

강우자료의 증가경향을 고려한 지점 및 지역강우빈도해석 (Point/Regional Rainfall Frequency Analysis Considering Increasing Trend in Observations)

  • 서린;이창환;김태웅
    • 한국방재학회:학술대회논문집
    • /
    • 한국방재학회 2010년도 정기 학술발표대회
    • /
    • pp.53.1-53.1
    • /
    • 2010
  • 수공구조물 설계 시 수문 설계빈도의 결정은 추정한계치방법과 주요 수공구조물의 설계빈도 표를 활용하여 결정되어지고 있다. 외국의 경우 수문 설계빈도가 결정되면 설계빈도와 자료의 수를 고려하여 지점빈도해석과 지역빈도해석을 수행한다. 하지만 국내의 주요 수공구조물의 설계수문량은 지점빈도해석만을 이용하여 산정하고 있는 실정이다. 국내의 수문자료의 관측기관이 짧다는 것을 고려하면, 지점빈도해석만을 이용하여 설계수문량을 결정하는 것은 효율적이고 안정적인 설계수문량을 산정하기에는 불충분하다 할 수 있다. 따라서 본 연구에서는 자료보유기간과 설계빈도를 고려하여 지점 및 지역빈도해석을 실시하고 지구의 온난화로 인한 강우 및 홍수량의 증가추세를 반영할 수 있는 비정상성 빈도해석법을 지점 및 지역빈도해석에 적용하였으며, 이를 수행하기 위한 실무프로그램을 개발, 제안하였다.

  • PDF

링크 빈도와 클릭 빈도를 이용하는 메타 검색엔진의 설계 (A Design of Meta Search Engine that Uses Link and Click Frequencies)

  • 유태명;김준태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.292-294
    • /
    • 2000
  • 대부분의 검색엔진들이 사용하는 내용 기반 검색 방법은 웹 페이지에 있는 단어의 빈도만을 이용하여 순위를 결정함으로써 비슷한 단어 빈도를 가지고 있는 방대한 양의 검색 결과로부터 참조할만한 가치가 있는 중요한 페이지를 찾아내기가 매우 어렵다. 중요한 페이지를 구분해 내는 한가지 방법은 얼마나 많은 웹 페이지들이 참조하고 있는가 또한 얼마나 많은 사용자들이 그 웹 페이지에 접속하는가를 보는 것이다. 본 논문에서는 링크 빈도와 클릭 빈도를 이용하여 웹 페이지의 중요도를 계산하는 메타 검색엔진의 프로토타입을 구현하였다. 링크 빈도는 검색엔진에 해당 웹 페이지의 URL을 질의로 던져 구하고 클릭 빈도는 servlet을 이용하여 사용자의 클릭 행위를 감시하여 얻어내도록 하였다. 메타 검색엔진은 이 두 값의 가중치 합으로 각 페이지의 중요도를 계산하고 중요도 순으로 검색 결과를 재배열하여 사용자에게 보여 준다.

  • PDF

가뭄빈도해석 프로그램 개발 (Development of drought frequency analysis program)

  • 이정주;강신욱;전근일;김현식
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2020년도 학술발표회
    • /
    • pp.14-14
    • /
    • 2020
  • 일반적으로 수문빈도해석은 치수계획 수립에 이용되는 설계강수량, 계획홍수량 등을 산정하기 위해 연최대치계열 또는 연초과치계열 자료를 이용한 극치빈도해석을 수행하고, 확률분포의 우측꼬리(right tail) 부분을 이용하여 확장된 재현기간에 해당하는 확률수문량을 추정한다. 하지만 가뭄 관련 분석에서는 확률분포의 좌측꼬리(left tail) 부분은 이용해 확장된 재현기간별 확률수문량을 추정해야할 경우가 발생한다. 또한 물관리 실무에서 장 단기 운영계획 수립을 위해 이용하는 갈수빈도 유입량 산정 등에서도 평년보다 작은 수문량에 대한 빈도해석이 필요한 경우가 있다. 국가 가뭄정보분석센터에서는 기존에 K-water연구원에서 개발한 빈도해석 프로그램인 K-FAT의 분석모듈을 이용해 극소치계열 또는 갈수빈도 유입량 분석에 특화된 가뭄빈도해석 프로그램을 개발하였다. 본 프로그램은 GEV, Gumbel, Weibull 등 14개의 확률분포형을 포함하며, 모멘트법, 최우도법 및 L-모멘트법을 사용하여 매개변수를 추정한다. 적합도 검정의 경우 χ2, K-S, CVM, PPCC 및 수정 Anderson-Darling test를 이용하여 다각적인 검정을 할 수 있도록 하였다. 분석을 위한 입력 자료의 경우 사용자가 전처리를 통해 준비한 연최소치계열 등 연도별 시계열자료를 이용할 수 있으며, 일단위 및 월단위의 강수량 또는 댐 유입량 자료를 이용해 사용자가 원하는 기간의 누적강수량, 평균 유입량으로 변환할 수 있는 자료변환 기능을 추가하여 실무 활용성을 높였다. 또한 최적 확률분포 선정을 위해 참고할 수 있도록 AIC(Akaike information criteria)와 BIC(Bayesian information criteria) 분석이 포함되어 있으며, Bootstrap 기법 등을 이용한 불확실성 산정을 통해 추정 값의 신뢰구간을 표시하도록 하였다. 개발된 프로그램은 베타버전 시험배포를 거쳐 가뭄정보포털을 통해 배포할 예정이다.

  • PDF

특허 문헌 검색에서 복합명사 가중치 부여 방법 (Weighting Methods for Compound Nouns in Patent Retrieval System)

  • 손기준;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.895-897
    • /
    • 2004
  • 문서 검색 시스템에서 특정 주지에 관한 문서를 검색하기 위한 색인어의 가중치 부여 방법으로 단순빈도와 역문헌빈도에 의한 가중치 부여 방법을 주로 이용한다 하지만 빈도 정보만을 이용한 방법은 성능 및 정확도의 향상에 한계가 있다. 이에 본 논문에서는 특허 문헌 검색 시스템의 검색 효율을 높이기 위해 자주 출현하는 복합명사의 재출현 양상과 복합명사의 역할변화에 따른 가중치 부여 방법을 제안한다 본 연구에서 제안한 가중치 부여 방법을 이용하여 실험한 결과 단순빈도와 역문헌빈도 정보를 이용한 방법보다 더 나은 성능을 보였다 .

  • PDF

인터넷 플로우와 인터넷 쇼핑의 추구 편익 및 지각 위험이 구매행위에 미치는 영향 (A Study on the Impact of Internet Flow, Internet-Shopping Benefits Sought and Perceived Risk on the Purchase Behavior)

  • 김종훈;류진화
    • 한국유통학회:학술대회논문집
    • /
    • 한국유통학회 2006년도 동계학술대회 발표논문집
    • /
    • pp.253-282
    • /
    • 2006
  • 본 연구는 인터넷 플로우와 인터넷 쇼핑에 대한 추구편익 및 지각된 위험이 인터넷 구매행위에 어떤 영향을 미치는지 규명하고 있다. 실증분석 결과 이들 세 선행변수는 현재의 인터넷 쇼핑 이용빈도와 향후 이용의도에 영향을 미치는 것으로 나타났다. 첫째, 인터넷 플로우는 현재의 인터넷 쇼핑 이용빈도에 긍정적인 영향을 미치고, 향후 이용의도에도 긍정적인 영향을 미치는 것으로 나타났다. 둘째, 인터넷 쇼핑에 대한 추구편익도 현재의 인터넷 쇼핑 이용빈도에 긍정적인 영향을 미치고, 향후 이용의도에도 긍정적인 영향을 미치는 것으로 나타났다. 셋째, 인터넷 쇼핑에 대한 지각된 위험은 현재의 이용빈도에 영향 미치는 것으로 나타나지 않았지만 향후 이용의도에는 부정적인 영향을 주는 것으로 나타났다. 이들 결과와 더불어 인터넷 쇼핑에 대한 현재의 이용빈도가 많을수록 향후 이용의도에도 긍정적인 영향을 미치는 것으로 나타났다.

  • PDF