Search | Korea Science

A Study on Fitness Function of Clustering Algorithm based on Genetic Algorithm (유전자 알고리즘을 이용한 군집화 기법의 적합도 함수에 관한 연구)

이수정;권혜련;김은주;이일병
- Proceedings of the Korean Information Science Society Conference
- /
- 2001.04b
- /
- pp.310-312
- /
- 2001
최근 관심의 대상이 되고 있는 CRM, eCRM에는 데이터 마이닝 기법이 핵심 기술로 이용되고 있다. 이러한 데이터 마이닝 기법가운데 가장 널리 사용되고 있는 군집화는, 데이터 집합을 유사한 데이터의 군집들로 분할하여 데이터 속에 존재하는 의미 있는 정보를 얻는 것이다. 그런데 기존의 군집화 알고리즘은 사전에 군집의 개수를 미리 결정해줘야 하고 잡음에 민감하여 지역적 최적해(local minima)에 수렴할 수 있다는 문제점을 가지고 있다. 이러한 문제점의 개선을 위해, 본 논문에서는 유사도 개념을 적합도 함수로 사용하는 유전자 알고리즘을 적용한 군집화 기법을 제안하다. 특히 적합도 하수에 사용된 군집의 대표값 개념은 요약 정보만을 이용하여 계산속도가 향상되기 때문에 대용량 데이터를 다루는 마이닝에 적합할 것을 기대된다.
PDF

Using Various Order Probability Weighted Moments for the Parameter Estimation of Appropriate Distribution Functions (여러 차수의 확률 가중 모멘트를 이용한 적정 분포함수의 매개변수 추정)

Lee, Kil Seong;Kim, Ji Young
- Proceedings of the Korea Water Resources Association Conference
- /
- 2004.05b
- /
- pp.635-639
- /
- 2004
댐과 같은 구조물의 설계시 큰 강우량에 내한 분포함수의 적합성을 놀일 필요가 있다. 이에 대해 Wang (1997a and b)은 큰 설계량에 내한 적합성을 놀이기 위해 LH 모멘트와 고차 PWM(higher Probability Weighted Moments)방법을 제안하였다. 따라서 본 연구에서는 우리나라의 자 지역별로 대표적인 4개 지점의 일 강우량 자료를 사용하여 제안된 고차 PWM 방법의 적용성을 살펴보았다. 그 과정으로 가장 낮은 차수인 일반적인 PWM 방법과 더 높은 차수의 PWM 방법을 이용하여, GEV(Generalized Extreme Value) 분포와 Gumbel 분포에 대한 매개변수를 추정한 후 이 추정치를 확률지에 실측치와 함께 도시하여 결과를 비교하였다. 그리고 PPCC(Probability Plot Correlation Coefficient) 적합도 검정결과를 통해 추정된 매개변수의 적합성을 확인하였다.
PDF

Testing of a discontinuity point in the log-variance function based on likelihood (가능도함수를 이용한 로그분산함수의 불연속점 검정)

Huh, Jib
- Journal of the Korean Data and Information Science Society
- /
- v.20 no.1
- /
- pp.1-9
- /
- 2009
Let us consider that the variance function in regression model has a discontinuity/change point at unknown location. Yu and Jones (2004) proposed the local polynomial fit to estimate the log-variance function which break the positivity of the variance. Using the local polynomial fit, Huh (2008) estimate the discontinuity point of the log-variance function. We propose a test for the existence of a discontinuity point in the log-variance function with the estimated jump size in Huh (2008). The proposed method is based on the asymptotic distribution of the estimated jump size. Numerical works demonstrate the performance of the method.
PDF

A study of Land Suitability Analysis using Algorithms of Artificial Neural Network (인공신경망의 알고리즘에 의한 토지적합성분석에 관한 연구)

Yang, Ok-Jin;Jeong, Yeong-Dong
- 한국지형공간정보학회:학술대회논문집
- /
- 2001.04a
- /
- pp.1-15
- /
- 2001
본 연구는 도시토지이용의 적합성분석을 실시하는 데 있어 GSIS와 인공신경망의 유기적인 결합을 시도해 보았다. 인공신경망은 학습이라는 과정을 통해 신경망 노드(node)간의 연결강도를 합리적으로 결정할 수 있는 이점이 있다. 이러한 점에서 공간분석에서 요구되는 인자간의 경중률과 신경망의 연결강도는 대체가 가능하리라 판단된다. 본 연구를 수행하기 위해 두 종류의 신경망을 구성하였다. 1차 신경망은 토지이용별 적합성 분석에 적용했으며, 2차 신경망은 최적의 토지이용패턴을 분석하기 위해 구성하였다. 이들 신경망은 C++로 작성된 프로그램에 의해 구현된 최급강하법에 의한 역전파 알고리즘에 의해 학습을 실시하였으며, 활성화 함수는 시그모이드 함수를 사용하였다. 분석결과는 현행 용도지역제에서 주거, 상업, 공업, 녹지에 대한 토지이용 적합도면과 4가지 유형의 토지이용에 대한 대상지역의 최적토지이용패턴을 제시한 도면으로서 Arc/Info의 Grid 형식으로 작성하였다. 또한 토지이용별 적합도면상에 나타난 적합지역과 최적토지이용패턴은 위치적인 면과 공간 구성에 있어 실제의 도시토지이용계획의 이론적인 개념에 매우 합치되는 분포형태를 보였다.
PDF

Optimal Solutions for Various Error Functions (패턴인식을 위한 오차함수의 최적해)

Oh, Sang-Hoon
- Proceedings of the Korea Contents Association Conference
- /
- 2011.05a
- /
- pp.9-10
- /
- 2011
패턴인식 문제의 학습을 위하여 여러 형태의 오차 함수들이 제안되었다. 이 논문에서는 이들 오차함수들에 대하여 그 특징을 통계학적으로 분석하여 비교하였다. 이 분석결과는 패턴인식기의 학습에 있어서 적합한 오차함수를 선정하는 이론적 토대를 마련해준다.
PDF

A Study on the Development of the Stochastic Continuous Storage Function Model (추계학적 연속형 저류함수 모형 개발에 관한 연구)

Lee, Byong-Ju;Bae, Deg-Hyo
- Proceedings of the Korea Water Resources Association Conference
- /
- 2009.05a
- /
- pp.231-235
- /
- 2009
본 연구에서는 홍수예보를 위한 사상형 모형인 저류함수모형 적용시 문제점을 개선하기 위해 기존의 저류함수 모형에 자유수와 장력수의 2개 영역으로 구성된 토양수분모의 컴포넌트를 결합하여 지표유출, 중간유출, 기저유출의 유출수문성분에 대한 연속적인 모의가 가능하도록 하였으며 실시간 홍수예측을 위해 다수의 유량 관측지점과의 실시간 오차 보정이 가능하도록 앙상블 칼만 필터링 기법을 도입하였다. 개발된 모형의 적용성을 평가하기 위해 낙동강 권역을 대상유역으로 선정하였으며 시단위 강우자료, 기상자료, 유량자료를 비롯하여 GIS를 기반의 지형자료를 구축하였다. 연속형 저류함수형의 매개변수 추정결과 주요지점의 관측유량에 대해 높은 적합도를 보였으며 1시간 선행시간의 홍수량 예측결과에서도 높은 정확도를 보이는 것으로 나타났다.
PDF

A Development of Noparamtric Kernel Function Suitable for Extreme Value (극치값 추정에 적합한 비매개변수적 핵함수 개발)

Cha Young-Il;Kim Soon-Bum;Moon Young-Il
- Journal of Korea Water Resources Association
- /
- v.39 no.6 s.167
- /
- pp.495-502
- /
- 2006
The importance of the bandwidth selection has been more emphasized than the kernel function selection for nonparametric frequency analysis since the interpolation is more reliable than the extrapolation method. However, when the extrapolation method is being applied(i.e. recurrence interval more than the length of data or extreme probabilities such as $200{\sim}500$ years), the selection of the kernel function is as important as the selection of the bandwidth. So far, the existing kernel functions have difficulties for extreme value estimations because the values extrapolated by kernel functions are either too small or too big. This paper suggests a Modified Cauchy kernel function that is suitable for both interpolation and extrapolation as an improvement.
https://doi.org/10.3741/JKWRA.2006.39.6.495 인용 PDF KSCI

A relevance-based pairwise chromagram similarity for improving cover song retrieval accuracy (커버곡 검색 정확도 향상을 위한 적합도 기반 크로마그램 쌍별 유사도)

Jin Soo Seo
- The Journal of the Acoustical Society of Korea
- /
- v.43 no.2
- /
- pp.200-206
- /
- 2024
Computing music similarity is an indispensable component in developing music search service. This paper proposes a relevance weight of each chromagram vector for cover song identification in computing a music similarity function in order to boost identification accuracy. We derive a music similarity function using the relevance weight based on the probabilistic relevance model, where higher relevance weights are assigned to less frequently-occurring discriminant chromagram vectors while lower weights to more frequently-occurring ones. Experimental results performed on two cover music datasets show that the proposed music similarity improves the cover song identification performance.
https://doi.org/10.7776/ASK.2024.43.2.200 인용 PDF

Estimating suitabilities for fish habitat using CASiMiR-Fish simulation (CASiMiR-Fish를 이용한 어류서식지 적합성 검토)

Lee, Jin-Young;Kim, Jeong-Kon;Hur, Jun-Wook
- Proceedings of the Korea Water Resources Association Conference
- /
- 2011.05a
- /
- pp.184-184
- /
- 2011
하천과 같은 생태계와 생물 서식지 들은 생물학적 요소와 무생물학적 요소간의 다양한 상호작용을 포함하는 복잡한 관계를 맺고 있다. CASiMiR 모델은 선정된 특정종의 서식지 적합도를 결정하기 위해 하천시스템의 수리학적 및 지형학적 특성을 사용하는 모듈형식의 조합으로 모의를 실시하는 프로그램으로 입력되는 자료로는 수심, 유량 등의 수리학적 자료와 하저구성물의 크기 토지피복의 종류 등의 지형학적 자료 등이 필요하다. 또한 어류의 서식지 적합도 지수를 제공하기 위해 선호도 함수를 사용하거나 Fuzzy 모형을 사용한다. 본 연구에서는 이러한 CASiMiR-Fish 모형을 이용해 피라미 종의 Fuzzy 함수로 수통 수위표 지점 상하류 3km 구간에 대한 어류 서식지 모의를 실시하였다.
PDF

Implement of Relevance Feedback in "MIRINE" Information Retrieval System ("미리내" 정보검색 시스템에서 Relevance Feedback 구현)

Park, Su-Hyun;Park, Se-Jin;Kwon, Hyuk-Chul
- Annual Conference on Human and Language Technology
- /
- 1997.10a
- /
- pp.65-71
- /
- 1997
이 논문은 부산대학교 전자계산학과 인공지능 연구실에서 개발한 정보검색 시스템 "미리내"의 적합성 피드백 방법을 분석하고, 그 방법들의 검색 효율을 비교 분석하였다. "미리내"에서 질의문은 자연언어 질의문을 사용하고 재검색을 위한 적합성 피드백은 원질의문에서 검색된 문서 중 이용자가 직접 선택한 적합 문서에서 추출한다. 적합성 피드백은 크게 단어 확장(Term Expansion)을 위한 단어 선택 방법과 추가될 단어에 가중치를 부여하는 단어 가중치 부여(Term Weighting)의 2가지 요소로 이루어진다. 단어 선택을 위해서는 적합 문서에 나타난 단어 빈도합(tf), 역문헌빈도(idf), 적합 문서 중에서 해당 단어가 있는 적합 문서의 비율(r/R) 등의 정보를 이용한다. 단어 가중치 부여 방법으로는 정규화 또는 코사인 함수를 이용하여 부여하였다. 단어확장에는 tfidf가 tfidf(r/R)보다 정확도 면에서 나은 향상율을 보였으나, 30위 내 검색된 적합문서의 수를 비교해 보았을 때 tfidf(r/R)의 정확도가 높았다. 단어 선택 방법에서 계산된 값을 정규화하여 가중치를 부여하였을 때 보다 코사인 함수를 이용하여 가중치를 부여하였을 때 정확도가 높았다. 실험은 KT-Set 2.0 (4391 건), 동아일보 96 년 신문기사(70459 건)를 대상으로 수행하였다.
PDF

Search Result 1,419, Processing Time 0.045 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)