• 제목/요약/키워드: statistical inferences

검색결과 123건 처리시간 0.017초

Hierarchical Clustering Approach of Multisensor Data Fusion: Application of SAR and SPOT-7 Data on Korean Peninsula

  • Lee, Sang-Hoon;Hong, Hyun-Gi
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2002년도 Proceedings of International Symposium on Remote Sensing
    • /
    • pp.65-65
    • /
    • 2002
  • In remote sensing, images are acquired over the same area by sensors of different spectral ranges (from the visible to the microwave) and/or with different number, position, and width of spectral bands. These images are generally partially redundant, as they represent the same scene, and partially complementary. For many applications of image classification, the information provided by a single sensor is often incomplete or imprecise resulting in misclassification. Fusion with redundant data can draw more consistent inferences for the interpretation of the scene, and can then improve classification accuracy. The common approach to the classification of multisensor data as a data fusion scheme at pixel level is to concatenate the data into one vector as if they were measurements from a single sensor. The multiband data acquired by a single multispectral sensor or by two or more different sensors are not completely independent, and a certain degree of informative overlap may exist between the observation spaces of the different bands. This dependence may make the data less informative and should be properly modeled in the analysis so that its effect can be eliminated. For modeling and eliminating the effect of such dependence, this study employs a strategy using self and conditional information variation measures. The self information variation reflects the self certainty of the individual bands, while the conditional information variation reflects the degree of dependence of the different bands. One data set might be very less reliable than others in the analysis and even exacerbate the classification results. The unreliable data set should be excluded in the analysis. To account for this, the self information variation is utilized to measure the degrees of reliability. The team of positively dependent bands can gather more information jointly than the team of independent ones. But, when bands are negatively dependent, the combined analysis of these bands may give worse information. Using the conditional information variation measure, the multiband data are split into two or more subsets according the dependence between the bands. Each subsets are classified separately, and a data fusion scheme at decision level is applied to integrate the individual classification results. In this study. a two-level algorithm using hierarchical clustering procedure is used for unsupervised image classification. Hierarchical clustering algorithm is based on similarity measures between all pairs of candidates being considered for merging. In the first level, the image is partitioned as any number of regions which are sets of spatially contiguous pixels so that no union of adjacent regions is statistically uniform. The regions resulted from the low level are clustered into a parsimonious number of groups according to their statistical characteristics. The algorithm has been applied to satellite multispectral data and airbone SAR data.

  • PDF

한국자료분석학회지에 대한 토픽분석 (A Topic Analysis of Abstracts in Journal of Korean Data Analysis Society)

  • 강창완;김규곤;최승배
    • Journal of the Korean Data Analysis Society
    • /
    • 제20권6호
    • /
    • pp.2907-2915
    • /
    • 2018
  • 1998년에 창립한 한국자료분석 학회지는 자료분석에 기반한 다양한 전공분야를 위해 현재까지 응용학회지로서 역할을 해오고 있다. 본 연구에서는 이러한 한국자료분석 학회지의 본연의 목적을 잘 수행해오고 있는지 최근 10년간 학회지 요약문을 통해 분석하였다. 분석은 한국연구재단에서 제공한 온라인 저널 홈페이지를 통해 2006년부터 2016년까지의 영문 요약문 2680개를 웹크롤링하여 토픽모델을 적용하였다. 분석결과로 18개의 토픽이 선정되었으며 이에 대한 토픽을 해석한 결과 자료분석학회지는 간호학, 경영학(마케팅), 경제학 등 여러 분야를 다루고 있으며 분석방법으로 회귀분석, 가설검정, 데이터마이닝(연관성분석), 요인분석 등이 많이 이용되고 있음을 볼 수 있었다. 그리고 단어들의 연관성(association rule)분석을 통하여 통계적으로 유의한 연관성 규칙 10개를 제시하였다. 여기서 연관성규칙의 통계적 유의성검정은 피셔의 정확검정(Fisher's exact test)을 사용하였다. 또한 연구주제(토픽)의 변화를 살펴본 결과 전반기에는 조사연구가, 후반기에는 대조 연구가 많아졌음을 볼 수 있고 또한 회귀분석과 요인분석은 전, 후반기 구분 없이 자료분석에서 공통적으로 많이 사용하는 통계적 방법임을 알 수 있었다.

밀도지수와 어획량으로서 수산자원의 가입량을 근사적으로 추정하는 방법 (APPROXIMATE ESTIMATION OF RECRUITMENT IN FISH POPULATION UTILIZING STOCK DENSITY AND CATCH)

  • 김기주
    • 한국수산과학회지
    • /
    • 제8권2호
    • /
    • pp.47-60
    • /
    • 1975
  • 자원해석은 일반적으로 시계열적 견지에 입각하고 있으나, 본 연구에서는 단면적인 견지에서, 2년간의 자원변동을 극수적인 관계에서 파악하여 자원해석을 하였으며, 이것으로 각년의 가입량을 추정하는 방법 시도하였다. 이를 요약하면 다음과 같다. 1. 단일 population에 있어서 t 시기(년 또는 어기)와 t+1 시기와의 초기자원량(미수)의 관계는 $N_{0,\;t+1}=N_{0,\;t}(1-m_t)-C_t+R_{t+1}$ 단, $N_0$ : 초기자원량 (미수), C : 어획미수, R : 가입미수, m : 자연사망률 이다. 위의 식에서 다음의 관계가 성립된다. $\phi_{t+1}=\frac{(1-\varrho^{-z}{t+1})Z_t}{(1-\varrho^{-z}t)Z_{t+1}}-\frac{1-\varrho^{-z}t+1}{Z_{t+1}}\phi_t-a'\frac{1-\varrho^{-z}t+1}{Z_{t+1}}C_t+a'\frac{1-\varrho^{-z}t+1}{Z_{t+1}}R_{t+1}$ 단, $\phi$ : 밀도지수, M : 자연사망계수, Z : 감소계수, a' : 평균자원량에 대한 밀도지수 이 식에서 $\phi$$C_t$를 독립변수, $\phi_{t+1}$를 종속변수라해서 중회귀분석하여 $\phi_t$$C_t$ 의 각 계수를 구하고, 이 각 계수로서 저연사망계수 M, 단위노력당 어획계수 a'을 구하여 t+1연의 가입량추정치 $\hat{R}_{t+1}$를 구할 수 있다. 중회귀분석하는 데 있어서는 $R_{t+1}$이 거의, 같으며 $X_{t+1}$에 심한 차이가 없는 시기를 선정하여 취급할 수 있다. 2. 각 시기의 추정된 가입량은 가입량의 상대치로서 인정하는 것이 안전하다. 3. 밀도지수 대신으로 자원량지수를 사용하여도 같은 추정방법으로 가입량이 추정된다. 단, 어장면적을 고려해야 한다. 4. 변동관계를 미수로서 취급할 때는 이론적으로 가입량의 절대치를 구할 수 있으나, 중량으로 취급할 때는 이론적으로 가입량의 상대치를 구하게 된다. 그러나 어느 경우나 같은 추정방법이 적용된다. 5. 인도양의 bigeye tuna에 대하여 수전(1970)의 자료를 이용하여 본 추정방법에 적용시켜 보았다. 수전(1970)가 구한 M,q(단위노력당 어획계수)로서 계산된 각년의 가입량의 변화와 본연구에서 구한 각년의 가입량의 변화와는 극히 비례적이었다(Table 2, Fig.2). 6. 한국동안의 꽁치에 있어서 해황어황 주간예보 ($1964.3\~1974.8$ : 국립수산진흥원 포항지원)의 자료를 이용하여 어느 해의 춘하기의 밀도지수와 그해의 추동기의 밀도지수와의 관계에서 각년의 추기의 가입량을 추정하고 어느 해의 추동기의 밀도지수와 다음해의 춘하기의 밀도지수와의 관계에서 각년의 춘하기의 가입량을 추정하였다(Table4, Fig.5, Fig.7). 그 결과, 년금의 폭이 좁은 이 꽁치 군단에 있어서 각년의 밀도지수와 가입량이 상당히 비례적이었다.

  • PDF