• 제목/요약/키워드: 상관계수 탐색통계량

검색결과 16건 처리시간 0.024초

Hash 함수를 이용한 디지털 영상의 내용기반 인증방법

  • 임현;박순영;조완현
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 춘계 학술발표회 논문집
    • /
    • pp.119-125
    • /
    • 2002
  • 우리는 본 논문에서 디지털 영상에 대하여 Hash함수를 이용한 내용기반의 안전한 워터마킹 인증기술을 제시하려고 한다. 허가되지 않는 이미지의 내용변경을 막기 위해 안전한 워터마킹 시스템을 개발하기 위하여 비밀키를 가지고 있는 Hash 함수가 사용되었고, 각 블록의 워터마크신호는 Hash함수의 출력결과를 Seed로 사용하여 의사난수를 발생시킨 값에 따라 생성되어진다. 이미지 기술벡터들은 블록기반 에지 이미지로부터 측정되는데 이 값들은 해롭지 않는 조작 등에 대해서는 쉽게 변화하지 않지만 고의적인 내용변경 등의 조작에 대해서는 이들 값들이 바꾸어지는 성질을 갖고 있다. 워터마크신호의 삽입은 블록기반 스펙트럼 방법에 기초를 두고 있으며 워터마크신호의 크기는 인지성과 강인성이 조화를 이루도록 AC 부 밴드의 지그재그 스캔라인의 DCT 계수들의 지역적인 통계량에 따라 조정되어진다. 또한 저작권인증의 확인을 위한 경계 값의 선택은 통계학적으로 분석되어진다. 수치적인 실험의 결과는 제안된 기술이 강력한 저작권인증의 수행을 위해서 매우 효율적인 것을 보여주고 있다.

  • PDF

회귀나무에서 변수선택 편의에 관한 연구

  • 김민호;김진흠
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.263-268
    • /
    • 2003
  • Breiman, Friedman, Olshen and Stone(1984)의 전체탐색법에 의한 회귀나무는 상대적으로 많은 분리가 가능한 변수로 분리기준이 정해지는 편의 현상을 갖고 있다. 본 연구에서는 이런 문제점을 해결할 수 있는 알고리즘을 제안하여 변수선택편의가 없는 회귀나무를 만들고자 한다. 제안하는 알고리즘은 노드의 분리변수를 선택하는 단계와 그 선택된 변수에 의해 이진분리를 위한 분리점을 찾는 단계로 구성되어 있다. 예측변수 중에서 목표변수와 가장 밀접하게 연관된 예측변수는 예측변수의 자료의 종류에 따라 스피어만의 순위상관계수에 의한 검정 혹은 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 가장 통계적으로 유의한 변수로 선택하였고, 선택된 변수에만 Breiman et al.(1984)의 전체선택법을 적용하여 분리점을 결정하였다. 모의실험을 통해 변수선택편의, 변수선택력 , 그리고 평균제곱오차 측면에서 Breiman et al. (1984)의 CART(Classification and Regression Trees)와 제안한 알고리즘을 서로 비교하였다. 또한, 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

  • PDF

변수선택 편향이 없는 회귀나무를 만들기 위한 알고리즘 (Regression Trees with. Unbiased Variable Selection)

  • 김진흠;김민호
    • 응용통계연구
    • /
    • 제17권3호
    • /
    • pp.459-473
    • /
    • 2004
  • 본 논문에서는 Breiman 등(1984)의 전체탐색법이 갖고 있는 변수선택 편향을 극복할 수 있는 알고리즘을 제안하였다. 제안한 알고리즘은 노드의 분리 변수를 선택하는 단계와 그 선택된 변수에 대해서만 이진분리를 위한 분리점을 찾는 단계로 나뉘어져 있다. 예측변수가 연속형 일 때는 스피어만의 순위상관계수에 의한 검정을 수행하고, 범주형일 때는 크루스칼-왈리스의 통계량에 의한 검정을 수행하여 통계적으로 가장 유의한 변수를 분리변수로 선택하였고 Breiman 등(1984)의 전체탐색법을 그 변수에만 적용하여 노드의 분리기준을 정하였다 모의실험 연구를 통해 Breiman등(19히)의 CART와 제안한 알고리즘을 변수선택 편의, 변수선택력파 평균제곱오차 측면에서 서로 비교하였다. 아울러 두 알고리즘을 실제 자료에 적용하여 효율을 서로 비교하였다.

다변량 경험분포함수와 시각적인 표현방법 (Multivariate empirical distribution functions and descriptive methods)

  • 홍종선;박준;박용호
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권1호
    • /
    • pp.87-98
    • /
    • 2017
  • 일변량 이상의 다변량 경험분포함수의 정의를 새롭게 제안하고, 경험분포함수의 기대값과 분산을 유도하면서 다변량 경험분포함수가 실제의 분포함수로 수렴함을 확인한다. 그리고 다양한 상관계수의 이변량 표준정규분포에서 추출한 확률표본을 바탕으로 이변량 경험분포함수를 구하고 이를 이차원 평면에 시각적으로 표현하는 두 종류의 그래픽적인 방법을 제안한다. 하나는 계단으로 표현하여 계단식 함수와 유사한 성격을 갖고 있는 방법이고, 다른 하나는 이변량 분위벡터로 설명되는 그림 방법이다. 두 종류의 시각적인 표현 방법은 삼차원으로 표현할 수 있으나 이차원 평면으로도 쉽게 구현이 가능하며, 일반적으로 이변량 누적분포함수의 모든 특징을 충분히 설명할 수 있다. 따라서 삼변량 경험분포함수를 시각적 표현이 가능함을 보인다. 이변량과 사변량의 실증 예제를 통하여 본 연구에서 제안한 다변량 경험분포함수와 이차원 평면에 표현하는 시각적인 표현 방법들을 구현하고 탐색한다.

이변량 왜도, 첨도 그리고 표면그림 (Bivariate skewness, kurtosis and surface plot)

  • 홍종선;성재현
    • Journal of the Korean Data and Information Science Society
    • /
    • 제28권5호
    • /
    • pp.959-970
    • /
    • 2017
  • 본 연구에서는 두 변수의 상관계수를 반영한 이변량 자료의 왜도와 첨도 통계량을 제안하고, 시각적으로 표현할 수 있는 표면그림을 개발한다. 이변량 왜도 통계량은 이변량 확률표본 자료의 치우침 방향과 정도를 표현하는 실수 한 쌍으로 정의한다. 첨도는 양의 값을 가지며 이변량 정규분포를 기준으로 꼬리 부분의 두터운 정도를 파악할 수 있다. 그리고 표면그림은 분위벡터를 바탕으로 평면에 구현한다. 다양한 형태의 이변량 자료를 생성하여 표면그림을 작성하고 왜도와 첨도를 계산하여 탐색해 본 결과, 왜도와 첨도 값들은 표면그림으로 구현한 이변량 자료의 특징을 잘 반영하는 것을 발견할였다. 그러므로 본 논문에서 제안한 왜도, 첨도 그리고 표면그림은 이변량 분포를 분석하는 기술통계학적 방법으로 활용할 수 있다.

창업자의 다중지능 영역별 발달 특성이 창업 행동 및 창업 분야에 미치는 영향 연구

  • 이선희
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2018년도 추계학술대회
    • /
    • pp.31-34
    • /
    • 2018
  • 다중지능은 하워드 가드너가 제시한 개념으로, 지능이 단일한 지적 능력을 나타내는 구조(construct)이라기 보다는 다차원적인 복수의 하위 능력들로 구성된 것이라는 의미를 담고 있다. Gardner는 다중지능의 구성을 음악지능이나 신체운동지능, 논리수학지능, 언어지능, 공간지능, 인간친화지능, 자기성찰지능 그리고 자연친화지능 등과 같은 상호독립적 능력으로 분류하고 있으며, 각 개인은 각 능력 영역에서 다른 발달 수준을 가지고 있다고 본다. 본 연구는 창업자의 다중지능의 영역별 발달 특성이 창업 실행 행동, 창업 분야, 창업 성과 만족도에 영향을 미치는지를 알아보는 것을 통해 예비 창업자들이 본인의 적성과 재능에 적합한 분야에서의 창업 가능성을 탐색하도록 돕는 지도자들에게 시사점을 제공하고, 향후 창업가 육성 프로그램의 구성 개선안을 마련하는 데에 기여하고자 한다. 이를 위해 본 연구에서는 2018년 중소기업진흥공단 청년창업사관학교에 입교한 만 39세 이하의 청년창업자 200인을 대상으로 다중지능검사와 인구통계학적 특성 및 창업 특성에 대해 묻는 설문조사를 실시한 후, Pearson 상관계수 및 다변량분산분석을 통해 수집된 자료를 분석할 예정이다. 연구목적을 달성하기 위하여 설정한 가설은 다음의 3가지이다. 가설 1. 창업자의 다중지능 영역별 발달 수준과 창업 실행에는 정적인 상관이 있을 것이다. 가설 2. 창업자의 다중지능 영역별 발달 수준에 따라 창업자가 선택한 창업 분야에 유의한 차이가 있을 것이다. 가설 3. 창업자의 다중지능 영역별 발달 수준에 따라 창업자의 창업 성과 만족도에 유의미한 차이가 있을 것이다.

  • PDF

식품의 일상섭취량 추정을 위한 식품섭취빈도의 활용가능성 및 타당도 연구 (Validation of Food Intake Frequency from Food Frequency Questionnaire for Use as a Covariate in a Model to Estimate Usual Food Intake)

  • 이자윤;김동우
    • 한국조리학회지
    • /
    • 제23권2호
    • /
    • pp.64-73
    • /
    • 2017
  • 본 연구에서는 국민건강영양조사의 식품섭취빈도 조사로부터 식품섭취빈도를 산출한 후 이를 24시간 회상법에서 조사된 식품별 섭취량과의 상관관계를 탐색하여 식품 수준의 일상 섭취량을 추정할 때 식품섭취빈도를 공변수의 형태로 활용할 수 있을지 타진해 보기 위해 수행되었다. 국민건강영양조사에서 식품섭취빈도 조사가 수행되기 시작한 2012년부터 2014년까지 총 3개년도의 자료를 사용하였으며, 24시간 회상법과 식품섭취빈도 조사 모두를 수행한 10,945명을 대상으로 하였다. 분석을 위해 식품섭취빈도 조사지에 수록된 112개 항목별로 24시간 회상법에서 산출된 식품별 섭취량을 재산출하였으며, 이 결과와 각 개인이 식품섭취빈도 조사법에서 응답한 섭취빈도 및 섭취분량 간의 스피어만 상관계수를 산출하였다. 상관계수를 분석한 결과, 24시간 회상법의 섭취량과 식품섭취빈도법의 섭취빈도 간에는 총 112개 식품 중 59개 식품(52.2%)에서 통계적으로 유의한 양의 상관관계를 보였으며, 24시간 회상법의 섭취량과 섭취분량 간에는 102개 식품(90.3%)에서 통계적으로 유의한 양의 상관관계를 보였다. 곡류, 과일류, 난류, 두류, 생선류, 서류, 우유류, 육류, 음료류, 주류, 채소류, 해조류, 기타류의 13개 식품군으로 묶어 분석한 결과에서도 섭취빈도의 13개 군(100%)에서 통계적으로 유의한 상관관계를 보였으며, 생선류, 해조류, 기타류는 음의 상관을 보였고, 나머지 10개 항목은 양의 상관을 보였다. 본 연구를 통해 식품섭취빈도조사로부터 산출한 식품섭취빈도와 24시간 회상법 섭취량간의 일관된 상관관계를 확인할 수 있었으며, 이는 식품(군) 수준의 일상 섭취량을 추정할 때 식품섭취빈도를 중요한 공변수로 활용할 수 있는 근거가 된다고 하겠다.

한류행사특성이 스폰서십에 미치는 영향 연구 (A study on How Korean Wave's characteristic effect on sponsorship)

  • 배성웅;박정배
    • 한국산학기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.70-77
    • /
    • 2015
  • 한류행사특성이 스폰서십에 미치는 영향 연구를 위해 일본 동경과 나고야소재 공연장에서 한류행사 경험자 199명의 표본을 추출하여 기술통계방법과 다변량통계분석 실시하였다. 연구 변수에 대한 특성을 파악하기 위해 평균, 표준편차 등을 산출하여 항목-전체 상관계수를 측정하였다. 문항 간 내적일관성을 나타내는 크론바하 알파 계수를 이용하여 0.7이상으로 나타나 측정도구에 대한 신뢰도는 양호하였다. 또한 측정도구의 타당성 검증을 위해 탐색적 요인분석을 실시하였으며 요인분석 결과 측정도구에 대한 타당성은 확보되었다. 가설인 한류행사특성이 스폰서십에 유의한 영향 관계를 보이는가를 알아 보기 위해 대 가설 1개를 중심으로 소 가설을 4개로 설정하고 분석하여 3개 채택, 1개 기각되는 결과를 도출하였다. 결과적으로는 설정한 대가설은 유의한 영향요소가 있음으로 채택하였다. 하지만 선행연구가 부족한 분야에 뜻하지 않게 상의한 결과에 대해서는 후속연구가 활발히 이루어져 본 연구 분야의 이론적 체계화는 물론 현업에서도 성과가 도출되기를 기대한다.

온라인 열람목록 (OPAC) 이용자의 능력에 관한 비교연구 (A comparative study of user interaction when using Online Public Access Catalogs)

  • 박일종
    • 한국문헌정보학회지
    • /
    • 제30권2호
    • /
    • pp.167-188
    • /
    • 1996
  • 도서관리 전산화된 정보시스템에서 어떤 특정 이용자그룹에 대한 특성과 이용 능력에 대한 이해의 부족으로 일과 그 관련 얻은 종사자들이 정보1.)스틸을 개발하고 채택하고 운영함에 있어 최상의 선택을 하는 데 사실상 큰 어려움을 겪어 왔다. 본 연구는 한국 내에서의 이용자, 유학생 이용자, 남학생 여학생, 학부생, 대학원생 둥과 같은 특정 이용자 집단의 특성과 이용 능력에 관한 조사를 목적으로 이루어 겼다. 또한 OPAC 사용법을 배우는 경로에 대한 연구와 비 이용자 연구도 동시에 행해졌다. 설문 조사는 대구 지역과 미 Texas지역에 유학 중인 학생들을 대상으로 실시하였으며, 345개의 이용 가능한 데이터를 수진 분석하였다. 여러 종류의 기술적, 추리적, 다변량적 통계분석 방법들을 SPSS의 도움을 얻어 적용하였다. 본 연구에서는 (1)특정 학생 이용자집단의 OPAC에 대한 지식의 분포에서는 통계적으로 유의한 차이가 있었지만. 학부생집단과 예체능 전공의 학생들의 그룹 비교에서는 예외적으로 유의한 차이가 나타나지 않았다. (2)응답자들이 OPAC시스템을 사용할 때 알고 있는 탐색 방법의 숫자와 컴퓨터 사용 시간의 상관관계는 다른 어떤 변수의 상관 계수보다 높았고 컴퓨터 이용 연한, 이용 빈도, OPAC이용 빈도는 도서관 이용 빈도와 수작업 카드 목록의 이용 빈도보다 비교적 높았다는 사실을 밝혀 냈으며, 아울러 이 변수들의 상관 계수와 그 상관 관계들의 순위까지 명확히 제시하였다. 또한 어떤 새로운 시스템을 개발하거나, 채택하거나 이를 운영할 때 참조할 수 있는 결론과 추천하는 내용, OPAC 시스템의 성격을 연구하고자 할 때의 미래 연구 주제도 제안하였다.

  • PDF

미국 소득분포의 지역적 수렴에 대한 공간자료 분석(1969∼1999년) - 베타-수렴에 대한 비판적 검토 - (Spatial Data Analysis for the U.S. Regional Income Convergence,1969-1999: A Critical Appraisal of $\beta$-convergence)

  • Sang-Il Lee
    • 대한지리학회지
    • /
    • 제39권2호
    • /
    • pp.212-228
    • /
    • 2004
  • 본 연구는 지역간 소득분포의 수렴/발산의 주요 측면인 베타-수렴을 공간자료분석에 의거하여 비판적으로 검토하고 있다. 베타-수렴에 대한 통상적인 접근법은 두 가지 측면에서 문제점을 갖고 있다. 첫째, 회귀분석 결과 도출되는 잔차의 공간적 자기상관을 고려하지 못한다. 둘째, 베타-수렴의 국지적 변이, 즉 공간적 이질성을 탐색할 어떠한 절차도 제공하지 못한다. 이러한 비판적 검토를 바탕으로, 다양한 공간자료분석 기법들, 즉, 공간적 자기회기 모델(spatial autoregressive models), 이변량 국지통지(bivariate local statistics)를 이용한 탐색적 공간자료분석(ESDA: exploratory spatial data analysis) 기법, 그리고 지리적 가중회귀분석(GWR: geographically weighted regression)을 사용하여 1969-1999년 간의 미국 노동시장지역에 대한 소득 자료를 분석하였다. 주요 결과는 다음과 같다. 첫째, OSL모델을 적용한 결과 베타-수렴은 단지 부분적으로만 드러났고, 베타-수렴 계수도 시기별로 상당한 편차를 보였다. 둘째, 공간적 자기회기 모델의 분석 결과 OLS에 의해 유의한 것으로 나타난 베타-수렴 계수가 99% 신뢰수준에서 유의하지 않은 것으로 드러났다. 셋째, 탐색적 공간자료분석과 지리적 가중회귀분석의 결과는 베타-수렴의 경향에 상당한 정도의 공간적 이질성이 존재한다는 점을 보여주고 있다. 또한 이 공간적 이질성의 양상이 시기별로도 다양하게 드러남이 관찰되었다.