• 제목/요약/키워드: 통계적결합

검색결과 278건 처리시간 0.037초

로버스트 회귀모형을 이용한 자료결합방법 (Statistical Matching Techniques Using the Robust Regression Model)

  • 전명식;정시송;박혜진
    • 응용통계연구
    • /
    • 제21권6호
    • /
    • pp.981-996
    • /
    • 2008
  • 서로 다른 출처로부터 얻어진 데이터 파일들을 하나의 데이터 파일로 만드는 통계적 자료결합방법은 공통변수와 서로 다른 고유변수를 포함하여 변수들 간에 존재하는 관련성에 대해 살펴볼 수 있다. Robin (1986)이 제안한 일반회귀모형의 예측값을 이용한 통계적 결합방법은 자료에 대한 다변량 정규성을 가정하기 때문에 이 가정을 위반하는 자료를 이용하는 것은 많은 문제를 수반한다. 본 연구는 제공파일의 고유변수에 모분포를 반영하지 못하는 특이점이 존재하는 경우, 일반회귀모형을 이용한 통계적 결합방법의 대안으로 로러스트 회귀추정방법을 이용한 자료결합방법을 제안하였다. 나아가 로버스트 회귀모형을 이용한 결합방법과 일반회귀모형을 이용한 결합방법에서의 상관관계 및 결정계수 보존에 관한 성능을 비교하기 위하여 모의실험을 수행하였다.

통계적 모형과 인공지능 모형을 결합한 기업신용평가 모형에 관한 연구 (A Study on the Credit Evaluation Model Integrating Statistical Model and Artificial Intelligence Model)

  • 이건창;한인구;김명종
    • 한국경영과학회지
    • /
    • 제21권1호
    • /
    • pp.81-100
    • /
    • 1996
  • 본 연구에서는 보다 효과적인 기업신용평가를 위하여, 통계적 방법과 인공지능 방법을 결합한 결합모형을 제시햐고자 한다. 이를 위하여 본 연ㄴ구에서는 통계적인 모형중에서 가장 널리 활용되고 있는 MDA (Multivariate Discriminant Analysis) 와 인공지능적인 방법으로서 최근에 널리 사용되고 있는 인공싱경망( neural network)모형을 휴리스틱한 방법으로 결합한다. 이러한 결합모형의 성과를 증명하기 위하여 우리나라의 대표적인 3대 기업신용평가 기관에서 수집한 1043개의 기업신용평가자료를 기초로 실혐을 하고, 그 결과를 기존의 MDA 및 인공신경망 방법에 의한 결과와 비교하였다. 실험결과, 통계적으로도 유의하고, 실무적인 관점에서도 의미가 있는 기업신용펑가 결과를 유도할 수 있었다.

  • PDF

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

한국어의 이형태 표준화를 통한 구 기반 통계적 기계 번역 성능 향상 (Improve Performance of Phrase-based Statistical Machine Translation through Standardizing Korean Allomorph)

  • 이원기;김영길;이의현;권홍석;조승우;조형미;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-290
    • /
    • 2016
  • 한국어는 형태론적으로 굴절어에 속하는 언어로서, 어휘의 형태가 문장 속에서 문법적인 기능을 하게 되고, 형태론적으로 풍부한 언어라는 특징 때문에 조사나 어미와 같은 기능어들이 다양하게 내용어들과 결합한다. 이와 같은 특징들은 한국어를 대상으로 하는 구 기반 통계적 기계번역 시스템에서 데이터 부족 문제(Data Sparseness problem)를 더욱 크게 부각시킨다. 하지만, 한국어의 몇몇 조사와 어미는 함께 결합되는 내용어에 따라 의미는 같지만 두 가지의 형태를 가지는 이형태로 존재한다. 따라서 본 논문에서 이러한 이형태들을 하나로 표준화하여 데이터부족 문제를 완화하고, 베트남-한국어 통계적 기계 번역에서 성능이 개선됨을 보였다.

  • PDF

브라켓 간접부착술식시 레진베이스의 표면처리가 전단결합강도에 미치는 영향 (The Effect of Resin Base Surface Treatment on Shear Bond Strength in Indirect Bracket Bonding Technique)

  • 임병철;황현식
    • 대한치과교정학회지
    • /
    • 제28권5호
    • /
    • pp.681-688
    • /
    • 1998
  • 본 연구는 브라켓 간접부착술식시 레진 베이스의 표면처리에 따른 전단결합강도와 파절양상을 비교함으로써 레진 베이스 표면처리의 효과를 평가해 보기 위하여 시행되었다. 소의 하악 중절치를 포매하여 만든 90개 시편의 석고 모형에 광중합형 레진 접착제를 이용하여 금속 브라켓을 위치시킨 후 대조군은 표면처리하지 않은 반면 실험군은 레진 베이스를 Plastic Conditioner와 sandblasting으로 각각 표면 처리하여 시편에 옮겨 부착한 다음 만능물성 시험기를 이용하여 전단결합강도를 측정하고,파절양상을 관찰하여 다음과 같은 결과를 얻었다. 1. 레진 베이스를 표면처리하지 않은 경우에 비하여 Plastic Conditioner와 sandblasting으로 각각 처리한 경우 평균 전단결합강도가 높게 나타났으며 통계적으로 유의한 차이를 보였다. 2. Plastic Conditioner로 처리한 군과 sandblasting으로 처리한 군 간의 전단결합강도는 통계적 유의차를 보이지 않았다. 3. 각 군의 파절양상을 접착제 잔류지수를 통하여 비교 관찰한 결과 세 군 간에 통계적 유의차를 보이지 않았다. 4. 전단결합강도와 접착제 잔류지수 간의 상관검정 결과 전단결합강도가 높은 경우 레진 베이스와 브라켓 경계부에서의 파절이 빈번한 경향을 보였으나 그 통계적 유의성은 보이지 않았다. 이상의 실험결과는 브라켓 간접부착술식에서 결합강도 증가를 위하여 레진 베이스의 표면처리가 필요함을 시사하였다.

  • PDF

한반도지역에 대한 미래 기후변화 시나리오의 통계적 상세화 (A Statistically Downscaling for Projecting Climate Change Scenarios over the Korean Peninsula)

  • 신진호;이효신;권원태;김민지
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1191-1196
    • /
    • 2009
  • 온실가스 증가에 따른 미래 기후변화가 수자원에 미치는 영향을 평가하기 위하여 전구기후모델(AOGCM)의 기온과 강수 자료를 이용하여 한반도 지역에 대한 통계적 규모 상세화(statistical downsacaling, SDS) 기법을 개발하였다. 개발된 기법은 Cyclostationary Empirical Orthogonal Function (CSEOF) 분석과 회귀분석을 결합한 것으로 관측과 AOGCM 시계열의 통계적 상관성을 이용하고 있다. 20세기말(1973-2000) 동안의 광역규모의 기온(ECMWF)과 강수량(CMAP) 및 AOGCM의 기온과 강수량 자료에 통계적 상세화 기법을 적용하고 비교함으로써 이 기법의 유효성을 검증하였는데, 상세화된 기온과 강수량 자료는 관측된 계절변동성과 월변동성을 잘 모사하였다. 특히, 여름철 관측에 비해 저평가된 AOGCM의 강수량 크기와 변동성이 상세화를 통해 관측치에 근접하게 되었다. AOGCM의 미래 강수량 변화는 21세기 후반에 계절적으로 봄과 여름에 증가할 것을 예상되었다. 상세화된 AOGCM의 강수는 겨울을 제외한 모든 계절에서, 특히 여름철에 가장 많이 증가할 것으로 전망되었다. AOGCM의 미래 기온변화는 21세기 후반으로 갈수록 상승하며, 계절적으로 겨울철의 기온 상승폭이 더 클 것으로 전망되는데, AOGCM을 상세화한 결과에서는 겨울과 더불어 여름에도 기온 상승폭이 클 것으로 전망되었다. 개발된 기법은 역학적 결과와 관측과의 통계적 상관성을 이용하기 때문에 광역규모의 기후적 특성뿐만 아니라 한반도 지형 등 지역적 특성도 모두 반영함과 더불어 광역규모의 자료를 빠른 시간내에 효과적으로 상세화시킬 수 있는 장점도 지닌다. 한편 상세화에 사용된 CSEOF의 모드수 등에 따른 불확실성 등은 통계적 상세화 과정에 개선될 여지가 남아있음을 보여준다.

  • PDF

유동성 레진 수복술에서 접착제 중합 여부에 따른 미세누출과 전단결합강도에 관한 연구 (THE EFFECTS OF PHOTOPOLYMERIZATION OF ADHESIVE ON SHEAR BOND STRENGTH AND MICROLEAKAGE OF FLOWABLE RESIN RESTORATION)

  • 박용규;김종수;유승훈
    • 대한소아치과학회지
    • /
    • 제34권3호
    • /
    • pp.398-407
    • /
    • 2007
  • 본 연구는 소아 환자의 유동성 복합 레진 수복 시 접착제의 사용 및 중합 여부 그리고 접착제 종류에 따른 수복물 변연의 미세누출과 전단결합강도를 비교함으로써 치료 시간의 단축 가능성을 타진해보고자 시행하였다. 미세누출을 평가하기 위해 우식이 없거나 법랑질에 제한된 우식이 있는 상, 하악 소구치 84개, 전단결합강도 평가를 위해 협설면에 우식이나 결손부가 없는 대구치 70개를 각각 준비하여 사용하였다. 접착 시스템의 종류에 따라 총 7군을 설정하여 I군과 II군은 Single $Bond^{TM}$, III군과 IV군은 AQ Bond $Plus^{TM}$, Ⅴ군과 Ⅵ군은 Prompt L-$Pop^{TM}$ 그리고 접착 시스템을 사용하지 않고 레진을 충전하는 VII군을 대조군으로 설정하였다. 미세누출과 전단결합강도를 측정하여 다음과 같은 결과를 얻었다. 1. 미세누출 평가 결과 Single $Bond^{TM}$를 사용한 I군과 II군이 다른 군에 비하여 낮은 염료 침투를 나타냈다. I군과 II군 사이의 염료 침투 양상은 유사하게 나타났다. 2. 전단결합측정결과 I군과 II군이 다른 군에 비하여 높은 수치를 나타냈으며 통계적 유의차를 보였다(p<0.05). I군과 II군 사이에는 유의차가 없었다(p>0.05). 3. I군과 II군, III군과 IV군, V군과 VI군 사이에는 통계적 유의차가 없었다(p>0.05). 4. VII군은 I, II군과 V, VI군에 비하여 통계적 유의차가 있게 낮은 전단 결합 강도를 보였으며(p<0.05) III, IV군과는 보다 낮은 수치를 보였으나 통계학적 유의차는 없었다(p>0.05).

  • PDF

문항반응이론에서의 추정방법과 대입학력고사의 문항분석

  • 박정수;조완현
    • Communications for Statistical Applications and Methods
    • /
    • 제1권1호
    • /
    • pp.192-205
    • /
    • 1994
  • 본 논문에서는 피험자의 능력과 검사문항에 정답할 확률과의 관계에 기초한 문항반응 이론의 기본 가정과 통계적 모형을 소개하였다. 또한 검사의 목적상 필요한 피험자의 능력을 정확히 추정하는 방법과, 검사에 사용되는 각 문항을 특성지우는 문항모수의 여러가지 통계적 추정 방법에 대하여 정리하였다. 그 방법들은 결합 최우추정법, 조건부 최우추정법, 주변 최우추정법, 베이지안 추정법 및 이들의 혼합에 의한 방법이다. 문항반응이론의 적용의 한 예로서 93년도 대입학력고사의 수학 시험문항을 BILOG 라는 컴퓨터 프로그램을 이용하여 분석하였다.

  • PDF

레이디얼 베이시스 함수망을 이용한 플라즈마 전자밀도 균일도 모델링 (Modeling of Electron Density Non-Uniformity by Using Radial Basis Function Network)

  • 김가영;김병환
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 제38회 하계학술대회
    • /
    • pp.1938-1939
    • /
    • 2007
  • Radial Basis Function Network (RBFN)을 이용하여 플라즈마 전자밀도를 모델링하였다. RBFN의 예측성능은 학습인자의 함수로 최적화하였다. 체계적인 모델링을 위해 통계적인 실험계획법이 적용되었으며, 실험은 반구형 유도결합형 플라즈마 장비를 이용하여 수행이 되었다. 전자밀도측정에는 Langmuir probe가 이용되었다. 최적화된 RBFN모델을 통계적인 회귀 모델과 비교하였으며, 59%정도 모델의 예측성능을 향상시켰다.

  • PDF

벤처기업정밀실태조사와 한국기업혁신조사 데이터를 활용한 통계적 매칭의 타당성 검증 (The Validity Test of Statistical Matching Simulation Using the Data of Korea Venture Firms and Korea Innovation Survey)

  • 안경민;이영찬
    • 지식경영연구
    • /
    • 제24권1호
    • /
    • pp.245-271
    • /
    • 2023
  • 최근 데이터 경제가 가속화되면서 경영학 분야에서는 데이터 매칭이라는 새로운 기법이 주목받고 있다. 데이터 매칭은 모집단이 같지만 서로 다른 표본에서 수집된 데이터셋을 합치는 기법 또는 처리 과정을 의미한다. 그중에서 통계적 매칭은 서로 다른 데이터를 결합하는데 있어서 사업자 번호와 같이 기준이 되는 변수가 없는 경우 통계적 함수를 활용하여 데이터를 매칭하는 방법이다. 선행연구 검토결과 경제학, 교육학, 보건, 의료 등 다양한 분야에서 통계적 매칭이 많이 사용되고 있는데 반해 경영학 분야는 제한적임을 확인할 수 있었다. 본 연구는 기존 경영학 분야에서 충분히 연구되지 않았던 통계적 매칭의 유용성을 검증하고 활용도를 높이는 방안을 연구하고자 한다. 연구목적을 달성하기 위해 본 연구에서는 2020 벤처기업정밀실태조사와 2020 한국기업혁신조사 자료를 활용하여 통계적 매칭 시뮬레이션을 수행하였다. 먼저, 선행연구를 바탕으로 통계적 매칭에 사용되는 변수를 선정하였다. 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수와 제공변수는 중소기업 혁신에서 가장 중요한 연구인력 비율과 R&D 비용으로 각각 설정하였다. 사전 검증을 위해 2020 벤처기업정밀실태조사 자료를 수여자 데이터 30%와 기여자 데이터 70%로 분할하였다. 통계적 매칭에는 마할라노비스 거리와 랜덤 핫덱을 결합한 방식을 사용하였고, 성능평가는 수여자 데이터와 원시 데이터의 평균값 비교와 커널 밀도 함수(Kernel Density Estimation)를 통해 데이터 분포를 비교하였다. 검증결과, 수여자 데이터 30%와 기여자 데이터 70%에서 추출된 매칭 데이터의 평균값이 통계적으로 유의한 차이가 없는 것으로 나타나 유사한 데이터가 매칭된다는 것을 확인하였다. 또한, 두 데이터의 커널 밀도 함수로 도출한 데이터 분포 역시 유사한 형태가 나타나는 것을 확인할 수 있었다. 사후 검증에는 2020 벤처기업정밀실태조사에서 임의로 30%를 수여자 데이터로 추출하고 2020 한국기업혁신조사 자료를 기여자 데이터로 설정하여 통계적 매칭을 수행하고 검증하였다. 사전 검증과 마찬가지로 공통변수는 업종, 종업원수, 지역, 업력, 상장시장, 매출로 설정하였고, 검증을 위한 고유변수는 연구 인력 비율과 R&D 비용으로 정의하였다. 분석 결과, 수여자 데이터의 연구인력 비율의 평균과 기여자 데이터의 평균은 예상과 다르게 통계적으로 차이가 있는 것으로 나타났다. 하지만 커널 밀도 함수에 따른 두 데이터의 분포는 유사한 형태를 보이는 것으로 조사되어 통계적 매칭의 적절성을 확인할 수 있었다. R&D 비용은 통계적 매칭 수행 결과, 수여자 데이터의 R&D 비용 평균과 기여자 데이터의 평균이 통계적으로 차이가 없었고, 커널 밀도 함수도 유사한 분포를 보이는 것으로 조사되었다. 이러한 결과는 모집단은 동일하지만 서로 다른 표본에서 수집된 자료를 통계적으로 결합하여 신뢰할 수 있는 새로운 데이터를 확보할 수 있다는 측면에서 큰 의의가 있다. 또한, 경영학 분야에서 많이 사용되지 않았던 데이터 매칭 방법론을 모의실험을 통해 타당성을 검증함으로써 연구용 데이터 확보와 연구방법론의 확장에 기여했다는 점에서 시사점을 가진다.