• 제목/요약/키워드: 통계 처리

검색결과 3,103건 처리시간 0.029초

이원배치모형에서 순서대립가설에 대한 점근분포무관검정법에 관한 연구 (On asymptotically distribution-free test for ordered alternatives in two-way layouts)

  • 송문섭;김진흠
    • 응용통계연구
    • /
    • 제4권1호
    • /
    • pp.25-32
    • /
    • 1991
  • 본 논문에서는 이원배치모형에서 처리효과의 순서대립가설을 검정하기 위한 점근분포무관 검정법을 제안하고 제안한 통계량의 점근정규성과 일반화된 Puri의 통계량과의 점근상대효율을 살펴보았다. 또한 소표본에서 Monte Carlo연구를 통하여 제안된 통계량을 기존의 다른 방법들과 비교 연구하였다.

  • PDF

통계적 수정규칙을 이용한 한국어-중국어 단어정렬 개선방법 (Using Statistical Correction Rule to Improve Word Alignment)

  • 김장호;이금희;나휘동;김동일;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.231-236
    • /
    • 2009
  • 본 논문에서는 통계적으로 추출한 수정규칙을 이용하여 구 기반 한-중 통계기계번역 시스템(PBSMT)의 단어정렬 결과를 개선하는 방법을 제안한다. 논문에서 제안하는 수정규칙은 단어정렬의 결과를 사람이 만든 정답과 비교하여 통계적으로 추출하였다. 본 논문에서는 위에서 추출한 수정규칙을 이용하여 한-중 통계기계번역 시스템의 단어정렬의 결과에서 한국어 기능어(functional word)에 나타나는 오류를 수정함으로써 단어정렬의 결과를 개선하였고 최종적으로 기계번역의 성능을 제고하였다.

  • PDF

회귀분석용 VLSI 머신 설계에 관한 연구 (A Reserach on the VLSI Machine Design for Regression Analysis)

  • 이현수
    • 대한전자공학회논문지
    • /
    • 제20권2호
    • /
    • pp.7-15
    • /
    • 1983
  • 근년, 반도체 기술의 급격한 진보에 따라 고기능 논리회로의 VLSI화가 가능하게 되었다. 이에 따라 수치 처리의 고원화, 광대역 화상처리등을 위한 고기능 회로들의 전용 VLSI 칩의 설계가 연구되고 있으며, 여러 종류의 소프트웨어 패키지의 VLSI화가 가능하게 되었다. 본 논문에서는 계산기의 회귀분석용 범용 소프트웨어 패키지(BMD)를 하드웨어화하는 설계 수법을 제안하였다. 이것은 종래의 통계 처리를 소프트웨어에만 의존하기 때문에 처리 속도가 저하되는 것을 하드웨어화함으로써 개선하였다. 설계 알고리즘은 통계 수첩의 계산 특징을 살려 본 시스템을 구성한다. 그 결과 하드웨어화에 의하여 소프트웨어 패키지의 복잡성이 제거되고, 고속 처리함으로써 확률을 향상시켰다.

  • PDF

모두의 말뭉치를 이용한 한국어 다의어 분별 (Korean Polysemy Word-Sense-Disambiguation using MoDu-Corpus)

  • 신준철;이주상;옥철영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.205-210
    • /
    • 2020
  • 한국어 자연어처리 분야가 발달하면서 동형이의어 분별을 한 단계 넘어선 다의어 분별의 중요성이 점점 상승하고 있다. 최근에 다의어가 태깅된 "모두의 말뭉치"가 발표되었고, 이 말뭉치는 다의어가 태깅된 최초의 공개 말뭉치로써 다의어 연구가 본격적으로 진행될 수 있음을 의미한다. 본 논문에서는 이 말뭉치를 학습하여 작동하는 다의어 분별의 초기 모델을 제시하며, 이 모델의 실험 결과는 차후 연구를 위한 비교 기준점이 될 수 있다. 이 모델은 딥러닝을 사용하지 않은 통계형으로 개발되었고, 형태소분석과 동형이의어 분별은 기존의 UTagger로 해결하고 말뭉치 자원 외에도 UWordMap을 사용하여 다의어 분별을 보조하였다. 이 모델의 정확률은 약 87%이며, 다의어 분별 전에 형태소분석 또는 동형이의어 분별 단계에서 오류가 난 것을 포함한다. 현재까지 공개된 이 말뭉치는 오직 명사만 다의어 주석이 있기 때문에 명사만 정확률 측정 대상이 되었다. 이 연구를 통하여 다의어 분별의 어려움과, 다의어 분별에는 동형이의어 분별과는 다른 방법이 필요하다는 것을 확인할 수 있었다.

  • PDF

마이크로어레이 자료의 사전 처리 순서에 따른 검색의 일치도 분석 (A Concordance Study of the Preprocessing Orders in Microarray Data)

  • 김상철;이재휘;김병수
    • 응용통계연구
    • /
    • 제22권3호
    • /
    • pp.585-594
    • /
    • 2009
  • 마이크로어레이 실험의 실험자들은 원 측정치인 영상을 조사하여 통계적 분석이 가능한 자료의 형태로 변환하는데 이러한 과정을 흔히 사전 처리라고 부른다. 마이크로어레이의 사전 처리는 불량 영상의 제거(filtering), 결측치의 대치와 표준화로 세분되어질 수 있다. 표준화 방법과 결측치 대치 방법 각각에 대하여서는 많은 연구가 보고되었으나, 사전 처리를 구성하는 원소들간의 적정한 순서에 대하여서는 연구가 미흡하다. 표준화 방법과 결측치 대치 방법 중 어느 것이 먼저 실시되어야 하는지에 대하여서 아직 알려진 바가 없다. 본 연구는 사전 처리 순서에 대한 탐색적 시도로서 대장암과 위암을 대상으로 실시한 두 조의 cDNA 마이크로어레이 실험 자료를 이용하여 사전 처리를 구성하는 원소들간의 다양한 순서에 따라 검색된 특이 발현 유전자 군이 어떻게 변화하는지를 분석하고 있다. 즉, 결측치대치와 표준화의 여러가지 방법들의 조합에 따라 검색된 특이 발현 유전자 군이 얼마나 일치적인가를 확인하고자 한다. 결측치 대치 방법으로는 K 최근접 이웃 방법과 베이지안 주성분 분석을 고려하였고, 표준화 방법으로는 전체 표준화, 블럭별 국소(within-print tip group) 평활 표준화 그리고 분산 안정화를 유도하는 표준화 방법을 적용하였다. 따라서 사전 처리를 구성하는 두개 원소가 각각 2개 수준과 3개 수준을 가지고 있고, 두개 원소의 순열에 따른 모든 가능한 사전 처리 개수 수는 12개가 된다. 본 연구에서는 12개 사전 처리 방법 각각에 따라 정상 조직과 암 조직간 특이적으로 발현하는 유전자 군을 검색하였고, 사전 처리 순서를 바꾸었을때 유전자 군이 얼마나 일치적으로 유지되는지를 파악하고 있다. 표준화 방법으로 분산 안정화 표준화를 사용할 경우는 사전 처리 순서에 따라 특이 발현 유전자 군이 다소 민감하게 변하는 것을 보이고 있다.

정상 정자에서 $Isolate^{(R)}$ gradient와 Swim-up 방법의 비교연구: 동결 및 융해시 미치는 영향 (Comparison between $Isolate^{(R)}$ gradient and Swim-up Procedures for Sperm Preparation: Effects on Freeze-thawing in Normal Semen Sample)

  • 정병준
    • Clinical and Experimental Reproductive Medicine
    • /
    • 제28권1호
    • /
    • pp.25-31
    • /
    • 2001
  • 연구목적: $Isolate^{(R)}$ gradient와 swim-up 방법이 정자의 형상 및 정밀정자형태 (strict morphology)에 미치는 영창을 비교분석하고, 이러한 정자처리방법이 정자의 동결-융해과정에 미치는 영향을 비교하고자 하였다. 연구재료 및 방법: 20명의 정상 정자를 대상으로 하였으며 각각의 정자는 두 가지 정자처리방법으로 나누어 정자의 형상과 정밀정자형태를 컴퓨터를 이용한 정자자동분석기를 통하여 측정하였고, 동결보호제의는 TYB 용액을 사용하였으며, 동결 및 융해는 cryo Magic사의 기계를 사용하였다. 통계는 SPSS PC+(version7.0)를 이용하였으며 통계학적인 유의성은 p<0.05로 하였다. 결과: 정자의 농도는 $Isolate^{(R)}$ gradient 처리군이 swim-up 처리군보다 유의성 있게 높았으나 ($51.2{\pm}40.1,\;156.6{\pm}64.3$), 운동성 VCL, VSL, VAP, Linearity, 및 ALH는 swim-up 처리군에서 유의성 있게 높았다. 정밀 정자형태는 swim-up 처리군과 $Isolate^{(R)}$ gradient 처리군에서 차이가 없었다 ($53.7{\pm}6.8$ vs $50.3{\pm}9.1%$). 동결-융해과정 중 두 가지 정자 처리군에서 정자의 형상들은 swim-up 처리군에서 전반적으로 높은 양상을 보였으나, 정밀정자형태는 $Isolate^{(R)}$ gradient 처리군이 swim-up 처리군 보다 감소율이 컸지만 두 군간에 유의한 차이는 없었다 ($12.8{\pm}8.5$ vs $8.6{\pm}6.6$). 결론: 정상 정자에서 swim-up 방법이 $Isolate^{(R)}$ gradient 방법보다 정자 회수율은 우수하였으나, 동결-융해과정 중 정밀정자형태에는 차이가 없어 두 방법을 상호보완적으로 사용할 수 있을 것으로 사료된다.

  • PDF

한국의 국가통계체계에 대한 소고 (Reviews and prospects on the official statistical system in Korea)

  • 이인실
    • Journal of the Korean Data and Information Science Society
    • /
    • 제23권3호
    • /
    • pp.419-446
    • /
    • 2012
  • 우리나라는 국가통계체제는 고속성장이라는 국가적 과제와 발전의 궤를 같이 하면서 필요할 때마다 관련 통계를 만들어 왔으며 이로 인해 기초통계가 체계적으로 균형 있게 발전해오지 못한 한계를 지니고 있다. 변화하는 경제사회 환경에 맞추어 필요통계를 발굴해내는 수요체계 파악, 국제기구의 통계와의 정합성 제고, 유사중복통계 작성 방지, 통계인력의 전문성 제고 등 구조적 문제를 해결하기 위한 법적 및 실질적 운영상의 개선 노력이 필요하다. 국가통계 총괄 조정기능 강화하고 실천력이 전제되는 거버넌스 구조를 위해 통계청을 차관급인 처나 장관급 행정부로 격상시키고 통계기관장을 임기제로 하고 공모를 통하여 선정해야 한다. 행정자료의 활용도 제고를 위한 대통령직속위원회의 신설, 민간 통계생산기관과의 협력강화, 지방자치단체의 통계역량 제고, 자료처리센터의 설치, 마이크로데이터의 공동 활용 시스템 설치 등도 시급한 과제들이다.

언어 사용환경에 적응적인 영어 문맥의존 철자오류 교정 기법 (Adaptive English Context-Sensitive Spelling Error Correction Techniques for Language Environments)

  • 김민호;김경식;권혁철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-136
    • /
    • 2015
  • 문서 교정기에서 문맥의존 철자오류를 교정하는 방법은 크게 규칙을 이용한 방법과 통계 정보를 이용한 방법으로 나뉜다. 한국어와 달리 영어는 오래전부터 통계 모형에 기반을 둔 문맥의존 철자오류 교정 연구가 활발히 이루어졌다. 그러나 대부분 연구가 문맥의존 철자오류 교정 문제를 특정 어휘 쌍을 이용한 분류 문제로 간주하기 때문에 실제 응용에는 한계가 있다. 또한, 대규모 말뭉치에서 추출한 통계 정보를 이용하지만, 통계 정보 자체에 오류가 있을 경우를 고려하지 않았다. 본 논문에서는 텍스트에 포함된 모든 단어에 대하여 문맥의존 철자오류 여부를 판단하고, 해당 단어가 오류일 경우 대치어를 제시하는 영어 문맥의존 철자오류 교정 기법을 제안한다. 또한, 통계 정보의 오류가 문맥의존 철자오류 교정에 미치는 영향과 오류 발생률의 변화가 철자오류 검색과 교정의 정확도와 재현율에 미치는 영향을 분석한다. 구글 웹데이터에서 추출한 통계 정보를 바탕으로 통계 모형을 구성하고 평가를 위해 브라운 말뭉치에서 무작위로 2,000문장을 추출하여 무작위로 문맥의존 철자오류를 생성하였다. 실험결과, 문맥의존 철자오류 검색의 정확도와 재현율은 각각 98.72%, 95.79%였으며, 문맥의존 철자오류 교정의 정확도와 재현률은 각각 71.94%, 69.81%였다.

  • PDF

도재의 표면처리가 인장접착강도에 미치는 영향 (Effect of Surface Treatment of Porcelain on Tensile Bond Strength)

  • 김신근;성재현
    • 대한치과교정학회지
    • /
    • 제26권3호
    • /
    • pp.301-307
    • /
    • 1996
  • 본 연구의 목적은 도재의 표면처리가 인장접착강도에 어떠한 영향을 미치는가를 알아보는 것이었다. 120개의 도재시편을 각 군당 10개씩 12군으로 나눈 후, 1군은 표면처리를 하지않았고, 2군에서 5군까지는 단독 표면처리를 6군에서 12군까지는 복합으로 표면처리를 시행하였으며 그후 교정용 레진으로 통상적인 방법에 따라 브라켓을 접착하고나서 각 군의 인장접착강도를 측정하여 다음과 같은 결론을 얻었다. 1. 모든 단독표면처리군(G2,G3,G4,G5)은 표면처리를 하지않은 군(G1)보다 인장접착강도가 통계적으로 유의성 있는 증가(P<0.05)를 나타내었으며, 단독표면처리군 중 샌드블라스팅군(G5)의 인장접착강도가 $10.34{\pm}2.50MPa$로 가장 높았다. 2. 복합표면처리군(G6,G7,G8,G9,G10,G11,G12)에서는 9-11.5MPa의 인장접착강도를 나타내었고 이들 상호간에는 통계적으로 유의차가 없었다. 3. 단독표면처리군 중 샌드볼라스팅군(G5)은 복합표면처리군(G6-G12)과 통계적으로 유의차가 없었다.

  • PDF

프라이버시 속성 인증을 위한 PC Agent 모델 (The PC Agent Model for Certification of Privacy Attributes)

  • 류춘열;박지환
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 추계학술발표대회(상)
    • /
    • pp.77-80
    • /
    • 2003
  • 현재 인터넷의 사용 증가로 인한 개인 정보의 유출이 급증하고 있다. 특히, 인중과 권한의 허가가 동일한 시스템 내에서 이루어지므로 처리에 불필요한 개인 정보가 과다하게 공개되고 있다. 이러한 문제를 해결하기 위해 인중과 권한, 처리를 개별적으로 분리한 프라이버시 속성 인증 제어 시스템 모델이 제시되어 있다. 그러나 프라이버시 보호를 위한 처리모델은 서버로 하여금 서비스 이용자의 각종 지원 서비스와 서버 운영 통계 처리 분석을 불가능하게 한다. 본 논문에서는 공개 가능한 개인 속성 정보만을 선별적으로 참조 가능하게 하는 프라이버시 속성 인중 네트워크 프레임으로 확장하기 위한 모델을 제안한다.

  • PDF