• 제목/요약/키워드: 통계용어

검색결과 107건 처리시간 0.024초

전문용어 인식 시스템을 위한 분산 병렬 처리 플랫폼 최적화 및 성능평가 (Optimization and Performance Analysis of Distributed Parallel Processing Platform for Terminology Recognition System)

  • 최윤수;이원구;이민호;최동훈;윤화묵;송사광;정한민
    • 한국콘텐츠학회논문지
    • /
    • 제12권10호
    • /
    • pp.1-10
    • /
    • 2012
  • 과학기술 문헌의 전문용어 인식 분야는 지금까지 다양한 통계적 방법론을 사용하여 용어 인식 정확률을 향상시키기 위하여 연구되어 왔다. 하지만 기존의 연구는 단일-코어 또는 단일 머신 상에서 수행되었기 때문에, 폭발적으로 증가하는 문헌들에 대한 실시간 분석 요구를 처리할 수 없는 상황에 직면하고 있다. 본 논문에서는 전문용어를 인식하는 과정에서 병목현상이 발생하는 작업을 '후보용어 추출 과정'의 언어처리부분과 '용어 가중치 할당 과정'에서 통계정보를 취합하는 부분으로 분류하고, 각 작업을 분산병렬 처리 기반의 맵리듀스 작업을 이용하여 해결하는 전문용어 인식 방법을 구현하고 실험하였다. 실험은 확장성과 분산 병렬 처리 환경 최적화 두 가지로 수행하였고, 첫 번째 실험에서 12개의 노드를 사용하여 분산 병렬 처리하였을 때 단일 머신을 사용한 경우보다 11.27배의 처리속도 향상을 보였다. 두 번째 실험에서 1)기본 환경, 2)복수 리듀서, 3)컴바이너, 4) 2)와 3)의 조합에 대하여 수행하였고, 3)컴바이너 사용이 가장 우수한 성능을 보여 주었다. 본 논문에서 구현된 전문용어 인식 시스템은 대용량 과학기술 문헌에 대한 지식 추출 작업속도 개선에 기여하였다.

Understanding Bayesian Statistics

  • 정윤식
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2002년도 추계 학술발표회 논문집
    • /
    • pp.61-68
    • /
    • 2002
  • 통계학은 불확실성(uncertainty)에 대한 연구이다. 베이지안 통계 방법은 불확실성 아래서 통계 추론과 의사 결정 모두를 위한 완전한(complete) 패러다임을 제공한다. 베이지안 방법론은 합리적인 초기 정보와 결합하는 것을 가능하게 만들고, 전통적인 통계적 방법론에 의하여 직면하는 많은 어려움들을 풀 수 있는 coherent 방법론을 제공하면서 엄격한 수학적 기본에 근거하고 있다. 베이지안 패러다임은 일반적인 용어로써 확률이란 단어의 사용을 가장 잘 어울리게 하는 불확실성의 조건부 측도(conditional measure of uncertainty)로써 확률의 해석에 근거한다. 관심있는 것에 대한 통계적 추론은 증거의 관점에서 그 값에 대한 불확실성의 변형으로써 묘사되며, 베이즈 정리(Bayes' theorem)는 이러한 변형이 어떻게 만들어지는 가를 자세히 설명할 수 있다. 베이지안 방법들은 전통적인 통계적 방법론에 접근할 없는 복잡하고, 다양한 구조적 문제들에 응용할 수 있다.

  • PDF

"의학 연구자료 분석과 통계적 기법"에 대하여

  • 송혜양
    • 응용통계연구
    • /
    • 제6권2호
    • /
    • pp.217-226
    • /
    • 1993
  • 이 논문은 크게 두 부분으로 구성되었는데, 첫째 부분은 의학연구 목적에 따라 요구되는 분석법을 소개하고 있고, 둘째 부분은 국내 의학논문에서 통계처리의 잘못의 유형과 빈도를 제시하고 있습니다. 첫째 부분인 여러 분석법의 소개에서는 분석법의 열거로 보아서는 통계인들에게 새로운 것이 많지 않다고 언뜻 느껴지시겠지만, 실제로는 여러 면에서 새로운 점이 많습니다. 이 차이점을 살펴보면 우선 rate와 proportion과 ratio란 용어를 구분하여 사용하고 있고, 이들의 사용이 요구되는 의학적인 경우도 분명히 다름을 의학연구의 예제와 연구목적에 따라 제시하였습니다. 교과서처럼 쓸 수 있어서 설명이 부족합니다만, 의학에서 요구되는 구체적인 상황은 매우 다릅니다. 여러 가지 연구의 하나인 원인성연구를 살펴보면 measure of association으로써 rate difference (RD), rate ratio (PR)과 odds ratio (OR)의 세가지가 제시되었고, 이 measure에 대해서도 각각이 요구되는 의학적인 경우가 분명히 다르며, 또한 각각에 따른 분석기법도 다름을 논문에서 볼 수 있습니다.

  • PDF

수학 I 검정교과서 확률통계 영역에 대한 연구 (A Study on 7th Probability and Statistics Education In Mathematics 1 Textbooks in Korea)

  • 이상복;손중권;정성석
    • 응용통계연구
    • /
    • 제18권1호
    • /
    • pp.197-210
    • /
    • 2005
  • 본 연구에서는 중등학교 통계교육을 위하여, 제7차 수학과 교육과정 중 고등학교에서 사용하는 검정교과서 수학 1과 국정교과서 확률과 통계의 확률통계 영역을 중심으로 용어와 개념 및 표현을 비교, 연구하였다. 검정과 국정교과서의 표본표준편차의 정의가 일치되지 않았으며, 표분평균의 분산과 중심극한정리에 대한 개념설명이 교과서마다 상이하였다. 또한, 확률변수 개념 설명이 불분명 한 교과서도 발견되었다. 본 연구에서는 오류의 수정과 더불어 표본분산으로 불편추정량을 사용할 것을 제안하였다.

주관적 평가를 통한 피로도에 대한 연구 (A Study on the Fatigue through the Subjective Evaluation)

  • 권규식;홍부성;김성웅;박세진
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2001년도 추계학술대회 논문집
    • /
    • pp.81-86
    • /
    • 2001
  • 산업의 발전과 함께 소비3자의 욕구는 제품의 질적, 감성적 향상을 요구하고 있으며, 또한 최근 각종 공학의 눈부신 발전에 힘입어서 자동차의 성능, 안락성 등이 크게 향상되면서 운전자의 운전 중 피로감 제거에 관심이 높아지고 있다. 본 연구는 주관적인 피로감 평가 방식 중 졸림감(KSS), 피로감 용어 및 신체 불편도를 이용하여 평가를 수행하였다. 졸림감 및 피로감 용어는 차종 및 자세에 따라 약간의 차이가 있었지만, 대체적으로 시간이 지남에 따라 불편함의 정도가 심해졌다. 신체 불편도에 대한 평가결과 엉덩이, 요추, 어때, 좌우 발목 부위가 불편한 것으로 나타났다. 이러한 결과들은 차종별 또는 운전자세에 따라 통계적으로 유의한 차이를 보이기도 했다. 이러한 연구 결과를 통해서 동환경 시스템의 기초 데이터를 확보할 뿐만 아니라, 자동차를 설계하는데 있어, 보다 안락하고 편안한 운전환경을 만들 수 있는 기초자료로써 활용이 가능할 것이다.

  • PDF

GIS를 이용한 교통망상 시간거리 지도화 방법 및 접근성의 구조 분석

  • 김소연;이금숙
    • 한국경제지리학회:학술대회논문집
    • /
    • 한국경제지리학회 2005년도 추계 정기학술대회 발표논문집
    • /
    • pp.40-47
    • /
    • 2005
  • 카토그램(Cartogram)은 통계데이터를 이용하여 지리공간에 나타나는 현상을 효과적으로 표현하는 방법 중 하나이다. 카토그램이란 넓은 의미에서 모든 통계지도를 포함하지만, 좁은 의미에서 지도의 변형을 통해 통계데이터의 특징을 표현하는 시각화 방법을 의미한다. 이 연구에서는 후자의 의미에서 카토그램이란 용어를 사용하였으며, 우리나라를 대상으로 절대적 공간을 시간거리 접근성에 의한 공간 카토그램으로 재구성하여 지도화하고, 변화된 공간패턴을 분석하고자 하였다. 카토그램은 특정한 목적을 위해 기본도의 형상이나 지역간의 연속성을 강조시켜서 만든 변형된 지도의 일종으로 전통적인 지도와는 매우 다른 이미지를 주게 되지만, 표현하고자 하는 현상의 공간적 구조를 매우 효과적으로 나타낼 수 있다.

  • PDF

P-norm 검색의 문헌 순위화 기법에 관한 실험적 연구 (A Study of Document Ranking Algorithms in a P-norm Retrieval System)

  • 고미영;정영미
    • 정보관리학회지
    • /
    • 제16권1호
    • /
    • pp.7-30
    • /
    • 1999
  • 본 연구의 목적은 문헌의 구조에 근거한 비통계적 용어 가중치 기법을 사용함으로써 기존의 불 논리 검색 시스템에 용이하게 적용될 수 있는 P-norm 검색의 효과적인 문헌 순위화 기법을 찾아내는 데 있다. 또한 용어 가중치를 사용하여 검색 된 문헌들을 대상으로 상위문헌 몇 개와 유사도가 높은 문헌의 순위를 높여주는 순위 조정 과정을 추가하여 검색성능을 더욱 향상시킬 수 있도록 하였다. 비통계적 가중치 기법으로는 필드 가중치와 근접거리 가중치를 사용하였고, 통계적 기법을 이용한 검색도 실시하여 검색성능을 비교하였다. 순위 조정 실험에서는 문헌간의 유사도 측정의 기준에 되는 상위문헌수를 1건으로 사용하는 경우부터 5건으로 사용하는 경우까지 5번에 걸친 실험을 실시하였다. 실험결과 비통계적 가중치 기법은 통계적 기법보다 더욱 효과가 있었고, 순위 조정 과정은 전반적으로 검색효율이 크게 향상되는 것으로 밝혀졌다.

  • PDF

수집자공급형 학술정보데이터베이스의 사용성 평가에 관한 연구 (Usability Evaluation of Aggregator-supplied Full-text Database)

  • 김종애
    • 한국도서관정보학회지
    • /
    • 제40권2호
    • /
    • pp.223-242
    • /
    • 2009
  • 본 연구는 초기수용자를 대상으로 수집자공급형 웹기반 학술정보데이터베이스의 사용성에 대한 정량적 및 정성적 평가를 실시하고, 개인의 특성에 따른 사용성 평가에 있어서의 차이를 분석한 탐색적 연구이다. Kolb 학습유형, 성별, 이용자교육 참가여부와 같은 이용자의 특성에 따른 탐색소요시간과 이용자 관점에서의 사용용이성, 용어이해도, 주제분류 이해도 및 만족도에 있어서의 차이가 있는지 살펴보았다. 분석 결과, Kolb 학습유형에서의 동화적 학습자와 조절적 학습자 간에 탐색소요시간에 있어서 통계적으로 유의한 차이가 있는 것으로 나타났으며, 사용용이성과 용어이해도에 대한 인식에 있어서 성별에 따른 통계적으로 유의한 차이가 나타났다. 그러나 이용자교육 참가여부에 따른 탐색소요시간과 사용성 인식에 있어서는 통계적으로 유의한 차이가 나타나지 않았다.

  • PDF

통계학사 속에서의 법 (Jurisprudence in the History of Statistics)

  • 조재근
    • Communications for Statistical Applications and Methods
    • /
    • 제18권5호
    • /
    • pp.559-570
    • /
    • 2011
  • 1650년대에 파스칼과 페르마가 주고 받은 편지에서 시작된 확률 연구가 하위헌스, 베르누이, 라플라스 등의 연구로 이어지는 과정에서 당시의 법률적인 사고가 어떤 역할을 하였는지 살펴보았다. 이 연구에서 살펴 본 바에 따르면 초기 확률 연구에서 '기댓값'과 '확률'이라는 새로운 용어와 개념이 생기는 데에는 '공정한 거래', '확실성의 정도'와 같은 법률적인 사고가 큰 역할을 하였던 한편, 19세기 이후 센서스를 비롯한 통계조사가 활발해지면서 거꾸로 통계가 사회적, 법률적 사고방식에 영향을 미치기도 하였다.

전자상거래 제도개선 방안 (Some Recommendations for E-commerce Promotion in Korea)

  • 지경용
    • 전자통신동향분석
    • /
    • 제32권2호
    • /
    • pp.45-53
    • /
    • 2017
  • 본 보고서는 KISA의 지원에 의하여 수행된 2016년 '전자상거래제도개선전담반'의 토론내용을 중심으로 대표저자인 필자가 작성했다. 우리나라는 2016년초 처음으로 전자상거래 무역이 흑자를 기록했다. 그러나 무역 규모에 비해 전자상거래 수출실적이 극히 미흡하다는 판단 아래 정책 효과를 배가할 범정부적 제도 개선책을 도출했다. 제I장에서는 전자상거래가 앞으로 대한민국 수출의 경제성장 동력원으로서 일익을 담당할 중요한 부문임을 역설하고, 제II장 본론에서 용어의 통일, 전자상거래 무역통계 제도 개선, 유통 통관 관세 제도 개선, 전자상거래 고급인력 양성, 글로벌 공동이용 플랫폼 기술개발 지원, 전자상거래 지원을 위한 표준화 등 개선안을 정리하였고, 제III장에서는 정책제언을 수록했다.

  • PDF