• 제목/요약/키워드: 이용 통계

검색결과 12,147건 처리시간 0.037초

일영 통계기계번역에서 의존문법 문장 구조와 품사 정보를 사용한 클러스터링 기법 (A Clustering Method using Dependency Structure and Part-Of-Speech(POS) for Japanese-English Statistical Machine Translation)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권12호
    • /
    • pp.993-997
    • /
    • 2009
  • 클러스터링 기법은 다양한 분야에서 이용되어 왔으며, 통계 기반 기계번역에서도 익히 사용된 기법이다. 그러나 기존의 연구에서는 깊이 있는 문법적인 분석 없이 기계학습 기법을 사용하거나, 문장구조의 정보를 사용하더라도 정규식을 이용하여 판별하는 선에서 그치는 경우가 많았다. 본 논문에서는 각 문장의 의존관계 문법에 따른 구조와 조사 등의 품사 정보를 사용하여 문장구조를 파악하고 유형별로 분류하여 각각에 특화된 언어모델을 획득하는 방법과, 이를 구 기반 통계기계번역에 추가적인 정보로 사용하여 번역성능을 향상하는 데 이용하는 방법을 제안한다.

고차통계 기법과 웨이브렛을 이용한 수중 천이신호 탐지 (Underwater Transient Signal Detection Using Higher-order Statistics and Wavelet Analysis)

  • 조환래;오선택;오택환;나정열
    • 한국음향학회지
    • /
    • 제22권8호
    • /
    • pp.670-679
    • /
    • 2003
  • 본 논문에서는 수중 천이신호 탐지를 위하여 시간주파수 영역에서 신호분석이 가능한 웨이브렛을 적용하였다. 낮은 신호대 잡음비를 가지는 관측신호로부터 천이신호를 탐지하기 위하여 고차통계 기법과 웨이브렛을 사용하였으며, 웨이브렛을 이용하여 신호를 주파수 영역에서 분해한 다음 고차통계 기법을 이용하여 분해된 웨이브렛 계수들의 정규분포 특성을 측정하였다. 제안한 방법으로 천이신호를 탐지할 경우 낮은 신호대 잡음비를 가지는 관측 신호로부터 천이신호를 잘 탐지할 수 있었다.

규칙의 일반화와 통계 방식을 결합한 한국어 문맥의존 철자오류 교정규칙의 재현율 향상 (Improving Recall for Context-Sensitive Spelling Correction Rules by Combining Rule-Generalization and Statistical Method)

  • 최현수;권혁철;윤애선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.18-23
    • /
    • 2014
  • 한국어 맞춤법 검사기는 전자화된 한국어 텍스트에 나타난 오류어를 검색하여 이를 교정할 대치어를 제시하는 시스템이다. 이때 오류어의 유형은 크게 단순 철자오류와 문맥의존 철자오류로 구분할 수 있다. 이중 문맥의존 철자오류는 어절(word)단위로 봤을 때는 정확하지만, 문맥을 고려하였을 때 오류가 되는 유형으로 교정 난도가 매우 높다. 문맥의존 철자오류의 교정 방법은 크게 규칙을 이용한 방법과 통계 정보에 기반을 둔 방법으로 나뉜다. 이때 규칙을 이용한 방법은 그 특성상 정확도가 매우 높지만, 반대로 재현율이 매우 낮다. 본 논문에서는 본 연구진이 기존에 연구하였던 규칙을 일반화하는 방식에 추가로 조건부 확률을 이용한 통계 방식을 결합하여 정확도를 유지하면서 재현율을 향상시키는 방법을 제안한다.

  • PDF

지역별 사망진단서 첨부율에 영향을 미치는 요인

  • 장혜정
    • 한국인구학
    • /
    • 제28권1호
    • /
    • pp.47-71
    • /
    • 2005
  • 본 연구는 사망원인통계의 질과 밀접한 관련이 있는 사망진단서 첨부율이 지역간 큰 격차를 보인다는 사실에 기초하여 어떤 요인이 이 현상에 영향을 미치는지 파악하는 데 목적이 있다. 이를 위해 1991년부터 2000년까지 10개 년 간 6개 대도시 및 9개 시도의 지역별 사망진단서 첨부율과 각 지역의 사망자, 신고자 및 기타 지역 특성을 사망신고자료와 지역통계연보를 통하여 수집하였다. 이 패널자료를 분석함에 있어서 진단서 첨부율에 영향을 미치되 불가피하게 누락된 요인의 영향은 가변수를 사용하는 고정효과모형을 이용하여 보정하였다. 분석에 포함된 변수 중에서는 사망자의 교육수준과 병원사망자 비율이 사망진단서 첨부율의 지역별 차이를 낳는 주요 요인인 것으로 나타났다. 따라서 사망원인통계의 추가적인 질 제고를 위해서는 국가정책수립에 있어서 사망원인통계의 중요성에 대한 홍보 및 교육과 농어촌 벽지 및 도서 지역 등 의료이용이 여전히 어려운 지역에서의 의료기관 이용률 제고를 위한 노력을 기울여야 할 것이다.

자료 통계 분석을 위한 MS 엑셀의 유용한 기능들에 관한 사례연구 (지하철 이용객 자료 분석) (A case study of MS Excel's powerful functions for statistical data analysis. (Focused on an Analysis of Variance menu))

  • 김숙영
    • 한국컴퓨터산업학회논문지
    • /
    • 제9권5호
    • /
    • pp.223-228
    • /
    • 2008
  • 엑셀이 자료 통계 분석에서 매우 편리하고 유용한 도구가 될 수 있음을 보여주기 위하여 지하철 이용객 자료로 가설을 검정하는 사례 연구를 시행하였다. 양적 자료는 엑셀의 기술통계량 메뉴에 의하여, 질적 자료는 히스토그램 메뉴에 의하여 기술되었고, 변수들간의 관계성 검정은 회귀 분석 메뉴에 의하여, 차이 검정은 T검정 메뉴에 의하여, 요인 검정은 분산배치법 메뉴에 의하여 전문적인 결과를 얻을 수 있었다. 엑셀만을 이용하여 자료 입력, 관리 및 통계 분석 결과를 편리하게 수행할 수 있는 사례가 되었다.

  • PDF

규칙 및 통계 기반 시스템의 결과를 활용하는 대화 상태 추적 시스템의 개발 및 사용자 시뮬레이터를 이용한 평가 (Development of a Dialogue State Tracking System utilizing the Results of Rule and Statistics-based System and Evaluation using User Simulator)

  • 신창욱;장두성;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.518-523
    • /
    • 2020
  • 본 논문에서는 목적 지향 대화 시스템을 위한 대화 상태 추적 시스템과 사용자 시뮬레이터를 설계 및 제안한다. 사용자 시뮬레이터는 작성된 대화 상태 추적 시스템을 평가하기 위한 용도로 사용된다. 본 논문에서 제안하는 대화 상태 추적 시스템은 대화 기록과 함께 사전에 학습된 대화 기록 및 규칙/통계 기반 추론 시스템의 추론 결과를 입력으로 받는다. 그리고 입력된 발화 기록 중 마지막 사용자 발화의 사용자 목표와 개체명 그리고 다음 시스템 발화의 화행을 추론한다. 또한, 작성된 대화 상태 추적기의 성능을 평가하고 분석하기 위해, 주어진 환경에서 시스템과 대화를 수행하며 대화 시스템의 성능을 평가하는 사용자 시뮬레이터를 구현 및 적용하였다. 본 연구에서 수행된 실험과 분석을 통해, 규칙 및 통계 기반의 기반 시스템을 이용해 목표 시스템의 성능 개선이 가능함을 보인다. 또한, 제안하는 사용자 시뮬레이터는 규칙과 통계를 이용해 평가 코퍼스 없이 여러 상황에 대해 대화 시스템의 성능을 평가할 수 있다.

  • PDF

반응편향성을 내포한 리커트형 척도 자료의 분석방법 - 통계 상담 사례 연구 -

  • 김상룡;조길호;이수형
    • Journal of the Korean Data and Information Science Society
    • /
    • 제5권2호
    • /
    • pp.107-116
    • /
    • 1994
  • 이 논문은 통계상담사례연구의 일종으로 설문지를 이용한 통계자료분석에 도움이 되도록 소개하고자 한다. 여러항목을 종합하여 한 척도를 구성하고 각 항목마다 중요도나 선호도 등에 따라 다품등 리커트형 척도를 묻는 자료는 개인의 성향이나 지리적 문화적 여건에 따라 그 응답경향이 달라 가질지도 모르는 반응편향성(Response Set Bias)을 감소시켜 보다 좋은 통계자료분석을 할 수 있는 통계적 방법을 소개하며, 이 방법을 적용시킨 통계상담을 예시하고자 한다.

  • PDF

지리정보를 갖는 통계 데이터의 Visualization

  • 이정진
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2003년도 추계 학술발표회 논문집
    • /
    • pp.27-29
    • /
    • 2003
  • 정보화시대의 발전과 더불어 우리 일상생활에 친숙하게 다가온 기술 중의 하나가 지리정보시스템(Geographical Information System: GIS)이다. GIS는 공간(지표, 지하, 해양 등)상에 분포하고 있는 정보에 대해 여러 종류의 세밀한 지도를 이용하여 효율적으로 사용자에게 제공하여 관리하는 종합정보기술이다. 통계 데이터 중에는 지리정보를 가지고 있는 경우가 상당히 많다. 하지만 지리정보를 갖는 통계 데이터의 탐색적 자료분석(Exploratory Data Analysis)을 위한 Visualization 기법에 대해서는 별로 연구된 바가 없다. 본 논문에서는 GIS를 위한 벡터맵(vector map)의 간단한 제작방법과 GIS의 개발방법, 그리고 탐색적 자료분석을 위한 Visualization기법을 소개한다.

  • PDF

표준 기반의 통계지리정보 참조모렐 개발에 관한 연구 (A study on the reference model for statistical geographic information system based on the GIS standards)

  • 하수욱;남광우;류근호
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 춘계학술대회
    • /
    • pp.258-260
    • /
    • 2010
  • 통계지리정보는 기존의 텍스트 기반 통계정보를 공간정보와 결합한 정보로서 공공 민간 분야의 다양한 의사결정을 위한 핵심 기반 정보로 그 활용성이 주목받고 있다. 본 논문은 통계지리 정보와 이를 이용한 서비스 구축 및 유지 관리 과정에서 발생하는 상호운용성 문제의 해결을 위한 접근방법으로 기존의 공간정보 표준 참조 모델들을 기반으로 통계지리 정보 및 서비스 참조모델을 제안하고, 각각의 정보 및 서비스 분류에 해당하는 표준화 요구사항을 제시한다.

  • PDF

자동차의 사후관리를 위한 등록통계 시스템 개발에 관한 연구 (A study on total registration statistics system development for after service of automobile)

  • 강지호
    • 오토저널
    • /
    • 제17권1호
    • /
    • pp.31-43
    • /
    • 1995
  • 본 연구에서는 교통부 자동차 등록 원시자료를 이용하여 자동차제작사가 직접 사용할 수 있는 사후관리를 위한 등록통계 시스템을 개발해서 결과를 제시하고자 한다. 특히 통계 활용범위를 극대화하도록 하기 위해 차명은 코드화로 작성하여 통합차명으로 표준화, 업계재편과정으로 인한 종전 자동차 제작사는 합병, 인수한 최종 자동차제작사에 통합, 단산 및 양산 차명별로 차령별분류, 시.군.구의 행정단위별의 통계정보 수록 및 자동차소유자의 구매성형분석을 위한 년령별분류외 15개 유형별로 개발결과를 제시함으로써 효율적이고 과학적인 통계를 산출할 수 있도록 하고자 한다.

  • PDF