• Title/Summary/Keyword: 통계처리

Search Result 3,102, Processing Time 0.031 seconds

The Postprocessing of a Korean OCR using the Output of the Word Recognition and the Statistical Information from a Corpus (문자 인식기의 특성과 말뭉치의 통계 정보를 이용한 문자 인식 결과의 후처리)

  • Son, Hoon-Seok;Choi, Sung-Pil;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.188-193
    • /
    • 1997
  • 한국어 문자 인식 후처리는 인식기가 제공하는 후보 음절을 바탕으로 후처리를 하였다. 이 논문은 문자 인식기가 제공하는 후보 음절 대신에 인식기의 인식 결과를 분석하여 인식기의 오인식 통계 정보에 따라 인식 결과 음절의 후보 음절을 생성한다. 여기서 생성된 후보 어절을 각 음절의 확률 값을 이용하여 확률이 가장 놓은 어절을 선택한다. 이때 한국어 대용량 말뭉치에서 추출한 어절의 통계정보를 이용하여 그 어절의 확률 값을 구한다. 이 기법의 장점은 후보 음절의 조합으로 생성된 어절의 확률 값과 그 어절의 말뭉치상의 확률 값을 이용한 결과 말뭉치에 포함된 미등록어 정보에 따라 형태소 분석이 되지 않는 미등록어 처리가 가능하다. 또한 후보 어절 중 형태소 분석이 성공하는 어절이 두개 이상 있을 경우 실제 거의 쓰이지는 않지만 단지 음절의 확률 값이 높아 우선으로 선택되는 경우를 방지하였다. 실험은 약 1,000page 분량의 실험을 통해 오인식 결과를 수집하고, 4000만 원시 말뭉치에서 구한 어절의 통계정보를 이용하였다. 그 결과 문자 인식기의 98.05%의 어절 인식률을 후처리 결과 99.52%로 향상시켰다.

  • PDF

통계 데이타베이스의 보호에 관한 조사 연구

  • Kim, Chul
    • Review of KIISC
    • /
    • v.4 no.1
    • /
    • pp.44-52
    • /
    • 1994
  • 정보화 사회에서는 가계, 기업, 정보 등의 정보 활동의 주체들이 가진 정보자산은 데이타 베이스(이하DB)와 소프트웨어(S/W)로 대변할 수 있으며, 이중 DB는 정보화 사회의 기반시설의 하나라고 볼 수 있다. 특별히 통계DB는 각 주체들에게는 필수적인 정보를 갖고 있다. 금융자산의 정보, 국방에 관련된 병력, 장비, 군수물자등의 정보, 회계정보 뿐 아니라 인구센서스, 경제계획수립 등등의 다양한 분야에 이 통계 DB는 사용되고 있다. 이러한 통계DB는 기존의DB에서의 데이타의 저장, 관리, 추출 기능외에 통계적인 데이타의 분석기능이 요구되고 있다. 통계 처리를 위한 데이타베이스관리 시스템(DBMS, database management system)은 주로 기존의 DBMS 에 통계처리를 위한 기능을 추가하거나 통계를 위한 DB를 따로 구축하는 방법을 사용하고 있다. 따라서 일반적인 DB 보호 기술과 더불어 통계 의 환경을 이해하는 보호 기술이 요구되고 있다. 일반적으로 DB 를 보호하는 방법으로는 물리적인 보안(physical security)과 운영체계 보안(operating system security) 이 있으며, 이들과 함께 데이타 암호화(data encryption)의 방법을 사용하고 있다. DB 의 보안 방법에 관한 연구 중 George I. Davida 등에 의한 방법은 중국인의 나머지 정리(chinese remainder thorem)를 사용하는 암호화 알고리즘을 이용하여 레코드(record) 단위의 암호화를 하며, Khamis A. Omar등에 의한 방법은 읽기, 쓰기, 갱신의 3단계의 사용자 등급을 부여하여 DB 접근의 제약을 가하는 기능을 갖고 있다. 본고에서는 특히 그 중요성이 더해가고 있는 통계 의 일반적인 개념을 살펴보며, 특성 지향형 질의 모델(characteristic-specified query model)의 보호기술을 살펴본다. 특별히 본고는 통계 DB의 보호에 대한 일반적인 조사 연구로서 잘 알려진 사실들을 많은 참고 문헌과 더불어 소개하는 내용으로 통계 DB의 보호에 관한 새로운 연구 결과는 아니다.

  • PDF

A Study of Statistical Geographic Information App Development (통계지리정보 앱 개발에 관한 연구)

  • Lee, Sunki;Min, Juhong;Bae, Jeonghwan;Kim, Eunjeong;Ju, Minwan;Jeong, Dongwon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1142-1145
    • /
    • 2011
  • 최근 스마트폰을 중심으로 한 모바일 기기의 보급 및 활용이 급격하게 증가하고 있다. 이러한 환경 변환에 맞춰 많은 서비스들이 모바일 기기를 위한 형태, 즉 앱으로 개발되고 있다. 이 논문에서는 이러한 패러다임의 이동을 고려하여, 현재의 통계지리정보서비스에 대하여 고찰하고 이를 통해 모바일 기기를 위한 적합한 앱 형태 및 고려사항에 대하여 기술한다. 통계정보는 다양한 형태로 제공될 수 있으며, 특히 지리정보시스템과의 연계를 통한 서비스 활용성과 이해력을 돕기 위한 통계지리정보서비스에 대한 연구가 진행되어 왔다. 그러나 변화하는 패러다임을 고려한 앱 개발에 관한 연구는 미비한 실정이다. 따라서 이 논문에서는 사용자의 통계정보의 활용성 향상시킬 수 있는 통계지리정보 앱 개발 시 고려사항 및 기능에 대하여 기술한다. 이 논문의 결과는 스마트폰과 같은 모바일 기기를 위한 앱 개발을 위한 기초 자료로 활용될 수 있다.

중등학교에서의 통계 지도 방향 탐색 - 대표값과 분산, 표준편차를 중심으로-

  • Kim, Chang-Il;Jeon, Yeong-Ju
    • Communications of Mathematical Education
    • /
    • v.14
    • /
    • pp.273-295
    • /
    • 2001
  • 통계는 연역적 사고를 강조하는 수학의 다른 영역과 달리 귀납적 추론과 직관적 사고를 요구한다. 따라서 학교 수업에서 학생들이 실제적인 상황을 모델링 할 수 있도록 하며, 주어진 상황에서 자료를 올바르게 산출하고 분석 할 수 있도록 적절한 지도 방법이 필요하다. 그렇지만 학교 수업은 대다수 알고리즘 연습 위주의 통계 학습-지도로 통계적 사고 교육이 제대로 이루어지지 못하고 있다. 이로 인해 학생들은 형식적인 통계 처리에는 익숙하지만 통계 교육의 궁극적 목적인 변이성과 자료를 현명하게 다루는 능력이 부족하다. 본고에서는 피상적인 기계적 계산위주의 통계교육에서 실제적인 자료를 수집하고, 이를 적절히 가공 처리하여 정보의 가치를 높일 수 있는 통계 지도 방향을 탐색해 보고자 한다.

  • PDF

A Study on Multivariate Tests in the Profile Analysis (프로파일 분석에서의 다변량 검정법 비교 연구)

  • 박진경;박태성
    • The Korean Journal of Applied Statistics
    • /
    • v.12 no.1
    • /
    • pp.97-107
    • /
    • 1999
  • 프로파일 분석은 반복측정 자료를 분석하는데 있어서 널리 사용되는 다변량 분석모형이다. 프로파일 분석에서는 처리 그룹간의 비교와 반응 프로파일의 평행성 검정을 위해서 4가지 검정통계량이 널리 사용되고 있다. 이들 검정통계량은 Wilks의 통계량($\Lambda$), Pillai's Trace 통계량(V), Hotelling-Lawley Trace 통계량(U), Roy's Maximum Root 통계량($\Theta$ )이다. 그 동안 이들 통계량들을 비교하기 위한 여러 연구가 있었지만 주로 일반적인 다변량 분산분석 모형에 근거한 비교였다. 본 논문에서는 자료가 반복측정 자료이고 우리의 관심이 프로파일 분석에 있을 때에 이 4가지 통계량의 비교에 초점을 맞추었다.

  • PDF

Data Processing Architecture on the Jeju Taxi Telematics System (제주 택시 텔레매틱스 시스템에서 이동 이력 데이터의 처리 구조)

  • Lee, Jung-Hoon;Hong, Young-Shin;Park, Gyung-Leen
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.05a
    • /
    • pp.879-880
    • /
    • 2008
  • 본 논문은 제주 택시 텔레매틱스 시스템에 축적되고 있는 차량들의 이동이력 데이터에 대한 처리구조를 설계하고 구현한다. 각 차량은 1분마다 자신의 위치와 GPS 정보 및 택시의 상태에 관련된 보고를 발생시키며 중앙의 관제시스템은 이를 수합하여 이력데이터를 구성한다. 본 논문에서 구현하는 시스템은 위치 보고를 처리하여 인코딩 변환, 좌표 변환, 맵 매칭, 도로상에서의 위치 계산 등을 수행한 후 오라클 데이터베이스의 이력 테이블에 저장하도록 한다. 이를 위하여 도로 네트워크가 데이터베이스로 변환되었으며 도로망에의 가시화를 위하여 지도 인터페이스 프로그램이 구현되었다. 이러한 정보들은 이력 테이블과 아울러 공간 데이터베이스 엔진과 결합하여 C 언어나 SQL 문장에 의하여 다양한 위치기반 질의를 가능하게 할 뿐 아니라 배차 정보 분석, 현재 통행 속도 분석 등 부가가치가 높은 정보를 산출하는데 필수적인 역할을 수행한다.

Estimation of Tunnel Convergence Using Statistical Analysis (통계처리를 활용한 터널 내공변위의 분석에 관한 연구)

  • 김종우
    • Tunnel and Underground Space
    • /
    • v.13 no.2
    • /
    • pp.108-116
    • /
    • 2003
  • Measured convergence data of a tunnel were investigated by means of statistical and regression analysis, where the rock mass were mainly composed of andesite and granite. The rock mass around tunnel were classified by RMR method into five different ratings, and then convergence data which belong to individual ratings were statistically processed to find out the appropriate regression equations. Exponential equations were better coincided with measured data than logarithmic equations. As the number of rock mass rating was increased, the magnitude and standard deviation of convergence were increased. Final convergence data were also investigated to study the relevance with both maximum displacement rate and early measured convergence. Some brief results of their relevance are presented. For instance, the regression coefficient between final convergence and maximum displacement rate was turned out to be 0.87 for this studied tunnel.

On the distribution-free tests for umbrella alternatives in a randomized block design (화률화 블록 계획법에서 우산형 대립가설에 대한 분포부관 검정법의 연구)

  • 김동희;김영철
    • The Korean Journal of Applied Statistics
    • /
    • v.5 no.1
    • /
    • pp.41-57
    • /
    • 1992
  • Distribution-free test for umbrella alternatives in a randomized block design is proposed and asymptotic properties test statistics and the asymptotic relatives efficiency (ARE) of the proposed test statistics with respect to the Puri's parametric method are investigated. For given peak points 2,3,4, with 4 blocks and 5 treatments, and with 3 blocks and 5 treatments : for given peak point 3, with 2 blocks and 4 treatments : from the small sample Monte Carlo Study, the empirical powers between the proposed test and Puri's test are compared. Throughout the simulation results, the proposed test statistic is efficient for the heavy tailed distributions.

  • PDF

A Study on Web-Based Power Distribution Statistics System (웹 기반 배전 통계 시스템 구현 사례 연구)

  • So-Yeon Kim;Hyunsik Choi
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2008.11a
    • /
    • pp.473-475
    • /
    • 2008
  • 회사 전략과 경영 계획을 세우는데 다양한 통계 데이터를 사용한다. 데이터가 필요할 때 마다 데이터 추출을 요청하고 취합한 후 원하는 형태로 가공해야한다면 급변하는 경영환경에 효과적으로 대응할 수 없게 된다. 이를 위하여 정확하고 신속한 통계 시스템이 필요하다. 본 논문에서는 배전업무의 통계정보를 좀 더 효과적으로 제공할 수 있는 웹 기반 배전 통계 시스템을 구현하였다. 웹 기반으로 환경에 제약 없이 누구나 사용할 수 있고 풍부한 유저 인터페이스 제공으로 편리하게 다양한 형태의 데이터 추출이 가능하여 통계 업무가 간소화 된다.