• Title/Summary/Keyword: 통계용어

Search Result 108, Processing Time 0.032 seconds

Hangul-Hanja Transfer for Terminology (전문용어 한글-한자 자동 변환)

  • 황금하;배선미;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.886-888
    • /
    • 2004
  • 기존의 한글-안자 변환에서는 문맥정보와 통계정보를 고려하지 않는 사전기반의 단어단위 변환 방법을 사용한 반면, 본 논문에서는 언어모델 밀 변환모델을 이용한 문장단위의 한자 자동변환 방법을 제안하고. 사전 미등록어와 복합어의 한글-한자 변환을 위하여 단어분할을 변환의 숨김 과정으로 처리하는 통합모델을 사용하였다. 실험 결과, 전문용어의 한글-한자 변환에서 제한된 한자 데이터를 이용하여 기존의 사전기반 변환보다 나은 결과를 얻을 수 있었다.

  • PDF

표준품질지수

  • 한근식
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2004.11a
    • /
    • pp.41-48
    • /
    • 2004
  • 2002년 10월 유럽통계협회는 품질지수개발을 위해 협회소속국가들이 연합하여 특별연구팀을 발족시켰다. 이 팀의 주목적은 유럽통계협회에서 생산되는 자료의 품질을 측정하기 위해 대표성이 있으며, 계산하기 쉽고, 이해하기 쉬운 지수를 개발하는 것이었다. 유럽 통계협회는 연구팀에서 개발한 지수를 이용하여 내부품질보고서를 작성하도록 결정하였다. 개발된 풀질지수들은 유럽 통계협회 소속 국가에 의해 생산된 통계에 적용하기 적합해야하며 유럽전체를 위해 Eurostat 이 보유하고 있는 통계에도 적합해야한다. 그러므로 지수들은 각 국이 합의한 용어, 공식, 변수, 도메인, 분석의 정도를 고려하여 개발되도록 하였다. 이러한 지수는 정기적으로 생산되도록 규정하고 있으며 이 규정이 지켜지기 위해서는 동일한 변수, 공식 통이 적용되어야함은 물론이고 시계열의 유지를 위해 관련된 메타데이터가 제공되어야한다. 서로 다른 조사결과로부터 관련된 통계량의 측정과 개념들간의 차이를 확인하기 위해서 메타데이터는 반드시 필요하며 품질보고서가 있는 경우 많은 도움이 릴 것이다. 본 연구에서는 동계생산자의 관점에서 본 각각의 품질 요소에 따라서 생산된 다양한 통계의 풀질을 평가하기 위해서 개발된 일련의 표준화된 품질지수를 제시할 것이다. 각 지수들의 정의와 가장 대표적인 지수산출을 제안하고 지수산출을 위해 필요한 메타데이터를 선명한 것이다.

  • PDF

Automatic Document Categorization by the Importance of Features (자질 중요도 계산 기법에 의한 자동문서 범주화)

  • 이경찬;강승식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.537-539
    • /
    • 2003
  • 문서 범주화를 위해 자질을 선별하는 기법으로는 자질의 출현 빈도에 따라 범주를 대표하는 자질들을 선별하는 것이 일반적이다. 출현 빈도에 의한 자질을 선별하는 통계적인 기법은 문서의 내용을 대표하는 용어들의 중요도를 간과하는 문제가 발생한다. 본 논문에서는 학습 문서 및 실험 문서에서 자질의 중요도에 의해 범주 대표어를 선별하는 문서 범주화 기법을 제안하였으며, 역범주 빈도 및 카이제곱 통계량에 의해 자질을 선별하는 방법과 비교-실험을 하였다. 문서 범주화 모델로는 나이브 베이지언 확률 모델을 이용하였으며, 성능 평가를 위해서 웹 디렉토리에서 수집된 데이터를 이용하여 실험하였다. 본 논문에서 제안한 자질 중요도에 의한 자질 선별 기법은 용어의 출현 빈도 및 카이제곱 통계량에 의해 자질을 선별한 방법보다 더 나은 성능을 보였다.

  • PDF

Performance Improvement of Extracting Bilingual Term from Phrase Table using Sentence Length Reduction (문장 길이 축소를 이용한 구 번역 테이블에서의 병렬어휘 추출 성능 향상)

  • Jeong, Seon-Yi;Lee, Kong-Joo
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.120-125
    • /
    • 2013
  • 본 연구는 대량의 특정 도메인 한영 병렬 말뭉치에서 통계 기반 기계 번역 시스템을 이용하여 병렬어휘를 효과적으로 추출해 낼 수 있는 방법에 관한 것이다. 통계 번역 시스템에서 어족이 다른 한국어와 영어간의 문장은 길이 및 어순의 차이로 인해 용어 번역 시 구절 번역 정확도가 떨어지는 문제점이 발생할 수 있다. 또한 문장 길이가 길어짐에 따라 이러한 문제는 더욱 커질 수 있다. 본 연구는 이러한 조건에서 문장의 길이가 축소된 코퍼스를 통해 한정된 코퍼스 자원 내 구 번역 테이블의 병렬어휘 추출 성능이 향상될 수 있도록 하였다.

  • PDF

A study for the standardization of statistics terminologies and statistics education in korea (통계교육과 용어 표준화를 위한 고찰)

  • 崔泳浩
    • The Korean Journal of Applied Statistics
    • /
    • v.2 no.2
    • /
    • pp.53-59
    • /
    • 1989
  • In this thesis, I have discussed the historical backgrounds of statistical education in kores from 1900 to present. And, I have compared statistical terminologies between theoretical statistics and applied statistics for the standardization of the statistical terminologies. Finally, I present some sugestion for the standardization of terminologies in statisetics.

  • PDF

프랜시스 골턴 다시 읽기

  • Jo, Jae-Geun
    • Proceedings of the Korean Statistical Society Conference
    • /
    • 2005.11a
    • /
    • pp.113-116
    • /
    • 2005
  • 오늘날 대부분의 통계학 교과서에서 프랜시스 골턴(Francis Galton 1822-1911)은 비록 "회귀(regression)"라는 용어를 처음 사용한 인물이기는 하되, 그가 생각했던 "평균으로의 회귀(regression to the mean)"라는 것은 오늘날의 회귀분석과는 거리가 먼 것이라는 언급과 함께 짧게 소개된다. 이 글에서는 바로 그 골턴이 직접 쓴 것들을 다시 읽어보고 골턴 자신과 후세에 소개되는 골턴 사이의 거리를 살펴보려 한다. 그 결과 골턴은 통계학의 역사에서 여러 가지로 흥미로운 인물이므로 그의 이름이 통계학 교육 내용 중에 지금보다는 조금 더 등장해도 좋을 것으로 보인다.

  • PDF

Comprehensive Diagnosis and Improvement Plans on Agricultural Production Cost Survey Statistics (농축산물생산비조사 통계의 종합적 품질 진단 및 개선 방안)

  • Koo, Seung-Mo;Kim, Sounghun;Lee, Kay-O;Sohn, Chang-Soo;Han, Suk-Ho
    • Journal of agriculture & life science
    • /
    • v.45 no.6
    • /
    • pp.291-301
    • /
    • 2011
  • This study is based on the diagnosis process on agricultural production cost survey, which is one of the most representative public statistics of agricultural sector in Korea. The diagnosis were performed by employing the quantitative and qualitative approaches with the official guideline provided by the Ministry of Statistics. The various results were produced from the aspects of exactness, relevance, timeliness, accessibility, and comparability, which were based on the qualitative approaches including focus group interview (FGI) with professional users. The results from statistical portfolio analysis implies that the first priority to improve the statistics is given to 'satisfaction level corresponding to user cost' and 'offering sufficient explanation'. The comprehensive results, discussed with the administrative office, are summarized into the following two major points. First, classification of the detailed items should be improved to avoid users' confusion. However, the re-classification need to be professionally reviewed with the relevant administrative office such as Rural Development Administration, producing similar statistics. Second, the KOSIS system is found to be constantly upgraded to improve the users' convenience.

특허조사에서 온라인 검색의 역할

  • Kim, Su-Cheon
    • Digital Contents
    • /
    • no.2 s.57
    • /
    • pp.55-57
    • /
    • 1998
  • 검색이란 데이터베이스에 축적된 막대한 데이터로부터 필요로하는 데이터를 찾아내는 조사로서, 통신회선을 이용하여 리얼타임으로 결과를 인출하는 것이 온라인 검색이다. 데이터베이스의 내용으로는 학술문헌, 신문기사, 물성 데이터, 통계 데이터, 기업 데이터 등 여러 분야에 대한 자료를 포함하며 특허도 이에 포함된다. 본 자료는 특허 조사에서 온라인 검색의 역할과 특징에 대하여 이야기 하고자 한다. 특허에는 특허와 실용신안 그리고 이들의 공개, 공고, 등록의 여러 형태가 존재하나, 여기서는 이를 총칭하여 특허라는 용어로 사용하고자 한다.

  • PDF

Analysis of the Yearbook from the Korea Meteorological Administration using a text-mining agorithm (텍스트 마이닝 알고리즘을 이용한 기상청 기상연감 자료 분석)

  • Sun, Hyunseok;Lim, Changwon;Lee, YungSeop
    • The Korean Journal of Applied Statistics
    • /
    • v.30 no.4
    • /
    • pp.603-613
    • /
    • 2017
  • Many people have recently posted about personal interests on social media. The development of the Internet and computer technology has enabled the storage of digital forms of documents that has resulted in an explosion of the amount of textual data generated; subsequently there is an increased demand for technology to create valuable information from a large number of documents. A text mining technique is often used since text-based data is mostly composed of unstructured forms that are not suitable for the application of statistical analysis or data mining techniques. This study analyzed the Meteorological Yearbook data of the Korea Meteorological Administration (KMA) with a text mining technique. First, a term dictionary was constructed through preprocessing and a term-document matrix was generated. This term dictionary was then used to calculate the annual frequency of term, and observe the change in relative frequency for frequently appearing words. We also used regression analysis to identify terms with increasing and decreasing trends. We analyzed the trends in the Meteorological Yearbook of the KMA and analyzed trends of weather related news, weather status, and status of work trends that the KMA focused on. This study is to provide useful information that can help analyze and improve the meteorological services and reflect meteorological policy.

An assessment of statistical errors of articles in the Journal of Korean Academy of Prosthodontics: Comparison between Korean version and English version (대한치과보철학회지에 게재된 논문의 통계적 오류: 국문논문과 영문논문의 비교)

  • Park, Dong-Gyu;Choi, Yong-Geun;Kim, Young-Su;Shin, Sang-Wan
    • The Journal of Korean Academy of Prosthodontics
    • /
    • v.47 no.3
    • /
    • pp.273-285
    • /
    • 2009
  • Statement of problem: The aim of dental research is to advance scientific knowledge and leads to improvement in the treatment and prevention of dental disease. Utilizing an effective research design and adequate statistical methods are essential procedures ensuring that the results of researches are based on evidences. A research should utilize proper statistical methods without statistical errors; Otherwise, it could adversely affect clinical practice and future research. Purpose: This study was made to investigate the statistical methods used in the Journal of Korean Academy of Prosthodontics (JKAP) and then to assess them for the statistical errors. Material and methods: Among the total of 399 articles in the JKAP published from 2000 to 2006, 292 articles using statistics were reviewed. The validity of the statistical methods used in them were assessed using a checklist based on the guideline for statistical reporting in the uniform requirements for manuscripts submitted to biomedical journals by International Committee of Medical Journal Editors. The checklist consisted of three categories of statistical errors: 1) Unspecified computer statistical packages, 2) Inadequate description of statistical methods, 3) Misuse of statistical terms. Then, the results were compared between the Korean version and the English version in the JKAP. Results: Among the 212 articles using statistics in the Korean version, 115 articles (54%) and among the 80 articles using statistics in the English version, 47 articles (59%) were shown to have unspecified computer statistical packages without statistically significant difference (P = .66). Likewise, 101 articles (48%) in the Korean version and 25 articles (31%) in the English version were shown to have the inadequate description of statistical methods without statistically significant difference (P = .09). However, 114 articles (54%) in the Korean version and 19 articles (24%) in the English version were shown to have the misuse of statistical terms with statistically significant difference (P = .01). Conclusion: Some of the articles in the JKAP had inadequate statistical validity, given the statistical errors identified in this assessment. Hence, dental researchers should be more careful when it comes to describing and applying statistical methods.