• Title/Summary/Keyword: 통계 처리

Search Result 3,103, Processing Time 0.036 seconds

Performance Improvement of POS tagging for English Unknown words Using Affixes (접사 정보를 이용한 영어 미등록어의 품사부착 성능개선)

  • Kim, Hyung-Chul;Kim, Jae-Hoon;Choi, Yun-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.186-190
    • /
    • 2009
  • 품사 부착은 각종 자연어처리의 기본적인 요소이며, 크게 규칙 기반 방법과, 통계 기반 방법으로 나눌 수 있다. 대부분은 통계 기반의 기계학습을 이용하고 있으며, 대개 95% 이상의 성능을 보여주고 있다. 그러나 미등록어에 대해서는 성능이 그다지 높지 않다. 이 논문에서는 단어의 접사 정보를 이용해서 미등록어에 대한 품사 부착의 성능을 높이는 방법을 제안한다. 제안된 시스템은 CRF(Conditional Random Fields)를 이용하며, 그 자질의 일부로 접사 정보를 이용한다. 그 결과 미등록어에 대해서 약 40%의 성능이 개선되었다. 앞으로 미등록어에 적합한 자질을 연구하고 개발할 필요가 있을 것으로 생각된다.

  • PDF

Improving the Performance of Statistical Context-Sensitive Spelling Error Correction Techniques Using Default Operation Algorithm (Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상)

  • Lee, Jung-Hun;Kim, Minho;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.165-170
    • /
    • 2016
  • 본 논문에서 제안하는 문맥의존 철자오류 교정은 통계 정보를 이용한 방법으로 통계적 언어처리에서 가장 널리 쓰이는 샤논(Shannon)이 발표한 노이지 채널 모형(noisy channel model)을 기반으로 한다. 선행연구에서 부족하였던 부분의 성능 향상을 위해 교정대상단어의 오류생성 및 통계 데이터의 저장 방식을 개선하여 Default 연산을 적용한 모델을 제안한다. 선행 연구의 모델은 교정대상단어의 오류생성 시 편집거리의 제약을 1로 하여 교정 실험을 하지만 제안한 모델은 같은 환경에서 더욱 높은 검출과 정확도를 보였으며, 오류단어의 편집거리(edit distance) 제약을 넓게 적용하더라도 신뢰도가 있는 검출과 교정을 보였다.

  • PDF

Implementation of String Selectivity Estimation for Range-based Predicate (범위 술어에 대한 문자열 선택도 추정 구현)

  • Kim, Jae-Myung;Lee, Mi-Young;Lee, Sang-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.357-360
    • /
    • 2006
  • 범위 술어에 대한 문자열 선택도 추정은 해당 문자열 범위를 숫자 표현으로 변환 해야 하는 어려움이 있다. 하지만 문자열을 숫자 표현으로 변환할 경우 각각의 바이트에 대한 모든 경우의 수를 모두 고려해야 한다. 따라서 변환 시 문자열 뒷부분에 대한 정보를 고려할 수 없는 문제가 발생한다. 최근 연구되고 있는 부분 문자열에 대한 선택도 추정 방식을 적용할 경우 통계정보와 추정에 대한 연산이 증가되는 단점이 있다. 따라서 이는 범위 술어에 대한 추정만을 위해 사용하기에는 적합하지 않다. 따라서 이 논문에서는 B+ Tree 인덱스의 제한적인 통계정보만을 가지고 범위 술어에 대한 문자열 선택도를 추정하는 방법으로 알티베이스에 구현하였다.

  • PDF

Performance Improvement of Regression Neural Networks by Using PCA and Zero-Mean Normalization (영평균 정규화와 PCA를 이용한 회귀 신경망의 성능개선)

  • Park, Yong-Soo;Cho, Yong-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2001.10a
    • /
    • pp.515-518
    • /
    • 2001
  • 본 논문에서는 전처리단계로 영평균 정규화 기법과 주요성분분석 기법을 도입하여 다층신경망을 이용한 고신뢰성의 회귀분석 모델을 제안한다. 영평균 정규화 기법은 데이터의 1차적 통계성을 고려하여 알고리즘을 간략화시키며, 주요성분분석 기법은 입력 데이터의 2차적 통계성을 고려하여 독립인 특징들의 집합으로 변환시켜 학습데이터의 차원을 감소시킬 수 있어 고차원의 학습데이터에 따른 회귀분석 모델의 제약을 해결할 수 있었다. 제안된 기법의 신경망을 3개의 독립변수를 가진 암모니아 제조공정문제와 10개의 독립변수를 가진 자동차 연비문제에 각각 적용하여 시뮬레이션한 결과, 단순정규화나 PCA를 적용하지 않는 경우보다 제안된 기법의 학습속도와 회귀성능이 더욱 더 우수함을 확인할 수 있었다.

  • PDF

Study on the method of acquiring GPU usage statistics information in cluster system (클러스터 시스템에서 GPU 사용 통계정보 획득 방안에 대한 연구)

  • Kwon, Min-Woo;Kim, Sung-Jun;Yoon, JunWeon;Hong, TaeYoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.10a
    • /
    • pp.476-477
    • /
    • 2018
  • 한국과학기술정보연구원에서는 최근 빅데이터, 인공지능에 관한 연구 인프라 수요를 대응하기 위해 슈퍼컴퓨터 4호기 보조 가속기 시스템인 GPU 클러스터를 운영 중에 있다. GPU 클러스터 시스템은 사용자들 간에 효율적인 작업 배분을 위해 SLURM JOB 스케줄러를 이용하고 있다. 본 논문에서는 SLURM JOB 스케줄러를 통해 실행되는 사용자의 작업별 GPU 사용 통계 정보를 획득하는 방안에 대하여 소개한다.

TraZer : Implementation of Traffic Analyzer for Efficient Network Management (TraZer : 효율적인 네트워크 관리를 위한 트래픽 분석기의 구현)

  • Lee, Sang-Young;Min, Zee-Young;Lee, Sang-Do;Chang, Beom-Hwan;Chung, Tai-Myoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2002.04b
    • /
    • pp.1385-1388
    • /
    • 2002
  • 인터넷의 기하 급수적인 발전과 더불어 네트워크 기반의 서비스가 확대되고 있다. 따라서 이전까지의 호스트 기반의 네트워크 관리와 더불어 트래픽 기반의 네트워크 관리가 요구되고 있으며, 이에 본 논문에서는 트래픽 기반의 네트워크 관리 시스템에 대하여 알아보고자 한다. 현재 개발된 시스템과 같은 단순한 트래픽의 모니터링과 분석뿐만 아니라 통계 정보를 제공하는 시스템을 제안하고, 시스템의 설계와 구현에 대하여 논의한다. 본 시스템은 프로토콜의 발신지와 목적지 그리고 프로토콜의 크기 등의 분석과 통계를 제공함으로서, 네트워크의 성능 뿐 아니라 장애 및 보안 관리에도 유용할 것이다.

  • PDF

Bayesian control problem in multivariate mixture model (다변량 혼합모형에서 통계적 제어문제의 베이지안적 고찰)

  • 이석훈;박래현;최종석
    • The Korean Journal of Applied Statistics
    • /
    • v.3 no.2
    • /
    • pp.27-37
    • /
    • 1990
  • We consider the statistical control problem for the mixture model in which one can choose the values of independent variables that produce the values of the dependent variables as close to the target values as possible. The theory suggested for the problem is reviewed and an extended model with respect to the assumption of variance and the number of dependent variables is suggested. A Basyesian treatment is studied for the above problem with example as an illustration.

  • PDF

A Design of Personalized Daily Nutrition Feedback System for Cultivating Healthy Eating Habit (건강한 식습관 형성을 위한 개인맞춤형 일일 영양 피드백 시스템 설계)

  • Oh, Yoori;Choi, Jieun;Jeon, Youngran;Kim, Yoonhee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.531-533
    • /
    • 2015
  • 전 세계적으로 건강이 큰 관심사가 되면서 건강한 생활을 위한 식습관 관리의 중요성이 대두되고 있다. 이에 따라 여러 가지 건강관리 시스템들이 등장하고 있지만 기존의 시스템의 경우, 입력된 식단에 단순한 통계를 제공하는 정도의 수준이다. 또한 개인화된 서비스를 제공하지 않고 사용자에게 실질적으로 필요로 하는 정보를 제공하지 않는다. 따라서 개인의 상황에 알맞은 섭취 식단에 대한 피드백을 제공하는 시스템이 필요하다. 본 논문에서 제안하는 시스템은 개인이 입력한 신체정보 및 식단 정보를 바탕으로 섭취한 식단에 대한 통계 및 개인맞춤형 피드백 기능을 제공하여 사용자의 건강한 식품관 형성에 도움을 줄 수 있다.

A study on Gunsan crime mapping system (군산 범죄예방 시스템에 관한 연구)

  • Han, Dong-Yup;On, Byung-Won
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1638-1641
    • /
    • 2015
  • 최근 다양한 공공 데이터가 속속 개방되고 있지만, 지역 내의 범죄 데이터는 통계 데이터 이외에는 공개되지 않고 있다. 이처럼 공공 데이터의 확보가 어려운 경우에는 해당 지역 내의 범죄 관련 모든 온라인 뉴스 기사를 주기적으로 수집하고 범죄 현황에 관한 정보를 자동으로 추출하여 맵(map)에 시각화 하여 보여주는 프레임워크의 개발이 필요하다. 본 논문에서는 프레임워크 개발에 필요한 주요 알고리즘들과 효과적인 시각화 방안을 제안한다. 또한 이미 공개된 군산시의 범죄 발생 통계 자료를 비교하여 제안 시스템의 효용성을 평가한다.

A Study on Computerization Method for the Yearbook of Road Statistics (도로현황조서시스템 전산화 방안 연구)

  • Lim, Jae-Kyu;Kim, Young-Jin;Kim, Byung-Kon;Lee, Seok-Won;Park, Jhung-Kyu
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1750-1753
    • /
    • 2012
  • 국토해양부는 합리적인 정책결정의 지원을 위해 매년 전국의 도로연장통계 등을 기재한 도로현황조서를 책자의 형태로 발간하고 있으며, 도로현황조서의 신속한 자료 취합 및 시의적절한 맞춤형 통계자료 제공 등 활용성 제고를 위해 도로현황조서시스템 구축을 진행하고 있다. 본 연구에서는 기존 도로 현황조서 작업업무 및 제한사항을 분석하여, 도로현황 정보에 대한 다양한 요구사항에 대처하기 위해 웹기반으로 전산화하는 방안에 대하여 기술하고자 한다.