• 제목/요약/키워드: 자동분석

검색결과 5,320건 처리시간 0.034초

품사태그부착 코퍼스 구축을 위한 한국어 품사태깅 워크벤치 (The Korean Part-of-speech Tagging Workbench for Tagged Corpus Construction)

  • 박영찬;김남일;허욱;남기춘;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.94-101
    • /
    • 1997
  • 한국어의 언어분석을 위한 가공코퍼스의 하나인 품사부착 코퍼스는 형태소 언어분석의 기초가 되는 자료로서 각종 언어분석 모델의 학습자료와 관측자료 또는 검증자료로서 중요한 역할을 한다. 품사부착 코퍼스의 구축은 많은 노력과 시간이 요구되는 어려운 작업이다. 기존의 구축방법은 자동 태거의 결과를 일일이 사람이 확인해 가면 오류를 발견하고 수정하는 단순 작업이었다. 이러한 단순 작업은 한번 수정된 자동태거의 반복적 오류, 미등록어에 의한 오류 들을 계속적으로 수정해야하는 비효율성을 내포하고 있었다. 본 논문에서는 HMM기반의 자동 태거를 사용하여 1차적으로 한국어 문서를 자동 태깅한다. 자동 태깅 결과로부터 규칙기반의 오류 수정을 추가적으로 행한다. 이렇게 구축된 결과를 사용자에게 제시하여 최종 오류를 수정하고 이를 앞으로의 태깅작업에 반영하는 품사부착 워크벤치에 대해 기술한다.

  • PDF

정기여객선 자동관측 시스템과 원격탐사 자료를 이용한 서해 연안 해수 모니터링 (Monitoring of the Yellow Sea Coastal Waters Using Ferry Box and Remotely Sensed Data)

  • 유주형;문정언;민지은;안유환
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2006년도 춘계학술대회 논문집
    • /
    • pp.87-90
    • /
    • 2006
  • 인천-제주 정기여객선에 수온, 클로로필 및 탁도계 등의 센서를 설치하여 해양환경 모니터링 시스템을 구축하였으며, 여객선 항로를 따라 2001년부터 2004년까지 18회에 걸쳐 자동관측과 함께 20-30분 간격으로 30여개의 정점에서 해수를 채수하여 분석하였다. 연구의 목적은 채수된 해수를 직접 분석하여 여객선에 설치된 자동측정 센서가 신뢰성 있는 자료를 생산하는지 비교 분석하는 것과 서해 한반도 연안의 해수특성을 전체적으로 이해함으로서 계절적인 변동을 파악하는 것이다. 2001-2003년 초까지 사용된 YSI 센서는 수온, 염분, 탁도와 클로로필 농도 등을 종합적으로 측정할 수 있는 멀티센서이나, 설치하여 운용해 본 결과 정밀도에서 많은 문제점이 발생하였다. 따라서 2004년 이후 클로로필과 탁도 자동 측정을 위한 단일 센서들로 교체되었으며 이들 센서는 멀티센서 보다 좋은 결과를 보였다. 비록 자동측정 장치에 문제는 있었으나, 18회에 걸친 서해 연안의 실시간 모니터링을 통하여 해수환경의 계절별 특성을 이해할 수 있었다. 부유퇴적물의 경우, 경기만과 목포 주변의 남쪽 해안은 농도가 모든 계절에서 높게 나타났으며 특히 가을 겨울철에 가장 높은 값을 나타냈다. 클로로필의 농도도 경기만 중심지역과 남쪽 해안에서 여름과 가을철에 걸쳐 0.4 - 6.0 $mg/m^3$ 정도의 분포를 보였으나 겨울철에는 2.6 $mg/m^3$ 미만으로 나타났다.

  • PDF

감성공학 문서 데이터의 지표 자동화를 위한 코퍼스 분석 기반 특성정보 추출 (Extraction of Informative Features for Automatic Indexation of Human Sensibility Ergonomic Documents)

  • 배희숙;곽현민;채균식;이상태
    • 감성과학
    • /
    • 제7권2호
    • /
    • pp.133-140
    • /
    • 2004
  • 최근 대량으로 쏟아지는 감성공학 연구 결과와 논문들을 가치 있는 자료로 만들기 위해서는 감성 데이터가 산업 전반에 활용될 수 있도록 지표로 정리해야 한다. 본 논문에서는 "웹기반 감성 데이터 베이스 구축 및 보급에 관한 연구" 과제를 통해 작성된 감성 데이터 지표에 입각해서 앞으로 대량으로 출현할 감성공학 데이터의 지속적인 지표화를 위한 과정의 자동화를 제안한다. 문서 데이터의 지표화 작업이 자동요약과 유사하다는 점에 착안하여 자동지표화 시스템을 위한 기술들의 기초가 되는 정보유형 및 주요어 추출, 특성표현을 통한 정보문 추출에 대해 감성공학 코퍼스 분석을 통해 연구하고자 한다. 이는 감성공학 분야에서의 지식관리 시스템이나 자동요약 시스템에 활용될 수 있다. 활용될 수 있다.

  • PDF

다수 형태소 분석 결과를 활용한 표준 말뭉치 반자동 구축 (Korean Linguistic GS Set Semi-Automatic Construction using Multiple POS taggers)

  • 김태영;류법모;김한샘;오효정
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.481-484
    • /
    • 2019
  • 최근 한국어 정보처리를 위한 대용량 언어분석 표준 말뭉치(GS:Gold Standard Set)를 구축하고 이를 공유·확산하기 위한 국가차원의 지원이 이뤄지고 있다. 본 연구는 이러한 사업의 일환으로, 현재 국내에서 개발된 다양한 한국어 언어분석 모듈을 활용하여 공통 정답셋을 구축하기 위한 방법론을 제시하고자 한다. 특히, 대량의 학습셋을 구축하기 위해 다수의 모듈(N-modules)로부터 제시된 후보 정답을 참조, 오류 형태를 분류하여 주요 유형을 반자동으로 보정함으로써 수작업을 최소화하였다. 본 연구에서는 우선 첫 단계인 형태소 분석 모듈 적용 결과를 토대로 표준 말뭉치를 구축한 결과에 대해 논하고자 한다.

  • PDF

소셜 빅데이터 마이닝 기반 이슈 분석보고서 자동 생성 (Automatic Generation of Issue Analysis Report Based on Social Big Data Mining)

  • 허정;이충희;오효정;윤여찬;김현기;조요한;옥철영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권12호
    • /
    • pp.553-564
    • /
    • 2014
  • 본 논문은 지금까지의 소셜미디어 분석과 분석보고서 생성의 세 가지 문제점을 해결하기 위해서 소셜 빅데이터 마이닝에 기반한 이슈분석보고서 자동 생성 시스템을 제안한다. 세 가지 문제점은 분석의 고립성, 전문가의 주관성과 고비용에 기인한 정보의 폐쇄성이다. 시스템은 자연언어 질의분석, 이슈분석, 소셜 빅데이터 분석, 소셜 빅데이터 상관성분석과 자동 보고서 생성으로 구성된다. 생성된 보고서의 유용성을 평가하기 위해, 본 논문에서는 리커트척도를 사용하였고, 빅데이터 분석 전문가 2명이 평가하였다. 평가결과는 리커트 척도 평가에서 보고서의 품질이 비교적 유용하고 신뢰할 수 있는 것으로 평가되었다. 보고서 생성의 저비용, 소셜 빅데이터의 상관성 분석과 소셜 빅데이터 분석의 객관성 때문에, 제안된 시스템이 소셜 빅데이터 분석의 대중화를 선도할 것으로 기대된다.

인터넷 여론 정보수집시스템과 관련 국내외 연구 동향 분석 (Internet based opinion collection System with current text filtering techniques survey)

  • 김시우
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2008년도 제38차 하계학술발표논문집 16권1호
    • /
    • pp.85-89
    • /
    • 2008
  • 웹상에서 자동 데이터 추출과 분석기법은 최근 검색분야의 주요이슈이다. 본 논문은 웹상의 자동 설문조사 시스템에 관한 연구이다. 그리고 기존의 Corpus의 성향을 분석하고 검색 및 분석 시스템의 항목들을 정의하였다. 또한 Corpus를 이용한 웹 검색 및 분석 시스템의 활용 분야를 기술하고 향후 개발 방향을 기술하였다.

  • PDF

자동유량관측소 초음파산란도를 활용한 부유사농도 측정을 위한 소프트웨어 개발 (Development of Software for Measuring Suspended Sediment Concentration Using Acoustic Backscatter Data from Automatic Flow Monitoring Station)

  • 손근수;노영신;김동수;최수인
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.489-489
    • /
    • 2023
  • 최근 유량 측정을 위해 사용되는 ADCP를 통해 부가적으로 측정되는 초음파산란도 자료를 활용하여 부유사농도를 측정하는 연구가 수행되고 있다. 이에 국내에서는 국가하천에 설치되어 있는 자동유량관측소의 초음파산란도를 활용하여 연속적인 부유사농도를 측정하는 연구가 수행되고 있다. 이를 통해 10분 단위로 연속적인 유사량 자료를 생산할 수 있을 것으로 기대되며, 현재 유사량 측정결과의 제공을 위해 사용되는 유량-유사량 관계곡선의 산포로 인한 신뢰도 문제를 개선할 수 있을 것으로 기대되고 있다. 그러나, 이미 설치된 자동유량관측소의 H-ADCP 원시데이터를 활용하여 다지점에서 부유사농도를 측정에 대한 분석을 수행하기 위해서는 초음파산란도의 보정, 관계식 개발, 관계식 적용을 통한 유사량 측정 결과의 분석을 위한 소프트웨어 개발이 필요하다. 이에 본 연구에서는 초음파산란도 자료를 이용하여 부유사농도를 분석할 수 있는 소프트웨어 개발하고자 하였다. 개발된 소프트웨어는 Microsoft Visual Studio를 이용하여 C# 언어를 사용하여 개발하였으며, ComponentOne 라이브러리를 활용하여 그래픽 사용자 인터페이스(GUI)를 구현하였다. 소프트웨어의 구성은 H-ADCP 원시자료와 실측 부유사농도 자료와의 시간동기화를 통해 동일시간에서 측정된 자료를 획득, 초음파산란도의 보정과 지표로 활용할 초음파산란도의 측정영역 분석, 초음파산란도-부유사농도와의 다중 회귀를 통한 관계식 개발 및 통계 분석결과 도출, 관계식을 활용한 부유사농도 계산을 수행할 수 있도록 구성하였다. 본 연구를 통해 개발된 소프트웨어를 통해 추후에 시범적용 예정인 자동유량관측소의 초음파산란도를 활용 부유사농도 측정 방법에 대한 분석 효율성을 향상시키고, 지속적인 개선을 통해서 실제 실무에서 활용이 가능할 것으로 기대된다.

  • PDF

머신러닝 모델을 이용한 파이썬 자동채점 연습문제의 타당성 분석 (Validity Analysis of Python Automatic Scoring Exercise-Problems using Machine Learning Models)

  • 허경
    • 실천공학교육논문지
    • /
    • 제15권1호
    • /
    • pp.193-198
    • /
    • 2023
  • 본 논문은 파이썬 프로그래밍 교육에서 단원별 연습문제의 타당성을 분석하였다. 단원별로 제시되는 연습문제는 온라인 학습 시스템을 통해 제시되고 학생 각자가 답안 코드를 업로드하여 자동으로 채점된다. 한학기 동안 진행되는 파이썬 교육을 통해, 학생들의 중간시험점수, 기말시험 점수 그리고 각 단원별 연습문제 점수 등 데이터가 수집된다. 수집된 데이터들을 통해, 자동채점 연습문제들의 타당도를 분석하여 단원별 연습문제들을 개선할 수 있다. 본 논문에서는 자동 채점 연습문제들의 타당도를 분석하기 위해, Orange 머신러닝 도구를 사용하였다. 파이썬 과목에서 수집된 데이터를 전체, 상위권 그리고 하위권 그룹별로 4가지 분석을 실시하고 종합적으로 비교한다. 파이썬 단원별 연습문제 점수들로부터 학생의 최종 성적을 예측하는 머신러닝 모델의 예측 정확도로부터 단원별 자동채점 연습문제의 출제 타당도를 분석하였다.

단일 키넥트를 이용한 골프 스윙 특징의 자동 추출 (Automatic extraction of golf swing features using a single Kinect)

  • 김병기
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권12호
    • /
    • pp.197-207
    • /
    • 2014
  • 본 논문에서는 실용적인 TOF 카메라인 키넥트(Kinect) 한 대를 이용하여 골프 스윙의 자동 분석에 필요한 스윙 특징들을 자동 추출하는 효율적인 방법을 제안하였다. 제안한 방법은 키넥트가 제공하는 관절정보와 깊이(Depth) 정보를 이용하여, 골프스윙에서 중요한 7개의 키프레임과 각 키프레임에서 중요한 스윙특징들을 자동 추출한다. 10명의 골퍼들로부터 구한 50회의 스윙데이터에 대하여 성능을 확인 하였다. 제안한 방법은 설치가 간단하면서도 비용이 저렴한 환경에서 의미 있는 3차원 골프스윙 특징 추출이 가능하고, 구체적인 수치 값을 자동으로 제시하므로 실제적인 자가 스윙분석 시스템 개발에 사용될 수 있다는 점에서 의의가 있다.

MPLS 통신망에서의 신속한 장애복구를 위한 서브네트워크 기반의 세그먼트 단위 자동복구 기법 (Subnetwork-based Segment Restoration for fast fault Recovery in the MPLS network)

  • 신해준;장재준;김영탁
    • 한국통신학회논문지
    • /
    • 제27권11C호
    • /
    • pp.1046-1054
    • /
    • 2002
  • 본 논문에서는 복구시간의 최소화 및 효율적인 복구 자원 사용을 위한 서브네트워크 기반의 세그먼트 복구 방법을 제안한다. 또한 서브네트워크의 분할에 있어서의 특성을 분석하여 서브네트워크의 크기와 그에 따른 자동복구 방법의 성능을 비교하고 분석한다. 세그먼트 복구는 대규모 통신망을 다수개의 소규모 서브네트워크로 분할하고, 각 서브네트워크 구간에 설정되어있는 세그먼트 별로 자동복구를 수행한다. 시뮬레이션 결과에서 세그먼트 자동복구 방법이 링크 자동복구보다는 복구 자원 사용 면에서 우수하였고 경로 자동복구보다는 복구시간 면에서 장점을 가지는 것을 확인할 수 있었다.