• 제목/요약/키워드: Classification rule

검색결과 543건 처리시간 0.028초

웹 문서를 위한 개선된 문장경계인식 방법 (Improved Sentence Boundary Detection Method for Web Documents)

  • 이충희;장명길;서영훈
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.455-463
    • /
    • 2010
  • 본 논문은 다양한 형태의 웹 문서에 적용하기 위해서, 언어의 통계정보 및 후처리 규칙에 기반하여 개선한 문장경계 인식 기술을 제안한다. 제안한 방법은 구두점 생략 및 띄어쓰기 오류가 빈번한 웹문서에 적용하기 위해서 문장경계로 사용될 수 있는 모든 종결어미를 대상으로 학습하여 문장경계 인식을 수행하였다. 또한 문장경계인식 성능을 최대화하기 위해서 다양한 실험을 통해 최적의 자질 및 학습데이터를 선정하였고, 학습데이터에 의존적인 통계모델의 오류를 규칙에 기반 해서 보정하였다. 성능 실험은 다양한 문서별 성능 측정을 위해서 구두점이 주로 문장경계로 사용된 문어체 위주의 평가셋1(신문기사와 블로그 문서)과 구두점 생략 및 띄어쓰기 오류가 빈번한 웹 문서 위주의 평가셋2(웹 사이트의 게시판 글)를 대상으로 성능을 측정하였다. 평가 척도로는 F-measure를 사용하였으며, 기존 연구와 동일하게 구두점만을 문장경계 대상으로 학습한 기본 모델을 만들어서 실험한 결과, 평가셋1에 대해서 96.5%의 성능을 보였지만, 평가셋2에 대해서는 56.7%로 매우 저조한 성능을 보였다. 제안하는 개선 방법은 기본 모델을 웹 문서의 특징을 반영시키도록 자질 및 엔진을 개선시켰고, 최종 모델을 평가셋2로 평가한 결과, 96.3%의 성능을 보여서 39.6%의 성능 향상이 있음을 확인하였다.

고객유지를 위한 접촉스케줄링시스템의 설계 (Design of Contact Scheduling System(CSS) for Customer Retention)

  • 이재식;조유정
    • 지능정보연구
    • /
    • 제11권3호
    • /
    • pp.83-101
    • /
    • 2005
  • 고객유지는 갈수록 경쟁이 심화되고 있는 생명보험산업에서 핵심이슈 중에 하나이다. 생명보험사들은 고객을 유지하기 위해서 많은 활동들을 한다. 그 가운데 대표적인 것이 바로 지속적으로 고객과 접촉하는 것이다. 본 연구는 접촉스케줄링시스템(CSS: Contact Scheduling System)의 설계에 대한 것으로 해촉된 모집설계사의 고객을 관리해야만 하는 지원설계사의 고객관리를 돕는 것을 목표로 한다 지원설계사는 모집설계사의 고객관리 경험과 지식을 공유할 수 없다. 이런 지원설계사의 고객접촉을 지원하기 위해서, 본 연구에서는 CSS를 설계한다. CSS설계는 두 단계로 이루어지고, CART(Classification And Regression Tree)와 SPM(Sequential Pattern Mining)의 데이터 마이닝 기법을 활용한다. 단계 1에서는 CART 기법을 이용하여 고객을 8개의 고객군으로 분류한다. 단계 2에서는 각 분류고객군에 적합한 접촉내용, 접촉간격 그리고 접촉방법 등의 접촉스케줄링 정보를 생성한다. 접촉내용은 스케줄 접촉내용, 이벤트접촉내용 그리고 비즈니스규칙에 의한 접촉내용의 결합으로 결정되는데 스케줄접촉내용은 SPM 모델의 결과를 통해 생성된다. 또한 본 연구에서 설계한 CSS가 실제상황에서 어떻게 작동하는지를 제시함으로써 CSS가 효율적이고 효과적인 고객접촉에 실용적임을 보인다.

  • PDF

텍스트 마이닝 기법을 이용한 환경 분야의 ICT 활용 연구 동향 분석 (A Study on Environmental research Trends by Information and Communications Technologies using Text-mining Technology)

  • 박보영;오관영;이정호;윤정호;이승국;이명진
    • 대한원격탐사학회지
    • /
    • 제33권2호
    • /
    • pp.189-199
    • /
    • 2017
  • 본 연구는 텍스트 마이닝 기법을 활용하여 환경 분야에서 ICT의 활용 연구동향을 정량적으로 분석하였다. 이를 위해 환경 분야 키워드 38개, ICT 관련 키워드 16개를 바탕으로 국가과학기술정보센터(NDSL)에서 최근 20년(1996년-2015년)의 논문 359편을 수집하였다. 해당 논문을 대상으로 환경 분야 및 ICT 관련 자연어를 처리하여 말뭉치(Corpus)단위로 분류체계를 재구성하였다. 전술된 분류체계의 키워드를 바탕으로 텍스트 마이닝 분석 기법인 빈도 분석, 키워드 분석, 키워드 간 연관규칙을 확인하였다. 그 결과 '환경 일반' 및 '기후' 분야의 키워드 출현 빈도가 전체의 77 %, ICT는 '공공융합서비스' 및 '산업융합서비스'가 약 30 %의 비율을 차지하였다. 시계열 분석을 통해 환경 분야에서의 ICT 활용 연구는 최근 5년(2011년-2015년)사이에 급증하여 과거(1996년-2010년)과 비교하여 약 2배 이상 관련 연구가 증가된 것으로 나타났다. 키워드 간 연관 규칙을 생성하여 환경 분야를 기준으로 나타내었을 때, '환경 일반'은 16개, '기후'는 '14'개의 ICT 기반 기술을 주로 활용하고 있는 것으로 확인하였다.

GIS와 로지스틱 회귀분석을 이용한 멧돼지 서식지 모형 개발 (Wild Boar (Sus scrofa corranus Heude ) Habitat Modeling Using GIS and Logistic Regression)

  • 서창완;박종화
    • Spatial Information Research
    • /
    • 제8권1호
    • /
    • pp.85-99
    • /
    • 2000
  • 보호동물사에 대한 서식지 분포정보는 개발압력이 심한 우리나라에서는 서식지 관리에 있어 매우 중요하다. 본 연구는 GIS와 로지스틱 회귀분석을 이용하여 멧돼지의 서식지 적합성모형을 개발하여 서식지 분포도를 작성하고 본 연구의 결과를 토대로 현재 우리나라의 멸종위기종과 야생동물보호종들의 서식지 관리를 위한 기초를 마련하고자한다. 서식지 모형을 구현하기 위한 연구내용 및 방법은 다음과 같다. 첫째, 멧돼지의 서식지 특성을 파악하기 위하여 GIS 자료를 구축하였다. 멧돼지의 위치파악을 위해 원격무선측정기법과 GPS를 이용하였다 둘째, 멧돼지의 서식지 이용과 유용성에 영향을 미치는 환경인자를 파악하기위해 원격무선측정기법과 GPS를 이용하였다. 둘째, 멧돼지의 서식지 이용과 유용성에 영향을 미치는 환경인자를 파악하기 위해 χ²검정(Chi-square test)을 실시하였다. 마지막으로, 최적 서식지의 분포를 예측하기위한 서식지 적합성모형 개발을 위해 로지스틱 회귀분석을 이용하였다. 본 연구의 결과는 다음과 같다. 첫째, 멧돼지의 서식지 이용특성 분석의 결과, 성별 그리고 활동유형별에서는 뚜렷한 차이를 볼 수 없으나, 계절별 그리고 서식지 유형별에서는 서식지 이용특성의 차이가 뚜렷한 것을 볼 수있었다. 둘째, 서식지 유용성 분석의 결과 멧돼지의 서식환경에 영향을 미치는 자연적인 환경요인으로 표고, 향, 임상 그리고 영급이 유의성이 있는 인자로 나타났다. 반면에, 경사, 능선/계곡 , 물 그리고 일사량의 경우 통계적 유의성이 적어 전반적으로 서식지를 결정하는 환경인자라고 볼 수 없었다. 마지막으로, 개발된 서식지 적합성모형의 결과 예측확률 0.5를 기준으로 전제서식지는 75.00%, 커버서식지는 84.26% 의 높은 분류정확도를 나타내었다. 모형검증의 결과 대상지 내부의 경우 전체서식지가 75.00%로 나타나 본 모형이 신뢰성이 있는 것으로 판단되었다.

  • PDF

선박용 디젤엔진 추진축에서 빙 충격 토크 기진에 의한 과도 비틀림 진동 응답 (Transient Torsional Vibration Response due to Ice Impact Torque Excitation on Marine Diesel Engine Propulsion Shafting)

  • 로날드디.바로;엄기탁;이돈출
    • 한국소음진동공학회논문집
    • /
    • 제25권5호
    • /
    • pp.321-328
    • /
    • 2015
  • 최근 극지 선박의 수요가 늘어나고 있고 IACS(국제선급연합)에서는 대빙 선박에 대한 새로운 기준이 적용되고 있다. 이 선박에서는 추진시스템에 대한 대빙 설계 기준으로 빙 충격 토크는 프로펠러 날개 수를 중심으로 한 조화 함수로 규정되어 있다. 그러나 실 상황에서는 이러한 주기적인 기진 토크보다는 불규칙한 빙의 충격 토크가 발생할 수 있는 확률이 오히려 크다. 이 논문에서는 비틀림진동이 비교적 큰 6개의 실린더를 갖는 디젤엔진을 주 기관으로 한 추진시스템의 안정성을 검토하고자 한다. 특히 불규칙한 빙 충격 토크와 디젤엔진에서 발생하는 진동토크를 동시에 고려하여 비틀림진동의 공진점을 통과할 과도 비틀림 진동 응답을 이론적으로 해석하였다. 여기서 빙 충격토크는 빙이 프로펠러에 부딪칠 때를 여러 유형별로 가상하여 선급에서 규정된 방법에 의해서 구하였다. 전체적인 시스템의 과도응답 해석은 직접적분방법의 하나인 뉴마크(Newmark) 법을 이용하였다.

폭력성 비디오게임에 대한 미국 연방순회항소법원판결이 한국게임법제도에 주는 시사점 : Video Software Dealers Association v. Arnold Schwarzenegger(2009) (Video Software Dealers Association v. Arnold Schwarzenegger(2009) of the United States Court of Appeals, Ninth Circuit and its Implication to the Korean Game Law)

  • 박민;황승흠
    • 한국게임학회 논문지
    • /
    • 제10권1호
    • /
    • pp.65-78
    • /
    • 2010
  • 이 논문은 2009년 2월 20일 미국의 제9 연방순회항소법원에서 내려진 Video Software Dealers Association v. Arnold Schwarzenegger 사건에 대한 판결의 의미와 한국게임법제도에의 시사점을 검토한 것이다. 이 사건에서 제9 연방순회항소법원은 폭력성 비디오게임을 18세 미만의 미성년자에게 판매하거나 대여하는 것을 금지하는 캘리포니아 주법(州法)이 미국 연방헌법에 명시된 미성년자 (minor)의 권리를 침해한다는 판결을 내렸다. 이에 비해서 한국의 헌법재판소는 청소년보호를 위한 청소년유해매체물 제도와 사전등급분류 제도에 대해서는 합헌이라는 결정을 하였다. 헌법재판소는 미국의 제9 연방항소법원의 판결과 같이 음란과 폭력성을 구분하여 접근하고 있고, 폭력성 개념이 대해서 간접적으로 위헌적이라는 결정을 한 바 있다. 미국법원의 덜 제한적인 수단의 선택이라는 법리와 헌법재판소의 최소침해성 원칙에서 본다면 청소년유해매체물 제도와 사전등급분류 제도의 중첩 적용은 문제될 수 있으며, 이 중에서 더 강한 규제가 위헌이 될 소지가 있다.

병원외 심정지 환자의 자발적 순환 회복에 영향을 미치는 요인 (Factors influencing the return of spontaneous circulation of patients with out-of-hospital cardiac arrest)

  • 박일수;김은주;손혜숙;강성홍
    • 디지털융복합연구
    • /
    • 제11권9호
    • /
    • pp.229-238
    • /
    • 2013
  • 병원외 심정지는 오늘날 우리나라의 중대한 보건문제로서, 환자의 퇴원 시 생존율은 3.5%이며, 이 중 1%만이 신경학적 기능을 회복하는 것으로 나타났다. 이처럼 낮은 병원외 심정지 환자의 생존율을 높이기 위해서는 병원 도착 전 환자의 자발적 순환을 회복시키는 것이 매우 중요하다. 따라서 본 연구에서는 질병관리본부의 2009년도 심정지 의무기록 조사 자료를 활용하여 병원외 심정지 환자의 자발적 순환 회복률을 향상시킬 수 있는 요인들에 대한 심층 분석을 수행하였다. 심정지 환자의 자발적 순환 회복에 영향을 미치는 요인은 의사결정나무기법을 적용하여 분석하였으며, 그 결과 도착전 CPR여부, 병원 도착전 심정지 목격여부, 심정지시 활동, 과거력(암/심장질환/뇌졸중), 심정지 발생 장소, 병원전 일반인 CPR여부, 신고~현장 도착까지 걸린 시간, 연령 등이 중요한 요인으로 밝혀졌다. 이 요인들의 조합을 통해 의사결정나무모형으로 분류된 심정지 환자는 총 16개 유형이었으며, 그 중 유형 1의 특징을 갖는 집단의 자발적 순환 회복률(29.6%)이 가장 높게 나타났다. 더불어 비공공장소에서 심정지가 발생한 환자에게 일반인이 CPR을 시행하였을 경우, 심정지 환자의 자발적 순환 회복률이 향상된 것으로 보아 지역주민들에 대한 CPR교육이 중요함을 파악할 수 있었다.

Q, R, S 피크 변화에 따른 개인별 ECG 신호의 패턴 분석 (Pattern Analysis of Personalized ECG Signal by Q, R, S Peak Variability)

  • 조익성;권혁숭;김주만;김선종;김병철
    • 한국정보통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.192-200
    • /
    • 2015
  • 부정맥 분류를 위한 기존 연구들은 특정 ECG 데이터에 종속적으로 개발되었기 때문에 다른 환경에 적용할 경우 그 성능에 변화가 많아 임상 적용에 한계가 있다. 즉, 생체 신호의 특성상 개인 간의 차이가 있음에도 불구하고, 일반적인 ECG 신호의 판단규칙에 따라 진단을 수행하기 때문이다. 또한 이러한 대부분의 방법들은 P, Q, R, S, T 지점의 정확한 측정을 필요로 하며, 데이터의 가공 및 연산이 복잡하다. 따라서 이러한 문제점을 극복하기 위해서는 개인별 특성을 가진 ECG 데이터를 분석하여 최소한의 특징점을 추출함으로써 그에 따른 패턴을 분류하는 것이 필요하다. 본 연구에서는 이상 심전도와 같은 다양한 신호를 고려하여 Q, R, S 피크 변화에 따른 개인별 ECG 신호의 패턴 분석기법을 제안한다. 이를 위해 전처리를 통해 잡음이 제거된 심전도 신호에서 R파를 검출하고 Q, R, S의 진폭과 위상변화에 따른 8개의 특징점을 추출하였다. 이후 각 특징점의 피크 변화와 형태에 따른 ECG 신호를 분석하고 부정맥 유형에 따른 9가지 패턴을 정의하였다. 제안한 방법의 우수성을 입증하기 위해 43개의 MIT-BIH 레코드를 대상으로 Normal, PVC, PAC, LBBB, RBBB, Paced Beat의 각 패턴을 분석하였다. 실험결과 9가지 패턴에 대한 검출율은 93.72%로 우수하게 나타났다.

퍼지 결정트리를 이용한 패턴분류를 위한 데이터 마이닝 알고리즘 (Data Mining Algorithm Based on Fuzzy Decision Tree for Pattern Classification)

  • 이중근;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1314-1323
    • /
    • 1999
  • 컴퓨터의 사용이 일반화됨에 따라 데이타를 생성하고 수집하는 것이 용이해졌다. 이에 따라 데이타로부터 자동적으로 유용한 지식을 얻는 기술이 필요하게 되었다. 데이타 마이닝에서 얻어진 지식은 정확성과 이해성을 충족해야 한다. 본 논문에서는 데이타 마이닝을 위하여 퍼지 결정트리에 기반한 효율적인 퍼지 규칙을 생성하는 알고리즘을 제안한다. 퍼지 결정트리는 ID3와 C4.5의 이해성과 퍼지이론의 추론과 표현력을 결합한 방법이다. 특히, 퍼지 규칙은 속성 축에 평행하게 판단 경계선을 결정하는 방법으로는 어려운 속성 축에 평행하지 않는 경계선을 갖는 패턴을 효율적으로 분류한다. 제안된 알고리즘은 첫째, 각 속성 데이타의 히스토그램 분석을 통해 적절한 소속함수를 생성한다. 둘째, 주어진 소속함수를 바탕으로 ID3와 C4.5와 유사한 방법으로 퍼지 결정트리를 생성한다. 또한, 유전자 알고리즘을 이용하여 소속함수를 조율한다. IRIS 데이타, Wisconsin breast cancer 데이타, credit screening 데이타 등 벤치마크 데이타들에 대한 실험 결과 제안된 방법이 C4.5 방법을 포함한 다른 방법보다 성능과 규칙의 이해성에서 보다 효율적임을 보인다.Abstract With an extended use of computers, we can easily generate and collect data. There is a need to acquire useful knowledge from data automatically. In data mining the acquired knowledge needs to be both accurate and comprehensible. In this paper, we propose an efficient fuzzy rule generation algorithm based on fuzzy decision tree for data mining. We combine the comprehensibility of rules generated based on decision tree such as ID3 and C4.5 and the expressive power of fuzzy sets. Particularly, fuzzy rules allow us to effectively classify patterns of non-axis-parallel decision boundaries, which are difficult to do using attribute-based classification methods.In our algorithm we first determine an appropriate set of membership functions for each attribute of data using histogram analysis. Given a set of membership functions then we construct a fuzzy decision tree in a similar way to that of ID3 and C4.5. We also apply genetic algorithm to tune the initial set of membership functions. We have experimented our algorithm with several benchmark data sets including the IRIS data, the Wisconsin breast cancer data, and the credit screening data. The experiment results show that our method is more efficient in performance and comprehensibility of rules compared with other methods including C4.5.

좌우 이두근의 근전도 출력에 따른 뇌파의 활성도 변화와 관련성 탐색 (Electroencephalogram(EEG) Activation Changes and Correlations of signal with EMG Output by left and right biceps)

  • 전부일;김종원
    • 전기전자학회논문지
    • /
    • 제23권2호
    • /
    • pp.727-734
    • /
    • 2019
  • 본 논문은 인간의 의지가 뇌로부터 전달되는 과정에서 근육의 움직임이나 동작이 뇌의 특정 부위에서 유의미한 특징을 나타내는 신호를 찾아낼 수 있는지를 확인한다. 일반적으로 뇌파의 발생은 특정한 동작을 유발하고 유발된 동작으로부터 신호를 받아 변화를 보인다. 이러한 신호는 불확실성이 높으며 육안으로 판별하기엔 그 차이를 파악하기 어렵다. 따라서 분류에 앞서 어떤 신호를 분석할 것인지 정의하는 과정이 필요하다. 뇌파 혹은 뇌전도의 형태는 주파수 대역별로 분류하였을 경우, 알파, 베타, 델타, 쎄타, 감마의 영역으로 나눌 수가 있다. 뇌파의 측정 부위에 따라 활성화되는 주파수의 대역이나 에너지의 차이가 다르기 때문에 이들 신호의 특정한 크기가 정확한 동작이나 의지를 표현한다고 할 수는 없지만, 특정한 영역에서 다른 동작을 했을 경우의 뇌파 활성도를 기준으로 동작을 분류하거나, 동작에 영향을 미치는 뇌파의 경향성을 판단할 수 있다. 따라서 본 논문에서는 1차적으로 근육의 좌우 이두근의 근전도가 활성화 되는 시점을 기준으로 뇌파의 발현형태를 관찰하고, 이후 좌완과 우완의 근육 활성화에 따른 뇌파의 유의미한 차이를 뇌파를 통해 유추할 수 있는지를 검증한다. 근전도의 좌우활성화에 따른 뇌파의 분류기준을 찾을 수 있다면, 뇌로부터 발현된 신호가 각각의 근육에 전달되는 과정에서 전이된 신호의 형태를 파악하는데 도움을 줄 수 있으며, 향후 더욱 복잡한 뇌신호의 발생 유형을 통해 알려지지 않은 많은 뇌파의 정보를 활용할 수 있을 것으로 판단한다.