• Title/Summary/Keyword: 오류 분류 패턴

Search Result 72, Processing Time 0.024 seconds

소셜 미디어 상 고객피드백을 위한 감성분석 (The Sensitivity Analysis for Customer Feedback on Social Media)

  • 송은지
    • 한국정보통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.780-786
    • /
    • 2015
  • SNS 등과 같은 소셜 미디어는 실시간으로 자발적인 고객의 의견들을 대거 포함하고 있어 최근 기업들은 효율적인 경영을 위해 소셜 미디어상의 빅 데이터를 분석하는 시스템을 이용하여 고객피드백에 관한 정보를 수집하고 분석하고 있다. 그러나 온라인 사이트에서 수집한 데이터는 띄어쓰기와 철자 오류가 많아 기존의 형태소 분석기로는 정확한 분석을 할 수 없다. 또한 온라인 상의 문장은 짧다는 특징이 있어 상호 정보량, 카이제곱 통계량 등과 같은 기존의 의미 선택 방법을 이용하게 되면 문장 내 선택 할 수 있는 의미의 부재로 인해 정확한 감성 분류를 할 수 없다는 문제점이 있다. 이러한 문제점들을 해결하기 위해서 본 논문에서는 초/중성 및 어절 패턴 사전을 이용해서 보정할 수 있는 모듈과 문장 내 품사의 우선순위를 이용한 의미 선택 방법을 제안한다. 이러한 방법으로 형태소 분석기에서 추출된 품사 정보를 기반으로 용언과 체언을 분리해서 분석 해당 품사에 종속적인 속성 DB 구축 한 후 학습에 의해 누적된 속성 DB를 사용하여 보다 정확한 긍/부정 감성을 추출한다.

뇌전도와 심박변이를 이용한 감성 분석 알고리즘에 대한 연구 (A Study on Algorithm of Emotion Analysis using EEG and HRV)

  • 전기환;오주영;박순희;정연만;양동일
    • 한국컴퓨터정보학회논문지
    • /
    • 제15권10호
    • /
    • pp.105-112
    • /
    • 2010
  • 의료 분야의 감성 및 심리 치료를 확장하여 이와 관련된 기술을 일반 생활에 접목하고, 또한 생체신호를 이용하여 보다 쾌적한 삶의 환경을 구축하려는 연구가 활발하게 진행되고 있다. 본 논문에서는 뇌전도(EEG : electroencephalogram)와 심전도(ECG : electrocardiogram)의 심박변이도(HRV : Heart Rate Variability)의 패턴을 분석하여 평온, 집중, 긴장, 우울의 네 가지 감성을 분류하고 추론하기 위한 감성추론시스템을 설계하고 구현하였다. 많은 감성 인식 연구가 얼굴이나 음성의 인식에 의하여 이루어지고 있으며, 생체신호를 이용한 추론 연구의 경우에도, 뇌전도나 심전도 등의 단일 생체신호의 분석에 의하여 이루어지고 있다. 본 논문에서는 단일 생체신호가 아닌 뇌전도와 심전도신호를 조합하여 복합적으로 분석함으로서 단일 생체신호의 분석 연구보다 추론의 정확도를 높였으며, 감성 추론을 위한 엔진으로지도 학습과 비지도학습의 RBFN(Radial Basis Function Network) 신경망을 적용하여 오류역전파 알고리즘의 지역 최소점과 수렴속도가 느린 단점을 보완하였다.

분리된 컬러 필터 배열을 이용한 에지 방향 컬러 보간 방법 (Edge-Directed Color Interpolation on Disjointed Color Filter Array)

  • 오현묵;유두식;강문기
    • 대한전자공학회논문지SP
    • /
    • 제47권1호
    • /
    • pp.53-61
    • /
    • 2010
  • 본 논문은 새로운 에지 방향 추정 방법과 영상의 영역 세분화에 기반을 둔 컬러 보간 알고리즘을 제안한다. 제안하는 에지 방향 추정은 컬러 필터 배열(color filter array: CFA)의 채널 별 분리와 표본 줄임(down-sampling)을 통해 획득한 영상 사이에 존재하는 에지 방향성 상관관계를 바탕으로 이루어진다. 에지 방향성 상관관계는 영상 간의 샘플링 위치와 각 영상의 국부위치에서의 에지 방향성 사이에 존재하는 방향의 유사성을 바탕으로 정의한다. 영상의 영역을 분류함에 있어서 평탄, 에지 영역뿐만 아니라 반복되는 에지가 나타나는 패턴 에지 영역을 구분함으로써 영역을 세분화 한다. 이렇게 구분한 영역 각각에 대해 수직 혹은 수평 방향 에지를 검출하여 에지 방향에 따라 보간함으로써 오류를 최소화 하는 에지 방향성 컬러 보간이 이루어진다. 실험 결과를 통해 제안하는 방법이 기존 방법에 비해 수치적인 면과 시각적인 면에서 뛰어난 결과를 보임을 확인할 수 있으며, 제안하는 영역 세분화와 에지 방향 추정을 통해 영상의 고주파 영역에서 성능이 향상됨을 확인할 수 있다.

PIR 센서 기반 침입감지 시스템 (Intruder Detection System Based on Pyroelectric Infrared Sensor)

  • 정연우;;조성원;정선태
    • 한국지능시스템학회논문지
    • /
    • 제26권5호
    • /
    • pp.361-367
    • /
    • 2016
  • 기존 디지털 출력 방식의 PIR 센서를 이용한 침입감지 시스템은 사람이 아닌 다른 물체에 대한 침입 탐지 오류가 많았다. 본 논문은 이를 극복하기 위하여 아날로그 출력 방식의 PIR 센서 기반 침입 감지 시스템을 제안한다. 아날로그 방식 PIR 센서는 임계값을 기준으로 이진 출력값 대신, 일정 범위 내의 다양한 전압 준위로 출력값을 내보낸다. 아날로그 PIR 센서를 이용하여 획득된 신호의 샘플링된 신호값으로부터 FFT(Fast Fourier Transform) 또는 MFCC(Mel-frequency cepstrum codfficents)을 이용하여 신호의 주파수 성분을 추출하여, 인공 신경회로망(Artificial Neural Network)의 특징벡터로 사용된다. 다양한 인간의 움직임과 애완동물의 움직임에 대한 신호 패턴들을 학습한 인공 신경회로망을 통해서 침입상황에서 침입한 객체가 사람인지 애완동물인지 판별하게 된다.

국내 학술논문의 동명이인 저자명 식별을 위한 방법 (A Method for Same Author Name Disambiguation in Domestic Academic Papers)

  • 신다예;양기덕
    • 한국비블리아학회지
    • /
    • 제28권4호
    • /
    • pp.301-319
    • /
    • 2017
  • 저자명 식별이란 다른 이름으로 표기된 한 명의 개인을 식별하는 것과 같은 이름을 가진 서로 다른 저자들을 각기 구별된 개인으로 분류하는 것으로, 저자의 연구 목록 및 연구 업적 평가, 특정 분야의 전문가를 검색하거나, 인용색인과 같은 학술 정보 서비스의 원활한 운영을 위해 반드시 해결해야 할 문제이다. 본 연구는 단순 머신러닝만을 사용한 실험 결과와 휴리스틱 방식으로 데이터 셋의 오류 수정 및 정규화 작업을 이후 머신러닝의 처리 과정에 룰 베이스 기반의 규칙을 부여한 저자명 식별 실험의 결과의 비교를 통하여, 인간의 개입이 머신러닝의 단점을 보완하고 저자명 식별 성능을 향상시킬 수 있는지 알아보았다. 그 결과 F-measure 0.1 이상 향상시킨 정규화 된 email기반의 룰 베이스 저자식별 결과로 정규화 과정과 휴리스틱 설정에 필요한 인간의 패턴인식과 추론능력이 머신러닝의 단점을 보완해줄 수 있음에 대한 가능성을 나타내었다.

MicroArray의 직관적 시각적 분석을 위한 웹 기반 분석 도구 (Web-based microarray analysis using the virtual chip viewer and bioconductor.)

  • 이승원;박준형;김현진;강병철;박희경;김인주;김철민
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2005년도 춘계학술대회
    • /
    • pp.198-201
    • /
    • 2005
  • DNA microarray 칩은 신약 개발, 유전적 질환 진단, Bio-molecular 상호작용 연구, 유전자의 기능연구 등 폭넓게 사용되고 있다. 이 논문은 cDNA mimcroarray 데이터를 분석하기 위한 웹형태의 시스템 개발에 대한 내용을 다룬다. 하나의 cDNA microarray에는 수 백에서 수 만개의 유전자가 심어져 있으며, 데이터를 분석할 때 대량의 데이터와 다양한 형태의 오류로 인해서 데이터간의 차이를 보정하는 분석 도구와 통계적 기법들이 사용되어야 한다. 본 논문에서는 가상 칩 뷰어를 이용하여 실제 microarray 데이터의 foreground intensity에서 백그라운드의 intensity를 제거하여 일반화된 칩 이미지를 생성한다. 이 가상 칩 뷰어는 여러 가지 필터효과와 서로 다른 두 형광의 차이를 조정하는 global normalization 기법을 사용하여 발현 유전자 분석을 시각적으로 할 수 있고, 중복된 마이크로어레이 칩 데이터를 통하여 시간이 많이 걸리는 분석전 칩의 유효성을 검토할 수 있다. 칩 데이터의 normalization을 위한 통계 방법으로 R 통계 도구와 linear 모델을 사용하여 microarray 칩의 유전자 발현 양상을 분석한다. 통계적 방법을 사용하지 않은 데이터를 추출, 이 데이터의 패턴 그래프 그리고 발현 레벨을 분류하여 마이크로어레이의 각 스팟의 유효성 검토의 정확성을 높였다. 이 시스템은 칩의 유효성 검토, 스팟의 유효성 검토, 유전자 선정에 대해 분석의 용이성과 정확성을 높일 수 있었다.

  • PDF

통합보안관리 에이전트를 확장한 웹 어플리케이션 공격 탐지 연구 (A Study of Web Application Attack Detection extended ESM Agent)

  • 김성락
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.161-168
    • /
    • 2007
  • 웹에 대한 공격은 웹 서버 자체의 취약점 보다 웹 어플리케이션의 구조, 논리, 코딩상의 오류를 이용한다. OWASP에서 웹 어플리케이션 취약점을 10가지로 분류하여 발표한 자료에 의하면 웹 해킹의 위험성과 피해가 심각함을 잘 알 수 있다. 이에 따라 웹 해킹에 대한 탐지능력 및 대응이 절실히 요구된다. 이러한 웹 공격을 방어하기 위해 패턴 매칭을 이용한 필터링을 수행하거나 코드를 수정하는 방법이 있을 수 있지만 새로운 공격에 대해서는 탐지 및 방어가 어렵다. 또한 침입탐지시스템이나 웹 방화벽과 같은 단위보안 제품을 도입할 수 있지만 운영과 지속적인 유지를 위해서는 많은 비용과 노력이 요구되며 많은 탐지의 오류를 발생한다. 본 연구에서는 웹 어플리케이션의 구조와 파라미터 입력 값에 대한 타입, 길이와 같은 특성 값들을 추출하는 프로파일링 기법을 이용하여 사전에 웹 어플리케이션 구조 데이터베이스를 구축함으로서 사용자 입력 값 검증의 부재에 대한 해결과 비정상적인 요청에 대해 데이터베이스의 프로파일 식별자를 이용하여 검증하고 공격 탐지가 가능하다. 통합보안관리시스템은 현재 대부분 조직에서 도입하여 운영하고 있으며 일반화 되어있다. 그래서 통합보안관리시스템의 보안 감사 로그 수집 에이전트에 웹 어플리케이션 공격 탐지 기능을 추가한 모델을 제시함으로서 추가 단위보안제품을 도입하지 않고서도 웹 어플리케이션 공격을 탐지할 수 있도록 하였다.

  • PDF

데이터 마이닝의 범죄수사 적용 가능성 (Usefulness of Data Mining in Criminal Investigation)

  • 김준우;손중권;이상한
    • 대한수사과학회지
    • /
    • 제1권2호
    • /
    • pp.5-19
    • /
    • 2006
  • 데이터 마이닝은 컴퓨터와 정보처리의 발전으로 각기 다른 차원에서 다량으로 수집되는 데이터 속에서 숨은 의미나 패턴을 발견하는 유용한 기법이다. 의사결정나무, 신경망 모형, 규칙 귀납, K-평균 군집화, 시각화 등의 데이터 마이닝 개별 기법들은 산재해 있는 데이터에서 연관성을 분석하고, 이를 분류함으로써 일반화된 개념을 정의하고, 새로운 지식을 추론함으로써 실제 생활에 적용 가능한 예측을 가능하게 한다. 따라서 현재 데이터 마이닝은 기업의 마케팅 분야, 금융기관의 고객 분석, 통신 회사의 고객 이탈 방지 등에서 유용하게 활용되고 있다. 우리가 접해야 하는 정보의 양이 늘어나는 것은 범죄 수사에 있어서도 마찬가지 현상이다. 범죄와 범죄자에 대한 데이터는 축적되어 가지만 정작 개별 사안에 있어서는 중요한 데이터가 접근조차 되지 않고 있으며, 많은 데이터 속에서 이것이 내포하고 있는 숨은 의미를 지나치게 되는 경우도 많다. 본 연구에서는 선행 연구와 사례 적용을 통해 데이터 마이닝의 범죄 수사 적용 가능성과 한계점을 살펴보고자 하였다. 미제 사건으로 남는 경우가 많은 절도나 사기 같은 습관적 상습 범죄의 경우 데이터 마이닝의 분류, 군집화 기능을 활용 한다면 향후 여죄 추적에 효율적으로 활용될 수 있음을 파악할 수 있었고, 특히 다양한 문제에 적용 가능하고, 잡음에 대한 견고성이 있음에도 예측의 정확성을 지니고 있는 신경망 모형의 경우 패턴 인식을 통하여 범죄자 프로파일링이나 화상 자료 대비 시스템 구축에 충분히 활용될 것으로 생각한다. 특히 보험 사기 사례 적용에서 살펴본 바와 같이 마약, 테러와 같은 조직적 범죄수사나 자금세탁과 같은 금융 추적 수사의 경우 해당 자료의 방대함과 모호성으로 인해 수사를 하는 데 많은 어려움이 있지만 이러한 데이터 마이닝 가시화 기법을 적절히 활용한다면 전체적인 윤곽을 파악하는 데 매우 유용하며, 효율적인 수사가 가능함을 확인할 수 있었다. 그러나 데이터 마이닝은 예측 모델이므로 오류를 내재하고 있다는 점에서 수사 기관의 데이터 마이닝 접근은 조심스러워야 하며, 정보 독점화 현상과 개인 사생활 보호라는 측면에서 각 수사기관은 해당 법률에 정한 범위 내에서 해당 사건별로 데이터를 수집하고 이를 통합, 재구성하여 활용하는 측면으로 적용되어야 할 것이다. 또한 각 수사기관별로는 자신의 보유하고 있는 데이터에 대해 다차원 처리가 가능하도록 데이터베이스 시스템을 구축하여 데이터 마이닝이 적용 가능한 환경을 구축하도록 하여야 할 것이다. 아직은 논의의 초기 단계이므로 효과가 크게 부각되지는 않았지만 지금까지 제시한 문제에 대한 연구가 계속 이루어진다면 인권중심, 증거중심의 수사 개념을 바탕으로 적법절차에 의한 수사 활동을 요구받는 시대에 새로운 대안으로 자리 잡을 것이며, 수사의 과학화에 기여할 것으로 전망한다.

  • PDF

대화체 연속음성 인식을 위한 한국어 대화음성 특성 분석 (Analysis of Korean Spontaneous Speech Characteristics for Spoken Dialogue Recognition)

  • 박영희;정민화
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.330-338
    • /
    • 2002
  • 대화체 연속음성은 자연스러운 발화로 낭독체 문장에 비해 잡음, 간투어와 같은 비문법적인 요소가 많고, 발음의 변이가 심하다. 이런 이유로 대화체 연속음성을 인식하기 위해서는 대화 현상을 분석하고 그 특징을 반영하여야 한다. 본 논문에서는 실제 대화음성에 빈번히 나타나는 대화 현상들을 분류하고 각 현상들을 모델링하여 대화체 연속음성 인식을 위한 기본 베이스라인을 구축하였다. 대화 현상을 묵음 구간과 잡음, 간투어, 반복/수정 발화의 디스풀루언시 (disfluencies), 표준전사와 다른 발음을 갖는 발음변이 현상으로 나누었다. 발음변이 현상은 다시 양성음의 음성음화, 음운축약/탈락현상, 패턴화된 발음변이, 발화오류로 세분화하였다. 대화체 음성인식을 위해서 빈번히 나타나는 묵음구간을 고려한 학습과 잡음, 간투어 처리를 위한 음향모델을 각각 추가하였다. 발음변이 현상에 대해서는 출현빈도수가 높은 것들만을 대상으로 발음사전에 다중 발음열을 추가하였다. 대화현상을 고려하지 않고 낭독체 스타일로 음성인식을 수행하였을 때 형태소 에러율 (MER: Morpheme Error Rate)은 31.65%였다. 이에 대한 형태소 에러율의 절대값 감소는 묵음 모델과 잡음 모델을 적용했을 때 2.08%, 간투어 모델을 적용했을 때 0.73%, 발음변이 현상을 반영했을때 0.92%였으며, 최종적으로 27.92%의 형태소 에러율을 얻었다. 본 연구는 대화체 연속음성 인식을 위한 기초 연구로 음향모델과 어휘모델, 언어모델 각각에 대한 베이스라인으로 삼고자 한다.

ST 분절 급상승 심근경색 환자들의 단기 재발 사망 예측 (Short-term Mortality Prediction of Recurrence Patients with ST-segment Elevation Myocardial Infarction)

  • 임광현;류광선;박수호;손호선;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권10호
    • /
    • pp.145-154
    • /
    • 2012
  • 현대 사회는 서구화된 식생활 패턴과 흡연, 비만 등의 원인으로 인해 심혈관계 질환들이 급증하고 있다. 특히, 급성심근경색은 심혈관계 질환으로 인한 사망의 대부분을 차지하고 있다. 이러한 추세에 따라 해외 선진국에서는 임상생리학적 오류를 줄이기 위해서 자국민의 데이터를 기반으로 급성심근경색의 발병 및 질병에 영향을 미치는 위험인자를 찾는 연구가 활발히 진행되고 있다. 하지만 한국인에 적합한 급성심근경색 예후 진단 예측 시스템이 미비한 실정이다. 따라서 이 논문에서는 KAMIR(Korea Acute Myocardial Infarction Registry) 데이터베이스에서 제공 받은 급성심근경색 환자의 예후 데이터를 기반으로 ST분절 급상승 심근경색 재발 환자들의 단기 사망률 예측모델을 찾고자 한다. 실험을 통해 로지스틱 회귀 분석에 의해 추출된 속성 집합을 적용하였을 때 기존의 원시 데이터 보다 높은 정확도를 얻을 수 있었으며, 인공신경망의 경우 다른 분류기법들보다 높은 성능을 보였다. 이를 통해 ST 분절 급상승 심근경색 재발 환자들의 단기 사망률을 예측함으로써 향후 고위험군 환자들의 관리에 도움을 줄 수 있을 것으로 기대한다.