• 제목/요약/키워드: 오류 분류 패턴

검색결과 72건 처리시간 0.025초

강건한 한국어 상품평의 감정 분류를 위한 패턴 기반 자질 추출 방법 (A Robust Pattern-based Feature Extraction Method for Sentiment Categorization of Korean Customer Reviews)

  • 신준수;김학수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권12호
    • /
    • pp.946-950
    • /
    • 2010
  • 기계 학습 기반의 많은 감정 분류 시스템들은 문장으로부터 언어적 자질을 추출하기 위하여 형태소 분석기를 사용한다. 그러나 온라인 상품평에는 많은 띄어쓰기 오류 및 철자 오류가 포함되어 있어서 일반적으로 형태소 분석기가 좋은 성능을 내기 어려우며, 기반 시스템의 낮은 성능은 감정 분류 시스템의 성능하락을 초래한다. 이러한 문제를 해결하기 위하여 본 논문에서는 어절 패턴과 음운 패턴의 최장 일치 매칭(matching)에 기반한 자질 추출 방법을 제안한다. 두 종류의 패턴은 대용량의 품사 부착 말뭉치로부터 자동으로 구축된다. 어절 패턴은 영사, 동사와 같은 내용어를 포함하는 어절들로 구성되며, 음운 패턴은 동사나 형용사와 같은 용언의 초성과 중성의 쌍으로 구성된다. 음운 패턴에 초성과 중성만을 사용한 이유는 철자 오류에 영향을 덜 받기 때문이다. 제안 방법을 평가하기 위하여 SVM(Support Vector Machine)을 기계 학습기로 사용하는 감정 분류 시스템을 구현하였다. 한국어 상품평에 대한 실험에서 제안 방법을 자질 추출 모듈로 사용하는 감정 분류 시스템이 형태소 분석기를 사용하는 것보다 우수한 성능을 보였다.

보로노이 공간분류를 활용한 원격 영상 패턴분류 시스템 (Pattern Classification System for Remote Sensing Data using Voronoi Diagram)

  • 백주현;김홍기
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.335-342
    • /
    • 2001
  • 본 논문은 보로노이 공간분류를 활용하여 원격탐사 영상인식을 위한 다층 신경망 분류기를제안한다. 제안된 다층 신경망 분류기는 보로노이 다각형 영역으로 클래스를 구분하며, 초평면 방정식의 계수를 오류 역전과 학습 초기의 연결 강도, 임계치 그리고 은닉층의 노드 수로 결정한다. 제안된 방법은 오류역전과 학습 알고리즘에서 임의로 정해주던 초기 정보를 사전 분석에 의해 공학적으로 결정함으로써 느린 수렴 속도와 학습실패 등의 단점을 피할 수 있는 장점이 있다. 보로노이 다이어그램에 대한 경계선의 초평면 방정식은 훈련집합의 클래스별 평균값을 구하여 Mathematica 패키지로 계산하였다. 제안된 다층 신경망에 의한 영상분류기의 인식능력을 평가하기 위하여 원격탐사 영상인식에서 자주 활용되는 최소거리 분류 방법과 최대우도 분류 방법으로 처리해서 비교한 결과, 최소거리 분류 방법은 실험화상에 대해 81.4%, 최대우도 부류기에 의한 분류는 87.8%, 제안한 방법은 92.2% 정확성을 가진 분류결과를 나타냈다.

  • PDF

영어 말하기, 쓰기 학습자를 위한 문법 오류 검출 시스템 (Grammar Error Detection System for Learners of Spoken and Written English)

  • 서홍석;이성진;이진식;이종훈;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.136-139
    • /
    • 2011
  • 외국어 교육의 필요성이 강조되고 그에 대한 요구가 늘어남에 따라 언어 교육의 기회를 늘리고 비용을 줄이기 위해 컴퓨터 기반의 다양한 기술들의 요구 역시 증가하고 개발되고 있다. 언어 능력 개발의 중요한 요소로서 문법 교육에 대한 컴퓨터 지원 기술 연구가 활발히 진행되고 있다. 본 연구에서는 문법 오류 시뮬레이션을 통해 문법 오류 패턴 데이터베이스를 구축하고 이들 패턴과 사용자 입력의 패턴 매칭으로 생성된 자질 벡터로 기계 학습을 하여 문법성 확인을 했다. 문법성 확인 결과에 따라 오류 종류에 따른 상대 빈도를 고려하여 오류 종류를 분류했다. 또 말하기와 쓰기 작업의 서로 다른 특성을 반영하기 위해 말하기 작업과 쓰기 작업에 대한 두 개의 다른 말뭉치가 학습에 이용 되었다.

  • PDF

Inclusion Polymorphism과 UML 클래스 다이어그램 구조에 의거한 디자인패턴 해석

  • 이랑혁;이현우;고석하
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2007년도 춘계학술대회
    • /
    • pp.55-68
    • /
    • 2007
  • 디자인 패턴은 새롭게 만들어 지는 것이 아니라 기존의 검증된 지식, 관용법, 원칙들을 체계화한 것이다. 다시 말하면 디자인 패턴은 특정한 문제를 해결하기 위한, 검증된 설계 방법에 이름을 붙인 것이다. 그러므로 적절한 디자인 패턴 사용은 1) 개발자들간의 원활한 의사소통에 도움을 주며, 2) 하급자가 고급기술을 쉽게 익힐 수 있도록 할 수 있다. 3) 또한 사용된 디자인이나 아키텍처를 재사용할 수 있도록 하고, 4) 만들어진 시스템의 유지 보수를 보다 쉽게 할 수 있는 등의 장점을 얻을 수 있다. 반면에 필요하지 않은 곳에 까지 디자인패턴을 사용하게 되면 소프트웨어를 복잡하고, 유지보수도 어렵게 만들 수 있다. 디자인 패턴의 분류는 수 많은 패턴을 비슷한 속성을 지닌 그룹들로 조직화 하는 것이다. 이는 개발자가 특정 문제에 맞는 디자인 패턴을 쉽게 선택 할 수 있도록 도와 줄 뿐만 아니라, 디자인 패턴의 주요특성을 빠르게 이해하고 간파 할 수 있게 한다. 그래서 Beck 이 디자인패턴을 소개한 이후 GoF, Buschmann, Grand, Antoy 등은 디자인 패턴을 단순히 열거를 통해 소개하지 않고, 각자의 기준에 따라 체계적으로 분류하여 패턴을 설명 하고 있다. 본 연구는 객체지향 설계의 근본 개념인 Polymorphism (Inclusion Polymorphism) 과 '객체 지향 소프트웨어 설계 원칙' 그리고 이 근본 원칙들이 UML 클래스 다이어그램에 나타나는 구조적 특정에 의거해 디자인 패 턴 해석을 수행 하였다. 본 연구의 목적은 1) 객체지향의 근본 원칙으로 표현 되는 패턴과 2) 설계자의 전문적 인 Art를 포함하고 있는 패턴으로 분류하는데 있다.3: 재미는 용이성을 통해 채택의도에 정의 영향을 미친다. 가설4: 유용성은 채택의도에 정의 영향을 미친다. 가설5: 용이성은 채택의도에 정의 영향을 미친다. 가설6: 용이성은 유용성에 정의 영향을 미친다. 본 연구의 대상은 자발적으로 이러닝을 채택할 수 있는 대학생을 대상으로 하였고, 설문 데이터 분석을 통한 실증연구를 수행하였다. 분석방법으로는 PLS 분석도구를 사용하였다. 분석결과 가설6을 제외하고는 모두 유용한 것으로 입증되었다.97)은 배움의 용이성, 기억의 용이성, 오류, 효율성, 만족성으로 분류하고 있고(Nielsen, 1997), Shneiderman(1998)는 효과성(직무시간, 배움의 시간), 효율성(기억의 지속시간, 오류), 만족도를 품질의 특성으로 분류하였다. 이와 같은 소프트웨어의 품질은 소프트웨어 계획, 개발, 성장과 쇠퇴의 모든 과정에 적용되며, 환경적 변화에 따라 사용자들의 정보욕구를 적절하게 반영하여 만족도를 높이 는 것이라고 요약할 수 있다. 그러나 현재까지 소프트웨어 품질 평가에 대한 연구들 은 보편적인 평가 항목들을 대상으로 측정하여 일반적인 품질기준을 제시하고 있고, 유사한 측정 내용들이 중복되어 있다. 이러한 경향은 산업별 특수성이 강한 소프트웨어에 대해서는 정확한 품질측정이 어려웠고, 품질측정에 대한 신뢰성을 떨어뜨리는 계기가 되었다. 이러한 한계를 극복하고자 나타난 방법론이 최종사용자들의 요구사항을 얼마나 적절하게 시스템에 반영했는지에 대한 사용성(Usability) 측정이다. 사용성에 대한 정의는 사용자들이 실질적으로 일하는 장소에서 직접 사용자들의 시스템 운용실태를 파악하여 문제점을 개선하는 것으로 요약할 수 있다. ISO9124-1

  • PDF

모호한 패턴 클래스 도입을 통한 기저 세포암 분류기의 신뢰도 향상 (Reliability Improvement of Automatic Basal Cell Carcinoma Classifier with an Ambiguous Pattern Class)

  • 박아론;백성준;정인욱;송민규;나승유
    • 전자공학회논문지CI
    • /
    • 제44권1호
    • /
    • pp.64-70
    • /
    • 2007
  • 라만 분광법은 피부암 진단에 사용되는 매우 유력한 비침습성 진단 방법이다. 라만 스펙트럼을 이용한 이전의 연구에 따르면 MAP (maximum a posteriori probability)와 MLP (multilayer perceptron networks)와 같은 기존의 분류 방법으로도 좋은 분류결과를 얻을 수 있다. 하지만 암 진단은 작은 오류에도 종종 치명적인 결과가 따르기 때문에 본 연구에서는 판정이 모호한 데이터를 따로 집단화하여 분류 오류를 감소하는 방법을 제안한다. 이때 모호한 패턴은 조직검사를 통하여 다시 암여부를 판정하게 된다. 본 논문에서는 모호한 패턴 클래스를 MSE (minimum squared error), MAP와 MLP에 도입하기 위해 기존 알고리듬을 수정하였고 모호한 패턴 클래스가 본래 도입되어 있는 RCE (reduced coulomb energy networks)와 실험결과를 비교하였다. 216개의 공초점 라만 스펙트럼에 대한 실험결과에 의하면 모호한 패턴으로 판정된 데이터를 늘림에 따라 나머지 패턴은 완벽하게 분류할 수 있음을 보였다. 그 중 MSE는 테스트 패턴 중 약 8.8%의 모호한 패턴으로 나머지 패턴에 대하여 완벽한 분류결과를 보였다.

국부 이진패턴 기반 참조표를 이용한 역 하프토닝 알고리즘 (Inverse halftoning algorithm using local binary pattern based lookup table)

  • 서원교;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 추계학술대회
    • /
    • pp.134-136
    • /
    • 2015
  • 영상 역 하프토닝은 입력된 하프톤 영상으로부터 그레이 영상을 복원시키는 것으로, 하프톤 영상으로 처리하지 못하는 다양한 영상처리를 가능하게 해주는 방법이다. 기존의 참조표를 이용한 역 하프토닝 방법은 다양한 하프톤 영상과 원본 그레이 영상으로부터 추출한 정보를 이용해 입력 영상을 복원시키는데, 본 논문에서는 이를 바탕으로 하여 영상의 질을 전반적으로 향상시킬 수 있는 국부적인 이진 패턴 기반 참조표를 이용한 영상 역 하프토닝 방법을 제안한다. 먼저 참조표를 이용한 역하프토닝 방법을 이용해 영상을 복원한 후 각 픽셀에서의 국부 이진패턴을 계산하여 각 픽셀 값을 패턴에 따라 분류한다. 분류된 패턴 정보에 따라 국부 이진 패턴 기반 참조표를 생성하고 이를 통해 입력 하프톤 영상에 대한 역 하프토닝을 수행한다. 실험 결과는 제안하는 알고리즘이 오류 확산법에 의해 변환된 하프톤 이미지를 역 하프토닝 했을 때, 기존의 역 하프토닝 방법에 비해 더 나은 PSNR을 달성하는 것을 보인다.

  • PDF

ART1과 Delta-Bar-Delta 방법을 이용한 개선된 자가 생성 지도 학습 알고리즘 (Enhanced Self-Generation Supervised Learning Alrorithm Using ARTI and Delta-Bar-Delta Method)

  • 백인호;김태경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.71-75
    • /
    • 2003
  • 오류 역전파 학습 알고리즘을 이용하여 영상 인식에 적용 할 경우에는 은닉층의 노드 수를 경험적으로 설정하므로, 학습시간과 지역최소화 및 정체현상이 발생한다. 그리고 ARTI 알고리즘은 입력 패턴과 저장 패턴간의 측정 방법인 유사성 검증 방법과 경계 변수의 설정에 따라 인식률이 좌우된다. 경계 변수의 값이 크면 입력 패턴과 저장 패턴사이에 약간의 차이만 있어도 새로운 카테고리(Category)로 분류하고, 반대로 경계 변수의 값이 적으면 입력 패턴과 저장 패턴 사이에 많은 차이가 있더라도 유사성이 인정되어 입력 패턴들을 대략적으로 분류한다. 따라서 ART1 알고리즘을 영상 인식에 적용하기 위해서는 경계 변수를 경험적으로 설정하므로 인식률에 부정적인 영향을 갖는 문제점이 있다. 따라서 본 논문에서는 개선된 ART1 알고리즘과 지도 학습 방법을 결합하여 신경망의 은닉층 노드를 동적으로 변화시키는 자가 생성지도 학습 알고리즘을 제안한다. 제안된 신경망에서 입력층과 은닉층의 학습 구조에는 ART1 알고리즘을 개선하여 적용하고, 은닉층과 출력층의 학습 구조에는 은닉층에서 승자로 선택된 노드와 출력층 노드와 연결된 가중치만을 조정하고 Delta-Bar-Delta 알고리즘을 적용한다. 제안된 방법의 학습 성능을 분석하기 위하여 학생증 영상에서 추출한 학번 패턴 분류에 적용한 결과, 기존의 신경망 학습 알고리즘보다 학습 성능이 개선됨을 확인하였다.

  • PDF

웹 사용 마이닝을 위한 SASOM+DT를 이용한 웹 데이터의 분류 (Classification of Web Data Using SASOM+DT for Web Usage Mining)

  • 유시호;김경중;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.346-348
    • /
    • 2002
  • 웹 마이닝은 크게 구조 마이닝, 컨텐츠 마이닝, 사용 마이닝으로 분류될 수 있다. 이 중에서도 사용 마이닝은 사용자의 로그 데이터를 바탕으로 사용자가 탐색한 웹 페이지의 순서를 추출하거나 연관관계를 분석하는 작업이다. 특히 웹에 기반을 둔 애플리케이션의 요구를 충족시키기 위해서 사용 마이닝은 웹 마이닝에 있어서 중요한 부분으로 부각되고 있다. 본 논문에서는 사용자들의 웹 페이지의 방문 패턴을 분석하여, 미래행동을 예측하는 것을 문제로 삼고, 사용자들의 이용패턴을 SASOM(Strtcture-Adaptive SOM)분류기들의 DT(Decision Tree)앙상블을 이용하여 분류하는 방법을 제안해보았다. MS웹 데이터를 가지고 SASOM 분류기의 집합을 DT를 이용하여 결합한 결과, 분류기 하나만 사용한 경우 보다 더 좋은 결과를 얻어, 3.5% 이하의 낮은 오류율을 보였다.

  • PDF

고등학교 1학년 함수단원 문제해결에서의 오류에 대한 분석 (An analysis of errors in problem solving of the function unit in the first grade highschool)

  • 문혜영;김응환
    • 한국학교수학회논문집
    • /
    • 제14권3호
    • /
    • pp.277-293
    • /
    • 2011
  • 본 논문은 수학문제해결 과정에서 고등학교 1학년 학생들이 공통적으로 범하는 실수 즉 오류를 분석을 통하여 수학의 교수학습방법의 보완을 위한 범례를 제시하고자 한다. 교사들 에게 제공되는 학생들의 수학적 지식에 대한 이해 정도 및 쉽게 빠지는 오류, 수학문제에 접근하는 방법 및 잘못된 해결 전략 등의 정보는 대체로 학생들의 오류를 분석함으로써 얻어 질 수 있다. 실제로 많은 학생들이 고교수학을 어렵게 느끼는데 그 중 특히 '함수'문제에서 막연한 어려움과 부담감을 느끼며 함수와 관련된 문제풀이에서 많은 실패를 겪고 있다. 구체 적으로 본 연구에서는 고등학교 1학년 학생들의 함수단원 문제해결 과정에서 보이는 오류를 분석하여 함수단원 수학문제해결능력을 키우고자 충남의 ${\bigcirc}{\bigcirc}$고등학교 1학년 학생 90명을 대상으로 함수단원 8문제로 구성된 검사지를 풀게 하고 그것을 토대로 오류를 분석하였다. 그 결과 학생들의 오류에서 몇 가지 공통적인 패턴이 있음을 발견하고 이것을 7가지 오류 분류 패턴을 설정하고 이를 분석하여 이를 보완할 수 있는 방법을 탐구하였다. 본 연구에서 나타난 결과를 토대로 학교현장에 투입하여 수학교육의 개선에 도움이 되길 기대한다.

  • PDF

ERP로 확인된 한국어 문장 이해과정에서의 통사 및 의미 처리특성 연구 (Syntactic and Semantic Integration Processes during Korean Sentence Comprehension: using ERPs as an neurophysiological index)

  • 김충명;이경민
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.259-263
    • /
    • 2004
  • 본 연구는 머리어-후행언어(head-final language)로 분류되는 한국어의 통사 및 의미 처리 과정의 언어간(cross linguistic) 일반성과 언어내(intra-language) 특이성을 ERP(event- related potentials) 실험결과를 통해 알아보고자 하였다. 한국어 문장처리 과정에서의 통사 및 의미 처리특성은, 우선 이들을 지표하는 각각의 오류문을 통해 P600과 N400 이라는 언어일반의 처리과정을 보이면서도 각 성분의 영역분포는 오류가 출현된 위치에 따라 분기하고 있음을 관찰할 수 있었다. 곧, 문미위치의 술어오류에서 중심-두정 부위의 활성화 우세로 각 오류간 영역분화를 보이는 패턴을 새롭게 확인하였다. 이로써 오류의 유형별 재분류과정으로 드러난 오류출현 위치가 오류의 유형 내에 영향을 끼치는 한 변수가 될 수 있으며. 이는 이들 보어 및 술어를 구성하는 고유의 범주 특성으로 해석할 수 있는 근거가 될 수 있음도 아울러 확인하였다.

  • PDF