• 제목/요약/키워드: 이진 분류

검색결과 607건 처리시간 0.027초

EDA 기법을 적용한 BERT 기반의 감성 분류 모델 생성 (Sentiment Classification Model Development Based On EDA-Applied BERT)

  • 이진상;임희석
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.79-80
    • /
    • 2022
  • 본 논문에서는 데이터 증강 기법 중 하나인 EDA를 적용하여 BERT 기반의 감성 분류 언어 모델을 만들고, 성능 개선 방법을 제안한다. EDA(Easy Data Augmentation) 기법은 테이터가 한정되어 있는 환경에서 SR(Synonym Replacement), RI(Random Insertion), RS(Random Swap), RD(Random Deletion) 총 4가지 세부 기법을 통해서 학습 데이터를 증강 시킬 수 있다. 이렇게 증강된 데이터를 학습 데이터로 이용해 구글의 BERT를 기본 모델로 한 전이학습을 진행하게 되면 감성 분류 모델을 생성해 낼 수 있다. 데이터 증강 기법 적용 후 전이 학습을 통해 생성한 감성 분류 모델의 성능을 증강 이전의 전이 학습 모델과 비교해 보면 정확도 측면에서 향상을 기대해 볼 수 있다.

  • PDF

감정 자질을 이용한 한국어 문장 및 문서 감정 분류 시스템 (A Korean Sentence and Document Sentiment Classification System Using Sentiment Features)

  • 황재원;고영중
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권3호
    • /
    • pp.336-340
    • /
    • 2008
  • 최근 감정 분류에 대한 관심이 높아져 연구가 활발히 진행되고 있다. 문서 전체에 관한 감정의 분류도 중요하지만, 문서를 이루고 있는 문장에 관한 분류도 점차 그 필요성이 높아지고 있다. 본 논문에서는 한국어 감정 분류 시스템 구축을 위해서 추출된 한국어 감정 자질을 이용한 한국어 문장 및 문서 감정 분류에 관해 연구한다. 한국어 감정 분류의 시작은 감정을 내포한 대표적인 어휘로부터 시작하며, 이와 같은 감정 자질들은 문장 및 문서의 감정을 분류하는데 결정적인 관여를 한다. 한국어 감정 자질의 추출을 위하여 영어 단어 시소러스 정보를 이용하여 자질들을 확장하고, 영한사전을 통해 확장된 자질들을 번역함으로써 감정 자질들을 추출하였다. 추출된 감정 자질들을 사용하여, 단어 벡터로 표현된 입력문서를 이진 분류기인 지지벡터 기계(SVM: Support Vector Machine)를 이용하여 문장과 문서에 내포된 감정을 판단하고 평가하였다.

Vision System을 이용한 광섬유 코팅 결함 검출 System 구현 (Implementation of a system for detecting defects on optical fiber coating)

  • 서상일;최우창;김학일
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1996년도 한국자동제어학술회의논문집(국내학술편); 포항공과대학교, 포항; 24-26 Oct. 1996
    • /
    • pp.796-799
    • /
    • 1996
  • 광섬유는 코어(Core), 클레드(Clad), 그리고 1,2차 코팅(Coating)으로 구성되어 있다. 본 연구에서는 광섬유의 코팅에 생기는 결함의 유무 및 종류와 크기를 분류하는 Vision System을 구현하였다. 전처리 과정으로, CCD Camera를 이용하여 얻은 화상에 대하여 Sobel 연산자로 경계선을 추출하고, 문턱값(Threshold Value)을 적용하여 이진 화상을 만든다. 외경 정보 추출을 위하여, 투영 정보, 수리 형태학(Mathematical Morphology)적 연산을 수행하고, 결함의 종류와 크기를 효율적으로 분류하도록 Tree Classifier를 설계하였다. 실험 결과로서 각 결함 별 오차율, 전체 오차율(Total Error Rate)등을 제시하였다.

  • PDF

Helmholtz Machine 학습에 기반한 문서 분류 (Text Categorization Using a Helmholtz Machine)

  • 장정호;장병탁;김영택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.466-468
    • /
    • 2000
  • 이 논문에서는 Helmholtz machine을 사용하여 데이터의 분포 추정을 함으로써 문서 분류기를 학습하는 방법 제안한다. Helmholtz machine 은 생성 모델과 인식 모델로 구성된 그래프 모델로서, 그래프 모델에서의 분포 추정을 보다 가능하게 하기 위한 근사 방법 중의 하나이다. Helmholtz machine에서의 각 입력 노드는 문서를 구성하는 하나의 단어에 대응하는 이진 노드이다. 입력 노드의 개수가 많아지면 그만큼 학습 시간이 증가하기 때문에, 학습 시간을 줄이면서 적정 수준의 성능을 유지하기 위해 자질 선정이 필요하다. 이러한 요구 사항을 충족시키기 위해 정보획득량(information gain)기준을 이용하였으며, 뉴스 그룹 데이터에 대해 그 성능을 측정하고 Naive Bayes를 이용한 것과 비교한다.

  • PDF

해안선 추출을 위한 초분광영상과 라이다 데이터의 이용 (Utilizing Hyperspectral Images and LiDAR Data for Extraction of Coastline)

  • 이진덕;방건준;김현호
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2016년도 춘계 종합학술대회 논문집
    • /
    • pp.325-326
    • /
    • 2016
  • 해역과 육역을 포함하는 연안지역을 대상으로 하여 CASI-1500에 의해 취득된 항공 초분광 영상을 이용하여 토지피복분류를 행하고 이 분류결과로부터 육역과 해역의 경계를 추출하였다. 또한 현재 활용되고 있는 방법에 의하여 LiDAR 데이터로부터 해안선을 검출하였다.

  • PDF

컴퓨터 문헌 분석 기법을 활용한 <적벽가> 이본의 계통 분류 연구 (A Study on the classification of Jeokbyeok-ga's version by the Computer analysis technique of bibliographies)

  • 이진오;김동건
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2018년도 춘계 종합학술대회 논문집
    • /
    • pp.135-136
    • /
    • 2018
  • 본 연구는 컴퓨터 문헌 분석 방법을 활용하여 <적벽가> 이본의 계통을 분류하고 기존 이본 연구를 검토한 것이다. <적벽가> 이본의 공통 서사단위는 5개의 계층으로 파악되며, 146개의 개별단락을 산출해낼 수 있다. 이를 통해 군집 분석 방법과 계통의 분기 분석 방법을 적용할 수 있으며, 작품의 계통과 이본간의 거리를 시각적으로 파악할 수 있다.

  • PDF

주파수 부대역별 병렬 신경망 분석에 의한 화산 분출 초저음파의 식별기법 연구 (Frequency Sub-bands Parallel Neural Network Classification of Infrasonic Signals Associated with Volcanic Eruptions)

  • 이진구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 춘계학술발표대회
    • /
    • pp.785-787
    • /
    • 2014
  • 본 논문에서는 화산 분출 초저음파의 식별을 위해서 FSPNNC(Frequency Sub-bands Parallel Neural NetworkClassification)을 선택한다. FSPNNC 는 각기 다른 주파수 영역에서 독립적으로 추출한 특징벡터를 병렬 구조의 신경망에 학습하는 구조를 가지며 하나의 신경망은 하나의 분류 및 하나의 주파수 부대역만을 학습하고 다른 신경망들은 해당 특징벡터를 분류하지 않도록 학습된다. 실험은 단일 신경망 및 PNNCB(Parallel Neural Network Classifier Bank)와의 비교실험을 통하여 식별 성능을 제시한다.

Landsat-8 위성영상 기반 수분지수 및 기계학습을 활용한 대구광역시의 지표수 탐지 (Detection of Surface Water Bodies in Daegu Using Various Water Indices and Machine Learning Technique Based on the Landsat-8 Satellite Image)

  • 정윤재;김경섭;박인선;정연인
    • 한국지리정보학회지
    • /
    • 제24권1호
    • /
    • pp.1-11
    • /
    • 2021
  • 위성영상을 활용한 하천, 습지, 호수 등 지표수 객체의 탐지는 해당 지역의 수자원 관리 및 조사 업무에 효율적으로 활용될 수 있다. 본 연구에서는 원격탐사 분야에서 물을 탐지하기 위해 제공하는 수분지수(Water Index)와 영상으로부터 객체를 인식하는 데 폭넓게 활용되는 기계학습(Machine learning) 기법을 대구광역시를 촬영한 Landsat-8 위성영상에 개별적으로 적용하여 하천, 호수 등 다양한 지표수 객체를 탐지하고 그 결과를 비교하였다. 우선 Landsat-8 위성영상의 다중분광 밴드로부터 NDWI(Normalized Difference Water Index), MNDWI(Modified Normalized Difference Water Index) 영상을 생성하였고, 임계치를 적용하여 개별 영상으로부터 물과 그 외 지역을 구분할 수 있는 이진 영상(Binary image)을 제작하였다. 그리고 기계학습 기법인 SVM(Support Vector Machine)을 동일 위성영상에 적용하여 토지 피복 영상을 제작하고 이로부터 이진 영상을 제작하였다. 최종적으로 100개의 검사점(Checkpoints)을 사용하여 세 이진 영상으로부터 지표수 탐지를 위한 정확도를 오차 행렬을 활용하여 계산하였다. 그 결과, MNDWI 영상으로부터 제작된 이진 영상의 정확도(84%)가 NDWI 영상으로부터 제작된 이진 영상의 정확도(94%)와 SVM에 의해 제작된 이진 영상의 정확도(96%)에 비해 낮았으며, 모든 이진 영상에서 그림자 등의 원인으로 인해 일부 육지 분류 결과가 지표수 객체로 오분류되었다.

국부이진패턴 히스토그램을 이용한 측면 차량 검출 (Passing Vehicle Detection using Local Binary Pattern Histogram)

  • 강형섭;조동찬;고 경우;김회율
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2010년도 하계학술대회
    • /
    • pp.260-263
    • /
    • 2010
  • 본 논문에서는 주행 중인 차량에서 전방을 향해 장착된 카메라를 통해 입력된 영상에서 측면에 부분적으로 나타나는 차량을 검출하는 방법을 제안한다. 기존 연구에서는 모션 벡터를 이용하여 주변 배경과 관측되는 차량 사이의 모션 벡터 차이를 이용하여 측면 차량을 검출하고 있다. 그러나 모션 벡터를 이용할 경우 정지된 차량이나 전방에서 다가오는 차량의 경우 검출하기 어려운 점이 있다. 이러한 문제를 해결하기 위해 본 논문에서는 모션 벡터를 사용하지 않고 차량 측면 모습에서 특징 정보를 추출하여 SVM 분류기를 통해 측면 차량을 검출하는 방법을 제안한다. 차량 측면 모습의 특징을 뽑기 위해 영상의 밝기 변화에 강인한 국부 이진 패턴을 사용하였고 ROI영역 내에서 차량이 나타나는 위치에 상관없이 차량의 측면 모습을 찾아내기 위해 국부 이진 패턴의 히스토그램을 이용하였다. 실험결과에서는 제안하는 방법이 정지된 차량을 포함하여 88.5%의 정확도로 측면 차량을 검출하는 것을 확인하였다.

  • PDF

개선된 ART2 알고리즘을 이용한 세라믹 영상에서의 결함 검출 (Fault Detection of Ceramic Imaging using Enhanced ART2 Algorithm)

  • 이진무;이선미;박지현;우영운;송두헌;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 추계학술대회
    • /
    • pp.87-89
    • /
    • 2013
  • 본 논문에서는 Ends-In Search Stretching 기법을 적용하여 명암 대비를 강조하고, 명암 대비가 강조된 영상에서 삼각형 타입의 소속 함수를 이용한 퍼지 이진화 기법을 적용한 후, 그 다음 임의의 패턴 입력에 대해서도 효과적으로 특징을 분류하는 개선된 ART2 알고리즘을 이용하여 결함 영역을 검출한다. 제안된 방법을 세라믹 소재 영상을 대상으로 실험한 결과, 기존의 방법보다 효율적으로 결함이 검출되는 것을 확인하였다.

  • PDF