• 제목/요약/키워드: 클래스 추출

검색결과 417건 처리시간 0.031초

재난관련 트윗 분류를 위한 딥 러닝 결합 모델 (Combining Deep Learning Models for Crisis-Related Tweet Classification)

  • 최원규;이경순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.649-651
    • /
    • 2018
  • 본 논문에서는 CNN에서 클래스 활성화 맵과 원샷 러닝을 결합하여 트위터 분류를 위한 딥 러닝 모델을 제안한다. 클래스 활성화 맵은 트윗 분류에 대한 분류 주제와 연관된 핵심 어휘를 추출하고 강조 표시하도록 사용되었다. 특히 작은 학습 데이터 셋을 사용하여 다중 클래스 분류의 성능을 향상시키기 위해 원샷 러닝 방법을 적용한다. 제안하는 방법을 검증하기위해 TREC 2018 태스크의 사건 스트림(TREC-IS) 학습데이터를 사용하여 비교실험을 했다. 실험 결과에서 CNN 기본 모델의 정확도는 58.1%이고 제안 방법의 정확도는 69.6%로 성능이 향상됨을 보였다.

  • PDF

XML 역공학 시스템 (XML Reverse Engineering System)

  • 박형철;간정현;장태진;이주연;이태혁;권순각
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.692-695
    • /
    • 2012
  • 만들어진 소프트웨어 시스템을 역으로 추적하여 처음의 문서나 설계기법 등의 자료를 얻어 내는 역공학(Reverse Engineering)은 유지 보수 및 재사용 측면에서 필요하다. 본 논문은 역공학 개념을 이용하여 하나의 소스 파일에서 클래스, 클래스내의 멤버 변수 및 메소드, 서로 다른 클래스 사이의 연관 관계 등을 추출하여 xml 문서로 표시하여 저장하는 시스템을 구현한다. 또한, 역공학한 프로젝트 내에서 선언된 변수와 함수들의 사용횟수를 분석하며, 분석된 결과를 GUI 형태로 표시시켜 줌으로써 사용자의 편리성을 제공해준다.

  • PDF

영역 모델과 객체후보군의 유사도 측정에 관한 연구 (A Study on the Degree of Signature Similarity between Domain Model and Object Candidate Groups)

  • 박성옥;노경주;이문근
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (1)
    • /
    • pp.522-524
    • /
    • 1999
  • 절차지향 소프트웨어를 객체지향 소프트웨어로 변환하는 여러 가지 방법이 존재한다. 프로그램을 변환하기 위하여 일반적으로 함수, 변수와 자료형들 간의 관계를 이용한다. 이들간의 관계성을 이용하면 결과로서 객체 후보가 생성된다. 생성된 객체 후보와 영역 전문가에 의하여 생성된 영역 모델을 비교하여 두 모델간의 유사성을 측정하여야 한다. 본 논문에서는 클래스의 시그너처(클래스 이름, 속성의 이름, 속성의 자료형, 메소드 이름, 메소드의 리턴형, 메소드 파라미터의 자료형)을 이용하여 클래스와 객체 후보의 유사도를 측정하고, 측정된 유사도의 평균값을 이용하여 객체 후보군의 유사도를 측정한다. 기존의 연구 방법과는 다르게 n개의 클래스와 m개의 객체 후보사이의 구문적 측면의 유사도 측정뿐만이 아니라 의미적 측면의 유사도를 측정하는 방법을 제시하여 최적합 객체 후보군을 추출하도록 하였다.

  • PDF

SVM의 다중결정템플릿을 이용한 지문분류 (Fingerprint Classification using Multiple Decision Templates with SVM)

  • 민준기;홍진혁;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권11호
    • /
    • pp.1136-1146
    • /
    • 2005
  • 지문분류는 대규모 자동지문식별시스템에서 지문을 카테고리별로 나누어 매칭시간을 줄이는데 유용하다. 지문을 5가지 클래스로 분류하는 헨리시스템을 기반으로 신경망이나 SYM(Support Vector Machines) 등과 같은 다양한 패턴분류 기법들이 지문분류에 널리 사용되고 있다. 특히 최근에는 높은 분류 성능을 보이는 SVM 분류기를 이용한 연구가 활발하다. 이진분류기인 SVM을 지문분류문제에 적용하기 위해서 본 논문에서는 새로운 분류기 결합모델인 다중결정템플릿(Multiple Decision Templates, MuDTs)을 제안한다. 이 방법은 클래스 구분이 모호한 지문영상들의 분류에서 단일 결합모델들의 한계를 극복하기 위해, 하나의 지문클래스로부터 서로 다른 특성을 갖는 클러스터들을 추출하여 각 클러스터에 적합한 결합모델을 생성한다. NIST Database4 데이타로부터 추출한 핑거코드에 대해 실험한 결과, 5클래스와 4클래스 분류문제에 대하여 각각 $90.4\%$$94.9\%$의 분류성능(거부율 $1.8\%$)을 획득하였다.

음파 특징 추출 및 패턴 인식을 통한 선박 식별 (Ship Identification Using Acoustic Characteristic Extraction and Pattern Recognition)

  • 장흥주;이상훈
    • 한국국방경영분석학회지
    • /
    • 제33권1호
    • /
    • pp.93-103
    • /
    • 2007
  • 현재 적용되고 있는 선박의 식별체계들은 대부분 사용자의 판단을 도울 수 있는 수중 음파의 주파수 분석, 분석 자료의 보관 및 데이터베이스, 그리고 비교기능 등의 사용자 인터페이스를 제공하고 있으나, 선박고유의 특성 추출부터 식별까지 전적으로 사용자의 정보인식능력에 의존하고 있다. 그러므로 이러한 식별방법들의 신뢰성은 사용자의 전문성에 크게 의존하고 있으며, 분석 장비 역시 고가의 장비를 사용하고 있다. 본 논문에서는 선박식별의 자동화로 가기위한 기초 자료를 제공할 목적으로 수중에서 들려오는 소리를 일반 PC에서 획득하여 수중 음파 특성을 도출하고 패턴인식 통하여 선박들을 클래스 별로 분류함으로써 식별 가능성을 보이고자 한다. 이를 위해 Matlab을 이용한 주변소음 제거 및 신호 처리를 통한 음파 특성을 추출하고 패턴인식을 이용하여 추출된 클래스에 대해 분류하고자 한다.

퍼지 신경회로망을 이용한 칼라 물체 추출 (Colored Object Extraction using Fuzzy Neural Network)

  • 김용수;정승원
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.197-202
    • /
    • 2006
  • 본 논문에서는 퍼지 신경회로망을 사용하여 영상에서 물체를 배경으로부터 추출해내는 방법을 제시하였다. 퍼지 신경회로망의 vigilance parameter를 조정하여 영상을 2개의 클래스로 분류하고, 물체 영역과 배경영역의 Cb와 Cr의 대표값을 추출하였다. 제안한 방법을 사용하여 물체색상의 위치 및 크기와 밝기에 상관없이 물체영역을 추출하였다.

  • PDF

XML 데이터의 인라인 바인딩 방법 (Inline Binding For XNL DataInline Binding For XML Data)

  • 이은정;유가연
    • 정보처리학회논문지A
    • /
    • 제13A권1호
    • /
    • pp.71-78
    • /
    • 2006
  • 어플리케이션에서 XML 데이터를 이용하기 위한 방법으로 XML 타입 정의에 맞는 클래스를 생성하고 데이터의 인터페이스를 담당하게 하는 XML 바인딩 방법이 있다. 그런데 이러한 방법을 지원하는 기존의 바인딩 프레임워크에서는 XML 정의 문법에서 정의된 모든 요소에 대해 클래스를 생성하여 클래스의 수가 많아지고 전체 어플리케이션의 복잡도가 높아지는 문제가 있다. 본 연구에서는 XML 정의 문법에서 XML 바인딩 클래스 생성이 필요한 요소들을 추출하는 인라인 방법을 제안한다. 제안된 바인딩 클래스생성 방법은 반복과 재귀 등의 경우에만 클래스를 생성하고 터미널 요소의 값은 필드로 표현하는 클래스를 생성한다. 그리고 인라인된 요소들의 경로를 회복하여 XML 문서를 생성하기 위한 마샬링 알고리즘을 소개한다. 제안된 방법을 검증하기 위하여 IBinder 시스템을 개발하고 생성된 결과를 기존의 방법과 비교하였다. 그 결과 IBinder 시스템에서 생성된 XML 바인딩 클래스의 수가 크게 줄어드는 것을 보일 수 있었다.

XMI기반 클래스의 메타데이터생성 (Generation of Class MetaData Based on XMI)

  • 이상식;최한용
    • 한국콘텐츠학회논문지
    • /
    • 제9권12호
    • /
    • pp.572-581
    • /
    • 2009
  • XMI 메타모델과 XML 메타데이터를 이용한 클래스에 대한 연구는 일반적으로 이용되고 있는 XML 메타데이터의 생성과 상당한 차이점이 있다. 대부분의 XML 시스템은 에디터기능과 데이터베이스 연동, 등 마크업언어의 생성부분에 많은 비중을 두고 개발하고 있다. 그러나 본 연구는 이와 달리 XMI 메타모델에서 추출되는 클래스 메타데이터의 마크업언어를 생성하는데 중점을 두었다. 또한 클래스내의 단위 엘리먼트의 속성부여와 모델내의 클래스 관계를 표현할 수 있도록 하였다. 마크업언어의 생성에서는 XML 스키마를 이용하여 세부적인 데이터타입의 선언이 가능하도록 하고 있다.

가우시안 혼합 모델을 이용한 하드 디스크 결함 분포의 패턴 분류 (Pattern Classification of Hard Disk Defect Distribution Using Gaussian Mixture Model)

  • 전재영;김정헌;문운철;최광남
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.482-486
    • /
    • 2008
  • 본 논문에서는 하드 디스크 드라이브(Hard Disk Drive, HDD) 생산 공정 과정에서 발생할 수 있는 불량 HDD의 결함 분포에 대해서 패턴을 자동으로 분류해주는 기법을 제시한다. 이를 위해서 표준 패턴 클래스로 분류되어 있는 불량 HDD의 각 클래스의 확률 모델을 GMM(Gaussian Mixture Model)로 가정한다. 실험은 전문가에 의해 분류된 실제 HDD 결함 분포로부터 5가지의 특징 값들을 추출한 후, 결함 분포의 클래스를 표현할 수 있는 GMM의 파라미터(Parameter)를 학습한다. 각 모델의 파라미터를 추정하기 위해 EM(Expectation Maximization) 알고리즘을 사용한다. 학습된 GMM의 분류 테스트는 학습에 사용되지 않은 HDD 결함 분포에서 5가지의 특징 값을 입력 값으로 추정된 모델들의 파라미터 값에 의해 사후 확률을 구한다. 계산된 확률 값 중 가장 큰 값을 갖는 모델의 클래스를 표준 패턴 클래스로 분류한다. 그 결과 제시된 GMM을 이용한 HDD의 패턴 분류의 결과 96.1%의 정답률을 보여준다.

  • PDF

어휘 정보와 구문 패턴에 기반한 단일 클래스 분류 모델 (One-Class Classification Model Based on Lexical Information and Syntactic Patterns)

  • 이현구;최맹식;김학수
    • 정보과학회 논문지
    • /
    • 제42권6호
    • /
    • pp.817-822
    • /
    • 2015
  • 관계 추출은 질의응답 및 지식확장 등에 널리 사용될 수 있는 주요 정보추출 기술이다. 정보추출에 관한 기존 연구들은 관계 범주가 수동으로 부착된 대용량의 학습 데이터를 필요로 하는 지도 학습모델을 기반으로 이루어져 왔다. 최근에는 학습 데이터 구축을 위한 인간의 노력을 줄이기 위해 원거리 감독법이 제안되었다. 그러나 원거리 감독법은 분류 문제를 해결하는데 필수적인 부정 학습 데이터를 수집하기 어렵다는 단점이 있다. 이러한 원거리 감독법의 단점을 극복하기 위해 본 논문에서는 부정 데이터 없이 학습이 가능한 단일 클래스 분류 모델을 제안한다. 입력 데이터로부터 긍정 데이터를 선별하기 위해서 제안 모델은 벡터 공간 상에서 어휘 정보와 구문 패턴에 기반한 유사도 척도를 사용하여 입력 데이터가 내부 범주에 속하는지 그렇지 않은지 판단한다. 실험에서 제안 모델은 대표적인 단일 클래스 분류 모델인 One-class SVM보다 높은 성능(0.6509 F1-점수, 0.6833 정밀도)을 보였다.