• 제목/요약/키워드: 정보 시스템의 분류

검색결과 4,152건 처리시간 0.033초

Modified ECCD 및 문서별 범주 가중치를 이용한 문서 분류 시스템 (A Document Classification System Using Modified ECCD and Category Weight for each Document)

  • 한정석;박상용;이수원
    • 정보처리학회논문지B
    • /
    • 제19B권4호
    • /
    • pp.237-242
    • /
    • 2012
  • 웹 문서 정보 서비스는 관리자의 효율적 문서관리와 사용자의 문서검색 편의성을 위해 문서 분류 시스템을 필요로 한다. 기존의 문서 분류 시스템은 분류하고자 하는 문서 내 선택된 자질어의 개수가 적거나, 특정 범주의 문서 비율이 높아 그 범주에서 대부분의 자질어가 선택되어 모델이 생성된 경우 분류 정확도가 저하되는 문제점을 가진다. 이러한 문제점을 해결하기 위해 본 논문에서는 'Modified ECCD' 기법 및 '문서별 범주 가중치' 특징 변수를 사용한 문서 분류 시스템을 제안한다. 실험 결과, 제안 방법인 'Modified ECCD' 기법이 ${\chi}^2$ 및 ECCD 기법에 비해 높은 분류 성능을 보였으며, '문서별 범주 가중치' 특징 변수를 'Modified ECCD' 기법으로 선택된 자질어 변수에 추가하여 학습하였을 경우에 더 높은 분류 성능을 보였다.

과학기술 지식인프라 통합서비스를 위한 분류체계 연구 (A Study on the Multiple Classification System for S&T Knowledge Infrastructure Integrated Service)

  • 이혜진;이석형;최희석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.665-668
    • /
    • 2020
  • 대규모 프로젝트나 상호 이질적인 여러 시스템을 보유하고 있는 기관에서는 보통 시스템을 여러개로 나누어 운영하고 있다. 이러한 경우 운영의 효율성을 위해 시스템 통합에 대한 요구가 증가하게 된다. 시스템을 하나로 통합하다 보면 효율적인 운영이 가능하며, 단일화된 서비스를 통해 이용자는 여러 서비스를 한 곳에서 활용할 수 있는 편의성을 제공할 수 있다. 본 연구에서는 통합서비스 구축을 통해 이용자가 여러 서비스를 효율적으로 활용할 수 있는 접근점 중의 하나인 분류체계 구축 방법을 소개하고 실제 구현 사례를 제시한다. 통합서비스 요구분석을 통해 서비스에 필요한 분류체계들을 도출하고 다양한 서비스들을 여러 분류체계에 맞춰 구분함으로써 이용자는 원하는 서비스를 효율적으로 접근할 수 있는 장점이 있다. 이에 통합서비스에서의 분류체계는 중요한 서비스 요소 중의 하나이다. 본 연구결과는 대규모 통합서비스 구축시 필요한 분류체계 구축 절차에 활용될 수 있다.

퍼지시스템을 이용한 텍스타일 인덱싱 (Textile Indexing using Fuzzy System)

  • 류형주;채송아;김수정;김은이;김지인;정갑주;구현진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.787-789
    • /
    • 2004
  • 본 논문에서는 퍼지 시스템을 이용하여 칼라 패턴으로부터 인간의 강성을 예측하는 텍스타일 인덱싱 시스템을 제안한다. 텍스타일 인덱싱이란 입력받은 직물 영상을 섬유의 영상을 강성 특징으로 색인화 하는 것이다. 제안된 시스템은 입력 영상에 대해 warm-cold, strong-weak, heavy-light특징이 어느 정도 있는지 조사한다. 제안된 시스템은 크게 특징추출 부분과 감성 분류로 구성한다. 특징 추출은 입력 영상에서 컬러 점보와 텍스처 정보를 추출하고, 감성 분류는 특징 추출 부분으로부터 얻어진 정보들을 분석하여 영상 내 포함된 강성을 찾아낸다. 이때 분류를 위해서 본 논문에서는 퍼지 시스템을 사용한다. 퍼지 룰은 80개의 영상에 대하여 70명의 설문조사를 기반으로 하여 경험적으로 얻어졌다. 제안된 시스템은 80개의 영상에 대하여 테스트 해본 결과는 제안된 시스템의 효율성을 보여주었다.

  • PDF

산출물 추출 및 분류를 위한 Index/XML순서관계 시스템 설계 (A Design of Index/XML Sequence Relation Information System for Product Abstraction and Classification)

  • 선수균
    • 정보처리학회논문지D
    • /
    • 제12D권1호
    • /
    • pp.111-120
    • /
    • 2005
  • 소프트웨어 개발은 다양한 산출물(클래스 부품, 클래스 다이어그램, 폼, 객체, 디자인 패턴)을 생성한다. 단 논문은 이런 산출물의 효율적인 추출 및 분류를 위한 Index/XML 순서관계 시스템을 제안한다. 이 시스템에서 산출물 순서 관계 추출은 패턴 관계정보를 메타 모델링 할 수 있으며 데이터베이스 할 수 있어 재사용 및 저장이 용이하다. 이 Index/XML 순서관계 시스템은 산출물의 추출과 분류를 위한 여러 가지 산출물의 관계 정보를 쉽게 변형할 수 있다. 이 시스템은 디자인 패턴을 효율적으로 분류 추출할 수 있도록 설계한다. 기능적인 인덱싱, 표준 패턴을 위한 순서 기준 인덱싱은 인덱스 아이디로 그룹화 할 수 있으며 분류할 수 있어 효과적이다. 이 정보론 이용하여 산출물들을 효과적으로 분류 및 추출을 할 수 있다.

머신러닝 기반의 대규모 이미지 파일에서 개인 정보 분류 시스템 (Machine Learning based Personal Information Classification System in Large Image Files)

  • 김기태;윤상혁;서보인;이세훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.293-294
    • /
    • 2020
  • 본 논문에서는 현재 이슈가 되고 있는 개인 정보 보안에 대해서 Keras 라이브러리를 사용하여 개인 정보 관련 데이터를 학습한 후, 한글 인식률 증가된 Tesseract-OCR 활용하여 사람들이 가지고 있는 데이터의 개인 정보 유무를 판단하여 분류한다.

  • PDF

API 정보와 기계학습을 통한 윈도우 실행파일 분류 (Classifying Windows Executables using API-based Information and Machine Learning)

  • 조대희;임경환;조성제;한상철;황영섭
    • 정보과학회 논문지
    • /
    • 제43권12호
    • /
    • pp.1325-1333
    • /
    • 2016
  • 소프트웨어 분류 기법은 저작권 침해 탐지, 악성코드의 분류, 소프트웨어 보관소의 소프트웨어 자동분류 등에 활용할 수 있으며, 불법 소프트웨어의 전송을 차단하기 위한 소프트웨어 필터링 시스템에도 활용할 수 있다. 소프트웨어 필터링 시스템에서 유사도 측정을 통해 불법 소프트웨어를 식별할 경우, 소프트웨어 분류를 활용하여 탐색 범위를 축소하면 평균 비교 횟수를 줄일 수 있다. 본 논문은 API 호출 정보와 기계학습을 통한 윈도우즈 실행파일 분류를 연구한다. 다양한 API 호출 정보 정제 방식과 기계학습 알고리즘을 적용하여 실행파일 분류 성능을 평가한다. 실험 결과, PolyKernel을 사용한 SVM (Support Vector Machine)이 가장 높은 성공률을 보였다. API 호출 정보는 바이너리 실행파일에서 추출할 수 있는 정보이며, 기계학습을 적용하여 변조 프로그램을 식별하고 실행파일의 빠른 분류가 가능하다. 그러므로 API 호출 정보와 기계학습에 기반한 소프트웨어 분류는 소프트웨어 필터링 시스템에 활용하기에 적당하다.

한국어 음성 인식 시스템의 오류 유형 분류 및 분석 (Categorization and Analysis of Error Types in the Korean Speech Recognition System)

  • 손준영;박찬준;서재형;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.144-151
    • /
    • 2021
  • 딥러닝의 등장으로 자동 음성 인식 (Automatic Speech Recognition) 기술은 인간과 컴퓨터의 상호작용을 위한 가장 중요한 요소로 자리 잡았다. 그러나 아직까지 유사 발음 오류, 띄어쓰기 오류, 기호부착 오류 등과 같이 해결해야할 난제들이 많이 존재하며 오류 유형에 대한 명확한 기준 정립이 되고 있지 않은 실정이다. 이에 본 논문은 음성 인식 시스템의 오류 유형 분류 기준을 한국어에 특화되게 설계하였으며 이를 다양한 상용화 음성 인식 시스템을 바탕으로 질적 분석 및 오류 분류를 진행하였다. 실험의 경우 도메인과 어투에 따른 분석을 각각 진행하였으며 이를 통해 각 상용화 시스템별 강건한 부분과 약점인 부분을 파악할 수 있었다.

  • PDF

자막 분석을 통한 교육 영상의 카테고리 분류 방안 (Classification of Education Video by Subtitle Analysis)

  • 이지훈;이현섭;김진덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.88-90
    • /
    • 2021
  • 본 논문은 교육 영상의 자막을 한글 형태소 분석기를 통해 추출하고 추출된 형태소 정보를 바탕으로 영상의 카테고리를 분류하는 방안에 대해 소개한다. 시스템에서 사람의 실수로 잘못된 정보가 입력되어 아이템의 특성으로 반영하게 될 경우 추천 시스템에서 정확도의 문제를 미치는 경우들이 있다. 이를 방지하기 위해 미리 분류된 영상에서 추출한 형태소 정보를 이용하여 각 카테고리에 해당하는 키워드 테이블을 생성하고, 각 카테고리 키워드 테이블과 영상의 형태소의 유사도를 비교하여 가장 유사도가 높은 키워드 테이블을 이용해 교육 영상의 카테고리를 분류한다. 이를 통해서 사람의 개입을 줄이고 시스템이 직접 영상을 분류하여 추천 시스템의 정확도를 높이는 것을 목표로 한다.

  • PDF

생리신호에 의한 감성 이미지 실시간 분류 시스템 개발 (Real-time classification system of emotion image using physiological signal)

  • 이정년;곽동민;정봉천;전기혁;황민철
    • 한국감성과학회:학술대회논문집
    • /
    • 한국감성과학회 2009년도 추계학술대회
    • /
    • pp.232-235
    • /
    • 2009
  • 본 연구에서는 실시간으로 변화하는 사용자의 감성을 평가하여 각성 또는 이완으로 분류된 시선 정보 이미지를 저장하는 시스템을 구현하고자 한다. 사용자의 감성을 분류하기 위한 요소는 Larson과 Diner 가 정의한 2 차원 감성모델에서 각성, 이완 요소를 사용한다. 감성 상태를 분류하기 위하여 자율 신경계 중 착용과 휴대가 간편한 PPG 센서를 사용하며, PPG 를 분석하기 위한 변수로는 진폭의 양과 초당 Peak 의 빈도수를 사용한다. 머리에 고정할 수 있는 캠을 사용하여 사용자가 바라보는 시선 정보를 획득하고, 클라이언트 컴퓨터는 획득된 시선 정보를 UDP 통신을 사용해 서버 컴퓨터로 전송하는 시스템이다. 320(pixel)*240(pixel)*32(bit)인 영상 데이터를 1/30 로 압축하여 전송하며, 각성과 이완으로 분류되는 시점의 영상을 블록화하여 JPEG 이미지로 저장한다. 본 시스템은 실시간으로 변화되는 사용자의 감성 상태를 파악하여 이미지를 전송하고 서버 컴퓨터에 저장함으로써 당시 사용자가 느꼈던 감성들에 대해 피드백을 주고자 하는데 의의가 있다.

  • PDF

감성용어 및 패턴을 이용한 감성기반 분산 문서분류시스템 (Distributed Document Classification System using Susceptibility Terms and Patterns)

  • 김명규;인주호;채수환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (D)
    • /
    • pp.356-360
    • /
    • 2007
  • 인터넷이 폭 넓게 보급되어 개인의 의견을 개진할 기회가 확대됨에 따라 정치, 경제 등의 사안이나 제품 기업의 이미지, 공인에 대한 긍정.부정의 글을 개진할 수 있게 되었다. 이러한 현상에 따라 기업, 제품, 혹은 공공의 분야에서 일반 개인들이 어떻게 생각하는가에 대한 분석 및 자료수집의 필요성이 높아지고 있다. 감성용어 문서분류시스템은 문서의 내용 중 감성기반의 용어들에 기반하여 이에 대한 패턴을 정의하고 이에 대응하는 범주에 문서를 자동으로 할당하는 작업으로써 효율적인 정보 관리 및 검색을 가능하게 한다. 하지만 자동문서 분류를 하기 위해서는 방대한 양의 데이터를 수집 보관하기 위한 분산 환경이 반드시 필요하다. 본 논문에서는 감성기반 문서분류 시스템을 위한 감성용어 추출 및 긍정, 부정의 패턴을 검색해 자동 문서분류를 위해 RTI(Run Time Infrastructure)를 통한 분산 시스템 환경으로 구성하였다.

  • PDF