• 제목/요약/키워드: 분류각

검색결과 5,725건 처리시간 0.065초

실시간 SNS 트렌드 분석에 기반한 이슈 요약 기법 (Issue summarization scheme based on real-time SNS trend analysis)

  • 김대용;김대훈;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1096-1097
    • /
    • 2013
  • 최근 Twitter를 비롯한 소셜 네트워크 서비스의 급속한 확산으로 인해, 많은 수의 SNS 메시지가 실시간으로 생성되고 있다. 이러한 SNS 상의 모든 글을 읽어보는 것은 현실적으로 불가능하며, 여러 포탈 사이트에서 제공되는 실시간 검색어 순위만으로는 상세 내용을 직관적으로 파악하기 어렵다. 따라서, 이러한 SNS상의 글을 실시간으로 분석하여 최신의 트렌드를 찾고 이와 연관된 내용을 분류 및 요약할 수 있다면, 사용자에게 유용한 최신 정보를 생성하여 제공할 수 있다. 본 논문에서는 Tweet 들을 분석하여 얻은 트렌드 키워드를 기반으로 관련된 Tweet 들을 주제 별로 분류한 후, 각 주제 별로 세부 내용을 요약해서 제공하는 기법을 제안한다. 제안하는 기법은 실시간으로 생성되는 Tweet 내에서 최근 화제가 된 트렌드 및 연관 키워드를 추출해낸다. 그 후, 해당 키워드가 출현한 Tweet 내에서 핵심 키워드를 찾고, 이를 기반으로 Tweet 들을 각각의 주제별로 분류하고 각 주제를 '이슈'로 정의한다. 마지막으로, 특정한 이슈에 해당되는 Tweet들을 분석하여 각 이슈 별로 키워드 리스트 및 단문 형식으로 요약된 줄거리를 생성한다. 제안된 기법을 바탕으로 프로토타입 시스템을 구현하고, 다양한 실험을 통하여 이슈 검출 기법의 유용성 면에서 성능을 평가한다.

한국산 둥굴레속(Polygonatum, Ruscaceae)의 분류학적 재검토 (A taxonomic review of Korean Polygonatum (Ruscaceae))

  • 장창기
    • 식물분류학회지
    • /
    • 제32권4호
    • /
    • pp.417-447
    • /
    • 2002
  • 한국산 둥굴레속 식물을 분류학적으로 재검토하였으며, 2절, 3계열하에 14종, 2변종의 모두 16분류군으로 재정리하였다. 이 중 한국 특산종은 선둥굴레와 늦둥굴레 2종이었으며, 한국 미기록종인 풍도둥굴레(P. odoratum var. odoratum)와 종둥굴레(P. acuminatifolium)의 자생지를 확인하였다. 정확한 종동정을 위해 절, 계열, 종의 검색표와 각 분류군의 기재문을 제시하였다.

룰 클러스터링에 의한 실시간 적응행동 분류자 시스템 (Classifier System for Real time Adaptive Behavior Based on Rule Clustering)

  • 황철민;김지윤;김현영;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.47-50
    • /
    • 2003
  • 기계학습의 한 종류인 분류자 시스템은 간단한 문제에 대하여 실시간 처리와 온라인 학습이 가능하다. 그러나 복잡한 환경에서는 빠른 적응이 힘들다. 본 논문에서는 복잡한 환경에서 분류자 시스템의 적응 성능을 개선함으로써 실시간이 가능하도록 전체 환경을 분류하고 각기 다른 룰 셋을 이용하는 룰 클러스터링에 의한 분류자 시스템을 제안한다 환경을 상황에 따라 나눔으로써 전체 환경이 변화하였을 경우 각 상황에 따른 변화에 대해서만 추가적으로 학습함으로써 탐색 공간을 줄여 학습 시간을 감소시킨다. 제안한 시스템은 분류자 시스템 중 ZCS을 이용하여 로봇축구 시스템에 적용하여 기존의 방법과 그 성능을 비교 검토한다.

  • PDF

하천의 수질 및 유량자료의 패턴분류에 의한 특성 파악 (Detection of Characteristics by Pattern Classification of Water Quality and Runoff Data in a River)

  • 박성천;진영훈;노경범;김용구;이용희
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2010년도 학술발표회
    • /
    • pp.1380-1384
    • /
    • 2010
  • 현재 환경부에서는 수질오염총량관리제를 위하여 각 단위유역의 말단지점에서 8일 간격으로 수질 및 유량을 측정하고 있으며, 이 자료들을 공개하고 있다. 이러한 양질의 자료의 활용성을 제고하기 위해서는 무엇보다도 자료의 분석을 위한 다양한 기법이 개발되고 제안되어야 한다. 따라서 본 연구에서는 수질 및 유량자료를 동시에 적용하여 두 자료 사이의 관계를 조사하고 특성을 파악하기 위하여 자기조직화 특성지도(Self-Organizing Feature Map: SOFM) 이론을 적용하였다. 시행착오법에 의해 적정한 SOFM 구조를 결정하였으며, 그 결과 $4{\times}4$ 구조의 육각형 배열을 갖는 구조를 이용하였다. SOFM에 의해 분류된 3개의 패턴 중 패턴-1은 유량자료의 크기에 의해 분류되었고, 패턴-2와 패턴-3은 BOD 농도의 크기에 따라 분류된 것으로 파악되었다. 따라서 SOFM의 적용에 의한 자료의 분류를 수행하고, 그 분류기준을 파악할 경우 SOFM의 자료 분석 도구로서의 활용성이 더욱 높아질 것으로 판단된다.

  • PDF

런길이 부호화를 이용한 지문융선 분류 (Classification of Fingerprint Ridge Lines Using Runlength Codes)

  • 이정환;노석호;김윤호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2004년도 춘계종합학술대회
    • /
    • pp.468-471
    • /
    • 2004
  • 본 논문에서는 런길이부호화를 이용하여 지문영상의 융선을 분류하는 방법을 연구하였다. 자동지문인식 시스템에서 단점, 분기점과 같은 특징점을 검출하기 위해 지문영상의 융선을 분류할 필요가있다. 본 논문에서는 분할된 지문영상을 런길이 부호화를 이용하여 지문융선을 분류하는 방법을 제안한다. 또한 융선의 분류와 동시에 각 런의 중심점을 연결하는 지문 세선화과정이 수행되고, 분기점 및 단점이 포함된 특징영역을 동시에 검출할 수 있다. 제안방법의 성능평가를 위해 지문영상을 사용하여 분기점 및 단점을 포함하는 특징영역을 검출하고, 동시에 지문융선을 분류할 수 있음을 보였다.

  • PDF

SVM기반 정보기술 문서분류를 위한 특성 선택 및 추출 기법 (Feature Selection and Extraction for Document Classifier for If documents based on SVM)

  • 강윤희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2001년도 추계산학기술 심포지엄 및 학술대회 발표논문집
    • /
    • pp.75-78
    • /
    • 2001
  • 본 논문에서는 웹 문서의 자동 분류를 위한 특성 선택 및 추출기법을 기술한다. 최근 인터넷의 급속한 성장과 보급으로 전자우편과 웹을 통해 제공되어지는 정보의 양이 기하급수적으로 증가함에 따라 효율적인 문서 분류의 필요성이 증가하고 있다. 본 논문에서는 웹 디렉토리 내의 문서로부터 추출된 용어 집합을 기반으로 SVM을 사용하여 학습한 후 문서 분류를 수행한다. 본 실험의 문서는 정보통신 분야 디렉토리 서비스 시스템인 itfind로부터 수집된 문서를 대상으로 하였으며 3가지 시나리오에 따라 실험을 수행하여 각 시나리오 별로 재현율/정확율 및 오분류율을 성능 요소로 계산하였다. 본 실험은 학습 벡터 구성과정에서 잡음에 의해 다른 클래스의 문서 분류에 미치는 영향을 평가하여 SVM을 기반으로 한 문서 분류 기법이 강건함을 보였다.

클러스터간 중첩성과 평균내부거리를 적용한 퍼지 클러스터링에 의한 위성영상 분류 (A Study on the Satellite Image Classification Based on the Fuzzy Clustering using Overlap Measure and Average Intracluster Distance)

  • 전영준;김진일
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 춘계학술발표대회
    • /
    • pp.359-362
    • /
    • 2004
  • 본 논문에서는 평균내부거리를 적용한 퍼지 클러스터링 알고리즘과 클러스터들 사이의 중첩성을 이용한 위성영상의 분류 알고리즘을 제안하였다. 제안된 방법은 클러스터의 크기에 따라 큰 클러스터에는 많은 소속정도를 작은 클러스터에는 적은 소속정도를 부여함으로 크기가 다른 클러스터가 존재하는 데이터 집합에 대해서도 분류의 효율성을 높였다. 클러스터들간의 중첩성을 이용한 평가를 통해 위성영상에 있어서 중첩되지 않은 화소는 각각의 분류항목에 포함시키고, 중첩된 화소들은 최대우도 분류를 수행한 후 각 화소에 대한 우도와 퍼지 클러스터링의 소속도를 비교 분석하여 최종 분류항목을 결정함으로서 분류를 효율적으로 할 수 있다.

  • PDF

ELECTRA 기반 순차적 문장 분류 모델 (Sequential Sentence Classification Model based on ELECTRA)

  • 최기현;김학수;양성영;정재홍;임태구;김종훈;박찬규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.327-330
    • /
    • 2020
  • 순차적 문장 분류는 여러 문장들을 입력으로 받아 각 문장들에 대하여 사전 정의된 라벨을 할당하는 작업을 말한다. 일반적인 문장 분류와 대조적으로 기준 문장과 주변 문장 사이의 문맥 정보가 분류에 큰 영향을 준다. 따라서 입력 문장들 사이의 문맥 정보를 반영하는 과정이 필수적이다. 최근, 사전 학습 기반 언어 모델의 등장 이후 여러 자연 언어 처리 작업에서 큰 성능 향상이 있었다. 앞서 언급하였던 순차적 문장 분류 작업의 특성상 문맥 정보를 반영한 언어 표현을 생성하는 사전 학습 기반 언어 모델은 해당 작업에 매우 적합하다는 가설을 바탕으로 ELECTRA 기반 순차적 분류 모델을 제안하였다. PUBMED-RCT 데이터 셋을 사용하여 실험한 결과 제안 모델이 93.3%p로 가장 높은 성능을 보였다.

  • PDF

애플리케이션 트래픽 분류를 위한 머신러닝 알고리즘 성능 분석 (Performance Analysis of Machine Learning Algorithms for Application Traffic Classification)

  • 김성윤;김명섭
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.968-970
    • /
    • 2008
  • 기존에 트래픽 분류 방법으로 payload 분석이나 well-known port를 이용한 방법을 많이 사용했다. 하지만 동적으로 변하는 애플리케이션이 늘어남에 따라 기존 방법으로 애플리케이션 트래픽 분류가 어렵다. 이러한 문제의 대안으로 Machine Learning(ML) 알고리즘을 이용한 애플리케이션 트래픽 분류방법이 연구되고 있다. 기존의 논문에서는 일정 시간동안 수집한 data set을 사용하기 때문에 적게 발생한 애플리케이션은 제대로 분류하지 못하여도 전체적으로는 좋은 성능을 보일 수 있다. 본 논문에서는 이러한 문제를 해결하기 위해 각 애플리케이션마다 동일한 수의 data set을 수집하여 애플리케이션 트래픽을 분류하는 방법을 제시한다. ML 알고리즘 중 J48, REPTree, BayesNet, NaiveBayes, Multilayer Perceptron 알고리즘을 이용하여 애플리케이션 트래픽 분류의 정확도를 비교한다.

소프트웨어 개요

  • 천유식
    • ETRI Journal
    • /
    • 제8권2호
    • /
    • pp.75-82
    • /
    • 1986
  • 소프트웨어의 개발환경에 관련하여 개발과정, work methods, 업무구조를 논하였다. TDX-1 소프트웨어를 성격에 따른 분류와 기능에 따른 분류로 대별하여 설명한 후 중점적으로 교환기(Exchange) 소프트웨어에 대하여 그 특성과 구조를 논하였다. 특성에서는 계층분산 구조, 분산다중처리 등 4개의 특성을 논하였으며 구조에서는 프로세서의 구성, 각 프로세서의 기능, 논리적 구조로 나누어 설명하였다.

  • PDF