• 제목/요약/키워드: 논문 분류

검색결과 12,514건 처리시간 0.04초

온톨로지의 개념구조에 의한 웹페이지의 의미적 분류 (Semantic Classification of Web Pages using Ontology Concept Structure)

  • 송무희;임수연;박승배;강동진;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.487-489
    • /
    • 2005
  • 본 논문에서는 온톨로지의 개념구조를 이용한 웹페이지의 의미적 분류방법을 제안한다. 웹 문서들이 가지는 용어 정보들과 어휘들 간의 개념 구조를 파악하여 온톨로지를 확장시키면서 이를 문서분류에 적용하여 의미적 분류가 이루어지게 한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하여 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 온톨로지와 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

어휘 유사 문장 판별을 위한 BERT모델의 학습자료 구축 (Methodology of Developing Train Set for BERT's Sentence Similarity Classification with Lexical Mismatch)

  • 정재환;김동준;이우철;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.265-271
    • /
    • 2019
  • 본 논문은 어휘가 비슷한 문장들을 효과적으로 분류하는 BERT 기반 유사 문장 분류기의 학습 자료 구성 방법을 제안한다. 기존의 유사 문장 분류기는 문장의 의미와 상관 없이 각 문장에서 출현한 어휘의 유사도를 기준으로 분류하였다. 이는 학습 자료 내의 유사 문장 쌍들이 유사하지 않은 문장 쌍들보다 어휘 유사도가 높기 때문이다. 따라서, 본 논문은 어휘 유사도가 높은 유사 의미 문장 쌍들과 어휘 유사도가 높지 않은 의미 문장 쌍들을 학습 자료에 추가하여 BERT 유사 문장 분류기를 학습하여 전체 분류 성능을 크게 향상시켰다. 이는 문장의 의미를 결정짓는 단어들과 그렇지 않은 단어들을 유사 문장 분류기가 학습하였기 때문이다. 제안하는 학습 데이터 구축 방법을 기반으로 학습된 BERT 유사 문장 분류기들의 학습된 self-attention weight들을 비교 분석하여 BERT 내부에서 어떤 변화가 발생하였는지 확인하였다.

  • PDF

고해상도 위성영상을 위한 감독분류 시스템 (Supervised Classification Systems for High Resolution Satellite Images)

  • 전영준;김진일
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제9권3호
    • /
    • pp.301-310
    • /
    • 2003
  • 본 논문에서는 고해상도 위성영상의 효과적인 분류를 위한 감독분류 시스템을 설계하고 구현하였다. 구현된 시스템은 분류의 정확도 향상을 위한 훈련데이타의 효율적인 선택을 위해서 다양한 인터페이스와 통계자료를 제공한다. 또한, 다양한 위성영상 포맷의 지원과 새로운 감독분류 알고리즘의 확장을 용이하게 하기 위하여 시스템을 모듈화 하였으며, 분광 특성을 고려한 분류의 적용이 가능하다. 분류 알고리즘으로는 평행육면체 분류, 최소거리 분류, 마하라노비스 거리 분류, 최대우도 분류, 퍼지 분류의 감독분류기법을 이용하여 고해상도 위성영상의 처리를 지원한다. 본 시스템의 적용은 고해상도 IKONOS 위성영상을 입력으로 하고, 그 결과를 분석하여 봄으로써 시스템의 응용 가능성을 보여준다.

학술문헌을 인용하는 트윗의 기능 분석 연구 (Function Classification of tweets Citing Scholarly Articles)

  • 김병규;강지훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.83-84
    • /
    • 2018
  • 개별논문 평가를 위해 제안된 altmetric가 주목받고 있다. altmetrics에서는 개별 논문의 트윗의 건수를 평가요소 중 하나로 활용한다. 그러나 여러가지 목적으로 작성된 트윗을 단일하게 처리하는 것은 문제가 있다. 본 논문은 과학 논문에 달린 트윗들을 분석하여 기능의 범주를 정의하고 분류체계를 제시하였으며, 기존의 논문의 인용기능 분류 실험을 실시하여 그 결과와 비교 분석을 수행하였다. 향후 도출한 트윗 기능 분류에 대한 개선과 추가적인 연구를 수행할 계획이다.

  • PDF

텍스트 마이닝 기법을 이용한 컴퓨터 네트워크의 침입 탐지 (Using Text Mining Techniques for Intrusion Detection Problem in Computer Network)

  • 오승준;원민관
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.27-32
    • /
    • 2005
  • 최근 들어 데이터 마이닝 기법을 컴퓨터 네트워크의 침입 탐지에 적용하려는 많은 연구가 진행되고 있다. 본 논문에서는 침입 탐지 분야에서 프로그램 행위가 정상적인지 비정상적인지를 분류하기 위한 방법을 연구한다. 이를 위해, 택스트 마이닝 기법중의 하나인 k 최근접 이웃 (kNN) 분류기를 이용한 새로운 방법을 제안한다. 본 논문에서는 택스트 분류 기법을 적용하기 위해 각각의 시스템 호출을 단어로 간주하고, 시스템 호출의 집합들을 문서로 간주한다. 이러한 문서들은 kNN 분류기를 이용하여 분류된다. 간단한 예제를 통하여 제안하는 절차를 소개한다.

  • PDF

단어 빈도 가중치를 이용한 자동 문서 분류 (Automatic Document Classification Based on Word Frequency Weight)

  • 노현아;김민수;김수형;박혁로
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.581-584
    • /
    • 2002
  • 본 논문에서는 범주 내의 키워드 빈도에 의해 문서를 자동으로 분류하는 방법을 제안한다. 문서 자동분류 시스템에서는 문서와 문서를 비교하기 위해서 분류 자질(feature)에 적절한 가중치를 부여할 필요가 있다. 본 논문에서는 수작업으로 분류된 신문기사를 이용하여 자질의 가중치를 학습하는 방법을 사용하였다. 기존의 용어가중치 방법은 각 범주별로 가장 많이 등장한 명사부터 순서대로 추출하여 가중치를 주는 방법을 사용한 것에 비해 본 논문에서는 명사의 출현 횟수뿐만 아니라 출현위치를 함께 고려하여 가중치를 계산하는 방법을 제안한다. 또한 단어 빈도 가중치 방법의 변형된 방식을 사용함으로써 기존의 단어 빈도 가중치 방법과 비교하여 분류 정확도 측면에서 9%이상 성능 향상을 있음을 보인다.

  • PDF

알츠하이머 치매환자 분류 방법 비교 분석 (Comparative Analysis of Classification Methods for Alzheimer's Dementia Patients)

  • 이재경;서진범;이재성;조영복
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.323-324
    • /
    • 2022
  • 전 세계적으로 고령화 사회가 지속됨에 따라 평균수명이 증가하여 고령화 문제가 심각해지고 있는 추세이다. 고령에 속하는 65세 이상 노인들이 자주 발병하는 알츠하이머 치매는 명확한 치료법이 존재하지 않아 발병 전 조기 발견 및 예방이 중요하다. 본 논문에서는 컨볼루션 신경망을 기반으로 한 알츠하이머 치매분류방법을 제안한 논문과, 그래프 합성곱 신경망, 다중 커널 학습 분류기, 기계학습, SVM 분류기 등의 방법으로 알츠하이머 치매 분류에 대한 논문을 소개하고, 각각의 제안 방법 및 특징에 대해 비교분석한다.

  • PDF

베이지안 네트워크와 규칙기반 병합 알고리즘을 이용한 자동 세포 분류 및 분할 (Automatic Cell Classification and Segmentation based on Bayesian Networks and Rule-based Merging Algorithm)

  • 정미라;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.141-144
    • /
    • 2008
  • 본 논문에서는 세포영상을 분할하고 분류하는 알고리즘을 제안한다. 우선, 배경으로부터 세포를 분할한 후, 학습데이터로부터 얻은 Compactness, Smoothness, Moments와 같은 형태학적 특징을 추출한다. 전경세포들이 분할된 후에, 보다 정밀한 세포분석을 위해서 군집세포(Overlapped Cell)와 독립세포(Isolated Cell)를 분류 할 수 있는 알고리즘의 개발이 필수적이다. 이를 위해서 본 논문에서는 베이지안 네트워크와 각 노드에 대한 3개의 확률밀도함수를 사용하여 각 세포 영역을 분류한다. 분류된 군집세포영역은 향후 정확한 세포 분석을 위해서 군집세포가 포함하는 독립세포의 수만큼 마커를 찾고, Watershed 알고리즘과 병합과정을 거쳐 하나의 독립세포를 분리하게 된다. 현미경으로부터 얻은 세포영상에 대한 실험 결과는 이전 논문들에서 제안한 방법들과 비교했을 때, 각 군집세포의 독립세포로의 분리 이전에 세포영역에 대한 분류과정을 먼저 수행하였기 때문에 분할 성능이 크게 향상되었음을 확인할 수 있다.

융선 기울기의 변화량을 이용한 앙상블 지문분류 시스템 (An Ensemble Fingerprint Classification System Using Changes of Gradient of Ridge)

  • 윤경배;박창희
    • 한국지능시스템학회논문지
    • /
    • 제13권5호
    • /
    • pp.545-551
    • /
    • 2003
  • 본 논문은 전통적인 지문분류 모델인 헨리식 분류방법으로는 적용이 어려운 현대의 자동화된 지문인식 시스템에서 대용량 데이터베이스 운용시 정합속도를 향상시키기 위한 융선 기울기의 변화량을 이용한 앙상블 지문분류 알고리즘을 적용한다. 기존의 분류체계인 헨리분류체계는 중심점과 삼각점을 모두 획득하는 회전낙인의 경우에 사용 가능한 분류방법이나 현대의 자동화된 지문인식 시스템에서는 입력센서의 크기 및 입력방법의 문제로 인하여, 헨리식 분류방법을 적용할 수 없다. 본 논문에서 제안하는 앙상블 지문분류 시스템 알고리즘은 융선 기울기의 변화량을 이용하여 삼각점을 획득하지 못한 영상에서도 기존의 헨리식 분류체계에 의해 분류된 5개의 문양을 분류할 수 있다. 이와 같은 방법으로 지문분류론 수행한 후 정합을 실행하면 정합 대상이 되는 데이터의 양이 줄어들게 되어 인식 시스템의 정합속도를 향상시킬 수 있다.

국내 대학기관 재난안전분야 학과 소속 저자의 학술지 논문 분석 (Analysis of Author's Journal Papers belonging to Departments in the field of Disaster and Safety at Domestic Universities)

  • 김병규;류범종;심형섭
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.169-172
    • /
    • 2022
  • 재난안전 분야의 기술개발 동향을 파악하고 지적 관계를 분석하기 위한 연구에서 신뢰성과 최신성을 겸비한 학술정보를 활용하는 것은 매우 유용하다. 기존의 논문 기반 계량정보분석 연구에서는 관련 분야의 학술지와 키워드를 중심으로 분석 대상 논문을 선별하여 연구재료로 사용하였다. 본 논문에서는 재난안전 분야의 보다 세부적인 연구 특성 파악을 위해 국내 대학기관의 방재 및 안전공학 학과에 소속된 저자들의 논문 정보를 대상으로 기관식별, 학과유형 분류, 재난안전유형 분류. 표준산업분류를 매핑하고 주요 측면별로 분석 연구를 수행하였다. 분석 결과, 재난안전 분야 연구에서 저자소속 기관의 유형 및 지역적 분포, 공저 학과 유형의 구성, 재난안전유형 및 표준산업분류의 현황과 핵심 키워드가 자세히 파악되었다. 연구 결과는 향후 지능형 위기경보 체계 구축을 위한 재난유형별 주요 기관 및 전문가 식별과 추천에 활용이 기대된다.

  • PDF