• 제목/요약/키워드: 동시 분류

검색결과 1,252건 처리시간 0.034초

분산 환경하에서의 데이타관리 분류체계에 대한 연구

  • 박주석;편흥렬
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1994년도 춘계공동학술대회논문집; 창원대학교; 08월 09일 Apr. 1994
    • /
    • pp.49-57
    • /
    • 1994
  • 진정한 의미의 다운사이징을 구현하기 위해서는 필요한 분산데이타베이스의 구현은 현재 여러가지 기술적인 문제점들을 안고 있다. 따라서 동시성 제어(concurrency control)와 갱신 (update propagation), 복구(recovery), 질의어 처리(query processing), 카달로그 관리(catalog management)등과 같은 분산 환경에서의 데이타베이스에 관련된 기술적인 문제점들을 해결하기 위해서는 어떠한 최적의 방법들을 개발해야만 한다. 이러한 방법들의 개발은 관계형 데이타베이스의 데이타관리 분류체계를 통한 대안들의 선택과 운용에 의해 가능할 것이다. 분산 환경하에서 사용되어질 수 있는 관계형 데이타베이스의 데이타관리 분류체계를 availability, expression, currency의 관점에서 Basic table과 view로 구분하여 정립해 보았다. Basic table은 current update가 필수적이므로 availability와 expression의 관점에서 분류하였고, view는 physical file의 존재성 유무와 시간적 실행의 차이를 기준으로 분류하였다. 그리고 이러한 분류기준에 따른 특성들을 분산데이타베이스 구축에 이용하는 방법들에 대해 이야기 하였다. 다시 말해 non-current materialized view 뿐만 아니라 current materialized view를 동시에 지원하는 하나의 distributed view update architecture를 개발하는 것에 대해 하나의 방법으로 제시하였다. 즉 immediate update와 deferred update는 current view를 이용하고 periodical update는 non-current view를 이용하여 100%의 distributed data resources를 관리 할 수 있는 효율적인 distributed system를 개발하는 것을 제시하였다. 본 논문은 데이타베이스론의 입장에서 아직 정립되어 있지 않은 분산 환경하에서의 관계형 데이타베이스의 데이타관리의 분류체계를 나름대로 정립하였다는데 그 의의가 있다. 또한 이것의 응용은 현재 분산데이타베이스 구축에 있어 나타나는 기술적인 문제점들을 어느정도 보완할 수 있다는 점에서 그 중요성이 있다.

새로운 과학 기술분류의 철학과 구조

  • 송충한
    • 기술혁신학회지
    • /
    • 제2권3호
    • /
    • pp.34-47
    • /
    • 1999
  • 과학기술분류는 연구자들의 연구활동을 담는 그릇이다. 과학기술자들이 다양한 분야에서 각기 다른 연구활동을 수행할 때 과학기술분류는 이들의 연구활동을 나누고 묶는 기준이된다. 이 연구는 한국과학재단에서 1999년부터 사용하고 있는 새로운 과학기술 분류체계의 속성과 구조에 관한 것이다. 새로운 분류체계는 분야를 복수로 기재하도록 함으로써 복합(interdisciplinary) 분야의 표현이 가능하도록 하였고 연구분야와 적용분야를 동시에 기재하도록 함으로써 과학기술정책과 산업정책이 연결될수 있는 체계를 갖도록 하였다.

  • PDF

개념 기반 문서 분류를 위한 단어 애매성 해소 (Word Ambiguity Resolution for Concept-based Text Classification)

  • 강원석;황도삼
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.167-169
    • /
    • 2000
  • 문서 분류 시스템은 문서에 나타난 용어나 개념의 출현 정보를 이용한다. 개념 기반문서분류는 용어를 사용하지 않고 문서의 단어에 나타난 의미를 이용한다. 단어가 중의성을 가지는 경우 그 뜻을 정확히 가리지 않으면 문서에 출현하지 않은 의미를 이용하게 되므로 문서 분류 시스템의 성능이 저하된다. 본 논문은 개념 기반 문서분류를 위하여 단어 애매성 해소를 시도하였다. 문서에 출현된 의미 정보를 이용하여 의미들간의 공기정보를 구하고 이를 이용하여 단어의 애매성을 해소하였다. 단어의 의미정보는 시소러스 도구를 통해 획득하고 의미들간의 공기정보는 의미들간의 동시 출현 정보를 획득하여 구축하였다. 본 시스템은 문서 분류 등 자연어처리 분야에 이용할 수 있어 효용가치가 높다.

  • PDF

문서 분류를 위한 문장 응집도와 주어 주도의 주제어 추출 (Sentence Cohesion & Subject driving Keywords Extraction for Document Classification)

  • 안희국;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.463-465
    • /
    • 2005
  • 문서분류 시 문서의 내용을 표현하기 위한 자질로서 사용되는 단어의 출현빈도정보는 해당 문서의 주제어를 표현하기에 취약한 점을 갖고 있다. 즉, 키워드가 문장에서 어떠한 목적(의미)으로 사용되었는지에 대한 정보를 표현할 수가 없고, 문장 간의 응집도가 강한 문장에서 추출되었는지 아닌지에 대한 정보를 표현할 수가 없다. 따라서, 이 정보로부터 문서분류를 하는 것은 그 정확도에 있어서 한계를 갖게 된다. 본 논문에서는 이러한 문서표현의 문제를 해결하기위해, 키워드를 선택할 때, 자질로서 문장의 역할(주어)정보를 추출하여 가중치 부여방식을 통하여 주어주도정보량을 추출하였다. 또한, 자질로서 문장 내 키워드들의 동시출현빈도 정보를 추출하여 문장 간 키워드들의 연관성정도를 시소러스에 담아내었다. 그리고, 이로부터 응집도 정보를 추출하였다. 이 두 정보의 통합으로부터 문서 주제어를 결정함으로서, 문서분류를 위한 주제어 추출 시 불필요한 키워드의 삽입을 줄이고, 동시 출현하는 키워드들에 대한 선택 기준을 제공하고자 하였다. 실험을 통해 한번 출현한 키워드라도, 문장을 주도하는 주어로서 사용될 경우와 응집도 가중치가 높을 경우에 주제어로서의 선택될 가능성이 향상되고, 문서분류를 위해 좀 더 세분화된 키워드 점수화가 가능함을 확인하였다. 따라서, 선택된 주제어가 문서분류의 정확도에 있어서 향상을 가져올 수 있을 것으로 기대한다.

  • PDF

계층적 분류체계를 위한 자동분류 기법에 관한 연구 (An Experimental Study on Text Categorization for Hierarchical Classification)

  • 이영숙;정영미
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.173-176
    • /
    • 2001
  • 이 연구는 계층적 분류체계를 기반으로 자동분류를 수행할 HiCat 알고리즘을 제안한다. HiCat 알고리즘은 DDC 지식베이스의 주제어와 기계학습을 거친 정보를 동시에 이용하고, 각 계층별로 주제적합성가중치를 구해 최종 주제범주를 결정한다. 이 알고리즘이 최적의 성능을 보이는 조건을 알아보고, 일반 분류기와의 성능 비교를 통해 HiCat 알고리즘을 평가해 보았다.

  • PDF

대화에서 멀티태스크 학습을 이용한 감정 및 화행 분류 (Emotion and Speech Act classification in Dialogue using Multitask Learning)

  • 신창욱;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.532-536
    • /
    • 2018
  • 심층인공신경망을 이용한 대화 모델링 연구가 활발하게 진행되고 있다. 본 논문에서는 대화에서 발화의 감정과 화행을 분류하기 위해 멀티태스크(multitask) 학습을 이용한 End-to-End 시스템을 제안한다. 우리는 감정과 화행을 동시에 분류하는 시스템을 개발하기 위해 멀티태스크 학습을 수행한다. 또한 불균형 범주 분류를 위해 계단식분류(cascaded classification) 구조를 사용하였다. 일상대화 데이터셋을 사용하여 실험을 수행하였고 macro average precision으로 성능을 측정하여 감정 분류 60.43%, 화행 분류 74.29%를 각각 달성하였다. 이는 baseline 모델 대비 각각 29.00%, 1.54% 향상된 성능이다. 본 논문에서는 제안하는 구조를 이용하여, 발화의 감정 및 화행 분류가 End-to-End 방식으로 모델링 가능함을 보였다. 그리고, 두 분류 문제를 하나의 구조로 적절히 학습하기 위한 방법과 분류 문제에서의 범주 불균형 문제를 해결하기 위한 분류 방법을 제시하였다.

  • PDF

라이다와 광학영상을 이용한 토지피복분류 (Land Cover Classification Using Lidar and Optical Image)

  • 조우석;장휘정;김유석
    • 한국측량학회지
    • /
    • 제24권1호
    • /
    • pp.139-145
    • /
    • 2006
  • 라이다 데이터는 데이터 취득시간과 처리시간이 짧으며 높은 점밀도와 정확도를 가지고 있다. 그러나 광학영상과는 달리 3차원 형태의 비정규 점군의 형태이기 때문에 지표면에 대한 정확한 분류가 어렵다. 본 연구에서는 라이다 데이터와 광학영상을 동시에 이용해서 감독분류 기법을 통해 토지피복분류를 수행하였다. 먼저 라이다 데이터로부터 격자 크기가 1m인 DSM 영상과 DEM 영상을 제작하고 이를 이용하여 nDSM 영상을 제작하였다. 또한 라이다 데이터의 인텐서티(intensity) 정보를 이용해서 인텐서티 영상을 제작하였다. 광학영상의 입력데이터는 CCD 영상의 적색, 청색, 녹색 파장영역과 IKONOS 영상의 근적외선 파장영역이다. 그리고 CCD 영상의 적생광 파장영역을 이용해서 제작한 식생지수 영상이다. 광학영상과 라이다 데이터를 동시에 이용해서 토지피복 분류를 수행한 결과 74%의 분류 정확도를 얻을 수 있었다. 추가적으로 그림자 지역의 재분류, 수계지역의 처리 그리고 숲과 건물의 오분류 수정 과정을 수행하여 최종적으로 81.8%의 분류 정확도를 얻을 수 있었다.

난수발생기를 이용한 일반화된 회귀신경망 분류기와 프로모터 분류에의 응용 (A GRNN classifier using random generator and application to classifying promoters)

  • 김근호;김병환;김경남;홍진한
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2003년도 하계학술대회 논문집 D
    • /
    • pp.2552-2554
    • /
    • 2003
  • 난수발생기 (Random generator-RG)와 GRNN을 이용한 분류기 설계방식을 제안하며, 이를 프로모터 염기서열의 분류에 적용한다. 주어진 난수범위에서 다중 분류기를 발생하였으며, 그 성능을 예측정확도와 분류민감도 측면에서 평가하였고, 분류민감도는 다시 전체와 개별적 프로모터에 대해서 세분화하여 평가하였다. 최적화된 분류기 상호간의 비교에서 제안된 기법은 모든 임계점에 대해서, 전체 분류민감도와 전체 예측정확도를 향상시키었으며, 이는 전체 분류 민감도에서 더 두드러졌다. 한편, 개별적 프로모터에 대한 분류민감도와 예측정확도도 평균적으로 향상되었다. 이 같은 결과로 제안된 기법이 분류와 예측성능을 동시에 증진하는데 매우 효과적임을 알 수 있었다.

  • PDF

Convolution Neural Network와 Recurrent Neural Network를 활용한 네트워크 패킷 분류 (Network Packet Classification Using Convolution Neural Network and Recurrent Neural Network)

  • 임현교;김주봉;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.16-18
    • /
    • 2018
  • 최근 네트워크 상에 새롭고 다양한 어플리케이션들이 생겨나면서 이에 따른 적절한 어플리케이션별 서비스 제공을 위한 패킷 분류 방법이 요구되고 있다. 이로 인하여 딥 러닝 기술이 발전 하면서 이를 이용한 네트워크 트래픽 분류 방법들이 제안되고 있다. 따라서, 본 논문에서는 딥 러닝 기술 중 Convolution Neural Network 와 Recurrent Neural Network 를 동시에 활용한 네트워크 패킷 분류 방법을 제안한다.

Multi-channel CNN을 이용한 한국어 감성분석 (Multi-channel CNN for Korean Sentiment Analysis)

  • 김민;변증현;이충희;이연수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-83
    • /
    • 2018
  • 본 논문은 한국어 문장의 형태소, 음절, 자소를 동시에 각자 다른 합성곱층을 통과시켜 문장의 감성을 분류하는 Multi-channel CNN을 제안한다. 오타를 포함하는 구어체 문장들의 경우에 형태소 기반 CNN으로 추출 할 수 없는 특징들을 음절이나 자소에서 추출 할 수 있다. 한국어 감성분석에 형태소 기반 CNN이 많이 쓰이지만, 본 논문의 Multi-channel CNN 모델은 형태소, 음절, 자소를 동시에 고려하여 더 정확하게 문장의 감성을 분류한다. 본 논문이 제안하는 모델이 형태소 기반 CNN보다 야구 댓글 데이터에서는 약 4.8%, 영화 리뷰 데이터에서는 약 1.3% 더 정확하게 문장의 감성을 분류하였다.

  • PDF