• 제목/요약/키워드: automatic classification

검색결과 883건 처리시간 0.028초

문단 단위 가중치 함수와 문단 타입을 이용한 문서 범주화 (Automatic Text Categorization Using Passage-based Weight Function and Passage Type)

  • 주원균;김진숙;최기석
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.703-714
    • /
    • 2005
  • 문서 범주화 분야에 대한 연구들은 전체 문서 단위에 한정되어 왔으나, 오늘날 대부분의 전문들이 주요 주제를을 표현하기 위해서 조직화 된 특정 구조로 기술되고 있어, 텍스트 범주화에 대한 새로운 인식이 필요하게 되었다. 이러한 구조는 부주제(Sub-topic)의 텍스트 블록이나 문단(Passage) 단위의 나열로서 표현되는데, 이러한 구조 문서에 대한 부주제 구조를 반영하기 위해서 문단 단위(Passage-based) 문서 범주화 모델을 제안한다. 제안한 모델에서는 문서를 문단들로 분리하여 각각의 문단에 범주(Category)를 할당하고, 각 문단의 범주를 전체 문서의 범주로 병합하는 방법을 사용한다. 전형적인 문서 범주화와 비교할 때, 두 가지 부가적인 절차가 필요한데, 문단 분리와 문단 병합이 그것이다. 로이터(Reuter)의 4가지 하위 집합과 수십에서 수백 KB에 이르는 전문 테스트 컬렉션(KISTl-Theses)을 이용하여 실험하였는데, 다양한 문단 타입들의 효과와 범주 병합 과정에서의 문단 위치의 중요성에 초점을 맞추었다 실험한 결과 산술적(Window) 문단이 모든 테스트 컬렉션에 대해서 가장 좋은 성능을 보였다. 또한 문단은 문서 안의 위치에 따라 주요 주제에 기여하는 바가 다른 것으로 나타났다.

미디어 영상 자동 분류를 위한 온톨로지 모델링 및 규칙 기반 추론 (Ontology Modeling and Rule-based Reasoning for Automatic Classification of Personal Media)

  • 박현규;소치승;박영택
    • 정보과학회 논문지
    • /
    • 제43권3호
    • /
    • pp.370-379
    • /
    • 2016
  • 최근 스마트 디바이스가 많이 보급되면서 개인 영상 미디어가 다양한 방식으로 생성되어 영상 미디어를 이용한 서비스가 요구되고 있다. 이에 따라 영상 미디어 분석 및 인지 기술에 대한 연구가 활발히 진행되어, 영상으로부터 의미 있는 객체를 인지할 수 있게 되었다. 기존의 미디어 온톨로지를 이용한 시스템은 영상의 제목, 태그 및 스크립터 정보를 이용하기 때문에 영상에 등장하는 객체를 통해 미디어 분류를 수행할 수 없는 단점이 있다. 따라서 본 논문에서는 영상 미디어 데이터에서 인지되는 객체들을 이용해 해당 영상이 속하는 범주로 자동 분류하기 위해 서술논리 기반(Description Logic) 추론 시스템과 순서에 따라 달라질 수 있는 이벤트 처리를 위한 규칙 기반 추론 시스템을 제안한다. 제안하는 서술논리 기반 추론 시스템은 영상 미디어에서 인지되는 객체들의 관계를 서술논리로 정의된 행위(Activity) 온톨로지로 표현하고, 실체화 추론을 통해 인지된 객체가 행위로 추론되는 방법에 대해 설명한다. 규칙 기반 추론 시스템은 추론된 행위의 순서에 따른 이벤트를 정의하고 순서 기반 규칙 추론을 이용하여 범주에 알맞은 이벤트로 자동 분류하는 방법에 대하여 설명한다. 제안하는 방법의 타당성을 증명하기 위해 유투브의 영상에 대한 분석을 통해 올바른 범주로 분류된 미디어 데이터를 구성하여 제안하는 시스템의 타당성을 증명하였다.

북 마크 자동 분류를 위한 학습 에이전트 (A Learning Agent for Automatic Bookmark Classification)

  • 김인철;조수선
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.455-462
    • /
    • 2001
  • 웹은 이제 인터넷의 중요한 서비스중의 하나가 되었다. 웹 공간을 탐색할 때 사용자들은 항해하는 동한 만나는 흥미 있는 사이트들을 기록하기 위해 북 마크 기능을 이용한다. 북 마크 기능을 이용할때 겪는 문제중의 하나가 거듭된 새로운 북 마크의 추가로 인해 북 마크 리스트의 길이가 길어지면 북 마크 리스트가 일관성 있는 구성을 잃어버리게 되어 실제적인 도움을 주기 어렵다는 것이다. 사용자가 북 마크 파일을 효율적이고 체계적으로 유지하기 위해서는 북 마크 파일에 추가되는 새로운 북 마크들을 카테고리별로 분류하여 신규 폴더를 찾아 삽입해주어야 한다. 본 논문에서는 대응되는 웹 문서들을 다운 받아 내용을 분서함으로써 자동으로 북 마크를 분류하는 BClassifier라 불리는 학습에이전트를 소개한다. BClassifier 에이전트를 위한 훈련 예의 주된 공급원은 바로 사용자가 명시적으로 이미 주제에 따라 몇 개의 북 마크 폴더들로 분류해놓은 북 마크들이다. 여기에 주제 카테고리들을 확대하고 이들에 대한 훈련 문서들을 확보하기 위해 추가적으로 Yahoo 사이트의 최상휘 카테고리들로부터 웹 문서들을 수집하여 훈련 예에 포함시킨다. BClassifier 에이전트는 잘 알여진 확률기반의 분류 기술이나 나이브 베이지안 학습 방법을 채용하고 있다. 본 논문에서는 BClassifier 에이전트에 관한 몇 가지 실험 결과를 소개하고 평가한다. 나이브 베이지안 방법과 k-최근접 이웃 방법, TFIDF 등과 같은 서로 다른 학습 방법들과 비교 실험 결과도 제시한다.

  • PDF

고해상도 위성영상의 상대방사보정을 통한 자동화 지향 공간객체추출 방안 연구 (A Study on Method of Automatic Geospatial Feature Extraction through Relative Radiometric Normalization of High-resolution Satellite Images)

  • 이동국;이현직
    • 대한원격탐사학회지
    • /
    • 제36권5_2호
    • /
    • pp.917-927
    • /
    • 2020
  • 우리나라 국토교통부는 GSD가 0.5m 급인 위성영상의 촬영이 가능한 CAS 500-1/2 위성과 함께 이를 활용하기 위한 기술을 개발 중에 있다. 이에 본 연구에서는 CAS 500-1/2 위성영상의 활용을 위한 기술로 자동화를 지향하는 공간객체추출 기술을 개발하고자 하였다. 연구 수행을 위해 CAS 500-1/2와 가장 유사할 것으로 예상되는 KOMPSAT-3A 위성영상을 연구에 이용하였으며, 상대방사보정을 통해 공간객체추출의 자동화 가능성을 분석하고자 하였다. 이를 위하여 상대방사보정에 이용된 참조 영상과 상대방사보정된 영상에서 매개변수 및 임계값을 동일하게 적용하고, 공간객체를 추출하였다. 추출된 공간객체가 참조영상과 상대방사보정된 영상에서 유사한 형태로 추출되는지에 대한 정성적 분석과 분류정확도가 본 연구에서 설정한 목표정확도인 90% 이상을 만족하는지에 대한 정량적 분석을 통해 공간객체추출의 자동화 가능성 여부를 분석하고자 하였다. 그 결과, 참조영상과 상대방사보정된 영상에서 각각 추출한 공간객체가 유사하게 추출되는 것을 확인하였으며, 분류정확도 분석 결과가 모두 목표정확도인 90% 이상을 만족하는 것으로 나타나 상대방사보정을 통해 공간객체추출 시 자동화가 가능할 것으로 판단된다.

KOMPSAT-3급 위성영상을 이용한 농업 토지이용 및 작물 생육정보 추출 (Extraction of Agricultural Land Use and Crop Growth Information using KOMPSAT-3 Resolution Satellite Image)

  • 이미선;김성준;신형섭;박진기;박종화
    • 대한원격탐사학회지
    • /
    • 제25권5호
    • /
    • pp.411-421
    • /
    • 2009
  • 본 연구에서는 KOMPSAT-3급 고해상도 위성영상을 이용하여 정밀농업 토지이용도와 식생정보를 추출하는 반자동 기법을 개발하여 제시하고자 한다. 분석에 사용한 자료는 KOMPSAT-3급의 공간 해상도와 분광 해상도가 동일한 IKONOS-2 영상(2001/5/25, 2001/12/25, 2003/10/23), QuickBird-2 영상(2006/5/1, 2004/11/17) 그리고 KOMPSAT-2 영상(2007/9/17)을 사용하였다. KOMFSAT-3급 영상자료로부터 정밀농업 재배지도를 작성하기 위해 ISODATA방법을 이용한 정밀농업 토지이용도를 작성하여 현장자료를 기존 스크린 디지타이징 기법으로 작성한 정밀 토지이용도와 비교하였다. 다양한 작물의 생육정보를 추출하기 위하여 식생지수인 RVI, NDVI, ARVI, SAVI를 이용하여 각 작물별로 분석하였으며, 이 과정을 ERDAS IMAGINE Spatial Modeler Tool로 개발하였다.

EDMS와 기록물의 라이프사이클 (EDMS and Life-cycle of Records)

  • 김익한
    • 기록학연구
    • /
    • 제5호
    • /
    • pp.3-37
    • /
    • 2002
  • Today the market of EDMS is esteemed more than 100 billions won. It signifies a comming of age of electronic records. The traditional archival theories which are based on the paper records are confronted with a new challenge. In some leading countries of archival studies reorientation of archives management has been tried by a number of distinguished specialists such as Bearman and Hedstrom since 10 years. As a consequence new paradigm of archival theories has been developed. Also in Korea this new paradigm has been introduced by some expert such as Lee, Sang-Min, Sul, Moon-won, Lee, Seung-Eok. However their arguments are too general to offer a concrete clue for new paradigm. Faced by new age of electronic records, it's important to start a discussion for the reasonable methods of electronic records management at once. The most drastically changed part of record management by the electronic technique is the life-cycle of records. The commonly practiced three-stage life-cycle is to be reduced to the two-stage life-cycle, and the concept of the spatial movement of records is to be changed. It can be also pointed that the public emerges as user from the early creating stage of records beyond time and space. Thus is can be said that the method of the management features dynamic and cohesive. The method of appraisal must be also changed and reproduced, so that it can reflect the various levels considering dynamics of the electronic records. Supposedly it will be a core factor that causes the change of methodology in records management with the change of life-cycle theory. It must be noted that various subjects would be involved in the work of classification and description over time and space and that feedback between them is of important. Description also tends to be made at the crating stage of records and structured dynamically. It results from the change of life-cycle and the introduction of the concept of continuum. Such trend allows us to start discussions on the assumption that description of both creator and archival professionals act together an important role. Of course, it is linked with the methodology in which most descriptions are made automatically at the early drafting stage of the structure. The meat date is formed on the assumption that there should be feedback between areas of automatic description, description of creators and archival professionals. The most important thing in description is to develop a suitable way how it is structured. An alternative must be offered for managing data set. As iweb that is being operated by Myongji university shows, records created in daily business are managed not as electronic records but as date base. This is because they exist outside the repository in the EDMS system. Since data set often has various sources, an alternative for classification needs to be developed. It is now likely that database is filed according to the created year to be transferred automatically to the repository. Over a long-term the total management of database, electronic records and electronic information will be a topic. A right direction of new paradigm will be found for both iweb and E-government, when practice and studies of theories are combined and interacted.

부분 단어 토큰화 기법을 이용한 뉴스 기사 정치적 편향성 자동 분류 및 어휘 분석 (Automatic Classification and Vocabulary Analysis of Political Bias in News Articles by Using Subword Tokenization)

  • 조단비;이현영;정원섭;강승식
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권1호
    • /
    • pp.1-8
    • /
    • 2021
  • 뉴스 기사의 정치 분야는 보수, 진보와 같이 양극화된 편향적 특성이 존재하며 이를 정치적 편향성이라고 한다. 뉴스 기사로부터 편향성 문제를 분류하기 위해 키워드 기반의 학습 데이터를 구축하였다. 대부분의 임베딩 연구에서는 미등록어로 인한 문제를 완화시키기 위해 형태소 단위로 문장을 구성한다. 본 논문에서는 문장을 언어 모델에 의해 세부적으로 분할하는 부분 단어로 문장을 구성할 경우 미등록어 수가 감소할 것이라 예상하였다. 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델을 제안하며 이를 SVM과 전방향 뉴럴 네트워크 구조에 적용하여 정치적 편향성 분류 실험을 진행하였다. 형태소 토큰화 기법을 이용한 문서 임베딩 모델과 비교 실험한 결과, 부분 단어 토큰화 기법을 이용한 문서 임베딩 모델이 78.22%로 가장 높은 정확도를 보였으며 부분 단어 토큰화를 통해 미등록어 수가 감소되는 것을 확인하였다. 분류 실험에서 가장 성능이 좋은 임베딩 모델을 이용하여 정치적 인물을 기반한 어휘를 추출하였으며 각 성향의 정치적 인물 벡터와의 평균 유사도를 통해 어휘의 편향성을 검증하였다.

적응형 블러 기반 비디오의 수평적 확장 여부 판별 네트워크 (Video classifier with adaptive blur network to determine horizontally extrapolatable video content)

  • 김민선;서창욱;윤현호;노준용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제30권3호
    • /
    • pp.99-107
    • /
    • 2024
  • 기존에 존재하는 비디오 영역을 가로 혹은 세로로 확장하는 비디오 확장 기술에 대한 수요가 높아지고 있지만, 최신 기술로도 모든 비디오를 성공적으로 확장할 수는 없다. 따라서 비디오 확장을 시도하기 전에 해당 비디오가 잘 확장될 수 있을지 판단하는 것이 중요하다. 이를 통해 불필요한 컴퓨팅 자원 낭비를 줄일 수 있기 때문이다. 이 논문은 비디오가 수평 확장에 적합한지 판별하는 비디오 분류기를 제안한다. 이 분류기는 광학 흐름과 적응형 가우시안 블러 네트워크를 활용하여 흐름 기반 비디오 확장 방식에 적용할 수 있다. 학습을 위한 라벨링은 유저 테스트 및 정량적 평가를 거쳐 엄격하게 이루어졌다. 이렇게 라벨링된 데이터셋으로 학습한 결과, 주어진 비디오의 확장 가능성을 분류하는 네트워크를 개발할 수 있었다. 제안된 분류기는 광학 흐름과 적응형 가우시안 블러 네트워크를 통해 비디오의 특성을 효과적으로 포착함으로써, 단순히 원본 비디오나 고정된 블러만을 사용하는 경우보다 훨씬 정확한 분류 성능을 보였다. 이 분류기는 향후 다양한 분야에서 활용될 수 있으며, 특히 몰입감 있는 시청 경험을 위해 장면을 자동으로 확장하는 기술과 함께 사용될 수 있을 것으로 기대된다.

요 분석을 위한 지능형 컬러 분류기 비교 (Comparison of Intelligent Color Classifier for Urine Analysis)

  • 엄상훈;김형일;전계록;엄상희
    • 한국정보통신학회논문지
    • /
    • 제10권7호
    • /
    • pp.1319-1325
    • /
    • 2006
  • 요 분석은 임상에서의 기본적인 검사항목으로 숙련된 간호사에 의한 육안검사를 시행한다. 최근에는 분석량의 증가와 분석 시간의 단축을 위하여 자동화된 요 분석 시스템을 이용하여 측정한다. 그러나 이들 시스템은 기기별 로 나타나는 결과에 차이가 발생하고 있다. 따라서 요의 컬러에 따른 정확한 검사를 위하여 새로운 요 컬러 분류 알고리즘이 요구된다. 본 논문은 퍼지 논리와 신경회로망 알고리즘을사용하여 요 분석 시스템의 지능형 컬러 분류기를 제작하였다. 입력 파라미터는 전처리 과정을 거친 RGB 3가지 색상을 사용하였다. 구현된 분류기는 퍼지 논리와 신경회로망 알고리즘을 사용하였으며, 적색, 녹색, 청색의 3 가지 입력 데이터를 사용하여 9 가지 시료에 대한 $3{\sim}7$ 개의 각 단계별 분류를 수행하도록 구현하였다. 실험에 사용된 검체는 표준 시약을 사용하였으며, 요 분석 시스템을 위한 개별 표준시료에 따른 분류기의 성능을 비교하고, 신뢰성 및 임상적용가능성 여부를 검토하였다. 설험 결과 지능형 컬러 분류기는 많은 검사 항목에서 육안검색보다 좋은 결과를 보였다.

낙동강 유역 안개 발생시 기상 특성: 강정고령보 사례를 중심으로 (Atmospheric Characteristics of Fog Incidents at the Nakdong River : Case Study in Gangjeong-Goryeong Weir)

  • 박준상;임윤규;김규랑;조창범;장준영;강미선;김백조
    • 한국환경과학회지
    • /
    • 제24권5호
    • /
    • pp.657-670
    • /
    • 2015
  • Visibility and Automatic Weather System(AWS) data near Nakdong river were analyzed to characterize fog formation during 2012-2013. The temperature was lower than its nearby city - Daegu, whereas the humidity was higher than the city. 157 fog events were observed in total during the 2 year period. About 65% of the events occurred in fall (September, October, and November) followed by winter, summer, and spring. 94 early morning fog events of longer than 30 minutes occurred when south westerly wind speed was lower than 2 m/s. During these events, the water temperature was highest followed by soil surface and air temperatures due to the advection of cold and humid air from nearby hill. The observed fog events were categorized using a fog-type classification algorithm, which used surface cooling, wind speed threshold, rate of change of air temperature and dew point temperature. As a result, frontal fog observed 6 times, radiation 4, advection 13, and evaporation 66. The evaporation fog in the study area lasted longer than other reports. It is due to the interactions of cold air drainage flow and warm surface in addition to the evaporation from the water surface. In particular, more than 60% of the evaporation fog events were accompanied with cold air flows over the wet and warm surface. Therefore, it is needed for the identification of the inland fog mechanism to evaluate the impacts of nearby topography and land cover as well as water body.