• 제목/요약/키워드: 분류화

검색결과 4,781건 처리시간 0.031초

OECD의 화학물질 분류체계 통일화 방향 (The Work on Harmonization of Classification and Labelling in OECD)

  • 김필제
    • Environmental Analysis Health and Toxicology
    • /
    • 제12권1_2호
    • /
    • pp.21-26
    • /
    • 1997
  • 서론 : 1991년 OECD 화학물질그룹 및 관리위원회(CGMC)합동회의에서는 OECD가 화학물질의 분류와 표시제도의 국제적 통일화 활동에 참여하기로 결정하였고, EC, 스웨덴, 미국 등을 주축으로 정보교환소를 설치하여 급성경구 독성 및 환경에 위험한 물질의 통일화 업무를 개시하였다. (생략)

  • PDF

맵리듀스 환경에서 규칙 기반 분류화를 이용한 궤적 데이터 주행 시간 예측 알고리즘 (Travel Time Prediction Algorithm for Trajectory data by using Rule-Based Classification on MapReduce)

  • 김재원;이현조;장재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.798-801
    • /
    • 2014
  • 여행 정보 시스템(ATIS), 교통 관리 시스템 (ITS) 등 궤적 기반 서비스에서, 서비스 품질을 향상시키기 위해서는 주어진 궤적 질의에 대한 정확한 주행시간을 예측하는 것이 필수적이다. 이를 위한 대표적인 공간 데이터 분석 기법으로는 데이터 분류에서 높은 정확도를 보장하는 규칙 기반 분류화 기법이 존재한다. 그러나 기존 규칙 기반 분류화 기법은 단일 컴퓨터 환경만을 고려하기 때문에, 대용량 공간 데이터 처리에 적합하지 않은 문제점이 존재한다. 이를 해결하기 위해, 본 연구에서는 맵리듀스 환경에서 규칙 기반 분류화를 이용한 궤적 데이터 주행 시간 예측 알고리즘을 개발하고자 한다. 제안하는 알고리즘은 첫째, 맵리듀스를 이용하여 대용량 공간 데이터를 병렬적으로 분석함으로써, 활용도 높은 궤적 데이터 규칙을 생성한다. 이를 통해 대용량 공간 데이터 기반의 규칙 생성 시간을 감소시킨다. 둘째, 그리드 구조 기반의 지도 데이터 분할을 통해, 사용자 질의처리 시 탐색 성능을 향상시킨다. 즉, 주행 시간 예측을 위한 규칙 그룹을 탐색 시 질의를 포함하는 그리드 셀만을 탐색하기 때문에, 질의처리 성능이 향상된다. 마지막으로 맵리듀스 구조에 적합한 질의처리 알고리즘을 설계하여, 효율적인 병렬 질의처리를 지원한다. 이를 위해 맵 함수에서는 선정된 그리드 셀에 대해, 질의에 포함된 도로 구간에서의 주행 시간을 병렬적으로 측정한다. 아울러 리듀스 함수에서는 출발 시간 및 구간별 주행 시간을 바탕으로 맵 함수의 결과를 병합함으로써, 최종 결과를 생성한다. 이를 통해 공간 빅데이터 분석을 통한 주행 시간 예측 기법의 처리 시간 및 결과 정확도를 향상시킨다.

TextRank 알고리즘을 이용한 문서 범주화 (Text Categorization Using TextRank Algorithm)

  • 배원식;차정원
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.110-114
    • /
    • 2010
  • 본 논문에서는 TextRank 알고리즘을 이용한 문서 범주화 방법에 대해 기술한다. TextRank 알고리즘은 그래프 기반의 순위화 알고리즘이다. 문서에서 나타나는 각각의 단어를 노드로, 단어들 사이의 동시출현성을 이용하여 간선을 만들면 문서로부터 그래프를 생성할 수 있다. TextRank 알고리즘을 이용하여 생성된 그래프로부터 중요도가 높은 단어를 선택하고, 그 단어와 인접한 단어를 묶어 하나의 자질로 사용하여 문서 분류를 수행하였다. 동시출현 자질(인접한 단어 쌍)은 단어 하나가 갖는 의미를 보다 명확하게 만들어주므로 문서 분류에 좋은 자질로 사용될 수 있을 것이라 가정하였다. 문서 분류기로는 지지 벡터 기계, 베이지언 분류기, 최대 엔트로피 모델, k-NN 분류기 등을 사용하였다. 20 Newsgroups 문서 집합을 사용한 실험에서 모든 분류기에서 제안된 방법을 사용했을 때, 문서 분류 성능이 향상된 결과를 확인할 수 있었다.

기계학습 기법에 따른 KOMPSAT-3A 시가화 영상 분류 - 서울시 양재 지역을 중심으로 - (KOMPSAT-3A Urban Classification Using Machine Learning Algorithm - Focusing on Yang-jae in Seoul -)

  • 윤형진;정종철
    • 대한원격탐사학회지
    • /
    • 제36권6_2호
    • /
    • pp.1567-1577
    • /
    • 2020
  • 시가화 지역 토지피복분류는 도시계획 및 관리에 활용된다. 따라서, 시가화 지역에 대한 분류 정확도 향상 연구는 중요하다고 할 수 있다. 본 연구에서는 고해상도 위성영상인 KOMPSAT-3A을 기계학습 중 Support Vector Machine(SVM)과 Artificial Neural Network(ANN)을 기반으로 시가화지역 분류를 진행하였다. 훈련 데이터 구축과정에서 25 m 격자를 기반으로 훈련 지역을 구분하여 영상을 학습하였으며, 학습된 모델을 활용하여 테스트 지역을 분류하였다. 검증과정에서 250개의 GTP를 활용하여 오차 행렬을 통한 결과를 제시하였다. SVM 4가지 기법과 ANN 2가지 기법 중 SVM Polynomial Model이 가장 높은 정확도인 86%를 나타냈다. Ground Truth Points(GTP)를 활용하여 두 개의 모델을 비교하는 과정에서, SVM 모델은 전체적으로 ANN 모델보다 효과적으로 KOMPSAT-3A 영상을 분류하였다. 건물, 도로, 식생, 나대지 4가지 클래스 분류 중 건물이 가장 낮은 분류정확도를 보여주었으며, 이는 고층건물에 따른 건물 그림자에 의한 오분류가 주요 원인으로 나타났다.

군집화와 유전 알고리즘을 이용한 거친-섬세한 분류기 앙상블 선택 (Coarse-to-fine Classifier Ensemble Selection using Clustering and Genetic Algorithms)

  • 김영원;오일석
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.857-868
    • /
    • 2007
  • 좋은 분류기 앙상블은 분류기간에 상호 보완성을 갖추어 높은 인식 성능을 보여야 하며, 크기가 작아 계산 효율이 좋아야 한다. 이 논문은 이러한 목적을 달성하기 위한 거친-섬세한 (coarse-to-fine)단계를 밟는 분류기 앙상블 선택 방법을 제안한다. 이 방법이 성공하기 위해서는 초기 분류기 풀 (pool)이 충분히 다양해야 한다. 이 논문에서는 여러 개의 서로 다른 분류 알고리즘과 아주 많은 수의 특징 부분집합을 결합하여 충분히 큰 분류기 풀을 생성한다. 거친 선택 단계에서는 분류기 풀의 크기를 적절하게 줄이는 것이 목적이다. 분류기 군집화 알고리즘을 사용하여 다양성을 최소로 희생하는 조건하에 분류기 풀의 크기를 줄인다. 섬세한 선택에서는 유전 알고리즘을 이용하여 최적의 앙상블을 찾는다. 또한 탐색 성능이 개선된 혼합 유전 알고리즘을 제안한다. 널리 사용되는 필기 숫자 데이타베이스를 이용하여 기존의 단일 단계 방법과 제안한 두 단계 방법의 성능을 비교한 결과 제안한 알고리즘이 우수함을 입증하였다.

언어학 관점에서의 한국어 대조학습 기반 문장 임베딩의 허위 문맥화에 대한 고찰 (Analyzing Spurious Contextualization of Korean Contrastive Sentence Representation from the Perspective of Linguistics)

  • 정유현;한명수;채동규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.468-473
    • /
    • 2023
  • 본 논문은 사전 학습 언어 모델의 특성인 이방성과 문맥화에 주목하여 이에 대한 분석 실험과 한국어 언어 모델만의 새로운 관점을 제안한다. 최근 진행된 영어 언어 모델 분석 연구에서 영감을 받아, 한국어 언어 모델에서도 대조학습을 통한 이방성과 문맥화의 변화를 보고하였으며, 다양한 모델에 대하여 토큰들을 문맥화 정도에 따라 분류하였다. 또한, 한국어의 언어학적 특성을 고려하여, 허위 문맥화를 완화할 수 있는 토큰을 문맥 중심어로, 문맥 중심어의 임베딩을 모방하는 토큰을 문맥 기능어로 분류하는 기준을 제안하였다. 간단한 적대적 데이터 증강 실험을 통하여 제안하는 분류 기준의 가능성을 확인하였으며, 본 논문이 향후 평가 벤치마크 및 데이터셋 제작, 나아가 한국어를 위한 강건한 학습 방법론에 기여하길 바란다.

  • PDF

패치 기반 영상처리를 위한 텍스쳐 분류 알고리즘 (Texture Classification Algorithm for Patch-based Image Processing)

  • 유승완;송병철
    • 전자공학회논문지
    • /
    • 제51권11호
    • /
    • pp.146-154
    • /
    • 2014
  • 텍스쳐 분류에 사용되는 방식 중 하나인 지역적 이진화 패턴은 일반적으로 영상 내의 평탄한 부분, 에지, 코너의 분포를 사용한다. 그러나 영상이 가지는 방향성을 고려하지 않고, 단순히 크고 작음만을 비교하는 지역적 이진화 패턴의 특성때문에 화소간 차이를 반영하지 못하는 문제점이 있다. 또한 영상의 분포를 사용하기 때문에 작은 크기의 영상에 대해서는 분류 성능이 저하된다. 이런 문제를 해결하기 위해 본 논문에서는 영상의 방향성 분포와 고유치 행렬을 이용한 세부 분류 기법을 제안한다. 지역적 이진화 패턴으로 초기 분류에서 누락된 텍스쳐 영상에 대하여 두 가지 특징을 이용하여 세부적으로 분류한다. 첫째, 영상이 가질 수 있는 방향을 여덟 가지로 양자화하고 그 방향들의 분포를 계산한다. 둘째, 구조 행렬을 이용하여 나온 고유치 중 큰 값의 분포를 구한다. 모의 실험을 통해 지역적 이진화 패턴만을 사용하였을 때 대비 제안 방법이 약 8% 정도 분류 정확도가 향상됨을 보였다.

자료 연계성을 고려한 차종 분류 기준의 제시 (The New Criterion of Classification System for Data Linkage)

  • 김윤섭;오주삼;김현석
    • 한국도로학회논문집
    • /
    • 제7권4호
    • /
    • pp.57-68
    • /
    • 2005
  • 현재 국내의 차종 분류 기준은 그 조사목적과 조사지점에 따라 이원화되어 운영되고 있다. 고속국도와 지방도의 경우는 8종 분류 기준이 그리고 일반국도의 경우는 11종 분류 기준이 활용되고 있는데, 이러한 이원화된 분류 기준은 자료 활용의 효율성을 저하시키고 있는 실정이다. 본 연구는 이러한 이원화된 차종 분류 기준의 문제점을 해결하기 위해 통합된 차종 분류 기준을 제시하고 있다. 분류 기준은 차량 제원에 의한 기계식 조사에 초점을 맞추었으며, 현장 조사의 문제점을 완화하기 위해 인력식 조사에도 적용이 가능하도록 설정되었다. 제안된 차종 분류 기준은 차량의 다양화 및 대형화 추세를 반영하고, 기타 차종 분류 기준과의 호환성을 고려하고 있어 보다 합리적인 차종 분류 기준이라 할 수 있다.

  • PDF

블록 경계 영역 분류를 이용한 블록화 현상 제거 기법의 성능 비교 (Performance Comparison of Blocking Artifact Reduction Using a Block Boundary Region Classification)

  • 소현주;장익훈;김남철
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1921-1936
    • /
    • 1999
  • 본 논문에서는 블록 기반 변환 부호화 영상에서 나타나는 블록화 현상을 분석하고 그 특성에 따라 각 블록 경계를 4개의 영역으로 분류하는 방법을 제안하였다. 그리고 제안한 블록 경계 영역 분류 방법을 이용하여 성능이 우수한 몇 가지 블록화 현상 제거 기법들의 성능을 비교하였다. 제안된 블록 경계 영역 분류 방법에서는 각 수평, 수직 블록 경계를 EQ 영역, BA 영역, 그리고 AE 영역의 4개의 영역으로 분류한다. 블록화 현상 제거기법으로는 LOT, Kim의 웨이브렛 영역에서의 필터링 방법, Yang의 POCS 방법, Paek의 POCS 방법, Jang의 CM 방법을 선택하였다. 실험결과, 제안한 블록 경계 영역 분류 방법으로 블록 경계의 영역들이 블록화 현상에 의한 불연속의 특성을 잘 나타내는 것을 알 수 있었다. 그리고 웨이블렛 변환을 이용하는 블록화 현상 제거 기법들이 대체적으로 우수한 성능을 나타냄을 알 수 있었다.

  • PDF

한국산 쑥속(국화과)의 두상화서 형태에 의한 분류학적 연구 (Taxonomic study on the capitulum morphology of Korean Artemisia (Compositae))

  • 박명순;홍기남;엄정애;정규영
    • 식물분류학회지
    • /
    • 제40권1호
    • /
    • pp.27-42
    • /
    • 2010
  • 본 연구는 한국산 쑥속 23분류군에 대하여 두상화서의 세부 형질을 조사하여 분류학적 중요도를 파악하고자 하였다. 쑥속의 속내 분류에 있어서 전통적인 아속의 구분형질인 중앙화의 임성 여부에 의해 중앙화가 불임성인 Dracunculus아속과 중앙화가 임성인 Artemisia아속으로 구분되었다. Artemisia아속 내에서 절을 구분하는 형질로 알려진 화탁의 털 유무는 화탁에 털이 밀생하거나, 성기게 나는 Absinthium절과 화탁에 털이 없는 Abrotanum절, Artemisia절과 구분되었다. 그러나 Abrotanum절의 큰비쑥(A. fukudo), 더위지기(A. sacrorum)와 Artemisia절의 외잎쑥(A. viridissima)에서 성기게 털이 있는 화탁이 관찰됨으로, 절의 식별형질로서 인정되는 무모성 화탁의 가치는 재검토되어야 할 것으로 판단되었다. 이외에 관찰된 형질 중 두상화서의 전체 형태와 크기, 주두정단의 특징, 포편의 털, 중앙화와 주변화 화관의 형태 등은 종의 식별로서 가치가 있는 것으로 판단된다.