• 제목/요약/키워드: 분류(分類)

검색결과 34,644건 처리시간 0.055초

보로노이 공간분류를 활용한 원격 영상 패턴분류 시스템 (Pattern Classification System for Remote Sensing Data using Voronoi Diagram)

  • 백주현;김홍기
    • 정보처리학회논문지B
    • /
    • 제8B권4호
    • /
    • pp.335-342
    • /
    • 2001
  • 본 논문은 보로노이 공간분류를 활용하여 원격탐사 영상인식을 위한 다층 신경망 분류기를제안한다. 제안된 다층 신경망 분류기는 보로노이 다각형 영역으로 클래스를 구분하며, 초평면 방정식의 계수를 오류 역전과 학습 초기의 연결 강도, 임계치 그리고 은닉층의 노드 수로 결정한다. 제안된 방법은 오류역전과 학습 알고리즘에서 임의로 정해주던 초기 정보를 사전 분석에 의해 공학적으로 결정함으로써 느린 수렴 속도와 학습실패 등의 단점을 피할 수 있는 장점이 있다. 보로노이 다이어그램에 대한 경계선의 초평면 방정식은 훈련집합의 클래스별 평균값을 구하여 Mathematica 패키지로 계산하였다. 제안된 다층 신경망에 의한 영상분류기의 인식능력을 평가하기 위하여 원격탐사 영상인식에서 자주 활용되는 최소거리 분류 방법과 최대우도 분류 방법으로 처리해서 비교한 결과, 최소거리 분류 방법은 실험화상에 대해 81.4%, 최대우도 부류기에 의한 분류는 87.8%, 제안한 방법은 92.2% 정확성을 가진 분류결과를 나타냈다.

  • PDF

림프종 암의 정확한 분류를 위한 산술연산자 분류규칙의 결합 (Ensemble of Classification Rules with Arithmetic Operators for the Accurate Classification of Lymphoma Cancer)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (1)
    • /
    • pp.202-204
    • /
    • 2004
  • 앙상블은 다수의 분류기를 효과적으로 결합하여 분류의 성능을 향상시키는 대표적인 기술이다. 효과적인 앙상블을 위해서는 다양한 특성을 지닌 분류기를 확보하여야 한다. 기존의 앙상블은 개별 분류기의 결과를 바탕으로 분류기 사이의 의존성이나 유사성을 평가하여 분류기 결합을 시도하였다. 따라서 분류기 사이의 유사도의 정확한 측정에 한계를 지니고 있다. 본 연구에서는 이를 극복하기 위해서 다수의 산술연산자 기반 분류규칙을 유전자 프로그래밍을 이용하여 획득하고, 실제 표현형의 유사성을 측정한 후 이를 바탕으로 분류기를 결합한다. 생물정보학에서 많이 사용되는 유전자 데이터 중 하나인 림포마 암 데이터에 제안하는 방법을 적용하여 97% 수준의 높은 분류 성능과 해석 가능한 분류규칙을 획득하였다.

  • PDF

단백질 구조 분류의 통합 검색을 위한 웹 정보시스템 (A Web-Based Information System for the Integrated Search for Protein Structure Classifications)

  • 신원준;황의윤;김진홍;안건태;이명준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.274-276
    • /
    • 2004
  • 단백질은 대부분 공간상의 특징을 고려할 때 유사한 부분을 기준으로 분류되는 경우가 많다 단백질 구조 분류 데이터베이스는 단백질이 가지는 다양한 구조 정보를 바탕으로 단백질 구조 분류 정보를 제공하고 있다. 대표적인 단백질 구조 분류 데이터베이스에는 CATH와 SCOP 데이터베이스가 있다. 이들 데이터베이스는 서로 다른 구조 분류 기준으로 단백질 구조를 분류하고 있으며, 단백질 구조 분류 정보를 검색하는 웹 서비스를 개별적으로 제공하고 있다. 따라서 여러 종류의 단백질 구조 분류 정보를 하나의 웹 사이트에서 검색할 수 있으면 유용할 것이다. 본 논문에서는 CATH와 SCOP에서 정의한 단백질 구조 분류 정보의 통합적인 검색 기능 일 통계 정보를 체계적으로 제공하는 웹 정보시스템에 관하여 기술한다. 제안된 시스템은 CATH와 SCOP에서 제공하는 각각의 데이터를 가공하여 효과적인 구조 분류 검색을 지원하는 구조화된 데이터베이스를 구축하였다. 개발된 시스템은 PDB 식별자, CAT터 식별자. 그리고 SCOP 식별자 또는 단백질 분류 이름으로 한번의 검색으로 두 데이터베이스에서 제공하는 계층적 구조 분류 정보를 제공한다. 또한, 단백질 구조에 대한 유용한 통계 정보를 제공한다.

  • PDF

KorBERT 기반 빈칸채우기 문제를 이용한 텍스트 분류 (Text Classification using Cloze Question based on KorBERT)

  • 허정;이형직;임준호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.486-489
    • /
    • 2021
  • 본 논문에서는 KorBERT 한국어 언어모델에 기반하여 텍스트 분류문제를 빈칸채우기 문제로 변환하고 빈칸에 적합한 어휘를 예측하는 방식의 프롬프트기반 분류모델에 대해서 소개한다. [CLS] 토큰을 이용한 헤드기반 분류와 프롬프트기반 분류는 사전학습의 NSP모델과 MLM모델의 특성을 반영한 것으로, 텍스트의 의미/구조적 분석과 의미적 추론으로 구분되는 텍스트 분류 태스크에서의 성능을 비교 평가하였다. 의미/구조적 분석 실험을 위해 KLUE의 의미유사도와 토픽분류 데이터셋을 이용하였고, 의미적 추론 실험을 위해서 KLUE의 자연어추론 데이터셋을 이용하였다. 실험을 통해, MLM모델의 특성을 반영한 프롬프트기반 텍스트 분류에서는 의미유사도와 토픽분류 태스크에서 우수한 성능을 보였고, NSP모델의 특성을 반영한 헤드기반 텍스트 분류에서는 자연어추론 태스크에서 우수한 성능을 보였다.

  • PDF

문화분류와 문화콘텐츠산업분류에 관한 연구 (A Study of A Cultural Classification and A Culture Contents Industrial Classification)

  • 안인자
    • 한국비블리아학회지
    • /
    • 제17권2호
    • /
    • pp.5-22
    • /
    • 2006
  • 문화분류와 문화콘텐츠산업분류는 관련 정책, 지원, 통계, 평가를 위한 필수적인 기본도구이며, 이과정은 순환되는 것을 알 수 있다. 이의 용례를 법, 문화지표, 통계, 평가항목, 관련 연구보고서 분석하여 살펴본 결과 단기적 목적에 따라 아주 다양하게 분류되는 것을 발견하였다. 본 논문에서는 콜론분류방법에 기초한 분류안을 제시하였으며, 분류요소로서 통신망, 매체, 장르, 문화영역구분을 사용하였다.

정준상관분석을 이용한 원격탐사 수치화상 분류기법의 개발 : 무감독분류기법과 정준상관분석의 통합 알고리즘 (Development of Classification Method for the Remote Sensing Digital Image Using Canonical Correlation Analysis)

  • 김용일;김동현;박민호
    • 대한공간정보학회지
    • /
    • 제4권2호
    • /
    • pp.181-193
    • /
    • 1996
  • 본 연구는 원격탐사의 수치화상분류에 적용된 바 없는 정준상관분석(Canonical Correlation Analysis)기법을 무감독분류한 위성화상데이터에 적용하여 토지피복분류하는 새로운 방법을 개발하는 것을 목적으로 한다. 개발된 분류기법은 기존의 분류기법인 최대우도분류기법에 비해 분류기준용 표본데이터 선정이 용이함을 알 수 있었다. 즉, 정준상관분석에 의한 분류결과는 분류기준용 표본데이터의 선정위치에 거의 영향을 받지 않는다. 또한 무감독분류 후 정준상관분석에 의해 결정된 각 군집의 토지피복은 최대우도분류를 위한 사전정보로 활용정보로 활용가능하다. 동일한 분류기준용 표본데이터 사용시, 무감독분류 후 정준상관분석에 의한 분류가 최대우도분류보다 분류정확도가 우수하였다. 이상과 같은 결과로 판단해 볼 때 연구에서는 시도된 분류기법은 원격탐사의 분류기법 분야에서 실용화 될 수 있으며, 나아가서는 GIS 데이터베이스 구축에 중요한 역학을 할 수 있을 것이다.

  • PDF

포섭구조 일대다 지지벡터기계와 Naive Bayes 분류기를 이용한 효과적인 지문분류 (Effective Fingerprint Classification using Subsumed One-Vs-All Support Vector Machines and Naive Bayes Classifiers)

  • 홍진혁;민준기;조웅근;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권10호
    • /
    • pp.886-895
    • /
    • 2006
  • 지문분류는 사전에 정의된 클래스로 입력된 지문을 분류하여 자동지문인식 시스템에서 비교해야할 지문의 수를 줄여준다. 지지벡터기계(support vector machine; SVM)는 패턴인식 분야에서 널리 사용되고 있을 뿐만 아니라 지문분류에서도 높은 성능을 보이고 있다. SVM은 이진클래스 분류기이기 때문에 다중클래스 문제인 지문분류를 위해서 적절한 분류기 생성과 결합 기법이 필요하며, 본 논문에서는 일대다(one-vs-all; OVA) 방식으로 구성된 SVM을 naive Bayes(NB) 분류기를 이용하여 동적으로 구성하는 분류방법을 제안한다. 지문분류에서 대표적으로 사용되는 특징인 FingerCode와 지문의 구조적 특징인 특이점과 의사융선을 사용하여 OVA SVM과 NB 분류기를 학습하고, 포섭구조의 분류기를 구성하여 효과적인 지문분류를 수행한다. NIST-4 데이타베이스에 제안하는 방법을 적용하여 5클래스 분류에 대해서 90.8%의 높은 분류율을 획득하였으며, OVA 전략의 SVM을 다중클래스 분류문제에 적용할 때 발생하는 동점문제를 효과적으로 처리하였다.

음식문화 분야 인터넷자원 분류체계 분석을 통한 한국십진분류법의 항목명 확장에 관한 연구 (A Study on Expansion of Headings of Korean Decimal Classification Based Upon the Analysis of Directory Classifications of Internet Resources in Food and Culture)

  • 정연경;이미화
    • 정보관리학회지
    • /
    • 제27권4호
    • /
    • pp.49-69
    • /
    • 2010
  • 듀이십진분류법(DDC)은 문헌분류체계로 도서관에서 뿐만 아니라 인터넷자원을 분류하는 기반으로 사용되고 있는데, 이는 DDC가 주기적이며 지속적인 용어 확장을 통해 최신성과 실용성을 유지하기 때문이다. 반면, 한국십진분류법(KDC)은 비정기적인 개정 주기로, 용어의 최신성과 실용성이 떨어진다. KDC가 도서관뿐만 아니라 인터넷자원 분류에도 활용 가능하기 위해서는 실용적인 분류 항목명이 반영되어야 한다. 본 연구에서는 인터넷 자원의 디렉토리 분류체계와 KDC에서 사용하고 있는 분류항목명을 비교 분석하고 KDC에 추가할만한 분류항목명을 확장 제안하였다. 네이버, 야후, 교보문고, 아마존의 디렉토리 분류체계에서 음식문화 분야의 용어를 분석하였으며, 다른 분류체계를 참조하여 KDC로의 적용 방안을 제안하였다. KDC에 추가적인 분류항목명이 필요한 분야는 식품위생, 음료기술, 식품공학, 식품과 음료, 식사 및 식탁차림, 주방, 식당 공간이었으며 부족한 항목명은 음식 관련 용어 및 한식 관련 요리명이 주를 이루었다. 본 연구를 통해 KDC의 부족한 항목명과 적용방안을 제시함으로써 KDC가 도서관과 인터넷자원 분류에 활용될 수 있는 기반을 마련하였다.

TELEMAC-2D를 이용한 분류부 평면형상 변화에 따른 흐름특성 수치모의 (Numerical Analysis of Flow Characteristics for Bifurcation Channel Depending on Channel Planform Change using TELEMAC-2D)

  • 정대진;장창래;정관수
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2019년도 학술발표회
    • /
    • pp.257-257
    • /
    • 2019
  • 최근 기후변화에 따른 대응을 위해 기존 수자원 활용의 고도화 및 배수능력 증대를 위해 다양한 방안이 추진되고 있으며, 그에 따라 기존 개수로에 신규 수로를 연결하여 합류와 분류를 시키는 사례가 증가하고 있다. 특히 신규 개수로 연결을 위한 분류부 형상은 관련 설계기준, 분류유량의 규모, 해당 지점의 하상변동 경향, 지형여건, 흐름 분류시설 및 구조물의 형태(양수펌프장, 스크린이나 수문, 암거설치)와 같은 구조적 요인 등에 의해 달라지지만, 이와 관련된 연구가 매우 부족한 실정이다. 따라서 본 연구에서는 2차원 수치모형을 이용하여 분류부 평면형상 변화에 따른 분류유량비와 흐름분리구역 분포 등에 대한 흐름특성을 분석하고 이수와 치수계획 수립 등에 활용하고자 한다. 본 연구에서는 TELEMAC-2D 모형을 이용하여 주수로 상류 유입흐름의 프루우드 수가 0.74, 0.52인 두 흐름에 대해 형상변화 폭을 주수로 폭(B)의 1B, 주수로 형상변화를 급확대, 점진적 확대 구간길이를 1B~3B로 변화시키며 분류유량비(분류수로 유입유량/상류 유입유량)와 흐름분리구역의 위치와 크기 등에 대한 분석을 수행하였다. 분류부 상류 유입흐름의 프루우드 수가 0.74, 분류유량비는 0.33인 흐름은 주수로 형상변화 구간길이가 1B 일 때 0.44~0.46, 3B일 때 0.54~0.60으로 점차 분류유량비가 증가한다. 반면 상류 유입흐름의 프루우드수가 0.52, 분류유량비가 0.52인 흐름은 주수로 형상변화 구간길이가 1B일 때 0.77~0.82에서 3B일 때 0.70~0.80으로 점차 분류유량비 증가율이 감소하는 경향을 나타내게 된다. 주수로 형상변화 폭을 0.5B, 1B로 달리하여 수로 형상변화를 시킨 경우 분류유량비 증가율은 각각 135~162%, 134~176%로 나타났으며, 이는 수로 형상변화 폭보다 변화구간 길이가 더 큰 분류유량비 변화에 영향을 미치는 것을 확인할 수 있다. 흐름분리구역은 상류 유입흐름의 프루우드 수가 0.74인 경우 수로형상 변화구간과 분류수로 입구에 형성되지만, 상류유입흐름의 프루우드 수가 0.52인 경우 수로형상변화 구간과 주수로 하류에도 형성된다. 수치실험 결과 동일수로 폭 직사각형 $90^{\circ}$ 분류수로에서 분류부 평면형상의 변화에 따라 주수로 하류방향흐름의 관성력은 감소하는 반면 분류수로로 향하는 횡압력경사와 흐름분리구역 발생위치 변화로 인해 분류 수로내 통수능이 증가하여 분류유량비가 급격하게 증가하게 된다. 또한 분류부 상류 유입흐름의 관성력이 작은 경우 분류부 평면형상 변화시 주수로 하류방향에서도 흐름분리구역이 형성되고 주수로 종방향 수위가 상승함에 따라 분류흐름 계획수립 시 세심한 주의가 필요하다.

  • PDF

공공도서관 분류오류의 실증적 분석과 대안 (Analysis and Alternative of Classification Errors in Public Libraries)

  • 윤희윤
    • 한국도서관정보학회지
    • /
    • 제34권1호
    • /
    • pp.43-65
    • /
    • 2003
  • 도서관은 오랫동안 분류법을 적용하여 자료를 정리하여 왔다. 그 궁극적 목적은 자료의 체계적 배가와 접근(브라우징)의 편의성을 극대화하는데 있으며, 동일한 자료가 동일한 분류번호에 배정되어야 한다는 원칙을 전제로 한다. 이러한 당위성에도 불구하고 한국십진분류법을 표준도구로 사용하고 있는 국내 공공도서관의 경우, 소위 분류오류가 적지 않은 것으로 판단되어 그 원인이 무엇이며 어느 정도로 심각한지를 실증적으로 분석하였다. 그리고 분류오류를 해소하기 위한 대안, 즉 분류의 중요성에 대한 인식 제고, 학부의 분류교육의 충실화, 사서직 실무교육의 강화. CIP 제도의 정착과 내실화, 분류표의 체계성 및 하위항목의 개선, 재분류(분류수정)팀의 구성과 가동, 분류사이트 운영의 필요성을 제시하였다.

  • PDF