• Title/Summary/Keyword: 과도 분류

Search Result 8,497, Processing Time 0.048 seconds

A Case Study on Personalized Patent Classification System (개인화 된 특허 분류 시스템 사례 연구)

  • Seo, Hyung-Kook;Choi, Kwang-Sun;Ahn, Han-Joon;Choi, Sung-Joon
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.241-245
    • /
    • 2006
  • 개인화 된 특허 분류 시스템은 기존의 자동 분류 및 특허 문서의 특성, 그리고 분류 체계의 개인화를 고려하여 접근해야 한다. 본 논문에서는 개인화 된 특허 분류 시스템을 구축하는데 있어 개인화된 분류 체계 및 모델의 구축, 특히 분류체계 구축에 있어서의 자동화에 초점을 두었다. 우리는 특히 분류체계 구축 자동화에 있어 특허 문서의 기존 분류체계인 IPC 및 문서 클러스터링을 활용하였다. 다음으로 이를 기반으로 한 구축 시스템 사례를 들었다. 구축 후 나타난 정성적 문제점을 분석해보고, 분석 결과를 향후 연구 방향으로 삼고자 한다.

  • PDF

Semantic Classification of Web Pages using Ontology Concept Structure (온톨로지의 개념구조에 의한 웹페이지의 의미적 분류)

  • Song, Mu-Hee;Lim, Soo-Yeon;Park, Seong-Bae;Kang, Dong-Jin;Lee, Sang-Jo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.487-489
    • /
    • 2005
  • 본 논문에서는 온톨로지의 개념구조를 이용한 웹페이지의 의미적 분류방법을 제안한다. 웹 문서들이 가지는 용어 정보들과 어휘들 간의 개념 구조를 파악하여 온톨로지를 확장시키면서 이를 문서분류에 적용하여 의미적 분류가 이루어지게 한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하여 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 온톨로지와 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

A Study of Personalized Retrieval System Evaluation (개인화 검색시스템 평가에 관한 연구)

  • Kim, Kwang-Young;Choe, Ho-Seop;Jin, Du-Suk;Kim, Jin-Suk
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06b
    • /
    • pp.39-42
    • /
    • 2010
  • 본 논문에서는 주제별 분류기반의 개인화 검색시스템의 평가를 위해서 기존의 한글 정보 검색시스템 평가를 위해서 사용하는 한글 테스트 컬렉션(HANTEC v2.0)을 사용하였다. 주제별 분류기반의 개인화 검색 시스템의 평가를 위해서 첫째, 한글 테스트 컬렉션을 한국일보-40075 문서분류 테스트 컬렉션을 이용하여 주제별 분류를 수행 하였다. 둘째, 한국일보-40075 문서분류 테스트 컬렉션의 분류 체계에 다라 한글 테스트 컬렉션의 문서들을 kNN 분류기를 이용하여 분류를 수행하였다. 마지막으로 구축된 컬렉션을 이용하여 주제별 분류기반의 개인화 검색시스템의 성능 평가를 수행하였다.

  • PDF

Methodology of Developing Train Set for BERT's Sentence Similarity Classification with Lexical Mismatch (어휘 유사 문장 판별을 위한 BERT모델의 학습자료 구축)

  • Jeong, Jaehwan;Kim, Dongjun;Lee, Woochul;Lee, Yeonsoo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.265-271
    • /
    • 2019
  • 본 논문은 어휘가 비슷한 문장들을 효과적으로 분류하는 BERT 기반 유사 문장 분류기의 학습 자료 구성 방법을 제안한다. 기존의 유사 문장 분류기는 문장의 의미와 상관 없이 각 문장에서 출현한 어휘의 유사도를 기준으로 분류하였다. 이는 학습 자료 내의 유사 문장 쌍들이 유사하지 않은 문장 쌍들보다 어휘 유사도가 높기 때문이다. 따라서, 본 논문은 어휘 유사도가 높은 유사 의미 문장 쌍들과 어휘 유사도가 높지 않은 의미 문장 쌍들을 학습 자료에 추가하여 BERT 유사 문장 분류기를 학습하여 전체 분류 성능을 크게 향상시켰다. 이는 문장의 의미를 결정짓는 단어들과 그렇지 않은 단어들을 유사 문장 분류기가 학습하였기 때문이다. 제안하는 학습 데이터 구축 방법을 기반으로 학습된 BERT 유사 문장 분류기들의 학습된 self-attention weight들을 비교 분석하여 BERT 내부에서 어떤 변화가 발생하였는지 확인하였다.

  • PDF

한국산 다슬기과 담수패류 분포

  • 이준상
    • Proceedings of the Korean Society of Fisheries Technology Conference
    • /
    • 2003.05a
    • /
    • pp.378-379
    • /
    • 2003
  • v. Martens(1905)은 국내 다슬기과 담수패류를 모두 1속 15종 및 3아종으로 기록하였다. 그 후 많은 학자들에 의하여 형태 및 분류에 대한 연구를 시도하여 근래에 이르러 한국산 다슬기과 담수패류는 3속 7종 및 1아종(Choi &. Yoon, 1997), 3속 6종 및 1아종(Kwon et al, 2001)으로 정리하고 있다. 다슬기과 패류는 서식지에 따른 형태 변이가 매우 심하고, 또한 v.Martens(1905)에 의하여 발표된 18종의 동종이명 정리에 대한 국내외 학자간의 견해 차이가 정리되어 있지 않아 현재까지도 정확한 종 동정과 분류가 난해한 분류군인다. (중략)

  • PDF

Flora and Actual Vegetation Classification of Protected Area for Forest Genetic Resource Conservation in Mt. Hambaek (함백산 산림유전자원보호구역의 식물상 및 현존식생)

  • Lee, Jung-Hyun;Kim, Dong-Kap;Shin, Jae-Kwon;Jung, Se-Hoon
    • Proceedings of the Plant Resources Society of Korea Conference
    • /
    • 2018.04a
    • /
    • pp.49-49
    • /
    • 2018
  • 본 연구는 함백산 산림유전자원보호구역의 생물다양성 증진과 체계적이고 객관적인 보전 및 관리를 위한 기초데이타 수립을 위하여 식물상과 정밀식생조사를 수행하였다. 함백산 산림유존자원보호구역에 분포하는 식물상은 83과 222속 321종 2아종 36변종 등 359분류군이 확인되었으며, 희귀 및 멸종위기식물은 산마늘, 등칡 등 총 10과 14분류군이 확인되었다. 식물구계학적 3등급 종은 15과 20분류군, 4등 급종은 8과 11분류군이 확인되었다. 산림청 특별산림보호 대상종은 3과 3분류군, 한국특산식물은 7과 10분류군이 확인되었으며 귀화식물은 9과 16분류군이 출현하였다. 함백산 산림유전자원보호구역 26개 조사구역에 대하여 정밀식생조사를 수행한 결과. 식생유형은 산지관목림, 일본잎갈나무식재림, 가래나무군락, 거제수나무군락, 거제수나무-신갈나무군락, 거제수나무-층층나무군락, 거제수나무-피나무군락, 소나무군락, 신갈나무군락, 피나무군락, 피나무-거제수나무군락 등 총 11개의 유형으로 확인되었다. 또한 식생조사와 드론을 활용하여 현존식생도를 작성하였으며, 그 결과 함백산 유전자원보호구역은 총 470.9ha로, 그 중 신갈나무군락이 총 390.8ha로 가장 넓게 분포하고 있으며, 거제수나무-신갈나무군락이 34.3ha, 산지관목림 18.5ha 순으로 대부분 10ha 이하로 나타났다.

  • PDF

Distribution Characteristics of Woody Plants Resources in Jeiu, Korea (제주도 목본식물자원의 분포특성)

  • Kim, Chan-Soo;Son, Seok-Gu;Tho, Jae-Hwa;Kim, Ji-Eun;Hwang, Seok-In;Cheong, Jin-Hyun
    • Korean Journal of Plant Resources
    • /
    • v.20 no.5
    • /
    • pp.424-436
    • /
    • 2007
  • In this paper, it was discussed situations and necessities of conservation management strategy for the woody plants resources in Jeju Island. Out of 320 taxa of the woody plants distributed in Jeju, there were 62 families, 136 genus, 279 species, 28 varieties and 13 forma. Conifers, gymnosperms, were 3 families, 5 genus and 7 species as holding 2.2% of total woody plants. Broad leaves, angiosperms, were 59 families, 131 genus, 272 species, 28 varieties and 13 forma that were 313 taxa. Evergreens were 84 taxa consisting of 31 families, 45 genus, 72 species, 7 varieties and 5 forma that make up 26.8% out of total angiosperms. Deciduous were 229 taxa(73.2%) consisting of 42 families, 93 genus, 200 species, 21 varieties and 8 forma that were 122 trees(38.1%), 177 shrubs(55.1%) and 21 vine plants(6.8%). Life form spectra by dormancy, disseminule, radicoid and growth form were analysed. Thirty eight taxa including 17 families, 21 genus, 14 species and 16 varieties out of 320 taxa growing Jeju were endemic to Korea and 22 taxa of them were endemic to Jeju. The specific plant species among the woody plants in Jeju were 10 taxa in V grade, 24 taxa in IV grade and 53 taxa in III grade. These are correspondence to those of nations as 12% of V grade, 7.6% of IV grade and 17.2% of III grade.

The Flora of Vascular Plants in Bonghwasan Mountain (Namwon) of Baekdudaegan, Korea (백두대간 봉화산(남원시)의 관속식물상)

  • Ju Eun Jang;Hyeon Jin Jeong;Young-Soo Kim;Ji Eun Kim;Jung Sim Lee;Aleksey Kim;Beom Kyun Park;Su-Young Jung;Hee-Young Gil
    • Korean Journal of Environment and Ecology
    • /
    • v.37 no.4
    • /
    • pp.235-250
    • /
    • 2023
  • This study was carried out to identify the vascular flora of Mt. Bonghwa in the Baekdudaegan Mountain range, located on the border between Namwon City and Jangsu Country in Jeollabuk Province and Hamyang Country in Gyeongsangnam Province and use them as basic data for the conservation of plant diversity and prevention of the spread of alien plants. Specimens deposited at the Herbarium of Korea National Arboretum (KH) were reexamined, and 15 field surveys were conducted from April 2020 to July 2023. The result revealed a total of 466 taxa, consisting of 97 families, 279 genera, 409 species, 16 subspecies, 32 varieties and 9 forms, Of which, eight taxa were endemic plants, and one taxon, Aconitum coreanum (H.Lév.), belonged to the vulnerable (VU) on the national red list species. Moreover, there were 57 floristic target species, including 1 taxon of grade V, 9 taxa of grade III, 14 taxa of grade II, and 33 taxa of grade I, whereas there were 24 taxa of alien plants and 1 taxon of ecosystem disturbance species. In the usefulness survey, 353 taxa were for food, 3 for textiles, 71 for medicinal use, 21 for ornamental use, 108 for pasture use, 2 for industrial use, 7 for miscellaneous use, and 11 for timber plants.

Vascular Plant Species in the Southern Sejong (세종시 남부일대의 관속식물상 연구)

  • Sung, Jung Won;Kang, Shin Gu
    • Korean Journal of Plant Resources
    • /
    • v.33 no.4
    • /
    • pp.311-336
    • /
    • 2020
  • The flora of Sejong were summarized as 531 taxa including 104 families, 315 genera, 462 species, 3 subspecies, 59 varieties and 7 form. The rare plants were 8 taxa including Nepeta cataria L. and Aristolochia ontorta Bunge. The Korea endemic plants were 9 taxa including Populus tomentiglandulosa T. B. Le and Clematis trichotoma Nakai.. The specific plants were 42 taxa including Phytolacca esculenta Van Houtte(V), Corydalis decumbens (Thunb.) Pers(IV), Poncirus trifoliata Raf(III), Pseudostellaria coreana (Nakai) Ohwi(II), Cyrtomium fortunei J.Sm.(I). The naturalized plants were 49 taxa including Sicyos angulatus L, Ambrosia trifida L, Physalis angulata L. Panicum dichotomiflorum Michx., Galinsoga parviflora Cav, and Erigeron philadelphicus L. Especially, Sicyos angulatus L., Phytolacca americana L. and Bidens frondosa L. have been spread throughout the country are required to manage. The naturalized index(NI) and urbanized index(UI) were 8.7% and 15.3%. Useful plants incuding Edible was 199 taxa, Pasture was 193 taxa, Medicinal was 178 taxa, Ornamental was 82 taxa, Timber was 25 taxa, Fiber was 18 taxa, Stain was 9 taxa. Useful plants will be important materials for plant design in recreational and healing forests.

A comparative study of classification methods for Face Recognition (얼굴 인식을 위한 분류기법에 관한 비교연구)

  • 이동훈;박영태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.538-540
    • /
    • 2003
  • 본 논문에서는 얼굴 영상의 변화를 보상할 수 있는 전처리 과정으로서 기하학적 특징에 기반한 순수 얼굴 영역 검출 기법을 도입하고 분류기로서 간단한 정합 기법을 사용한 얼굴 인식 기법을 제안한다. 실험결과를 보면 제안한 기법은 NNC, BPN, SVM 분류 기법에 비해 월등한 성능을 가진다.

  • PDF