• Title/Summary/Keyword: 과도 분류

Search Result 8,482, Processing Time 0.035 seconds

Multi-label Open Intent Classification using Known Intent Information (의도 정보를 활용한 다중 레이블 오픈 의도 분류)

  • Nahyeon Park;Seongmin Cho;Hyun-Je Song
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.479-484
    • /
    • 2023
  • 다중 레이블 오픈 의도 분류란 다중 의도 분류와 오픈 의도 분류가 합쳐져 오픈 도메인을 가정하고 진행하는 다중 의도 분류 문제이다. 발화 속에는 여러 의도들이 존재한다. 이때 사전에 정의된 의도 여부만을 판별하는 것이 아니라 사전에 정의되어 있는 의도에 대해서만이라도 어떤 의도인지 분류할 수 있어야 한다. 본 논문에서는 발화 속 의도 정보를 활용하여 다중 레이블 오픈 의도를 분류하는 모델을 제안한다. 먼저, 문장의 의도 개수를 예측한다. 그리고 다중 레이블 의도 분류기를 통해 다중 레이블 의도 분류를 진행하여 의도 정보를 획득한다. 획득한 의도 정보 속 다중 의도 개수와 전체 의도 개수를 비교하여 전체 의도 개수가 더 많다면 오픈 의도가 존재한다고 판단한다. 실험 결과 제안한 방법은 MixATIS의 75% 의도에서 정확도 94.49, F1 97.44, MixSNIPS에서는 정확도 86.92, F1 92.96의 성능을 보여준다.

  • PDF

A Hypertext Categorization Model Exploiting Link and Incrementally Available Category Information (점진적으로 계산되는 분류정보와 링크정보를 이용한 하이퍼텍스트 문서 분류 모델)

  • Oh, Hyo-Jung;Lim, Jeong-Mook;Lee, Mann-Ho;Myaeng, Sung-Hyon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.89-96
    • /
    • 1999
  • 본 논문은 하이퍼텍스트가 갖는 중요한 특성인 링크 정보를 활용한 문서 분류 모델을 제안한다. 하이퍼링크는 문서간의 관계를 나타내는 유용한 정보로서 링크를 통해 연결된 두 문서는 내용적으로 관련이 있어 검색에 도움을 준다는 것은 이미 밝혀진바 있다. 본 논문에서는 이러한 과거 연구를 바탕으로 새로운 문서 분류 모델을 제안하는데, 이 모델의 주안점은 대상 문서와 링크로 연결된 이웃 문서의 내용 및 범주를 분석하여 대상 문서 벡터를 조정하고, 이를 근거로 문서의 범주를 결정한다. 이웃 문서에 포함된 용어를 반영함으로써 대상 문서의 내용을 확장 해석하고, 이웃 문서의 가용 분류 정보가 있는 경우 이를 참조함으로써 정확도 향상을 기한다. 이 모델은 이웃한 문서의 범주가 미리 할당되어 있지 않은 경우 용어 기반 분류 방법으로 가용 범주를 할당하고, 이렇게 할당된 분류 정보가 다시 새로운 문서의 범주를 결정할 때 사용됨으로써, 문서 집합 전체의 분류가 점진적으로 이루어지며 그 정확도를 더해 나가는 효과를 가져올 수 있다. 이러한 접근 방법은 일반 웹 환경에 적용할 수 있는데, 특히 하이퍼텍스트를 주제별로 분류하여 관리하는 검색 엔진의 경우 매일 쏟아져 나오는 새로운 문서와 기존 문서간의 링크를 활용함으로써 전체 시스템의 점진적인 분류에 매우 유용하다. 제안된 모델을 검증하기 위하여 Reuter-21578과 계몽사(ETRI-Kyemong) 자료를 대상으로 실험한 결과 18.5%의 성능 향상을 얻었다.

  • PDF

Flora of Sum-eunmulbaengdui Forest Genetic Resource Reserve Area in Jeju-do (숨은물뱅듸 산림유전자원 보호구역의 식물상)

  • Jung, Gi-Soo;Hyun, Hwa-Ja;Jeong, Jun-Ho;Moon, Sung-Pil;Lee, Sun-Ryung;Song, Gwanpil
    • Proceedings of the Plant Resources Society of Korea Conference
    • /
    • 2018.10a
    • /
    • pp.54-54
    • /
    • 2018
  • 숨은물뱅듸 산림유전자원 보호구역은 해발 950 m 이상 지역의 습지로서 오름으로 둘러싸인 넓은 웅덩이 형태로 환경부 멸종위기 2급 야생식물인 자주땅귀개를 비롯한 다양한 습지 식물과 이를 둘러싸고 있는 산림지역을 포함하여 산림청에서는 산림유전자원 보호구역으로 지정 관리되고 있다. 본 조사는 숨은물뱅듸 산림유전자원 보호구역을 대상으로 식물상을 조사하여 식물종 다양성을 보존하기 위한 기초자료를 만들기 위해 실시하였다. 본 연구는 2018년 7월 24일부터 8월 28일까지 총 4회에 걸쳐 현장조사를 통하여 표본을 채집하고 기록하여 정리하였다. 그 결과, 숨은물뱅듸에 자생중인 식물은 양치식물 8과 11속 17종 17분류군, 나자식물 2과 2속 2종 2분류군, 피자식물 56과 121속 167종 5변종 1품종 173분류군 총66과 134속 186종 5변종 1품종의 총 192분류군이 조사되었다. 이 중 환경부 멸종위기야생식물은 자주땅귀개 1종이 확인되었고, 제주특산식물 6분류군, 한국특산식물 2분류군이 확인되었다. 식물구계학적특정식물은 총37분류군이며 V등급 5분류군, IV등급 5분류군, III등급 12분류군, II등급 5분류군, I 등급 10분류군이 확인되었다. 한국의 적색목록 식물은 위기(EN) 1분류군, 취약(VU) 1분류군, 준위협(NT) 1분류군, 관심대상(LC) 6분류군, 미평가(NE) 3분류군으로 나타났다. 조사된 식물들 대상으로 생활형을 분석해보면, 휴면형은 Ch 47분류군으로 가장 많이 나타났고, G(30분류군), MM(24분류군), HH(23분류군) 순으로 나타났다. 번식형은 R5가 101분류군, 산포기관형은 D4가 84분류군, 생육형은 e가 89분류군으로 가장 많이 나타났다. 반면, 외래식물 1분류군이 출현한 것으로 보아 숨은물뱅되는 아직까지 보전이 잘 되어 있고, 식물종다양성이 우수하며 식물학적으로 가치가 매우 높은 것으로 판단되었다.

  • PDF

The Flora of Three Eastern Mountains(Susdolbong(Mt.), Seongjubong(Mt.), Sulibong(Mt.)) of Paroho Lake in Yanggu-gun, Korea (강원도 양구군 파로호 동부 3개 산지(숫돌봉, 성주봉, 수리봉)의 관속식물상)

  • Song, Jin-Heon;Shin, Hyun-Tak;Yun, Ho-Geun;Kim, Sang-Jun
    • Korean Journal of Environment and Ecology
    • /
    • v.35 no.1
    • /
    • pp.1-23
    • /
    • 2021
  • This study conducted a survey on flora at Mt. susdolbon(508m), Mt. seongjubong (625.3m), and Mt. sulibong(596.2m), located in Yanggu-gun, Gangwon-do. A total of 403 taxa, including 6 forms, 43 varieties, 4 subspecies, 350 species, 255 genera, and 84 families, were surveyed in the three mountain areas. 18 taxa from 5 families of ferns, 3 taxa from 1 family of gymnosperms, and the dicotyledonous plants as 302 taxa from 69 families of the dicotyledonous plants were identified. The remarkable plants included 11 taxa of the Korean endemic plants, such as Populus tomentiglandulosa, Salix koriyanagi, Cimicifuga heracleifolia, Aconitum pseudolaeve, Clematis trichotoma, Echinosophora koreensis, Vicia chosenensis, Salvia chanryoenica, and Hemerocallis hakuunensis. The rare plants designated by the Korea Forest Service were 4 taxa, including Echinosophora koreensis as endangered species (EC), Cimicifuga heracleifolia, Epimedium koreanum, and Lilium cernuum. The Least Concern species (LC) were 13 taxa, including Persicaria orientalis, Exochorda serratifolia, Viola diamantiaca, Lithospermum erythrorhizon, and Trigonotis icumae. The invasive alien plants were 28 taxa, including Persicaria orientalis, Rumex crispus, Phytolacca americana, Cerastium glomeratum, Chenopodium album, Chenopodium ficifolium, Amorpha fruticosa, Robinia pseudoacacia, Trifolium pratense, Trifolium repens, Oxalis dillenii, Euphorbia supina, and Oenothera biennis, accounting for 6.9 percent of the 403 taxa of the surveyed plants.

Flora of Hangyeong Gotjawall Forest Genetic Resource Reserve Area in Jeju-do (한경 곶자왈 산림유전자원보호구역의 식물상)

  • Park, Ji-Hyun;Hyun, Hwa-Ja;Lim, Eun-Young;Kim, Chang-Uk;Chung, Jun-Ho;Kang, Shin-Ho;Song, Gwanpil
    • Proceedings of the Plant Resources Society of Korea Conference
    • /
    • 2018.10a
    • /
    • pp.61-61
    • /
    • 2018
  • 한경 곶자왈 산림유전자원보호구역은 개가시나무와 백서향 등을 포함한 암괴지대의 상록활엽수림으로서 그 중요성이 인정되어 산림유전자원 생태보전지역으로 지정 관리되고 있다. 따라서 본 지역의 식물상을 조사하여 곶자왈의 분포식물을 파악하고자 실시하였다. 본 연구는 한라산 서쪽 곶자왈지역 중 곶자왈 산림유전자원 보호구역으로 지정된 지역을 2017년 6월부터 2017년 9월까지 20여 차례 현장조사를 통하여 표본을 수집하고 이를 기록 정리하였다. 조사지역의 식물은 총 83과 181속 236종 23변종 2품종 총 261종으로 조사결과 양치식물이 7과 18속 30종 2변종 32분류군, 나자식물이 1과 1속 2분류군, 피자식물은 74과 162속 204종 21변종 2품종 227분류군 이었다. 그 중 쌍자엽식물은 67과 139속 179종 16변종 1품종 196분류군이고, 단자엽식물이 7과 23속 25종 5변종 1품종 31분류군이었다. 조사에서 확인된 환경부 멸종위기야생식물은 개가시나무 1종 이었다. 식물 구계학적 특정식물로는 총 97분류군이 조사되었다. 등급별로는 V등급 검정개관중, 개가시나무로 2분류군, IV등급 백서향, 녹나무 등 12분류군, III등급 아왜나무, 호자나무 등 37분류군, II등급 올벚나무, 개산초 등 13분류군, I 등급 푸조나무, 자금우 등 33분류군으로 확인되었다. 한국의 적색목록 식물을 분석해보면 취약(VU)은 개가시나무, 섬다래 등 3분류군, 준위협(NT)은 백서향, 약난초로 2분류군, 관심대상종(LC)은 골고사리, 새우난초 등 9분류군, 미평가종(NE)은 빌레나무 1분류군으로 나타났다. 이 결과는 청수 저지 곶자왈 지역의 생태학적 자료로 제주도 내 곶자왈과 비교하였을 때 맹아가 발달한 종가시나무가 우점하는 지역으로 향후 상록수림 천이에 의해 상록수 아래에 자라는 식물로 낙엽활엽수가 대체될 것으로 추정되어 지속적인 조사가 요구된다.

  • PDF

Integrating Classification Method using PCM Algorithm and Bayesian Method (PCM 알고리즘과 베이시안 분류의 통합기법)

  • 전영준;김진일
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.790-792
    • /
    • 2004
  • 본 논문은 PCM(Possibilistic C-Means) 알고리즘과 베이시안 분류 알고리즘을 통합한 고해상도 위성영상의 효과적인 분류방법을 제안하였다. 제안된 알고리즘은 학습데이터를 참고로 하여 PCM 알고리즘을 반복적인 과정 없이 수행한다. 각 분류항목별로 분류된 데이터에서 평균내부거리 내부에 해당되는 데이터들을 선정하여 각 항목별 비율을 구한 후 베이시안 분류기법의 사전확률로 적용하여 분류를 수행한다 PCM 알고리즘은 각 데이터와 특정 클러스터와의 거리에 소속도를 부여하는 퍼지 C-Means 알고리즘과 달리 소속도를 각 데이터와 클러스터 중심간의 절대거리에 의존하는 방법으로 퍼지 C-Means 알고리즘이 가지는 상대성 문제를 해결하였다. 제안된 분류 기법을 고해상도 다중분광 데이터인 IKONOS 위성영상에 적용하여 분류를 수행한 후 최대우도 분류기법과 비교한다.

  • PDF

Document Autoclustering for Web Agent (웹 에이전트를 위한 문서 자동 분류)

  • 양찬범;박영택
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1999.10b
    • /
    • pp.54-56
    • /
    • 1999
  • 웹 에이전트는 사용자가 웹을 브라우징하는 행위를 모니터하여 사용자의 관심정보를 학습하고 사용자가 필요로 한느 웹 상의 정보를 제공하는 시스템이다. 웹 에이전트는 사용자의 관심정보를 추출하기 위해서 귀납적 기계학습을 수행한다. 이때, 학습의 효율을 높이기 위해서는 관련이 있는 문서들을 그룹화하여 학습 시스템에 제공하여야 한다. 본 논문에서는 비감독 개념 학습 알고리즘인 COBWEB을 이용하여 사용자가 관심을 표시한 문서들의 분류트리를 생성한다. 분류트리는 귀납적 기계학습 시스템의 입력으로 사용될 수 있는 형태가 아니므로 분류 트리의 분석과 문서 분류 후처리 작업을 통해서 문서 집합을 생성해야 한다. 이를 위해서는 분류트리를 분석하여 초기 클러스터를 생성하고, 유사한 클러스터들의 병합을 수행한다. 본 논문에서 제안하는 문서 자동 분류 방식은 비감독 개념 학습 알고리즘이 생성한 문서 분류 트리의 분석을 통해서 충분한 유사도와 적절한 수의 문서를 포함하는 초기 클러스터를 생성할 수 있다. 그러므로 문서 분류의 후처리 작업인 클러스터의 병합 작업에서 불필요한 작업을 제거함으로서 보다 효과적이고 합리적인 문서 분류 작업을 수행한다.

  • PDF

Dynamic Classifier Selection Using Self-Organizing Maps (자기조직화지도를 이용한 동적 분류기 선택(1))

  • 이관희;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.250-252
    • /
    • 2003
  • 패턴 인식 분야에서 다중 분류기 시스템은 여러 분류기의 결과들을 조합하여 전체 성능을 항상 시키는 시스템이다. 다중 분류기를 사용함으로써 단일 분류기 보다 더 나은 결과를 얻을 수 있음은 이미 널리 알려진 사실이다. 서로 다른 구조를 갖는 분류기들은 상호 보완적인 정보를 제공하기 때문에 각 분류기마다 입력 공간에 대해서 지역적으로 좋은 성능을 갖는다. 본 논문에서는 지역적으로 가장 좋은 성능을 보이는 분류기 선택 방법을 제안한다. 제안하는 방법은 주어진 입력 공간에 비해 각 분류기들을 학습하는 과정에서 자기조직화지도를 생성하고 각 노드별로 평가함으로써 입력이 주어지면, 해당 노드에서 가장 성능이 좋은 분류기를 선택하여 전체 성능을 향상시키는 시스템이다.

  • PDF

E-Mail Classification Using Text and Domain Name (텍스트와 도메인 네임을 이용한 메일 분류)

  • 김원화;이일병
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.256-258
    • /
    • 2003
  • 정보화 시대에는 사람들의 모든 활동이 인터넷을 통해서 대부분 이루어진다. 이중에서 전자 메일이 차지하는 비중은 매우 크다. 고객 유치를 위한 기업들의 광고와 배움을 위한 강의, 자신의 관심 분야에 대한 정보 등을 전자 매일로 받아보게 되는 것이 더 많아 질것이다. 이러한 상황에서 사람들은 자신이 필요로 하는 메일과 필요로 하지 않는 메일을 분류하는데 많은 시간을 낭비한다. 사람들은 이러한 시간 낭비를 줄이기 위해서 메일 분류 시스템을 사용한다. 현재 사용되고 있는 매일 분류 시스템은 스팸 매일을 기준으로 하고 있다. 그러나 오분류되는 메일들이 있어 사용자가 스팸 메일을 다시 보는 경우가 있어 한계를 보인다. 본 논문에서는 사람들이 자신이 원하는 메일과 그렇지 않은 메일을 분류하기 위해서 1차 분류로 긍정어와 부정어를 이용하여 전자 메일을 분류하고 2차 분류로 도메인 네임을 이용하여 분류한다.

  • PDF

Efficient Document Classification for Web Document Collection (웹 문서 수집을 위한 효율적인 문서 분류)

  • Lee, Jung-Hun;Cheon, Suh-Hyun;Kim, Sun-Hee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.10b
    • /
    • pp.397-401
    • /
    • 2006
  • 최근 다양한 형식의 웹 문서에서 사용자가 원하는 정보만을 검색 하기위해 웹 문서를 주제별로 분류하여 수집하고, 관리하는 것은 필수적인 요소이다. 즉, 정확하고 빠른 정보 검색을 위한 웹 문서 수집은 문서 형식에 따라 분류되어 수집 되어야 한다. 따라서 웹 환경에서 문서를 구성하는 형식을 텍스트나 이미지 데이터로 구분하고 그 형식에 맞는 분류기법을 사용한다면 정확한 정보 검색이 이루어 질수 있다. 본 논문에서는 텍스트와 URL을 이용한 주제 중심의 하이브리드 웹 문서 분류 방법을 제안한다. 텍스트와 URL을 이용한 분류 방법은 텍스트 형식은 주제 중심의 문서 분류방식을 사용하며, 텍스트 정보의 효용성이 낮은 경우 URL의 주제 분포도를 이용하여 분류하며 수집한다. 이를 통해 여러 가지 형식의 웹 문서가 분류 가능하며, 주제에 따른 문서 분류의 정확도가 높아진다.

  • PDF