• 제목/요약/키워드: 과도 분류

검색결과 8,482건 처리시간 0.042초

온라인 오피니언 문서 분류를 위한 한국어 형용사 의미 극성 사전 (Lexicon of Semantic-Polarity of Korean Adjectives for the Classification of On-line Opinion Documents)

  • 안애림;심승혜;남지순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.166-171
    • /
    • 2010
  • 본 논문은 한국어 온라인 리뷰 문서의 오피니언 분류(Opinion Classification)에 있어 그 핵심 키워드가 형용사 (Adjective) 범주라는 점을 고려하여, 한국어 형용사를 <문맥에 의존하지 않는 절대 극성>과, <문맥에 의존하여 극성이 바뀌는 상대극성>으로 대분류한 뒤 그 각각의 의미 극성을 하위 분류하는 작업을 수행하였다. 기존의 연구에서 특징적인 오피니언 어휘 수십개에 의존하여 자동 분류를 시도하고자 하였던 문제점을 극복하기 위해서는 한국어 형용사 전체 범주에 대한 체계적인 극성 분류가 이루어져야 할 필요가 있으며, 여기서 특히 상세히 주목받지 못했던 상대 극성 어휘에 대한 본격적인 의미 분류가 요구된다. 본 연구에서 제시하는 형용사의 극성 분류는 기존의 이론 언어학적 형용사 의미 분류와 달리 온라인 오피니언 문서에서 도메인에 따라 나타나는 특징적 의미 유형을 결정하고, 이를 기준으로 온라인 오피니언 문서의 극성 판별에 효과적으로 적용할 수 있는 사전을 구축하였다는 점에서 의의를 가진다.

  • PDF

DMZ 일원 간무봉(강원도 인제군)의 관속식물상 (The Vascular plants of Ganmu-bong(Inje, Gangwon) in the vicinity of the DMZ)

  • 박기쁨;박진선;황희숙;김상준;안종빈;이아영;송진헌;윤호근;정지영;김일권;정수영;신현탁;이철호
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2019년도 춘계학술대회
    • /
    • pp.72-72
    • /
    • 2019
  • 간무봉(555.8m)은 강원도 인제군 남면에 위치하고 있다. 북한강의 지류인 소양강으로 대부분 둘러싸여 있으며 북서쪽에 봉화산(874.4m), 북동쪽에 기룡산(940.4m)과 이어진다. 현재까지 간무봉을 대상으로 한 식물상 조사 이력은 없었으나, DMZ 일원에 위치하는 산이기 때문에 DMZ의 식물상 연구를 위한 기초 자료로 보전하고 탐색하는 의미가 있다. 현지조사는 2018년 4월부터 10월까지 총 6회 수행하였다. 간무봉에는 굴참나무, 신갈나무, 소나무가 우점하고 있는 형태였으며, 조사 결과 관속식물은 73과 175속 211종 3아종 27변종 4품종으로 총 245분류군이 조사되었다. 그 중 양치식물은 고비, 고사리삼, 십자고사리, 퍼진고사리 4분류군이고, 나자식물은 소나무, 일본잎갈나무 2분류군, 피자식물은 노랑제비꽃, 은방울꽃, 꽃향유 등 205분류군이었다. 이는 우리나라 관속식물 4,494분류군(국립수목원, 2016)의 5.45%에 해당한다. 간무봉에서 확인한 특산식물은 진범, 할미밀망, 갈퀴아재비, 병꽃나무 등 6 분류군이며, 희귀식물은 미치광이풀(LC), 말나리(LC) 2 분류군 이외에 VU 이상에 해당하는 희귀식물은 발견하지 못하였다. 그리고 침입외래식물(국립수목원, 2016)의 경우 미국자리공, 수박풀, 미국쑥부쟁이, 단풍잎돼지풀 등 17 분류군이었다. 간무봉 주변에는 경작지, 군부대 훈련장소 등이 있으며, 서쪽 사면은 이미 벌목이 많이 된 상태이며, 북동쪽도 마을과 더불어 경작지로 개간되어 있다. 따라서 주변의 외부에서 가해지는 인위적인 간섭이 많은 상태라고 볼 수 있으며, 이미 유입된 단풍잎돼지풀 등 생태계교란종에 의한 변화에도 유의할 필요가 있다.

  • PDF

DMZ 일원 박달산(경기도 파주시)의 관속식물상 (The Flora of Vascular Plants of Mt. Baldal (Gyeong-gi-do, Paju-si) Adjacent to the DMZ)

  • 송진헌;변경열;이종원;최영민;정재상;길희영;장계선
    • 한국자원식물학회:학술대회논문집
    • /
    • 한국자원식물학회 2021년도 춘계학술대회
    • /
    • pp.32-32
    • /
    • 2021
  • 본 연구에서는 DMZ 일원인 경기도 파주시 광탄면과 양주군 백석면에 걸쳐있는 박달산(363m) 주변의 관속식물상을 조사하였다. 파주시는 동쪽은 양주시, 서쪽은 한강을 경계로 김포시, 북부는 임진강을 경계로 북한과 접하고 있다. 남쪽은 고양시, 북쪽은 연천군에 접하고 있으며, 북위 37° 42'~38° 07', 동경 126° 41'~127° 01'에 위치한다. 박달산은 파주시 광탄면 경계에 위치하였으며, 현재 명칭은 박달나무가 많아서 박달산이라고 부르고 있으나 예전에는 독수리가 많아서 수리봉이라는 명칭으로 부르기도 했다. 박달산 주변에 분포하는 관속식물 현황은 79과 211속 288종 3아종 36변종 4품종 331분류군으로 조사되었다. 양치식물은 5과 10속 11종 1변종 12분류군, 나자식물은 2과 3속 5종 5분류군, 쌍자엽식물은 63과 154속 208종 3아종 22변종 3품종 236분류군, 단자엽식물 9과 44속 61종 13변종 1품종 78분류군으로 조사되었다. 희귀식물은 취약종(VU)에 속하는 왜박주가리(Tylophora floribunda Miq.) 1분류군, 약관심종(LC)에 속하는 태백제비꽃(Viola albida Palib.), 이팝나무(Chionanthus retusus Lindl. & Paxton) 2분류군이 조사되었다. 특산식물은 키버들(Salix koriyanagi Kimura), 외대으아리(Clematis brachyuran Maxim.), 서울제비꽃(Viola seoulensis Nakai), 오동나무(Paulownia coreana Uyeki), 백운산원추리(Hemerocallis hakuunensis Nakai) 5분류군이 조사되었다. 침입외래식물은 가시박(Sicyos angulatus L.), 단풍잎돼지풀(Ambrosia trifida L.), 돼지풀(Ambrosia artemisiifolia L.) 등 28분류군으로 조사되었다.

  • PDF

통계적 관점에서의 직업의 특성 분석

  • 남기성
    • 한국조사연구학회:학술대회논문집
    • /
    • 한국조사연구학회 2007년도 추계학술대회 발표논문집
    • /
    • pp.179-189
    • /
    • 2007
  • 본 연구에서는 기존의 연구와는 다른 관점으로 경제학적 관점에서의 임금에 대한 연구가 아니고 통계학적인 관점에서의 임금에 의한 분류로서 직업군들 간에 작용하는 몇 가지의 변수를 이용하여 소득(실제 분석은 임금)과의 관련성을 살펴보고 직업군들을 그룹으로 분류하고자 한다. 연구 결과 KECO 직업분류의 중분류 상에서 통계적 관점으로 2차원 산점도에 의한 그룹화와 군집분석에 의한 군집화 결과 '관리직'은 다른 직업과 여러 가지 형태에서 다른 그룹으로 분류가 되며, 또한 '법률, 경찰, 소방, 교도 관련직'과 '금융, 보험 관련직' 그리고 '정보통신 관련직'이 다른 차원에서 하나의 그룹을 형성하고, '경비 및 청소 관련직'과 '농림,어업 관련직'도 하나의 그룹으로 형성되고 있다.

  • PDF

문서의 주제어별 가중치와 말뭉치를 이용한 한국어 문서의 자동분류 : 베이지안 분류자 (An Automatic Classification of Korean Documents Using Weight for Keywords of Document and Corpus : Bayesian classifier)

  • 허준희;고수정;김태용;최준혁;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.154-156
    • /
    • 1999
  • 문서 분류는 미리 정의된 두 개 또는 그 이상의 클래스에 새로 생성되는 객체들을 할당하는 방법이다. 문서의 자동 분류에 대한 연구는 오래 전부터 연구되어 왔지만 한국어에 대한 적용 및 연구는 다른 분야에 비해 아직까지 활발히 이루어지지 않고 있다. 본 논문에서는 문서를 자동으로 분류하기 위해 문서의 주제어에 가중치를 부여하고, 부족한 문서의 특징을 보충하기 위하여 말뭉치로부터 주제어들과의 상호정보에 의해 추출된 단어를 사용하여 문서를 표현한 후, 가중치를 부여한 문서의 주제어에 베이지안 분류자를 사용하여 문서분류를 수행한다. 실험은 한국어 정보검색 실험용 데이터 집합인 KTset95 문서 4,414개 중 1,300개의 문서를 학습 집합으로, 1,000개의 문서를 분류에 대한 검증 집합으로 사용하였다. 실험 결과, 순수 베이지안 확률을 사용한 기존의 방법보다 실험 집합과 검증 집합에서 각각 1.92%, 4.3% 향상된 분류 정확도를 얻었다.

  • PDF

다중결정템플릿기반 SVM결합모델을 통한 지문분류 (Fingerprint Classification Using SVM Combination Models based on Multiple Decision Templates)

  • 민준기;홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.751-753
    • /
    • 2005
  • 지문을 5가지 클래스로 나누는 헨리시스템을 기반으로 신경망이나 SVM(Support Vector Machines) 등과 같은 다양한 패턴분류 기법들이 지문분류에 많이 사용되고 있다. 특히 최근에는 높은 분류 성능을 보이는 SVM 분류기의 결합을 이용한 연구가 활발히 진행되고 있다. 지문은 클래스 구분이 모호한 영상이 많아서 단일결합모델로는 분류에 한계가 있다. 이를 위해 본 논문에서는 새로운 분류기 결합모델인 다중결정템플릿(Multiple Decision Templates, MuDTs)을 제안한다. 이 방법은 하나의 지문클래스로부터 서로 다른 특성을 갖는 클러스터들을 추출하여 각 클러스터에 적합한 결합모델을 생성한다. NIST-database4 데이터로부터 추출한 핑거코드에 대해 실험한 결과. 5클래스와 4클래스 분류문제에 대하여 각각 $90.4\%$$94.9\%$의 분류성능(거부율 $1.8\%$)을 획득하였다.

  • PDF

띄어쓰기 오류에 강건한 문장 압축 기반 한국어 문장 분류 (Jam-packing Korean sentence classification method robust for spacing errors)

  • 박근영;김경덕;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.600-604
    • /
    • 2018
  • 한국어 문장 분류는 주어진 문장의 내용에 따라 사전에 정의된 유한한 범주로 할당하는 과업이다. 그런데 분류 대상 문장이 띄어쓰기 오류를 포함하고 있을 경우 이는 분류 모델의 성능을 악화시킬 수 있다. 이에 한국어 텍스트 혹은 음성 발화 기반의 문장을 대상으로 분류 작업을 수행할 경우 띄어쓰기 오류로 인해 발생할 수 있는 분류 모델의 성능 저하 문제를 해결해 보고자 문장 압축 기반 학습 방식을 사용하였다. 학습된 모델의 성능을 한국어 영화 리뷰 데이터셋을 대상으로 실험한 결과 본 논문이 제안하는 문장 압축 기반 학습 방식이 baseline 모델에 비해 띄어쓰기 오류에 강건한 분류 성능을 보이는 것을 확인하였다.

  • PDF

포섭 구조기반 OVR SVM 결합을 통한 다중부류 암 분류 (Multi-class Cancer Classification by Integrating OVR SVMs based on Subsumption Architecture)

  • 홍진혁;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.37-39
    • /
    • 2006
  • 지지 벡터 기계(Support Vector Machine; SVM)는 기본적으로 이진분류를 위해 고안되었지만, 최근 다양한 분류기 생성전략과 결합전략이 고안되어 다중부류 분류에도 적용되고 있다. 본 논문에서는 OVR(One-Vs-Rest) 전략으로 생성된 SVM을 NB(Naive Bayes) 분류기를 이용하여 동적으로 구성함으로써, OVR SVM을 이용한 다중부류 분류 시스템에서 자주 발생하는 동점을 효과적으로 해결하는 방법은 제안한다. 이 방법을 유전발현 데이터를 이용한 다중부류 암 분류에 적용하였는데, 고차원의 데이터로부터 NB 분류기 구축에 유용한 유전자를 선택하기 위해 Pearson 상관계수를 사용하였다. 14개의 암 유형과 16,063개의 유전발현 수준을 가지는 대표적인 다중부류 암 분류 데이터인 GCM 암 데이터에 적용하여 제안하는 방법의 유용성을 확인하였다.

  • PDF

가상예제를 이용한 $Na{\ddot{i}}ve$ Bayes 분류기 성능 향상 (Improving Performance for $Na{\ddot{i}}ve$ Bayes Classifier Using Virtual Examples)

  • 이유정;강병호;강재호;류광렬
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 가을 학술발표논문집 Vol.32 No.2 (2)
    • /
    • pp.655-657
    • /
    • 2005
  • 기계학습에서 분류는 훈련 예제들로 학습하여 생성한 분류기를 활용하여 새로운 예제에 어느 한 범주를 부여하는 것을 말한다. 일반적으로 분류의 성능 즉 정확도의 향상은 학습 알고리즘을 개선하거나 훈련예제 집합을 변형시킴으로써 가능하다. 본 논문에서 소개하는 가상예제를 이용한 분류기 성능 향상 방안은 후자에 속한다. 실세계 분류문제에서 많은 수의 훈련예제들을 수집하는 일은 대상문제에 따라 비용이 많이 드는 경우가 있다. 또한 적은 수의 훈련예제를 학습해 생성한 분류기는 분류성능이 좋지 않을 수 있다. 본 논문에서는 이런 문제를 해결하기 위해서 가상예제를 생성해 훈련예제 집합에 추가하는 방안을 제안하고자 한다. 가상예제를 이용한 분류성능 향상방안이 $Na{\ddot{i}}ve$ Bayes 학습 알고리즘 성능 개선에 효과가 있음을 실험을 통해 확인하였다.

  • PDF

교육용 저장소 시스템을 위한 분류 모델 (A Classification Model for the Educational Repository System)

  • 최명회;정동원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (C)
    • /
    • pp.76-78
    • /
    • 2006
  • 이 논문에서는 교육용 저장소 관리 시스템의 자원들을 위한 분류체계를 제안한다. 생성되는 자원들에 대한 체계적인 저장관리, 정확한 검색 및 활용을 위해서는 적절한 분류체계가 우선적으로 요구된다. 여러 가지 자원들에 대한 효율적이고 편리한 활용을 위하여 자원들의 관점에 따른 다양한 뷰를 제공해야 하고 뷰가 생성과 소멸에 따라 분류체계도 일관성 있게 유지 및 변경되어야 한다. 이 논문에서는 교육 자원들 중에서 학습활동에서 생성되는 구현자원들에 대한 체계적인 관리 및 활용성 향상을 위한 분류체계를 제안한다. 관련된 과학기술분야 분류체계들을 바탕으로 구현자원들에 적합한 분류체계를 정의하며 동적 분류체계 관리 방법을 제안한다. 제안된 분류체계 및 관리 모델은 보다 정확하고 체계적인 구현자원에 대한 관리를 가능하게 하며 또한 활용의 용이성을 향상시킨다.

  • PDF