• 제목/요약/키워드: 복수-범주 분류

검색결과 9건 처리시간 0.026초

기계학습에 기초한 국내 학술지 논문의 자동분류에 관한 연구 (An Analytical Study on Automatic Classification of Domestic Journal articles Based on Machine Learning)

  • 김판준
    • 정보관리학회지
    • /
    • 제35권2호
    • /
    • pp.37-62
    • /
    • 2018
  • 문헌정보학 분야의 국내 학술지 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히, "정보관리학회지"에 수록된 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 용어 가중치부여 기법, 학습집합 크기, 분류 알고리즘, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 각 요소를 적절하게 적용하는 것이 효과적이며, 보다 단순한 모델의 사용으로 상당히 좋은 수준의 성능을 도출할 수 있었다. 또한, 국내 학술지 논문의 분류는 특정 논문에 하나 이상의 범주를 할당하는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있다. 따라서 이러한 환경을 고려하여 단순하고 빠른 분류 알고리즘과 소규모의 학습집합을 사용하는 최적의 분류 모델을 제안하였다.

기계학습에 기초한 자동분류의 성능 요소에 관한 연구 (An Analytical Study on Performance Factors of Automatic Classification based on Machine Learning)

  • 김판준
    • 정보관리학회지
    • /
    • 제33권2호
    • /
    • pp.33-59
    • /
    • 2016
  • 국내 학술회의 논문으로 구성된 문헌집합을 대상으로 기계학습에 기초한 자동분류의 성능에 영향을 미치는 요소들을 검토하였다. 특히 구현이 쉽고 컴퓨터 처리 속도가 빠른 로치오 알고리즘을 사용하여 "한국정보관리학회 학술대회 논문집"의 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 분류기 생성 방법, 학습집합 규모, 가중치부여 기법, 범주 할당 방법 등 주요 요소들의 특성을 다각적인 실험을 통해 살펴보았다. 결과적으로 분류 환경 및 문헌집합의 특성에 따라 파라미터(${\beta}$, ${\lambda}$)와 학습집합의 크기(5년 이상)를 적절하게 적용하는 것이 효과적이며, 동등한 성능 수준이라면 보다 단순한 단일 가중치부여 기법을 사용하여 분류의 효율성을 높일 수 있음을 발견하였다. 또한 국내 학술회의 논문의 분류는 특정 논문에 하나 이상의 범주가 부여되는 복수-범주 분류(multi-label classification)가 실제 환경에 부합한다고 할 수 있으므로, 이러한 환경을 고려하여 주요 성능 요소들의 특성에 기초한 최적의 분류 모델을 개발할 필요가 있다.

랜덤포레스트를 이용한 국내 학술지 논문의 자동분류에 관한 연구 (An Analytical Study on Automatic Classification of Domestic Journal articles Using Random Forest)

  • 김판준
    • 정보관리학회지
    • /
    • 제36권2호
    • /
    • pp.57-77
    • /
    • 2019
  • 대표적인 앙상블 기법으로서 랜덤포레스트(RF)를 문헌정보학 분야의 학술지 논문에 대한 자동분류에 적용하였다. 특히, 국내 학술지 논문에 주제 범주를 자동 할당하는 분류 성능 측면에서 트리 수, 자질선정, 학습집합 크기 등 주요 요소들에 대한 다각적인 실험을 수행하였다. 이를 통해, 실제 환경의 불균형 데이터세트(imbalanced dataset)에 대하여 랜덤포레스트(RF)의 성능을 최적화할 수 있는 방안을 모색하였다. 결과적으로 국내 학술지 논문의 자동분류에서 랜덤포레스트(RF)는 트리 수 구간 100~1000(C)과 카이제곱통계량(CHI)으로 선정한 소규모의 자질집합(10%), 대부분의 학습집합(9~10년)을 사용하는 경우에 가장 좋은 분류 성능을 기대할 수 있는 것으로 나타났다.

RAM 기반 신경망을 이용한 필기체 숫자 분류 연구 (A Study on Handwritten Digit Categorization of RAM-based Neural Network)

  • 박상무;강만모;엄성훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권3호
    • /
    • pp.201-207
    • /
    • 2012
  • RAM 기반 신경망은 2진 신경망(Binary Neural Network, BNN)에 복수개의 정보 저장 비트를 두어 교육의 반복 횟수를 누적하도록 구성된 가중치를 가지지 않는(weightless) 신경회로망으로서 한 번의 교육만으로 학습이 이루어지는 효율성이 뛰어난 신경회로망이다. 지도 학습에 기반을 둔 RAM 기반 신경망은 패턴 인식 분야에는 우수한 성능을 보이는 반면, 비지도 학습에 의해 패턴을 구분해야 하는 범주화 연구에는 적합하지 않은 모델로 분류된다. 본 논문에서는 비지도 학습 알고리즘을 제안하여 RAM 기반 신경망으로 패턴 범주화를 수행한다. 제안된 비지도 학습 알고리즘에 의해 RAM 기반 신경망은 입력 패턴에 따라 자율 학습하여 스스로 범주를 생성할 수 있으며, 이를 통해 RAM 기반 신경망이 지도 학습과 비지도 학습이 모두 가능한 복합 모델임을 증명한다. 실험에 사용한 학습 패턴으로는 0에서 9까지의 오프라인 필기체 숫자로 구성된 MNIST 데이터베이스를 사용하였다.

RAM 기반 신경망의 비지도 학습에 관한 연구 (A Study on Unsupervised Learning Method of RAM-based Neural Net)

  • 박상무;김성진;이동형;이수동;옥철영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권1호
    • /
    • pp.31-38
    • /
    • 2011
  • RAM 기반 3-D 신경망은 2진 신경망(Binary Neural Network, BNN)에 복수개의 정보 저장 비트를 두어 교육의 반복 횟수를 누적하도록 구성된 가중치를 가지지 않는 신경회로망으로서 한 번의 교육만으로 학습이 이루어지는 효율성이 뛰어난 신경회로망이다. MRD(Maximum Response Detector) 기법을 이용한 3-D 신경망의 인식 방법은 지도 학습에 기반을 둔 것으로서 학습을 통해 신경망 스스로가 범주를 구분할 수 없으며 잘 구분된 범주의 학습 데이터를 통해서만 성능을 발휘할 수 있다. 본 논문에서는 기존 3-D 신경 회로망에 학습 데이터의 구분 없이 신경망 자체가 입력 패턴에 따라 학습하여 범주를 구분하는 비지도 학습 알고리즘을 제안한다. 제안된 비지도 학습 알고리즘에 의해 신경회로망은 판별자의 수를 스스로 조절할 수 있는 구조를 가지게 되며 이는 망의 유연한 확장성을 보장한다. 0에서 9까지의 다중 패턴으로 구성된 오프라인 필기체 숫자를 무작위로 추출하여 학습 패턴으로 인식 실험을 수행하였으며 실험을 통해 신경망이 스스로 비지도 학습에 의해 판별자의 수를 결정하게 되며 이것은 신경망이 각각의 필기체 숫자에 대한 개념을 가지게 되는 것으로 해석할 수 있다.

익국환과 익국보화환의 실험적(實驗的) 간경변(肝硬變)에 대(對)한 효과(效果) (Effects of Ikgukwhan and Ikgukbowhawhan on the Production of Collagen and the Regeneration of Liver Cells Damaged by Bile Duct Ligation and Dimethylnitrosamine)

  • 배철호;김성환;김강산;강병기
    • 대한한의학방제학회지
    • /
    • 제6권1호
    • /
    • pp.119-139
    • /
    • 1998
  • 간경변(肝硬變)은 각종(各種) 만성미만성간염(慢性彌滿性肝炎)이나 광범위(廣範圍)한 간장실질(肝臟實質)의 손상(損傷)이 계속적(繼續的)으로 발전(發展)하여 이루어진 결과(結果)이다. 주(主)된 병리적(病理的) 특징(特徵)은 간세포(肝細胞)의 변성(變成), 괴사(壞死) 후(後)에 나타나는 섬유조직(纖維組織)의 증식(增殖), 간세포(肝細胞)의 결절상(結節狀) 재생(再生), 가소엽(假小葉)의 형성(形成) 등(等)으로서, 이들 세가지의 변화(變化)가 뒤섞여 진행(進行) 되는 가운데, 간내(肝內) 혈관망(血管網)이 감소(減少)하거나 혈관망(血管網)에 이상(異狀) 함몰(陷沒)이 발생(發生)하는 것이다. 주(主)된 임상표현(臨床表現)은 간기능감퇴(肝機能減退)와 문맥압(門脈壓) 상승(上升)으로 인(因)한 비종대(脾腫大), 복수(腹水), 복벽정맥(腹壁靜脈)의 노장(怒張), 식도(食道)와 위저정맥(胃底靜脈)의 노장파열(怒張破裂), 간성혼수(肝性昏睡) 등(等)이 나타난다. 한의학(韓醫學)의 범주(範疇)로는 '적취(積聚), 징가, 황달(黃疸), 고창(鼓脹), 협통(脇痛), 단복창(單腹脹), 비괴' 등(等)에 해당(該當)되는 것으로 습열(濕熱)이 구울(久鬱)함에 따라 간(肝), 비(脾)가 손상(損傷)되고 이것이 더욱 오래되어 기체혈어(氣滯血瘀)로 발전(發展)하게 되는 병리변화(病理變化)를 갖는다. 이에 담도결찰(膽道結紮) 및 dimethylnitrosamine의 복강투여(腹腔投與)로 간경화(肝硬化)를 유발(誘發)하고, 울증(鬱證)에 다용하는 익국환과 익국보화환이 이러한 병증(病症)에 간기능보호작용(肝機能保護作用)이 있는가를 관찰(觀察)하고, 한의학적(韓醫學的) 병증(病症)의 분류(分類)에 따라 간질환(肝疾患)에 대(對)한 치료(治療)의 가능성(可能性)을 알아보고자 본(本) 실험(實驗)을 실시(實施)한 결과(結果), 유의성(有意性) 있는 결과(結果)를 얻었기에 보고(報告)하는 바이다.

  • PDF

모바일 컨텐츠 공급파트너와 서비스 제공업체의 관계에 대한 연구 -전략적 성과에 영향을 미치는 관계특성을 중심으로-

  • 송영욱
    • 한국유통학회:학술대회논문집
    • /
    • 한국유통학회 2003년도 동계학술대회 발표논문집
    • /
    • pp.169-200
    • /
    • 2003
  • 소비자의 욕구변화와 정보기술의 발전으로 정보경제시대, 신경제시대가 도래함에 따라 가치사슬이 변화하고, 새로운 가치를 창출하는 신산업이 등장하고 있다. 인터넷의 확산과 더불어 선으로부터의 자유, 개인성, 즉시성이 가능한 모바일 비즈니스가 우리나라에서도 태동하고 있다. 모바일 비즈니스는 금융업체, 정보제공업체, 통신망 운용업체, 최종이용자간의 새로운 가치의 결합이 특징이며, 막 흐름이 만들어지고 발전되고 있는 상황이다. 이와 같이 다양한 이해관계자가개입하고 있어 협력이 특히 강조되고 또 요구되고 있다. 이러한 중요성에도 불구하고 이들간의 관계에 대한 연구가 미흡한 편이다. 따라서 본 연구는 모바일 비즈니스를 주도하고 있는 통신망 제공업체와 모바일 컨텐츠 공급 파트너간의 조직간 협력관계에 대한 실증 연구를 수행하였다. 관계마케팅, 거래비용, 자원기반관점, 네트워크 이론 등 기업간 관계를 기술, 설명, 예측하는 주요이론에서 논의되고 있는 개념을 바탕으로 본 연구는 컨텐츠 공급파트너의 전략적 성과에 영향을 주는 연구 모형을 제시한다. 최근 중요성이 더 강조되고 있는 항목은 신뢰와 결속임을 감안하여, 매개변수로써 전략적 성과에 영향을 주는 주요한 요소로 신뢰와 결속을 제시하고 있다. 컨텐츠 제공업체의 전략적 성과는 서비스제공업체에 대한 신뢰와 결속에 큰 영향을 받고있다는 점을 반영하고 있다. 한편 신뢰에 영향을 주는 독립변수로는 서비스 제공업체에 대한 평판, 서비스제공업체와 컨텐츠 제공 파트너간의 상호의사소통, 그리고 업무처리의 절차에 대한 공정성을 제시하고 있다 결속에 영향을 미치는 독립변수로는 동의된 목표, 업무정보교류, 거래특유자산의 3개의 변수를 선정하였다. 독립, 매개, 종속변수간의 9개의 연구 가설을 수립하였다. 국내의 주도적인 이동통신망소유업체에 모바일 컨텐츠를 공급하고 있는 170여개의 파트너를 대상으로 실증연구를 수행했다. 공변량 구조분석을 위주로 분석한 연구의 결과에 의하면 본 연구의 모델은 충분한 적합성을 보여주고 있는 것으로 나타났다. 또한 가설의 상당수가 채택이 되었다. 그러나 모바일 비즈니스의 기업간관계의 실제측면을 나타내는 업무정보교류와 결속자의 관계의 유의하지 않게 나와 기각되었다. 기각에 대한 여러 가지의 해석이 가능하지만 측정의 신뢰성을 확보해야 하고 개념의 타당성을 더 엄격하게 준수할 필요성이 제기되었다. 본 연구는 조직이론에 근거한 변수를 채택하고 있으나 모바일 비즈니스의 생명주기특성상 태동기이기 때문에 기업간 관계를 연구하는 측면에서는 탐험적 연구성격이 강하다. 더 나아가 본 산업의 주된 연구가 질적이고 기업내부만을 연구했던 것에 비교하면 시초적이라고 할 수 있다. 또한 관계마케팅, CRM 등의 이론적 배경이 되고 있는 신뢰와 결속의 중요성이 재확인하는 결과도 의의라고 할 수 있다. 그리고 신뢰는 양사 간의 상호관계에서 조성될 수 있는 특성을 가진 반면, 결속은 계약관계 초기단계에서 성문화하고 규정화 할 수 있는 변수의 성격이 강하다고 할 수가 있다. 본 연구는 복잡한 기업간 관계를 지나치게 협력적 측면에서만 규명했기 때문에 많은 측면을 간과할 가능성이 있다. 또한 방법론적으로 일방향의 시각만을 고려했고, 횡단적 조사를 통하고 국내의 한 서비스제공업체와 관련이 있는 컨텐츠 공급파트너만의 시각을 검증했기 때문에 해석에서 유의할 필요가 있다. 또한 타당성확보 노력을 기하였지만 측정도구 면에서 엄격한 개발과정을 준수하지는 못했다. 향후에는 모바일 컨텐츠 파트너의 기업의 특성을 조사하여 관계성 변수와의 상호관련연구를 진행할 필요가 있다. 관계기간, 의존성, 거래처의 단/복수여부, 서비스 범주 등의 제반 변수를 고려하여 이러한 변수가 양사와의 관계성 변수에 어떤 영향이 있는가를 검증할 필요가 있다. 또한 신뢰, 결속 등 다차원의 개념에 대한 심도 깊은 연구와 최근 제기되고 있는 이론의 확대도 필요하다. 마지막으로 신뢰와 결속에 영향을 미치는 요소간의 개념적 분류, 차이의 검증, 영향력 등을 광범위하게 진행시킬 필요가 있다.

  • PDF

실어증에서 나타나는 참조어 정보처리과정의 특성 : 명칭 실어증과 이해성 실어증을 중심으로 (Anaphoric Resolution in Anomia and Wernike Aphasia)

  • 김가영;황유미;문영선;박윤;남기춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.455-461
    • /
    • 1999
  • 본 연구의 목적은 실어증 화자가 참조어(대명사)를 이해하고 표현하는데 있어서의 오류 반응을 살펴봄으로써 참조어에 관한 처리기제를 알아보는 것이다. 본 연구에서는 명칭성 실어증 환자와 이해성 실어증 환자를 대상으로 하였으며, 각각의 환자에게 두 가지 실험을 진행하였다. 실험 1은 정오판정 과제로 문장, 혹은 문단을 제시하고 사용된 참조어가 옳은지 그른지를 판정하도록 하는 것이다. 실험 2는 채워넣기 과제로 문장, 문단을 제시하고 괄호 안에 들어갈 참조어를 보기에서 고르도록 하는 것이다. 사용된 참조어는 인칭 대명사와 지시 대명사, 그리고 지시 관형사였다. 인칭 대명사의 경우는 인칭과 수로 나누어 각각 1인칭, 2인칭의 단수 복수로 구분하여 제시되었으며, 문장 내에서 각각 주격조사 '가', 보조사 '는', 소유격조사 '의'와 결합되어 제시되었다. (나는, 너는, 우리는, 너희는/ 내가, 너가, 우리가, 너희가/ 나의, 너의, 우리의, 너희의) 지시 대명사의 경우는 사물을 나타내는 것과 장소를 나타내는 것으로 구분되어 제시되었다. (이것, 그것, 저것/ 이곳, 그곳, 저곳) 지시 관형사의 경우는 '이', '그', '저'가 각각 명사와 결합되어 제시되었는데 지시대명사로 분류하였다. 실험결과는 실험과제간(정오판정, 채워넣기), 실험재료간(인칭 대명사, 지시 대명사)의 차이로 분석될 수 있다. 또한 인칭 대명사와 지시 대명사 내에서도 각각의 재료들 간에 오류반응의 특징이 있는 것으로 나타났다 이로 미루어 볼 때 참조어 범주간 별개의 처리과정이 작용하는 것이라고 생각할 수 있다. 물론 인칭대명사와 지시대명사가 사용되는 문맥적 상황, 대명사의 개념적 거리, 빈도, 사용된 문장의 길이 등 여타의 요소들도 고려되어야 할 것이다. 보조용언으로 쓰일 때 어휘적 의미가 전혀 활성화되지 않아 정상인과는 다른 언어처리를 하고 있음이 밝혀졌다.류의 의미가 모두 활성화되는 것을 보여 주었다. 즉, "먹은"과 간은 어절 이해는 구성 형태소로의 분석과 구성 형태소 어휘 접근을 통해 어절 이해가 이루어진다는 가설을 지지하고 있다. 실험 2에서는 실험 1과 다르게 한 뜻으로만 안일 수밖에 없는 "쥐어"와 같은 어절을 사용하여 이런 경우에도(즉, 어절의 문맥이 특정 뜻으로 한정하는 경우) 구성 형태소로의 분석 과정이 일어나는지를 조사하였다. 실험 2의 결과는 실험 1의 결과와는 다르게 어간의 한가지 의미와 관련된 조건만 촉진적 점화 효과가 나타나는 것을 보여주었다. 특히, 실험 2에서 SOA가 1000msec일 경우, 두 의미의 활성화가 나타나는 것을 보여주었는데, 이 같은 결과는 어절 문맥이 특정한 의미로 한정시킬 경우는 심성어휘집에 활용형태로 들어있다는 것이다. 또한 명칭성 실어증 환자의 경우에는 즉시적 점화과제에서는 일반인과 같은 형태소 처리과정을 보였으나, 그이후의 처리과정이 일반인과 다른 형태를 보였다. 실험 1과 실험 2의 결과는 한국어 어절 분석이 구문분석 또는 활용형태를 통해 어휘 접근되는 가설을 지지하고 있다. 또 명칭성 실어증 환자의 경우에는 지연된 점화과제에서 형태소 처리가 일반인과 다르다는 것이 밝혀졌다. 이 결과가 옳다면 한국의 심성 어휘집은 어절 문맥에 따라서 어간이나 어근 또는 활용형 그 자체로 이루어져 있을 것이다.으며, 레드 클로버 + 혼파 초지가 건물수량과 사료가치를 높이는데 효과적이었다.\ell}$ 이었으며 , yeast extract 첨가(添加)하여 배양시(培養時)는 yeast extract 농도(濃度)가 증가(增加)함에

  • PDF

하천과정과 식생 - 연구동향과 시사점 (Fluvial Processes and Vegetation - Research Trends and Implications)

  • 우효섭;조강현;장창래;이찬주
    • Ecology and Resilient Infrastructure
    • /
    • 제6권2호
    • /
    • pp.89-100
    • /
    • 2019
  • 본 연구는 전통적 수문지형학 범주에서 식생요소를 추가하여 식생-수문-지형 간의 상호작용을 연구한 국내외 성과를 정리, 분석한 것이다. 이 분야는 전통적 하천관리는 물론 하천복원과도 직접적으로 관련되어 있어 학술적으로나 실무적으로나 중요하다. 이 분야 연구는 20세기 중후 반부터 시작하여 현지조사-실내실험/수치모형의 단계를 거쳐 21세기 들어 다시 현장에서 정밀, 장기조사 단계로 가고 있다. 그러나 이 분야 국내 관련연구는 매우 미흡하다. 본 연구는 국내외 관련 연구성과를 분석하고 저자들의 지식과 경험을 토대로 식생-수문-지형 간 상호작용을 설명하는 개념적 모형과 그에 따른 6개의 유형을 제안하였다. 국내 관련연구는 제안된 6개 유형에 따라 분류하고 검토하였다. 다음 국내에서 실제 나타나는 하천식생 관련이슈들을 고려하여 향후 시급히 필요한 연구로서 식생-수문-지형 간 상호작용의 이해를 위해 특성이 서로 다른 복수의 하천에서 이에 대한 장기적, 체계적, 집중적 조사연구(모니터링) 등 다수를 제안하였다.