• 제목/요약/키워드: Selective Sampling

검색결과 83건 처리시간 0.017초

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

남산과 광릉지역의 잣나무림에서 낙엽분해과정에 관련된 날개응애 군집분석 (Community Analysis of Oribatid Mites (Acari : Oribatida) in the Process of Needle Leaf Decomposition in Korean Pine (Pinus koraiensis) Forest of Namsan and Kwangreung)

  • 배윤환
    • 한국토양동물학회지
    • /
    • 제6권1_2호
    • /
    • pp.25-31
    • /
    • 2001
  • 주변환경의 오염에 의한 스트레스를 받는 정도가 다른 남산과 광릉의 잣나무림에서 낙엽주머니 (mesh size :남산 1.7mm, 광릉 0.4mm, 1 7mm)방법을 이용하여 낙엽의 분해과정에 관련된 날개응애 군집에 대한 분석을 실시하였다. 각 조사구에서 2년에 걸쳐 총 11회 수거한 낙엽주머니에서 조사된 날개응애 종 수는 30종을 초과하지 않았고, 남산과 광릉의 mesh size 1.7mm에서 조사된 종 수는 광릉이 남산에 비해 유의성있게 높았다(paired t-test, p<0.05), mesh size가 다른 광릉 지역의 낙엽주머니간에는 종수의 차이가 없어 남산,광릉 두지역간의 종수 차이만이 인정되었다. 낙엽주머니내 날개응애 체장 분포 및 체장별 밀도 패턴은 세 조사구에서 중형종(0.3-0.7mm미만)이 다수 출현했고, 밀도가 높은 종은 광릉에서는 체장이 0.2-0.5 mm 사이의 종들이, 남산에서는 이들 조사구들보다 조금 더 큰 종들에서 높은 밀도를 보였다. S renson 지수 및 Cluster analysis를 이용한 조사구 날개응애 군집의 정성적, 정량적 분석은 두 지역의 날개응애 군집이 종 구성에 있어 다른 그룹이라는 것을 제시했다. 낙엽주머니내 날개응애 종들의 출현은 20종 미만의 종들이 5월에서 9월 사이에 출현하였는데, 1년차와 2년차간에 출현 패턴에는 다소 변화가 있었다. 낙엽주머니내 날개응애 유입은 1년차에는 5월부터 다수의 새로운 종들이 이입되었지만, 2년차에는 새로운 종의 유입은 미미한 반면 1년차에 이입했던 종들의 재차 유입이 일어났고, 유입시기도 빨라졌다. 낙엽주머니내 날개응애군집의 종 다양도 분석에는 종 풍부도지수, Shannon 지수, 균등도 지수가 사용되었고, 이들 세 가지 다양도 지수의 값이 모두 광릉이 높고 남산이 낮은(mesh size 1.7mm>광릉 mesh size 0.4 mm>남산 mesh size 1.7 mm) 일관된 경향을 나타냈다. 이는 날개응애 군집의 종 다양성은 광릉지역이 남산지역에 비해 더 높다는 결론을 도출할 수 있는 것이었다. 낙엽주머니내 출현종의 우점종과 출현빈도 분석결과, 각 조사구의 우점종들은 전체 밀도의 70%이상을 차지하고 있어 비중이 매우 높은 것들로 나타났고, 최고 우점종은 mesh size 1.7mm의 남산과 광릉 조사구에서 Tricho-galumna nipponica로 동일했고, 광릉 mesh size 0.4 mm에서는 이 종보다 크기가 작은 Ramusella sengbuschi가 최고 우점종이었다. 그리고 낙엽주머니내에 밀도와 출현빈도가 높아 낙엽분해에 직,간접적으로 크게 관여하는 날개응애 종들로는 Tricogalumna nipponica, Epidamaeus coreanus, Scheloribates latipes, Ceratozetes japonicus, Ramusella sengbuschi, Eohypochthonius crassisetiger, Cultroribula lata 등을 선발할 수 있었다.

  • PDF

기술교육의 쟁점과 실천 전략: 우리나라 기술교육 현장 전문가의 인식 (Critical Issues and Practical Strategies in Technology Education: Technology Education Practitioners' Perception in South Korea)

  • 성의석;권혁수
    • 대한공업교육학회지
    • /
    • 제39권1호
    • /
    • pp.189-208
    • /
    • 2014
  • 이 연구의 목적은 기술교사들이 인식하고 있는 기술교육의 쟁점과 그에 대한 실천전략을 연구하는 데 있었다. 이러한 연구 목적을 위하여, 우리나라 기술교사들이 인식하는 기술교육의 쟁점과 그에 대한 해결방안을 도출하기 위해 기술교사 전문가 집단을 대상으로 하나의 질적 연구가 이루어졌다. 기술교사 전문가 그룹을 선정하기 위하여 의도적 표집방법이 다음의 세 가지 조건을 가지고 사용되었다: 1) 대한민국 기술교사상 수상자이거나 2) 온라인 오프라인 상의 기술교사모임을 이끌고 있는 교사들이거나 3) 지역의 기술교사 모임 운영진들. 이 연구는 한국의 기술교사들이 인식하고 있는 쟁점과 실천 전략에 관하여 선택된 15명의 기술교사들과 탐색적인 집중 면담을 실시하였다. 이 인터뷰 내용에 대한 해석은 2명의 연구자들에 의해 주제 분석 방법을 통해 이루어졌으며 이는 선택된 자료에서 개념, 단어, 의미 등의 빈도수를 분석하였다. 결론적으로 이 연구에서 찾고 있는 기술교육의 쟁점은 1) 교육과정의 문제, 2) 교육 환경의 문제, 3) 교사 문제, 4) 학생 문제, 5) 관련 연구 기관 및 대학 문제, 6) 사회적 문제 등이 있었으며, 이에 대한 해결책으로는 1) 기술과 가정교육의 분리, 2) 교육환경 개선 사례 공유, 3) 교사모임과 교사운동 활성화, 4) 체험학습을 통한 흥미유발, 5) 교사 양성 기관의 질적/양적 향상, 6) 기술교육의 가치를 대중에게 홍보 등이 있었다. 또한 기술교육 관련 긍정적 요인으로는, 1) 시대적 요구에 부응하는 기술 교육, 2) 교사들의 교실수업 개선 의지 또는 열정 등이 있었으며, 부정적 요인으로는 1) 기술교사들의 낮은 자존감, 2) 시대의 변화에 대한 거부 또는 늦은 수용 등이 있었다. 이와 같은 결론을 토대로 다음 몇 가지 제언으로는 1) 도출된 기술교육의 문제에 대한 심층적인 연구와 2) 전문가들이 언급한 해결방안에 대한 구체적인 해결책에 대한 대표적인 사례들을 밝히는 연구의 실행 등이 있다.