자동문서분류(Text Classification)는 주어진 텍스트 문서를 이에 적합한 카테고리로 분류하는 텍스트 마이닝 기술 중의 하나로서 스팸메일 탐지, 뉴스분류, 자동응답, 감성분석, 쳇봇 등 다양한 분야에 활용되고 있다. 일반적으로 자동문서분류 시스템은 기계학습 알고리즘을 활용하며, 이 중에서 텍스트 데이터에 적합한 알고리즘인 나이브베이즈(Naive Bayes), 지지벡터머신(Support Vector Machine) 등이 합리적 수준의 성능을 보이는 것으로 알려져 있다. 최근 딥러닝 기술의 발전에 따라 자동문서분류 시스템의 성능을 개선하기 위해 순환신경망(Recurrent Neural Network)과 콘볼루션 신경망(Convolutional Neural Network)을 적용하는 연구가 소개되고 있다. 그러나 이러한 최신 기법들이 아직 완벽한 수준의 문서분류에는 미치지 못하고 있다. 본 논문은 그 이유가 텍스트 데이터가 단어 차원 중심의 벡터로 표현되어 텍스트에 내재한 의미 정보를 훼손하는데 주목하고, 선행 연구에서 그 효능이 검증된 시멘틱 텐서공간모델에 기반하여 심층 신경망 아키텍처를 제안하고 이를 활용한 문서분류기의 성능이 대폭 상승함을 보인다.
Aljabri, Atif A.;Alshanqiti, Abdullah;Alkhodre, Ahmad B.;Alzahem, Ayyub;Hagag, Ahmed
International Journal of Computer Science & Network Security
/
제22권10호
/
pp.406-412
/
2022
Scene classification of very high-resolution (VHR) imagery can attribute semantics to land cover in a variety of domains. Real-world application requirements have not been addressed by conventional techniques for remote sensing image classification. Recent research has demonstrated that deep convolutional neural networks (CNNs) are effective at extracting features due to their strong feature extraction capabilities. In order to improve classification performance, these approaches rely primarily on semantic information. Since the abstract and global semantic information makes it difficult for the network to correctly classify scene images with similar structures and high interclass similarity, it achieves a low classification accuracy. We propose a VHR remote sensing image classification model that uses extracts the global feature from the original VHR image using an EfficientNet-V2L CNN pre-trained to detect similar classes. The image is then classified using a multilayer perceptron (MLP). This method was evaluated using two benchmark remote sensing datasets: the 21-class UC Merced, and the 38-class PatternNet. As compared to other state-of-the-art models, the proposed model significantly improves performance.
기존의 기호주의 적 추론 시스템은 경직성 문제로 인하여 유연성을 결여하고 있다. 이는 기호주의 적 지식표현 체계가 지식의 유연한 의미구조를 충분히 반영하고 있지 못할 뿐 아니라 추론 방법도 논리를 바탕으로 하기 때문이다. 이러한 문제를 해결하기 위하여, 우리는 최근 인공 신경 망에 기반 한 유연한 지식표현과 추론을 위한 연결주의 적 의미 망(CSN)을 제안한 바 있다. CSN은 인간의 유사성과 연관성에 기반 하여 근사 추론과 상식추론을 수행할 수 있다. 그러나 CSN 모델에서는 상위개념간의 관계를 표현하는 데 있어서 단순한 전향 신경 망을 이용함으로써 상위개념간의 일반적이고 구조화된 관계를 표현하거나 변수의 표현 및 바인딩의 어려움과 같은 문제점이 있었다. CSN모델의 이런 문제점을 해결하기 위해 본 논문에서는 상위개념간의 일반적이고 구조화된 지식표현을 가능하게 하고 추론이 용이한 기호주의 표현 체계와 이 표현 체계 안에서 의미구조를 표현하고 학습할 수 있는 연결주의 학습 모델인 CSN을 결합한 기호-연결주의 통합 시스템 SymCSN(Symbolic CSN)을 제안하고, 실험을 통하여 제안한 시스템이 인간과 유사한 유연한 지식표현과 추론을 위한 모델임을 보인다.
본 논문은 기존의 TextRank 알고리즘에 상호정보량 척도를 결합하여 군집 기반에서 키워드 추출하는 LSI-based ClusterTextRank 기법과 추출된 키워드를 Latent Semantic Indexing(LSI)을 이용한 연관망 구축 기법을 제안한다. 제안 기법은 문서집합을 단어-문서 행렬로 표현하고, 이를 LSI를 이용하여 저차원의 개념 공간으로 차원을 축소한다. 그 다음 k-means 군집화 알고리즘을 이용하여 여러 군집으로 나누고, 각 군집에 포함된 단어들을 최대신장트리 그래프로 표현한 후 이에 근거한 군집 정보량을 고려하여 키워드를 추출한다. 그리고나서 추출된 키워드들 간에 유사도를 LSI 기법을 통해 구한 단어-개념 행렬을 이용하여 계산한 후, 이를 키워드 연관망으로 활용한다. 제안 기법의 성능을 평가하기 위해 여행 관련 블로그 데이터를 이용하였으며, 제안 기법이 기존 TextRank 알고리즘보다 키워드 추출의 정확도가 약 14% 가량 개선됨을 보인다.
학생들의 과학과 관련된 직업에 대한 인식은 이공계 직업동기와 과학학습동기에 큰 영향을 미친다. 특히 미래의 국가 과학기술발전의 핵심 동력인 과학영재학생들이 지속적으로 과학을 하는데 있어 과학관련 직업에 대한 긍정적 인식은 중요한 역할을 한다. 이 연구는 언어네트워크 분석법을 통하여 중학교 과학영재와 일반학생들의 과학과 관련된 직업에 대한 인식을 비교 분석하였다. 이를 위하여 학생들이 인식하고 있는 과학과 관련된 직종으로 구성된 네트워크를 구조화 한후, 네트워크 분석을 수행하여 두 집단의 인식 네트워크의 구조적 특성을 확인하였다. 과학영재학생들과 일반학생들의 네트워크를 비교분석한 결과, 첫째, 과학영재들은 일반학생들에 비하여 과학과 관련된 직업의 종류에 있어 다양했으며, 직업명의 구체성이 있었다. 둘째, 물질과학자와 의사는 과학영재와 일반학생 모두의 과학관련 직업 인식망에서 가장 중심적인 위치를 차지하였다. 또한 교수, 컴퓨터 및 수학 관련 직업은 과학영재의 인식망에서는 상대적으로 높은 중심성을 나타낸 반면, 일반학생의 인식망에서는 낮은 중심성을 보이며 과학영재와 일반학생들의 인식의 차이를 확인하였다. 셋째, 기술적 직업은 과학영재와 일반학생들의 인식망의 외곽에 위치하여, 학생들은 기술적 직업을 과학과 관련된 직업으로 쉽게 떠올리지 못함을 확인할 수 있었다. 이 연구는 과학영재 학생들의 진로 지도를 위한 근거 자료로 활용될 수 있을 것이다.
서비스 탐색기법은 퍼베이시브 환경을 지향하는 홈 네트웍 환경에서 중요한 기술 중 하나로 연구되고 있다 그러나 기존의 연구들은 디바이스나 서비스가 갖는 시멘틱을 이해하지 못하고 단순히 구문검색에 의한 매칭기법만 제공하고 있다. 본 연구에서는 이와 같은 문제점을 해결하기 위하여 시멘틱 서비스 탐색을 위한 온톨로지를 개발하였다. 개발된 온톨로지는 시멘틱을 포함하여 퍼베이시브 홈 네트워크 환경 내의 디바이스나 서비스를 기술하고, 이들의 관계를 프리미티브 서비스 개념을 통해 효과적으로 기술하였다. 또한, 디바이스에 대한 프로퍼티를 표현하여, 퍼베이시브 환경에서 디바이스가 갖는 여러 가지 위치정보나 디바이스 상태 등의 정보가 기술되도록 하였다. 본 논문에서는 이와 같이 정의된 온톨로지를 사용하여 서비스를 검색하고, 그 유용성을 평가하기 위해 기존의 Jini 룩업서비스를 확장하여 시멘틱 서비스탐색 시스템을 개발하였다. 그리고 개발된 시스템에서 다양한 시나리오상의 서비스 탐색 실험을 통해, 온톨로지에 의한 시멘틱 탐색기법의 유용성을 입증하였다.
차세대 워게임 시뮬레이터는 웹상에 분산되어 있는 다양한 자원들을 재사용하고 실시간에 발생되는 각종 이벤트에 따라 동적으로 모델을 재조합하는 기술을 필요로 한다. 기존의 HLA기반 페더레이트는 군 전용망 내에 있는 다른 페더레이트와의 상호운영성을 보장하기 위해 정해진 문법 수준의(syntax-level) 규칙들을 준수하도록 제한한다. 웹서비스는 비즈니스 영역에서 상호운영성을 보장하기 위해 제시된 기술로 이미 많은 사례를 통해 의미수준(semantic-level)에서 WAN 상의 자원들을 연동시키는 데 사용되어 왔다. 이러한 웹서비스 기술을 워게임 시뮬레이션에 응용하기 위해서는, 1) WAN상에 분산된 페더레이트들을 의미수준에서 상호 운영 할 수 있는 기술 및 2) RTI 기반 페더레이트와 Web 서비스 기반 페더레이트를 상호 운영하기 위한 기술이 제공되어야 한다. 본 논문에서는 상기한 문제들의 해결책을 제공하고, 수상전 예제를 통해 웹기반 페더레이트 사용으로 인한 장점을 보이도록 한다.
본 논문에서는 실내 공간 이미지의 의미론적 영상 분할을 위해 배경과 물체로 재설계된 클래스를 학습하는 방법을 제안한다. 의미론적 영상 분할은 이미지의 벽이나 침대 등 의미를 갖는 부분들을 픽셀 단위로 나누는 기술이다. 기존 의미론적 영상 분할에 대한 연구들은 신경망을 통해 이미지의 다양한 객체 클래스들을 학습하는 방법들을 제시해왔고, 긴 학습 시간에 비해 정확도가 부족하다는 문제가 지적되었다. 그러나 물체와 배경을 분리하는 문제에서는, 다양한 객체 클래스를 학습할 필요가 없다. 따라서 우리는 이 문제에 집중해, 클래스를 단순화 후에 학습하는 방법을 제안한다. 학습 방법의 실험 결과로 기존 방법들보다 정확도가 약 5~12% 정도 높았다. 그리고 같은 환경에서 클래스를 달리 구성했을 때 학습 시간이 약 14 ~ 60분 정도 단축됐으며, 이에 따라 물체와 배경을 분리하는 문제에 대해 제안하는 방법이 효율적임을 보인다.
Ha, Hyoji;Han, Hyunwoo;Mun, Seongmin;Bae, Sungyun;Lee, Jihye;Lee, Kyungwon
한국컴퓨터정보학회논문지
/
제21권5호
/
pp.19-29
/
2016
This paper suggests a method to refine a massive collective intelligence data, and visualize with multilevel sentiment network, in order to understand information in an intuitive and semantic way. For this study, we first calculated a frequency of sentiment words from each movie review. Second, we designed a Heatmap visualization to effectively discover the main emotions on each online movie review. Third, we formed a Sentiment-Movie Network combining the MDS Map and Social Network in order to fix the movie network topology, while creating a network graph to enable the clustering of similar nodes. Finally, we evaluated our progress to verify if it is actually helpful to improve user cognition for multilevel analysis experience compared to the existing network system, thus concluded that our method provides improved user experience in terms of cognition, being appropriate as an alternative method for semantic understanding.
This study analyzes messages from Korean TV debates on the conflict over U.S. beef imports and the process of negotiations over the imports in 2008. The authors have conducted a content analysis and a semantic network analysis by using KrKwic and CONCOR. The data was drawn from nine TV debates aired by three major TV networks in Korea (MBC, KBS, and SBS) from 27 April 27 2008 to 6 July 2008. The results indicate substantial differences in the semantic structure between arguments by the government and those by civic groups. We also investigated the relationship between the terms frequently used by both sides (i.e., the government and civic groups), and the terms used exclusively by one side. There was a gradual increase in the number of terms frequently used by both sides over time, from the formation of the conflict to its escalation to its resolution. The results indicate the possibility of general agreement in conflict situations.
본 웹사이트에 게시된 이메일 주소가 전자우편 수집 프로그램이나
그 밖의 기술적 장치를 이용하여 무단으로 수집되는 것을 거부하며,
이를 위반시 정보통신망법에 의해 형사 처벌됨을 유념하시기 바랍니다.
[게시일 2004년 10월 1일]
이용약관
제 1 장 총칙
제 1 조 (목적)
이 이용약관은 KoreaScience 홈페이지(이하 “당 사이트”)에서 제공하는 인터넷 서비스(이하 '서비스')의 가입조건 및 이용에 관한 제반 사항과 기타 필요한 사항을 구체적으로 규정함을 목적으로 합니다.
제 2 조 (용어의 정의)
① "이용자"라 함은 당 사이트에 접속하여 이 약관에 따라 당 사이트가 제공하는 서비스를 받는 회원 및 비회원을
말합니다.
② "회원"이라 함은 서비스를 이용하기 위하여 당 사이트에 개인정보를 제공하여 아이디(ID)와 비밀번호를 부여
받은 자를 말합니다.
③ "회원 아이디(ID)"라 함은 회원의 식별 및 서비스 이용을 위하여 자신이 선정한 문자 및 숫자의 조합을
말합니다.
④ "비밀번호(패스워드)"라 함은 회원이 자신의 비밀보호를 위하여 선정한 문자 및 숫자의 조합을 말합니다.
제 3 조 (이용약관의 효력 및 변경)
① 이 약관은 당 사이트에 게시하거나 기타의 방법으로 회원에게 공지함으로써 효력이 발생합니다.
② 당 사이트는 이 약관을 개정할 경우에 적용일자 및 개정사유를 명시하여 현행 약관과 함께 당 사이트의
초기화면에 그 적용일자 7일 이전부터 적용일자 전일까지 공지합니다. 다만, 회원에게 불리하게 약관내용을
변경하는 경우에는 최소한 30일 이상의 사전 유예기간을 두고 공지합니다. 이 경우 당 사이트는 개정 전
내용과 개정 후 내용을 명확하게 비교하여 이용자가 알기 쉽도록 표시합니다.
제 4 조(약관 외 준칙)
① 이 약관은 당 사이트가 제공하는 서비스에 관한 이용안내와 함께 적용됩니다.
② 이 약관에 명시되지 아니한 사항은 관계법령의 규정이 적용됩니다.
제 2 장 이용계약의 체결
제 5 조 (이용계약의 성립 등)
① 이용계약은 이용고객이 당 사이트가 정한 약관에 「동의합니다」를 선택하고, 당 사이트가 정한
온라인신청양식을 작성하여 서비스 이용을 신청한 후, 당 사이트가 이를 승낙함으로써 성립합니다.
② 제1항의 승낙은 당 사이트가 제공하는 과학기술정보검색, 맞춤정보, 서지정보 등 다른 서비스의 이용승낙을
포함합니다.
제 6 조 (회원가입)
서비스를 이용하고자 하는 고객은 당 사이트에서 정한 회원가입양식에 개인정보를 기재하여 가입을 하여야 합니다.
제 7 조 (개인정보의 보호 및 사용)
당 사이트는 관계법령이 정하는 바에 따라 회원 등록정보를 포함한 회원의 개인정보를 보호하기 위해 노력합니다. 회원 개인정보의 보호 및 사용에 대해서는 관련법령 및 당 사이트의 개인정보 보호정책이 적용됩니다.
제 8 조 (이용 신청의 승낙과 제한)
① 당 사이트는 제6조의 규정에 의한 이용신청고객에 대하여 서비스 이용을 승낙합니다.
② 당 사이트는 아래사항에 해당하는 경우에 대해서 승낙하지 아니 합니다.
- 이용계약 신청서의 내용을 허위로 기재한 경우
- 기타 규정한 제반사항을 위반하며 신청하는 경우
제 9 조 (회원 ID 부여 및 변경 등)
① 당 사이트는 이용고객에 대하여 약관에 정하는 바에 따라 자신이 선정한 회원 ID를 부여합니다.
② 회원 ID는 원칙적으로 변경이 불가하며 부득이한 사유로 인하여 변경 하고자 하는 경우에는 해당 ID를
해지하고 재가입해야 합니다.
③ 기타 회원 개인정보 관리 및 변경 등에 관한 사항은 서비스별 안내에 정하는 바에 의합니다.
제 3 장 계약 당사자의 의무
제 10 조 (KISTI의 의무)
① 당 사이트는 이용고객이 희망한 서비스 제공 개시일에 특별한 사정이 없는 한 서비스를 이용할 수 있도록
하여야 합니다.
② 당 사이트는 개인정보 보호를 위해 보안시스템을 구축하며 개인정보 보호정책을 공시하고 준수합니다.
③ 당 사이트는 회원으로부터 제기되는 의견이나 불만이 정당하다고 객관적으로 인정될 경우에는 적절한 절차를
거쳐 즉시 처리하여야 합니다. 다만, 즉시 처리가 곤란한 경우는 회원에게 그 사유와 처리일정을 통보하여야
합니다.
제 11 조 (회원의 의무)
① 이용자는 회원가입 신청 또는 회원정보 변경 시 실명으로 모든 사항을 사실에 근거하여 작성하여야 하며,
허위 또는 타인의 정보를 등록할 경우 일체의 권리를 주장할 수 없습니다.
② 당 사이트가 관계법령 및 개인정보 보호정책에 의거하여 그 책임을 지는 경우를 제외하고 회원에게 부여된
ID의 비밀번호 관리소홀, 부정사용에 의하여 발생하는 모든 결과에 대한 책임은 회원에게 있습니다.
③ 회원은 당 사이트 및 제 3자의 지적 재산권을 침해해서는 안 됩니다.
제 4 장 서비스의 이용
제 12 조 (서비스 이용 시간)
① 서비스 이용은 당 사이트의 업무상 또는 기술상 특별한 지장이 없는 한 연중무휴, 1일 24시간 운영을
원칙으로 합니다. 단, 당 사이트는 시스템 정기점검, 증설 및 교체를 위해 당 사이트가 정한 날이나 시간에
서비스를 일시 중단할 수 있으며, 예정되어 있는 작업으로 인한 서비스 일시중단은 당 사이트 홈페이지를
통해 사전에 공지합니다.
② 당 사이트는 서비스를 특정범위로 분할하여 각 범위별로 이용가능시간을 별도로 지정할 수 있습니다. 다만
이 경우 그 내용을 공지합니다.
제 13 조 (홈페이지 저작권)
① NDSL에서 제공하는 모든 저작물의 저작권은 원저작자에게 있으며, KISTI는 복제/배포/전송권을 확보하고
있습니다.
② NDSL에서 제공하는 콘텐츠를 상업적 및 기타 영리목적으로 복제/배포/전송할 경우 사전에 KISTI의 허락을
받아야 합니다.
③ NDSL에서 제공하는 콘텐츠를 보도, 비평, 교육, 연구 등을 위하여 정당한 범위 안에서 공정한 관행에
합치되게 인용할 수 있습니다.
④ NDSL에서 제공하는 콘텐츠를 무단 복제, 전송, 배포 기타 저작권법에 위반되는 방법으로 이용할 경우
저작권법 제136조에 따라 5년 이하의 징역 또는 5천만 원 이하의 벌금에 처해질 수 있습니다.
제 14 조 (유료서비스)
① 당 사이트 및 협력기관이 정한 유료서비스(원문복사 등)는 별도로 정해진 바에 따르며, 변경사항은 시행 전에
당 사이트 홈페이지를 통하여 회원에게 공지합니다.
② 유료서비스를 이용하려는 회원은 정해진 요금체계에 따라 요금을 납부해야 합니다.
제 5 장 계약 해지 및 이용 제한
제 15 조 (계약 해지)
회원이 이용계약을 해지하고자 하는 때에는 [가입해지] 메뉴를 이용해 직접 해지해야 합니다.
제 16 조 (서비스 이용제한)
① 당 사이트는 회원이 서비스 이용내용에 있어서 본 약관 제 11조 내용을 위반하거나, 다음 각 호에 해당하는
경우 서비스 이용을 제한할 수 있습니다.
- 2년 이상 서비스를 이용한 적이 없는 경우
- 기타 정상적인 서비스 운영에 방해가 될 경우
② 상기 이용제한 규정에 따라 서비스를 이용하는 회원에게 서비스 이용에 대하여 별도 공지 없이 서비스 이용의
일시정지, 이용계약 해지 할 수 있습니다.
제 17 조 (전자우편주소 수집 금지)
회원은 전자우편주소 추출기 등을 이용하여 전자우편주소를 수집 또는 제3자에게 제공할 수 없습니다.
제 6 장 손해배상 및 기타사항
제 18 조 (손해배상)
당 사이트는 무료로 제공되는 서비스와 관련하여 회원에게 어떠한 손해가 발생하더라도 당 사이트가 고의 또는 과실로 인한 손해발생을 제외하고는 이에 대하여 책임을 부담하지 아니합니다.
제 19 조 (관할 법원)
서비스 이용으로 발생한 분쟁에 대해 소송이 제기되는 경우 민사 소송법상의 관할 법원에 제기합니다.
[부 칙]
1. (시행일) 이 약관은 2016년 9월 5일부터 적용되며, 종전 약관은 본 약관으로 대체되며, 개정된 약관의 적용일 이전 가입자도 개정된 약관의 적용을 받습니다.