• 제목/요약/키워드: Semantic networks

검색결과 169건 처리시간 0.024초

Word2Vec과 WordNet 기반 불확실성 단어 간의 네트워크 분석에 관한 연구 (Network Analysis between Uncertainty Words based on Word2Vec and WordNet)

  • 허고은
    • 한국문헌정보학회지
    • /
    • 제53권3호
    • /
    • pp.247-271
    • /
    • 2019
  • 과학에서 지식의 불확실성은 명제가 현재 상태로는 참도 거짓도 아닌 불확실한 상태를 의미한다. 기존의 연구들은 학술 문헌에 표현된 명제를 분석하여 불확실성을 의미하는 단어를 수동적으로 구축하고 구축한 코퍼스를 대상으로 규칙 기반, 기계 학습 기반의 성능평가를 수행해왔다. 불확실성 단어 구축의 중요성은 인지하고 있지만 단어의 의미를 분석하여 자동적으로 확장하고자 하는 시도들은 부족했다. 한편, 계량정보학이나 텍스트 마이닝 기법을 이용하여 네트워크의 구조를 파악하는 연구들은 다양한 학문분야에서 지적 구조와 관계성을 파악하기 위한 방법으로 널리 활용되고 있다. 따라서, 본 연구에서는 기존의 불확실성 단어를 대상으로 Word2Vec을 적용하여 의미적 관계성을 분석하였고, 영어 어휘 데이터베이스이자 시소러스인 WordNet을 적용하여 불확실성 단어와 연결된 상위어, 하위어 관계와 동의어 기반 네트워크 분석을 수행하였다. 이를 통해 불확실성 단어의 의미적, 어휘적 관계성을 구조적으로 파악하였으며, 향후 불확실성 단어의 자동 구축의 확장 가능성을 제시하였다.

RJCC 연구 키워드 네트워크 - 동시출현단어분석과 군집분석 - (Keyword networks in RJCC research - A co-word analysis and clustering -)

  • 서현진;최영현;오승택;이규혜
    • 복식문화연구
    • /
    • 제27권3호
    • /
    • pp.193-205
    • /
    • 2019
  • A trend analysis of research articles in a field of knowledge is significant because it can help in finding out the structural characteristics of the field and the future direction of research through observing change in a time series. We identified the structural characteristics and trends in text data (keywords) gathered from research articles which in itself is an important task in various research areas. The titles and keywords were crawled from research articles published from 2016 to 2018 in the Research Journal of the Costume Culture (RJCC), one of the representative Korean journal in the field of clothing and textile. After we extracted data comprising English titles and keywords from 195 published articles, we transformed it into a 1-mode matrix. We used measures from network analysis (i.e., link, strength, and degree centrality) for evaluating meaningful patterns and trends in the research on clothing and textile. NodeXL was used for visualizing the semantic network. This study observed change in the clothing and textile research trend. In addition to covering the core areas of the field, the subjects of research have been diversifying with every passing year and have evolved onto a developmental direction. The most studied area in articles published by the RJCC was fashion retailing/consumer psychology while aesthetic/historic and fashion industry/policy studies were covered to a more limited extent. We observed that most of the studies reflecting the identity of RJCC share subject keywords to a significant extent.

소셜 빅데이터분석을 통한 외국인근로자에 관한 국민 인식 분석과 정책적 함의 (Analysis of Public Perception and Policy Implications of Foreign Workers through Social Big Data analysis)

  • 하재빈;이도은
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.1-10
    • /
    • 2021
  • 본 연구에서는 빅데이터 기법 중에 하나인 텍스트마이닝을 활용하여 소셜플랫폼에서 외국인근로자에 대한 인식을 알아보고 시사점을 도출하고자 하였다. 연구를 위해서 2020년 1월 1일부터 12월 31일까지를 기준으로 '외국인근로자' 검색 키워드를 수집하여 빈도분석, TF-IDF 분석, 연결중심성 분석으로 상위 키워드 100개를 도출하고 비교분석을 수행하였다. 또한 Ucinet6.0과 Netdraw를 이용해 의미연결망을 분석하였으며, CONCOR 분석을 통해 외국인정책 이슈, 지역사회 이슈, 사업주 관점 이슈, 고용 이슈, 근로환경 이슈, 법적 이슈, 출입국 이슈, 인권 이슈로 8개 클로스터로 군집화하였다. 이러한 분석 결과를 바탕으로 외국인근로자 국민적 인식, 주요 이슈를 파악하였으며, 향후 외국인근로자에 대한 정책 및 관련 연구에 필요한 기초자료를 제공하고자 한다.

콘텐츠 배급을 위한 RSS 기반의 VoiceXML 다이얼로그 시스템 (VoiceXML Dialog System Based on RSS for Contents Syndication)

  • 권형준;김정현;이현구;홍광석
    • 정보처리학회논문지B
    • /
    • 제14B권1호
    • /
    • pp.51-58
    • /
    • 2007
  • 본 논문은 갱신이 잦은 콘텐츠의 배급 및 구독을 위해 등장한 시맨틱 웹의 대표적인 기술인 RSS(RDF Site Summary or Really Simple Syndication)와 인터넷에 존재하는 정보를 음성으로 제공하기 위해 제안된 XML 규격의 W3C 표준 마크업 언어인 VoiceXML을 결합한 시스템의 프로토타입을 제시한다. 제안하는 시스템은 인터넷 기반으로 제공되는 콘텐츠를 유무선 전화망을 통해 음성인식 및 합성기술로 제공하기 위한 것으로서, RSS 서비스를 제공하기 위한 기존의 구성을 수정하지 않고 갱신된 콘텐츠의 구독이 손쉬운 RSS의 장점을 VoiceXML에 적용할 수 있는 특징이 있다. 정보 요청자 측면에서는 RSS로 제공되는 콘텐츠 탐색에 인터넷 환경이 아닌 유무선 전화망을 이용하므로 시공간의 제약을 줄일 수 있으며, 정보 제공자 측면에서는 음성인식 및 합성기술을 이용한 콘텐츠의 배급에 최신 정보의 제공을 위한 별도의 구성요소를 필요로 하지 않는 장점이 있다. 제안하는 시스템의 예로 뉴스 서비스를 구현한 결과, 실제 콘텐츠를 구독하고 탐색할 때에 응답 시간과 음성 인식 측면에서 장애 없이 RSS Feed를 이용해 비주얼 환경으로 제공되는 내용과 동일한 내용을 음성으로 제공받을 수 있었다.

딥러닝을 이용한 소규모 지역의 영상분류 적용성 분석 : UAV 영상을 이용한 농경지를 대상으로 (Applicability of Image Classification Using Deep Learning in Small Area : Case of Agricultural Lands Using UAV Image)

  • 최석근;이승기;강연빈;성선경;최도연;김광호
    • 한국측량학회지
    • /
    • 제38권1호
    • /
    • pp.23-33
    • /
    • 2020
  • 최근 UAV (Unmanned Aerial Vehicle)를 이용하여 고해상도 영상을 편리하게 취득할 수 있게 되면서 저비용으로 소규모 지역의 관측 및 공간정보 제작이 가능하게 되었다. 특히, 농업환경 모니터링을 위하여 작물생산 지역의 피복지도 생성에 대한 연구가 활발히 진행되고 있으며, 랜덤 포레스트와 SVM (Support Vector Machine) 및 CNN(Convolutional Neural Network) 을 적용하여 분류 성능을 비교한 결과 영상분류에서 딥러닝 적용에 대하여 활용도가 높은 것으로 나타났다. 특히, 위성영상을 이용한 피복분류는 위성영상 데이터 셋과 선행 파라메터를 사용하여 피복분류의 정확도와 시간에 대한 장점을 가지고 있다. 하지만, 무인항공기 영상은 위성영상과 공간해상도와 같은 특성이 달라 이를 적용하기에는 어려움이 있다. 이러한 문제점을 해결하기 위하여 위성영상 데이터 셋이 아닌 UAV를 이용한 데이터 셋과 국내의 소규모 복합 피복이 존재하는 농경지 분석에 활용이 가능한 딥러닝 알고리즘 적용 연구를 수행하였다. 본 연구에서는 최신 딥러닝의 의미론적 영상분류인 DeepLab V3+, FC-DenseNet (Fully Convolutional DenseNets), FRRN-B (Full-Resolution Residual Networks) 를 UAV 데이터 셋에 적용하여 영상분류를 수행하였다. 분류 결과 DeepLab V3+와 FC-DenseNet의 적용 결과가 기존 감독분류보다 높은 전체 정확도 97%, Kappa 계수 0.92로 소규모 지역의 UAV 영상을 활용한 피복분류의 적용가능성을 보여주었다.

그린인프라스트럭처의 의미구조 - 기존문헌의 정의문 분석을 중심으로 - (Meaning Structure of Green Infrastructure - A Literature Review about Definitions -)

  • 이은석;노초원;성종상
    • 한국조경학회지
    • /
    • 제42권2호
    • /
    • pp.65-76
    • /
    • 2014
  • 최근 한국 조경분야는 도시 물 순환능력회복을 위한 새로운 개념적 대안으로 그린인프라스트럭처(GI)를 제안하고 있다. 이러한 맥락에서 본 연구를 통해 그린인프라스트럭처의 본질적 의미를 고찰하고자 한다. 연구의 방법은 인터넷 검색과 학술지 데이터베이스 문헌수집과정을 통해 최근 5년간 발간된 47편의 해외 학술지논문을 선별하고 분석하였다. 각 논문에서 연구에 활용한 그린인프라스트럭처의 정의문을 대상으로 분석하였으며, 각 문장에 포함된 동사와 목적어의 의미구조를 통해 해석하여 5대 목적성, 4대 대상요소, 3대 계획공간의 유형을 파악하였다. 5대 목적성은 '제공', '개선', '생산', '보전', '저감'이며, 4대 대상요소는 '인문', '환경', '생태', '수문'이다. 3대 계획공간은 '도입할 수 있는 대상이 되는 공간', '기술적으로 활용이 가능한 공간', '도입대상이 될 수 있으면서, 기술적으로 활용이 가능한 공간' 등이 해당한다. 각각의 대상 요소들은 목적성에 단수 혹은 2~3개가 직접 연결되며, 이는 그린인프라스트럭처의 본질적 의미연결망이다. 종합적으로 조경계획과 도시계획 수립에 활용가능 한 의미연결망의 수는 83개가 있음을 도출하였다.

제17대 대통령 후보 합동 토론 언어네트워크 분석 - 북한 관련 이슈를 중심으로 (Semantic Network Analysis of Presidential Debates in 2007 Election in Korea)

  • 박성희
    • 한국언론정보학보
    • /
    • 제45권
    • /
    • pp.220-254
    • /
    • 2009
  • 대통령 후보 합동 TV토론은 후보들의 정책과 인성의 상호 검증을 통해 민주적인 방식의 대통령 선출에 기여하는 중요한 선거 캠페인이다. 본 연구는 제17대 대통령 후보들이 TV합동토론에서 상호 교환한 어휘군(群)의 연결망을 언어네트워크 분석 소프트웨어인 KrKwic와 UCINET을 통해 분석하고 단어의 사용과 단어 간 거리를 비교 고찰함으로써 정치 토론의 실효성을 점검하고 북한 관련 이슈에 대한 후보 간 입장 차이를 규명하고자 했다. 연구 결과 이명박, 정동영, 이회창 세 후보의 상호토론에는 중심 논제의 구성이 본래 토론이 지향하는 상호이해의 구성요건인 접점(stasis)을 형성하기에 부적합하고, 단어의 선택과 사용빈도에서 생산적인 공방이나 토론의 교육적 효과에 대한 한계를 노정시킨 것으로 나타났다. 북한 관련 이슈 8개 단어들의 공출현 단어 간 거리 분석(co-occurrence matrix) 결과, 각 후보가 연결시킨 단어들 간의 관계를 통해 입장의 차이를 도식화할 수 있었다. 이명박 후보는 북한 문제를 남한과의 상대성에서 파악하는 경향을 보였으며, 이회창 후보는 한-미간의 관계 틀 안에서 북한 문제를 고려하고 북한문제와 핵문제를 동일시하는 것으로 드러났다. 또 정동영 후보는 북한의 문제를 한반도 문제로 개념화하고 북한과 전쟁을 연결 짓지 않는 특징을 나타냈다.

  • PDF

중등학생들의 과학과 생물에서의 '실험'의 의미에 대한 인식구조 비교 (Comparing the Structure of Secondary School Students' Perception of the Meaning of 'Experiment' in Science and Biology)

  • 이준기;신세인;하민수
    • 한국과학교육학회지
    • /
    • 제35권6호
    • /
    • pp.997-1006
    • /
    • 2015
  • 실험에 대한 메타적 인식은 학생들의 과학적 탐구와 과학의 본성에 대한 이해의 중요한 요소 중 하나이다. 이 연구에서는 중학생과 고등학생의 과학과 생물에서의 '실험'의 의미에 대한 인식을 알아보았다. 특히 이 연구에서는 언어 네트워크 분석방법을 사용하여 학생들의 인식을 구조적으로 확인하였다. 이 연구를 위해 190명의 중학생과 200명의 고등학생 이 연구에 참여하였다. 학생들은 과학에서의 '실험'과 생물에서의 '실험'의 의미에 대한 두 문항에 서술형으로 응답하였다. 수집된 응답을 바탕으로 총 4개의 언어 네트워크가 구성되었다. 연구 결과, 과학에서의 '실험'에 대하여 중학생들은 '우리', '직접', '원리' 등의 단어를 중심으로 활동적 측면에서의 실험을 인식하였다. 반면 고등학생은 '이론', '사실', '내용' 등의 단어를 중심으로 지식을 생성하는 탐구과정으로서의 실험으로 인식하였다. 또한 생물에서의 '실험'에 대하여 중학생은 '해부', '몸'을 중심으로, 고등학생은 '생명', '관찰'이 중심으로 인식하여 생명체를 다루는 관찰활동으로 인식하였다. 이러한 연구결과는 앞으로 과학 교과 및 생물 교과에서 실험을 지도하는데 있어서 중요한 근거자료로 활용될 수 있을 것이다.

코퍼스를 이용한 상하위어 추출 연구 (A Study of the Automatic Extraction of Hypernyms arid Hyponyms from the Corpus)

  • 방찬성;이해윤
    • 인지과학
    • /
    • 제19권2호
    • /
    • pp.143-161
    • /
    • 2008
  • 본 논문에서는 코퍼스를 이용하여 어휘들의 상하위 관계 패턴들을 추출하는 방법을 제안한다. 기존 연구들에서는 어순 교체가 자유로운 한국어의 특성으로 인해 주로 사전의 정의문을 이용하여 어휘들의 의미관계 패턴들을 추출하는 방법을 취하고 있으나, 본 논문에서는 코퍼스를 이용하여 보다 다양한 의미관계 패턴들을 추출하여 제시하고자 한다. 이를 위해 먼저 기존의 사전들을 이용해 상하위어 쌍들의 목록을 선정하였다. 다음 이 목록의 어휘 쌍들을 포함하는 문장들을 코퍼스에서 추출한 이후, 이로부터 다시 체계적으로 패턴화 할 수 있는 문장들을 추출하여 21 가지 상하위 관계 패턴들로 일반화하였다. 21가지 패턴들을 정규식으로 표현한 뒤 각각 동일한 패턴들을 가진 문장들을 코퍼스에서 다시 추출한 결과 57%의 정확률이 측정되었다.

  • PDF

NASNet을 이용한 이미지 시맨틱 분할 성능 개선 (Improved Performance of Image Semantic Segmentation using NASNet)

  • 김형석;류기윤;김래현
    • Korean Chemical Engineering Research
    • /
    • 제57권2호
    • /
    • pp.274-282
    • /
    • 2019
  • 최근 빅데이터 과학은 사회현상 모델링을 통한 예측은 물론 강화학습과 결합하여 산업분야 자동제어까지 응용범위가 확대되고 있다. 이러한 추세 가운데 이미지 영상 데이터 활용연구는 화학, 제조, 농업, 바이오산업 등 다양한 산업분야에서 활발히 진행되고 있다. 본 논문은 신경망 기술을 활용하여 영상 데이터의 시맨틱 분할 성능을 개선하고자, U-Net의 계산효율성을 개선한 DeepU-Net 신경망에 AutoML 강화학습 알고리즘을 구현한 NASNet을 결합하였다. BRATS2015 MRI 데이터을 활용해 성능 검증을 수행하였다. 학습을 수행한 결과 DeepU-Net은 U-Net 신경망 구조보다 계산속도 향상 뿐 아니라 예측 정확도도 동등 이상의 성능이 있음을 확인하였다. 또한 이미지 시맨틱 분할 성능을 개선하기 위해서는 일반적으로 적용하는 드롭아웃 층을 빼고, DeepU-Net에 강화학습을 통해 구한 커널과 필터 수를 신경망의 하이퍼 파라미터로 선정했을 때 DeepU-Net보다 학습정확도는 0.5%, 검증정확도는 0.3% 시맨틱 분할 성능을 개선할 수 있었다. 향후 본 논문에서 시도한 자동화된 신경망을 활용해 MRI 뇌 영상진단은 물론, 열화상 카메라를 통한 이상진단, 비파괴 검사 진단, 화학물질 누출감시, CCTV를 통한 산불감시 등 다양한 분야에 응용될 수 있을 것으로 판단된다.