• 제목/요약/키워드: 단어네트워크

검색결과 283건 처리시간 0.03초

북한 도서관잡지 『도서관일군 참고자료』의 텍스트 네트워크 분석 (A Text Network Analysis of North Korean Library Journal, 『Reference Materials for Librarian』)

  • 이성신;김현숙;백수민;윤수빈;최재황
    • 한국도서관정보학회지
    • /
    • 제53권3호
    • /
    • pp.169-191
    • /
    • 2022
  • 본 연구의 목적은 북한의 도서관운영방법연구소가 간행한 2년간의 『도서관일군 참고자료』(2016~2017)를 대상으로 텍스트 네트워크 분석을 시도해 보는데 있다. 텍스트 네트워크 분석은 단순 단어의 빈도분석을 뛰어넘어 단어 간의 연결성과 관계성을 파악하여 특정 단어가 얼마나 중요한 위치를 차지하는지를 측정할 수 있으며, 특정 사회현상에 대한 해석과 시사점 도출도 가능하다, 본 연구에서는 용어의 빈도분석, 연결중심성 분석, 매개중심성 분석, 군집분석을 통한 분석이 이루어졌다. 『도서관일군 참고자료』의 텍스트 네트워크 분석 결과 북한의 도서관을 이해하는데 있어서 가장 중요한 용어들은 '리용자', '정보봉사', '정보요구', '정보기술', '과학기술', '사회적학습', '콤퓨터', '자료기지', '정보수집', '정보검색', '도서관일군' 등의 순으로 나타났다.

유비쿼터스도시종합계획과 유비쿼터스도시계획 비교 연구 -U-서비스 계획을 중심으로- (A Comparative Study between Ubiquitous City Comprehensive Plan and Ubiquitous City Plan - Focusing on U-Service Plan)

  • 유지송;정다운;이미숙;민경주
    • Spatial Information Research
    • /
    • 제23권2호
    • /
    • pp.83-93
    • /
    • 2015
  • 최근 U-City 계획을 수립한 지자체의 U-서비스는 시설 및 도시 관리 위주의 서비스로 구현되고 있으며, 시민 맞춤형 U-서비스는 계획에만 그치고 있는 실정이다. 이에 본 연구는 U-City 종합계획과 U-City 계획의 U-서비스 내용을 네트워크 텍스트 분석과 단어 빈도 분석을 통해 비교 검토하여 향후 시민 맞춤형 U-서비스 제공을 위한 시사점을 제시하였다. 제1, 2차 U-City 종합계획과 4개 지방자치단체의 U-City 계획 중 U-서비스 계획 내용을 추출하여 주요 단어들을 산출하였고, 도출된 단어를 통해 네트워크 텍스트 분석과 단어 빈도 분석을 실시하였다. 분석 결과를 바탕으로 향후 U-City 종합계획에서는 지자체의 특색에 따른 서비스 추가와 정책 재정 지원 및 시민의 필요사항을 반영하여 다양한 분야의 시민 맞춤형 U-서비스 개발과 같은 시사점을 도출하였으며, 이를 통해 U-City에 대한 시민들의 인식 또한 증가될 것으로 기대할 수 있다.

텍스트마이닝을 활용한 건설실무정보의 특성 분석 - 건설기술, 사례, 원가절감 등 정보를 중심으로 - (Analysis on the Characteristics of Construction Practice Information Using Text Mining: Focusing on Information Such as Construction Technology, Cases, and Cost Reduction)

  • 정성윤;김진욱
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.205-222
    • /
    • 2022
  • 본 연구는 전문지식을 갖지 않은 건설기술자와 건설사업 참여자가 건설 실무에서 중요도가 높은 단어와 단어 간의 상호 연관관계를 쉽게 이해할 수 있도록 정보서비스를 개선하고자 하였다. 이를 위해 텍스트마이닝과 네트워크 중심성을 이용하여 건설기술정보시스템에서 가장 많이 사용하고 있는 기술정보, 사례정보 및 원가절감 등 건설실무정보에 대해 단어의 출현 빈도, 주제 모형화, 네트워크 중심성을 분석하였다. 이러한 분석을 통해 도로, 포장, 교량, 터널 등 도로공사와 관련한 설계, 시공, 사업관리, 시방·기준, 유지관리 등이 건설 실무에서 중요한 정보로 파악되었다. 또한, 연결 중심성과 고유벡터 중심성 측정을 통해 중요도가 높은 단어 간의 상관도를 분석하였다. 상관도 분석을 통해 기술정보를 확충한다면 보다 유용한 정보를 제공할 수 있다는 결과를 얻었다. 끝으로, 연구 결과가 갖는 제약과 이에 따른 추가적인 연구를 제시하였다.

단어의 의미와 순서를 고려하는 문서색인방법을 이용한 CNN 기반 한글문서분류 (Classification of Korean Documents Based on CNN Using Document Indexing Method based on Word Meaning and Order)

  • 김남훈;양형정
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.41-45
    • /
    • 2017
  • 본 논문에서는 컨볼루션 신경망 네트워크(CNN:Convolution Neural Network)을 기반으로 단어의 의미와 순서를 고려하는 문서 색인 방법을 이용하여 한글 문서 분류 방법을 제안한다. 먼저 문서를 형태소 분석하여 어절 단위로 분리 한 후, 불용어를 처리 하고, 문서의 단어 의미를 고려하는 문서 표현하고, 문서의 단어 순서까지 고려하여 CNN의 입력으로 사용하였다. 실험결과 CNN 분류기를 기반으로 본 논문에서 제안하는 문서 색인 방법은 TF-IDF를 이용하는 방법보다 4.2%, Word2vec만 단독으로 사용하는 것보다 1.4%의 성능 상승을 이루었다. 이러한 결과를 통해 본 논문에서 제안하는 방법이 문서범주화 데이터 셋에서 문서 분류 성능향상에 영향을 미친다는 것을 확인하였다.

  • PDF

의미네트워크를 이용한 단어의미의 모호성 해결방법 (A Word Sense Disambiguation Method with a Semantic Network)

  • 나동렬
    • 인지과학
    • /
    • 제3권2호
    • /
    • pp.225-248
    • /
    • 1992
  • 본 논문에서는 의미 네트워크에 기반을 둔 지식베이스를 이용하여 단어 의미의 모호성을 해소하는 방법들을 소개 한다. 기본이 되는 방법은 입력문자의 의미해석이 진행됨에 따라 수집되는 지식베이스내의 경로(path)들을 추적하여 이용하는 것이다. 이러한 경로들을 의미경로(semantic path)라고 부른다. 파싱과정에서 한 단어가 입력되면 이단어가 가질수 있는 의미 중에서 어느 의미 경로에도 이용되지 않은 것들이 제거된다. 각 제거는 의미 경로들을 통하여 전파되어 이미 입력된 다른 단어들의 의미의 제거를 유발한다. 이 박업은 더이상 제거되는 의미가 없을때 까지 반복 진행된느데 이를 recursive word sense removal 작업이라 부른다. 추상적인 개념의 구체화(conctetion) 작업도 단어 의미 모호성해소의 중요한 방법인데, 본 논문에서는 이를 경로조절작업(path adjustment operation)이라고 불리는 방법을 이용하여 확장시키는 방법을 소개한다. 의미사이의 연과성(semantic association)이나 구문분석으로부터의 정보를 위의 방법들과 관련지어 이용하는 방법도 살펴본다.

애너그램 문제 인지적 해결과정의 분자컴퓨팅 시뮬레이션 (Molecular Computing Simulation of Cognitive Anagram Solving)

  • 천효선;이지훈;류제환;백다솜;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권12호
    • /
    • pp.700-705
    • /
    • 2014
  • 애너그램은 주어진 문자들을 재배열하여 숨겨진 단어를 찾아내는 철자바꾸기 놀이로, 문제를 빨리 풀어내는 사람들은 제약 만족 네트워크의 병렬적 탐색에 의해 문제를 해결한다. 본 연구에서는 이러한 인지적 현상을 모델링한 분자 애너그램 풀이 알고리즘을 제시하였다. 문자를 DNA 서열로 인코딩하고, 문자 DNA 가닥을 연결하여 바이그램과 단어 서열을 만들었다. DNA 혼성화, 연결, 젤 전기영동, 추출 연산을 수행해 문자와 바이그램 집합으로부터 답을 찾는 데 필요한 바이그램을 추출한 후, 추출한 바이그램과 단어 집합으로부터 다시 네 가지 DNA 연산을 반복하여 답을 찾는다. 분자 실험 결과 분자 컴퓨터는 정답인 단어와 오답인 단어를 구분해낼 수 있었다. 이를 통해 인간의 병렬적 사고과정을 분자 컴퓨터로 모델링할 수 있는 가능성을 보였다.

SNS 환경에서 양방향 헬스케어 질의응답 서비스 개발을 위한 사용자 질문 추출 및 분류 방법 연구 (Extracting and Classifying User Questions to Develop Bidirectional Healthcare Q&A Services in an SNS Environment)

  • 오교중;김승석;최호진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.198-201
    • /
    • 2011
  • 본 연구는 현재 널리 사용되고 있는 소셜네트워크 속에서 일반 사용자들이 의료 도메인의 전문가들과 쉽게 질문과 응답을 주고 받을 수 있게 해주는 서비스 개발을 위한 기초 연구로써, 사용자의 문서를 분석하여 질문을 추출해 내고 어떤 의료 도메인에 해당하는 질문인지 분류하는 연구이다. 한글로 구성된 문서 속에서 질문에 해당하는 형태소 분석 방법을 이용하야 질문을 추출을 한 다음 질문 속의 단어 들을 분석하여 KORLEX를 이용한 단어간의 관계성을 분석하여 도메인을 분류하는 작업을 거친다. 또한 본 연구는 텍스트마이닝 기법과 인공지능의 분류 기법을 응용하여 소셜네트워크 속에서 질문과 응답을 분석하여, 의료 도메인의 전문가들이 볼 수 있게 함으로써, 소셜네트워크를 이용한 양방향의 질의응답 서비스를 제공 한다. 이 같은 양방향 질의응답 서비스를 통해 헬스케어 및 의료 관리 서비스를 받을 수 있다. 본 논문은 소셜네트워크 상에서 사용자들이 올린 헬스케어에 관련된 질문들을 추출하고 분류해 주는 과정에 한정하여 진행된 결과를 기술한다.

제17대 대통령 후보 합동 토론 언어네트워크 분석 - 북한 관련 이슈를 중심으로 (Semantic Network Analysis of Presidential Debates in 2007 Election in Korea)

  • 박성희
    • 한국언론정보학보
    • /
    • 제45권
    • /
    • pp.220-254
    • /
    • 2009
  • 대통령 후보 합동 TV토론은 후보들의 정책과 인성의 상호 검증을 통해 민주적인 방식의 대통령 선출에 기여하는 중요한 선거 캠페인이다. 본 연구는 제17대 대통령 후보들이 TV합동토론에서 상호 교환한 어휘군(群)의 연결망을 언어네트워크 분석 소프트웨어인 KrKwic와 UCINET을 통해 분석하고 단어의 사용과 단어 간 거리를 비교 고찰함으로써 정치 토론의 실효성을 점검하고 북한 관련 이슈에 대한 후보 간 입장 차이를 규명하고자 했다. 연구 결과 이명박, 정동영, 이회창 세 후보의 상호토론에는 중심 논제의 구성이 본래 토론이 지향하는 상호이해의 구성요건인 접점(stasis)을 형성하기에 부적합하고, 단어의 선택과 사용빈도에서 생산적인 공방이나 토론의 교육적 효과에 대한 한계를 노정시킨 것으로 나타났다. 북한 관련 이슈 8개 단어들의 공출현 단어 간 거리 분석(co-occurrence matrix) 결과, 각 후보가 연결시킨 단어들 간의 관계를 통해 입장의 차이를 도식화할 수 있었다. 이명박 후보는 북한 문제를 남한과의 상대성에서 파악하는 경향을 보였으며, 이회창 후보는 한-미간의 관계 틀 안에서 북한 문제를 고려하고 북한문제와 핵문제를 동일시하는 것으로 드러났다. 또 정동영 후보는 북한의 문제를 한반도 문제로 개념화하고 북한과 전쟁을 연결 짓지 않는 특징을 나타냈다.

  • PDF

텍스트마이닝 기법을 이용한 한국 사회의 혐오 양상 분석 (Analyzing the Phenomena of Hate in Korea by Text Mining Techniques)

  • 김혜진
    • 한국문헌정보학회지
    • /
    • 제56권4호
    • /
    • pp.431-453
    • /
    • 2022
  • 혐오는 타인에 대한 배타성이 집단적으로 표출된 것으로, 잘못된 대중적 인식을 통하여 양산되고 재생산된다. 이 연구는 우리사회에서 언급되고 있는 '혐오' 양상을 거시적으로 탐색하고자 1990년부터 2020년까지 발행된 뉴스데이터 17,867건을 대상으로 텍스트마이닝 기법을 활용하여 키워드 네트워크와 군집 분석을 수행하였다. 그리고 단어를 추출하기 전에 먼저 기사를 문장으로 분리하는 전처리 과정을 거쳐 '혐오', '편견', '차별'이라는 단어를 포함하고 있는 문장 총 52,520개를 추출하여 분석에 활용함으로써 '혐오'라는 단어와 인접한 단어들로 구성된 키워드 네트워크를 구축하였다. 수집한 뉴스데이터의 단어 동시출현빈도 분석 결과, 우리 사회에서 혐오와 관련되어 가장 빈번하게 등장하는 대상은 여성, 인종, 성소수자 등이며, 관련된 이슈는 이들 집단과 관련된 법과 범죄 등이었다. 키워드 네트워크 군집 분석 결과, 성별(41.4%), 소수자(28.7%), 인종·민족(15.1%), 선택적·이해관계적(8.5%), 정치·이념(5.7%), 환경·생존적(0.3%) 혐오 등 총 6개의 혐오 군집들이 발견되었다. 논의에서는 군집 분석 결과 구체적으로 드러나지 않은 혐오의 표적(대상)을 모두 추출하여 분석하였다.

텍스트 내용분석 방법을 적용한 소프트웨어 교육 요구조사 분석: A대학을 중심으로 (The Study on the Software Educational Needs by Applying Text Content Analysis Method: The Case of the A University)

  • 박금주
    • 한국산학기술학회논문지
    • /
    • 제20권3호
    • /
    • pp.65-70
    • /
    • 2019
  • 본 연구는 대학생을 대상으로 시행되고 있는 소프트웨어 교육의 강의평가결과에 대해 텍스트 내용분석 방법을 적용하여 수강생의 요구사항을 파악하고 개선방안을 도출하는 데 목적이 있다. 연구방법은 텍스트 내용분석 프로그램을 활용해 단어출현빈도, 핵심단어 선정, 핵심단어의 공출현빈도를 산출하고, 네트워크 분석 프로그램을 활용해 텍스트 중앙성 분석, 네트워크 분석을 실시하였다. 연구결과, 소프트웨어 교육의 좋은 점 네트워크는 '교수님'에 대한 언급이 가장 많고 '친절', '학생', '설명', '코딩'과 함께 언급되고 있다. 개선점 네트워크는 '강의'에 대한 언급이 가장 많고 '좋겠다', '학생', '교수님', '과제', '코딩', '어려운', '발표'가 함께 언급되었다. 좋은 점과 개선점에 대한 네트워크 비교 분석에서 공통으로 언급된 핵심 단어 중 조별(활동), 과제, 수업의 난이도, 교수자에 대한 생각에서 차이를 보였다. 이러한 생각 차이는 강의평가 내용을 통해, 개별 조원의 적절한 역할 부족, 어렵고 과다한 과제, 소프트웨어 교육의 난이도와 필요성에 대한 인식, 교수자의 수업방식과 피드백의 부족을 확인할 수 있었다. 따라서, 소프트웨어 교육의 조별(활동)과 과제부여가 어떻게 이루어지고 있는지 살펴보고 강의내용과 교수방법, 실습과 디자인 싱킹을 다루는 비율에 대한 점검이 필요하다.