• 제목/요약/키워드: 텍스트네트워크분석

검색결과 393건 처리시간 0.029초

MPEG4를 이용한 다자간 멀티미디어 프로그램에서의 효율적인 데이터 전송 방법 (Efficient Data Transmission of Multi-Point Multimedia Chatting Program using MPEG4)

  • 윤교철;김영만
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.493-495
    • /
    • 2002
  • 본 논문에서는 MPEG4 표준 코덱을 사용하여 다자간 멀티미디어 프로그램을 구현하는데 있어서 효율적으로 멀티미디어 데이터를 전송하는 방법과 그 구현에 대해서 연구한다. 다자간 멀티미디어 프로그램은 크게 음성, 영상, 텍스트의 멀티미디어 요소를 가지고 있으며 각각의 데이터는 네트워크를 통해 여러 사용자에게 전송이 되는데 네트워크를 통해 전송되어지는 데이터를 최소화하기 위한 여러가지 방법을 제시하고 각 방법에 대한 전송효율에 대하여 분석한다. 본 논문에서는 서버-클라이언트 모델을 사용하여 이 방법들을 구현하였으며 현재 8명의 사용자가 동시에 접속하여 다자간 멀티미디어 프로그램을 사용할 수 있도록 하였고 그 이상의 사용자 수에 대해서도 변경할 수 있도록 하였다.

  • PDF

빅카인즈를 활용한 5·18 관련 국내 기사 분석 연구 (An Analysis of Domestic Newspaper Articles on 5.18 using the Bigkinds System)

  • 박주현;박현지;김영범
    • 정보관리학회지
    • /
    • 제41권1호
    • /
    • pp.107-132
    • /
    • 2024
  • 이 연구에서는 한국언론진흥재단의 빅카인즈에서 제공하는 1990년부터 2022년까지 약 30년간의 5·18 관련 뉴스데이터를 빈도분석과 네트워크 분석하였다. 구체적으로 시기별과 지역별 기사량을 분석하여 양적 변화 추이를 살펴보았으며 동시 출현 키워드를 활용한 정부별 네트워크 분석을 통해 정부별 주요 키워드 간의 연결 구조를 탐색하였다. 분석 결과, 시기적으로는 사회적 이슈가 많았던 2019년의 보도량이 가장 많은 것으로 나타났으며 지역적으로는 전라권의 보도량이 가장 많은 것으로 나타났다. 그리고 네트워크 분석 결과, 정권이 5·18을 바라보는 인식과 정책에 따라 뉴스데이터 내 5·18과 관련된 단어에 차이가 있었다. 5·18 뉴스데이터 분석을 종합한 결과, 5·18이 지역과 상관없이 시간이 지남에 따라 민주화운동으로 자리매김해 나가고 있었으나 동시에 5·18에 대한 왜곡이 해소되지 못하고 있음을 확인하였다.

온톨로지와 텍스트 마이닝 기반 지능형 역사인물 검색 서비스 (Ontology and Text Mining-based Advanced Historical People Finding Service)

  • 정도헌;황명권;조민희;정한민;윤소영;김경선;김평
    • 인터넷정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.33-43
    • /
    • 2012
  • 시맨틱 웹 기술은 특정 개체를 중심으로 의미적 연관 관계를 생성하고 연관 관계를 이용해서 다양한 지능형 정보 서비스를 구축하는데 활용되며, 텍스트 마이닝 기술은 비정형 데이터를 대상으로 의미 분석을 통해서 의미적 연관 관계를 생성하는데 활용될 수 있다. 본 연구에서는 역사인물을 중심으로 온톨로지 스키마, 인스턴스를 생성하는 가이드라인, 인스턴스 생성, 동명이인 해소를 위한 텍스트 마이닝, 추론을 활용한 지능화된 역사인물 검색서비스를 제안한다. 역사분야 전문가들이 생성한 역사적 사건, 기관, 인물 중심의 연관 관계와 국사편찬위원회에서 보유한 다양한 문헌들 간의 연계를 통해, 사용자들의 정보접근성을 향상시킴과 동시에 관계 정보에 기반한 새로운 역사인물 검색 서비스를 제안하였다. 새로운 역사인물 검색 서비스는 인물간의 소셜 네트워크를 사용하여 역사문헌에 나타난 동명이인을 해소함으로써 보다 정확한 검색서비스를 제공하는 것은 물론, 역사 인물 시소러스를 포함한 다양한 외부 정보와의 연계를 통해서 역사인물에 대한 고부가 정보를 제공하고 있다.

스캔된 문서에서의 도장 검출 (Seal Detection in Scanned Documents)

  • 유견아;김경혜
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.65-73
    • /
    • 2013
  • 디지털 시대의 도래에 따라 문서들이 기록 보관되기 위해서 혹은 네트워크를 통해 전송되기 위해서 스캔되는 경우가 많아졌다. 스캔된 문서에서 가장 큰 비중을 차지하는 것은 텍스트이며 텍스트 이외에는 문서 작성자를 나타내는데 사용되는 도장이 가장 많이 포함되어 있다. 스캔된 문서의 중요성이 부각되면서 스캔된 문서로부터 텍스트를 인식하는 연구는 많이 진행되어 상용화된 제품도 개발된 것에 비해 문서가 포함하고 있는 도장에 대한 정보는 버려지고 있는 실정이다. 본 논문에서는 도장이 포함된 컬러 혹은 흑백 문서 영상에서 도장 영역을 검출하여 도장 이미지를 저장하는 방법을 연구한다. 스캔된 문서에서 도장의 외곽선 후보만을 남기고 다른 기타 구성 요소를 제거하는 전처리 과정과 도장의 특징을 이용하여 남은 요소 중에 최종 관심 영역을 선정하는 방법을 제안한다. 또한 검출된 관심 영역의 도장 정보가 텍스트와 겹친 이미지인 경우에는 템플릿 매칭을 통해 데이터베이스로부터 가장 유사한 도장을 찾아 대신 저장할 수 있게 한다. 구현된 시스템은 학교에서 일반적으로 생성되는 여러 유형의 문서들을 대상으로 검증하고 그 결과를 분석한다.

'미술'과 '언어' 활동 융합형의 아동 발달지원 교육 프레임워크 개발을 위한 탐색적 연구: 텍스트 마이닝을 중심으로 (An exploratory study for the development of a education framework for supporting children's development in the convergence of "art activity" and "language activity": Focused on Text mining method)

  • 박윤미;김시정
    • 한국융합학회논문지
    • /
    • 제12권3호
    • /
    • pp.297-304
    • /
    • 2021
  • 이 연구는 학령기 아동의 발달지원을 위하여 기존의 미술 치료 및 교육에서 시행되어 온 시각적 사고 중심의 접근에 더하여, 언어 교육 및 치료적 접근을 융합하고자 한 것이다. 이에 언어와 미술의 서로 다른 영역의 융합 가능 영역을 탐색하기 위하여 텍스트 마이닝 기법을 적용하였다. 이에 따라 이 연구는 기초 연구, 예비 DB구축, 텍스트 선별, DB 전 처리 및 확정, 불용어 처리, 텍스트 마이닝 분석 및 융합 가능 역 도출'의 절차에 따라 연구를 진행하였다. 연구 결과, 미술 치료 및 교육과 언어 치료 및 교육 분야에서 나타나는 문헌상의 각 군집을 연계하여 의사소통 및 학습 기능, 문제해결 및 감각 기관, 예술 및 지능, 정보와 의사소통, 가정 및 장애, 주제와 개념화 및 또래, 통합과 재구성 및 태도 등과 관련된 융합역을 도출할 수 있었다. 결론적으로 본 연구를 통하여 향후 미술과 언어의 활동 중심 융합형 프로그램을 설계할 수 있는 프레임워크를 마련하고 아동발달 지원을 위한 총체적 접근을 시도하였다는 점에서 연구의 의의가 있다.

계량적 접근에 의한 조선시대 필사본 조리서의 유사성 분석 (A Quantitative Approach to a Similarity Analysis on the Culinary Manuscripts in the Chosun Periods)

  • 이기황;이재윤;백두현
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.131-157
    • /
    • 2010
  • This article reports an attempt to perform a similarity analysis on a collection of 25 culinary manuscripts in Chosun periods using a set of quantitative text analysis methods. Historical culinary texts are valuable resources for linguistic, historic, and cultural studies. We consider the similarity of two texts as the distributional similarities of the functional components of the texts. In the case of culinary texts, text elements such as food names, cooking methods, and ingredients are regarded as functional components. We derive the similarity information from the distributional characteristics of the two key functional components, cooking methods and ingredients. The results are also quantified and visualized to achieve a better understanding of the properties of the individual texts and the collection of the texts as a whole.

  • PDF

텍스트마이닝을 활용한 아동, 청소년 대상 소비관련 연구 키워드 분석 (Keyword Analysis of Research on Consumption of Children and Adolescents Using Text Mining)

  • 진현정
    • 한국가정과교육학회지
    • /
    • 제33권4호
    • /
    • pp.1-13
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법으로 최근 20년간 아동, 청소년 대상 소비 관련 연구의 주요어를 분석하여 소비 관련 연구의 동향을 파악하고자 하였다. 이를 위하여 KCI 등재/등재후보 학술지에 게재된 아동, 청소년의 소비관련 연구 869편의 주요어를 분석하였다. 빈도분석 결과 가장 빈도가 높은 주요어는 청소년, 청소년소비자, 소비자교육, 과시소비, 소비행동, 캐릭터, 경제교육, 윤리적소비 순으로 나타났다. 5년 단위로 주요어의 빈도를 분석한 결과, 2006년~2010년에는 소비자교육의 빈도가 월등하게 높아 이 시기에 소비자교육에 관한 연구가 많이 이루어졌음을 확인할 수 있었다. 2011년 이후 윤리적소비에 관한 연구가 활발해졌으며, 최근 5년 동안은 두드러지는 주요어가 없는 대신 다양한 주제로 연구가 이루어졌음을 알 수 있었다. TF-IDF 기준으로 주요어를 살펴보면 2001년~2005년 사이에는 환경과 인터넷 관련 단어가 주요 키워드였다. 2006년~2010년에는 미디어이용, 광고 교육, 인터넷아이템, 2011년~2015년에는 공정무역, 녹색성장, 녹색소비, 북한이탈청소년, 소셜미디어, 2016~2020년에는 텍스트마이닝, 지속가능발전교육, 메이커교육, 2015개정교육과정이 중요한 용어로 등장하였다. 토픽모델링 결과, 소비자교육, 대중매체/또래문화, 합리적 소비, 한류/문화산업, 소비자역량, 경제교육, 교수학습방법, 친환경/윤리적소비의 8개의 토픽이 도출되었다. 동시 출현 빈도를 활용한 네트워크 분석을 통해 아동, 청소년 관련 소비 연구에서 과시소비와 소비자교육이 중요한 연구주제임을 알 수 있었다.

텍스트 마이닝 기반의 이슈 관련 R&D 키워드 패키징 방법론 (Methodology for Issue-related R&D Keywords Packaging Using Text Mining)

  • 현윤진;윌리엄;김남규
    • 인터넷정보학회논문지
    • /
    • 제16권2호
    • /
    • pp.57-66
    • /
    • 2015
  • 빅데이터 기술에 대한 관심이 급증함에 따라, 소셜 미디어를 통해 유통되는 방대한 양의 비정형 데이터를 분석하고자 하는 시도가 활발히 이루어지고 있다. 이에 따라서 텍스트 형태의 비정형 데이터 분석을 통해 의미 있는 정보를 찾고자 하는 시도가 비즈니스 영역뿐 아니라, 정치, 경제, 문화 등 다양한 영역에서 이루어지고 있다. 특히 최근에는 여러 현안 및 이슈들을 발굴하여 이를 의사결정에 활용하고자 하는 시도가 활발히 이루어지고 있다. 이처럼 빅데이터 분석을 통해 국가현안이나 이슈를 발굴하고자 하는 시도가 꾸준히 이루어져왔음에도 불구하고, 국가현안 및 이슈로부터 이와 관련된 R&D 문서를 효율적으로 제공하는 방안은 마련되지 않고있다. 이는 사용자들이 인식하는 현안 키워드와 실제 사용되는 R&D 키워드 사이의 이질성이 존재하기 때문이다. 따라서 현안 및 R&D키워드간의 이질성을 극복하기 위한 중간 장치가 필요하며, 이 중간 장치를 통해 각 현안 키워드와 R&D 키워드간에 적절한 대응이 이루어져야 한다. 이를 위해 본 연구에서는 (1) 현안 키워드 추출을 위한 하이브리드 방법론, (2) 현안 대응 R&D 정보 패키징 방법론, 그리고 (3) R&D 관점에서의 연관 현안 네트워크 구축 방법론의 총 세 가지 방법론을 제안한다. 제안하는 방법론은 텍스트 마이닝, 소셜네트워크 분석, 그리고 연관 규칙 마이닝 등의 데이터 분석 기법들을 활용하여 수행하였으며, 그 결과, (1)에 의한 키워드 보강률은 42.8%로 나타났으며, (2)의 경우, 현안 키워드와 R&D 키워드간 다수의 연관 규칙이 나타났다. (3)의 경우는 현재 진행 중에 있으며, 향후 가시적 성과를 낼 수 있을 것으로 예상된다.

서울로 7017 방문자들의 이용행태 분석 -텍스트 마이닝과 소셜 네트워크 분석을 중심으로- (Analysis of Behavior of Seoullo 7017 Visitors - With a Focus on Text Mining and Social Network Analysis -)

  • 우경숙;서주환
    • 한국조경학회지
    • /
    • 제48권6호
    • /
    • pp.16-24
    • /
    • 2020
  • 본 연구는 국내 최초의 공중보행로인 서울로 7017의 이용행태를 이용객이 자율적으로 서술한 블로그를 분석하여 이용현황을 파악하고, 서울로 7017의 이용행태 및 개선방안을 제시하는 것을 목적으로 하였다. 이에 서울로 7017이 시민에게 개방된 2017년 6월부터 2020년 5월까지로 검색엔진 NAVER·DAUM의 블로그 제목과 원문에 '서울로 7017'이 포함된 텍스트 데이터를 빅데이터 기법인 텍스트 마이닝(Text Mining)과 소셜 네트워크(Social Network; 사회연결망)분석을 활용하여 분석하였다. 연구결과의 요약은 다음과 같다. 먼저 서울로 7017의 주요 행태는 '야경'과 '걷다'이고, 영향을 미치는 요소는 문화·예술과 관련된 요소로 여러 가지 프로그램 및 축제를 이용객의 요구에 맞는 프로그램을 개설하고 적극적으로 알린다면 주요 행태가 더 활발하게 일어나게 할 수 있을 것이다. 한편, 서울로 7017의 이용객들이 원하는 주요행태는 정적 행태인 '앉다'인데, 앉는 행태가 일어나기에 물리적인 조건이 충분하지 않으므로 그늘, 벤치 등 앉는 행태가 일어날 수 있는 시설을 개선하여 방문객의 요구를 충족시킬 수 있을 것이다. 서울로 7017의 행태변화의 특이점으로 코로나19로 인하여 공공다중이용시설 및 집단 활동이 제한되면서 혼자 여행하기 좋은 곳, 혼자 산책하기 좋은 곳으로 인식되고 있다는 점이다. 이에 코로나19와 같은 상황에서 사람들이 산책 등을 할 수 있는 시설, 여러 가지 볼거리 증대 등을 통하여 더 다양한 행태가 도출될 수 있고, 이용객의 만족도를 높일 수 있다. 서울로 7017은 국내 최초의 공중보행로서 공공공간의 의미를 넘어 주변 지역의 도시재생 및 도시자원의 효율적 활용을 위하여 조성되었으며, 역사, 자연, 복지, 문화, 관광자원 등 다양한 가치를 지니고 있는 장소이다. 그러나 이용행태 분석 결과, 서울로 7017에서 다양한 행태가 일어나지 않고 있으며, 주요 행태를 방해하는 요소가 도출되었다. 이러한 연구 결과를 참고하여 서울로 7017의 이용행태를 파악하고, 공간체계 및 시설 개선의 계획을 수립하여 서울로 7017이 도시민들에게 중요한 장소이자 도시를 활성화하는 동력이 될 수 있도록 발전시켜 나가야 할 것이다.

키워드 네트워크의 클릭 분석을 이용한 특허 데이터 분석 (Patent data analysis using clique analysis in a keyword network)

  • 김현;김동건;조진남
    • Journal of the Korean Data and Information Science Society
    • /
    • 제27권5호
    • /
    • pp.1273-1284
    • /
    • 2016
  • 본 연구에서는 기계 학습 분야의 특허를 수집하여 키워드 네트워크를 구축하고 클릭 분석을 실시하였다. 먼저 텍스트 마이닝 기법을 적용하여 핵심 키워드들을 선정한 다음, 이 키워드를 기반으로 키워드 네트워크를 구축하였다. 다음으로 네트워크 구조 분석, 중요 키워드 분석 및 클릭 분석을 시행하여 2005년도와 2015년도에 출원된 기계 학습 특허의 동향을 파악하였을 뿐만 아니라 양해년도의 분석 결과를 통해 특허 경향을 파악하였다. 분석 결과 기계 학습 특허의 키워드 네트워크는 밀도와 군집 계수가 낮은 것으로 드러났으며 기계 학습 기법 자체에 대한 특허보다는 다양한 응용 영역에서 기계학습을 적용한 특허들이 다수이기 때문으로 판단된다. 클릭 분석 결과 2005년도 클릭 분석에 의해 발견된 주제는 뉴스메이커 검증, 상품 소비 예측, 바이러스 공격 예방, 바이오마커, 그리고 워크플로우 관리였으며, 2015년도 기계 학습 특허 주제는 디지털 이미지 편집, 직불카드, 수신자 인라이닝 시스템, 유방 촬영 시스템, 재고 관리 시스템, 이미지 편집 시스템, 비행기 티켓 가격 예측, 그리고 문제 예측 시스템으로 나타났다. 2005년도에 비하여 2015년도의 근접 중앙성은 낮아지고 매개 중심성은 높아진 것으로 보아 최근의 특허 경향은 보다 다양한 분야에서 출원되고 있으며 이들 간의 연결이 활발해지고 있음을 알 수 있다. 클릭 분석은 클릭을 형성하는 키워드 집합을 해석하여 주제를 파악하는데 활용될 수 있을 뿐만 아니라 추출된 공유 멤버쉽 키워드 집합은 특허 검색 시스템과 같이 키워드 검색 기반의 시스템에서 검색 키워드로 활용될 수 있을 것으로 기대된다.