• 제목/요약/키워드: 텍스트 네트워크

검색결과 540건 처리시간 0.03초

텍스트 마이닝을 이용한 주제기반의 기업인 네트워크 계층 분석 (Topic Based Hierarchical Network Analysis for Entrepreneur Using Text Mining)

  • 이동훈;김용화;김관호
    • 한국전자거래학회지
    • /
    • 제23권3호
    • /
    • pp.33-49
    • /
    • 2018
  • 다양한 고객의 요구를 만족시키기 위한 신제품 설계 및 개발의 필요성 때문에 중소기업 간의 융합 활동의 중요성은 증대하고 있다. 특히, 최고 의사결정을 가지는 중소기업 대표는 적합한 융합 활동 파트너를 구하기 위해 인맥관리는 필수적이다. 한편 기업인들은 많은 양의 인맥을 형성하는 것이 중요할 뿐만 아니라 유사한 토픽정보를 가진 기업인과의 인맥관계를 이해하는 것이 중요하다. 그러나 중소기업의 현황 부재와 산업분야별 기업인들의 기술과 특성을 나타낼 수 있는 토픽정보를 수집하는데 어려운 한계가 존재한다. 본 논문에서는 토픽 추출기법을 통해 이와 같은 문제점을 해결하고 3가지 측면에서 기업 네트워크를 분석한다. 구체적으로 C, S, T-Layer 모델이 있으며 각각의 모델은 인맥의 양, 인맥 중심성, 토픽 유사성을 분석한다. 실 데이터를 통한 실험 결과, 인맥의 양이 적은 경우 중심성이 높은 기업과 네트워크를 강화하여 인맥 네트워크를 활성화 시켜야 할 필요가 있고, 토픽 유사성이 낮은 경우 주제 기반의 네트워크를 활성화 시켜야 할 필요가 있다는 것을 실험을 통해 확인하였다.

정보미학적 해석을 통한 소셜네트워크 시각화의 예술적 활용 (The Artistic Practical Use of Social Network Visualization through the Information Aesthetic Interpretation)

  • 방승애;윤준성
    • 한국콘텐츠학회논문지
    • /
    • 제13권7호
    • /
    • pp.16-23
    • /
    • 2013
  • 본 논문은 소셜네트워크 시각화의 정보미학적 해석을 통해 소셜네트워크 시각화의 예술적 활용을 분석한다. 초창기 소셜네트워크 시각화는 개인과 집단의 상호관계를 규명하는 사회연결망 분석(Social Network Analysis: SNA)의 한 방법인 '소시오그램(sociogram)'의 형태로 등장했다. 이후 소셜네트워크가 점차 복잡해지면서 다양한 인간 관계망을 분석하는 기술이 등장했다. 초창기 소셜네트워크 시각화는 사회 구조를 측정하기 위한 실용적 목적을 지향했다. 그러나 현재 소셜네트워크 시각화는 정보 기반의 예술적 표현에 이르기까지 다양한 형태로 분화되었다. 본 논문은 이러한 소셜네트워크 시각화의 최근 예술적 활용에 주목하여 정보미학적 접근을 시도하고 예술적 활용 사례를 두 가지 범주로 나눈다. 먼저, 아날로그 기반의 정적인 그래프 시각화 유형을 분석한다. 두 번째는 소셜네트워크 웹 사이트와 텍스트 분석 기술을 연동하여 실시간 디지털 이미지를 생성하는 상호작용성 기반의 시각화 유형을 분석한다. 이러한 방법을 통해 예술과 공학의 융합적 패러다임을 제시하여 기존 예술 연구 영역의 한계를 벗어나고자 한다.

텍스트 마이닝을 활용한 한국학 주경로(Main Path) 분석: '한국'을 키워드로 포함하는 SCOPUS 문헌을 대상으로 (The Main Path Analysis of Korean Studies Using Text Mining: Based on SCOPUS Literature Containing 'Korea' as a Keyword)

  • 김혜진
    • 정보관리학회지
    • /
    • 제37권3호
    • /
    • pp.253-274
    • /
    • 2020
  • 이 연구는 한국학의 주류를 이루는 연구영역들의 기원과 발전경로를 파악하기 위하여 텍스트 마이닝과 주경로 분석(main path analysis, MPA) 기법을 수행하였다. 이를 위하여 전통적인 인문학 연구방법론이 아닌 디지털 텍스트를 기반으로 한 정량적 분석을 시도하였고 인용 데이터베이스를 활용하여 인용정보가 포함된 한국학 관련 문헌들을 수집하고 직접 인용 네트워크를 구축하여 한국학 분야 주경로를 추출하였다. 주경로 추출 결과, 한국학 인문분야에서는 키루트(key-route) 주경로 탐색에서 두 개의 주경로 군집(①한국 고대 농경문화(역사·문화·고고학), ②한국인의 영어습득(언어학))이 발견되었고, 한국학 인문·사회분야에서는 키루트 주경로 탐색에서 네 개의 주경로 군집(①한국 지역(공간)개발·조경, ②한국 경제발전(경제원조·소프트파워), ③한국의 산업(정치경제학), ④한국의 인구구성(남아선호)·북한경제(빈곤·중국협력))이 발견되었다. 이 연구의 결과가 한국학의 정체성을 파악하는데 기존의 지엽적 분석에서 벗어나 한국학이라는 학문에서 논의되고 있는 주 영역의 발전과 진화를 거시적으로 분석·제시함으로써 한국학이 가지는 포괄성과 모호성을 다소 해소하고 한국학 외연을 가시적으로 조망하는데 기여할 수 있으리라 기대한다.

온톨로지와 텍스트 마이닝 기반 지능형 역사인물 검색 서비스 (Ontology and Text Mining-based Advanced Historical People Finding Service)

  • 정도헌;황명권;조민희;정한민;윤소영;김경선;김평
    • 인터넷정보학회논문지
    • /
    • 제13권5호
    • /
    • pp.33-43
    • /
    • 2012
  • 시맨틱 웹 기술은 특정 개체를 중심으로 의미적 연관 관계를 생성하고 연관 관계를 이용해서 다양한 지능형 정보 서비스를 구축하는데 활용되며, 텍스트 마이닝 기술은 비정형 데이터를 대상으로 의미 분석을 통해서 의미적 연관 관계를 생성하는데 활용될 수 있다. 본 연구에서는 역사인물을 중심으로 온톨로지 스키마, 인스턴스를 생성하는 가이드라인, 인스턴스 생성, 동명이인 해소를 위한 텍스트 마이닝, 추론을 활용한 지능화된 역사인물 검색서비스를 제안한다. 역사분야 전문가들이 생성한 역사적 사건, 기관, 인물 중심의 연관 관계와 국사편찬위원회에서 보유한 다양한 문헌들 간의 연계를 통해, 사용자들의 정보접근성을 향상시킴과 동시에 관계 정보에 기반한 새로운 역사인물 검색 서비스를 제안하였다. 새로운 역사인물 검색 서비스는 인물간의 소셜 네트워크를 사용하여 역사문헌에 나타난 동명이인을 해소함으로써 보다 정확한 검색서비스를 제공하는 것은 물론, 역사 인물 시소러스를 포함한 다양한 외부 정보와의 연계를 통해서 역사인물에 대한 고부가 정보를 제공하고 있다.

시맨틱 웹 응용 서비스에서의 텍스트 처리 기술 적용 (Use of Text Processing Technologies in a Semantic Web Application)

  • 정한민;강인수;구희관;이승우;김평;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.189-196
    • /
    • 2006
  • 본 논문은 시맨틱 웹 응용 서비스를 구현함에 있어 필수적으로 요구되는 온톨로지 인스턴스 구축을 효율적으로 처리하는 데 있어 텍스트 처리 기술이 어떤 역할을 수행할 수 있는 가를 $OntoFrame-K^{(R)}$라는 시맨틱 웹 기반 정보 유통 체계에의 적용 사례를 통해 살펴본다. 본 논문에서 소개하는 텍스트 처리 기술은 개체 확인물 통한 개념 사례화, 주제 분야 할당을 통한 메타데이터 확장에, 그리고 인용 정보 추출 및 인용 관계 구축을 통한 객체 관계속성 구축에 적용된다. 개체 확인에서는 메타데이터 비교 잊 병합을 사용하였으며 이를 기반으로 한 수작업 구축을 통해 8,543명의 인력 URI를 확보하였다. 주제 및 분야 할당에서는 색인어와 분야분류명이 매핑된 시소러스 개념어의 매칭을 통해 색인어 별 TF (Term Frequency), 색인어와 매칭된 개념어 별 TF, 색인어와 매칭된 개념어 별 시소러스에서의 깊이, 색인어와 매칭된 개념어 별 개념 패싯, 색인어와 매칭된 각 개념어에 부착된 분야분류명 목록 등 할당을 위한 다양한 자질을 확보 적용하였다. 인용 정보 추출과 인용 관계 구축에서는 객체 URI와 인력 URI를 기반으로 하여 자동 추출된 인용 정보를 반영하는 방식으로 7,237개 문헌으로부터 총 135개의 인용 네트워크 그룹을 자동으로 확보하였다. 본 연구를 통해 제시된 텍스트 처리 기술의 활용 방안이 향후 시맨틱 웹 응용 서비스 및 인프라 구현에서 다각적으로 활용될 수 있기를 기대한다.

  • PDF

스캔된 문서에서의 도장 검출 (Seal Detection in Scanned Documents)

  • 유견아;김경혜
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.65-73
    • /
    • 2013
  • 디지털 시대의 도래에 따라 문서들이 기록 보관되기 위해서 혹은 네트워크를 통해 전송되기 위해서 스캔되는 경우가 많아졌다. 스캔된 문서에서 가장 큰 비중을 차지하는 것은 텍스트이며 텍스트 이외에는 문서 작성자를 나타내는데 사용되는 도장이 가장 많이 포함되어 있다. 스캔된 문서의 중요성이 부각되면서 스캔된 문서로부터 텍스트를 인식하는 연구는 많이 진행되어 상용화된 제품도 개발된 것에 비해 문서가 포함하고 있는 도장에 대한 정보는 버려지고 있는 실정이다. 본 논문에서는 도장이 포함된 컬러 혹은 흑백 문서 영상에서 도장 영역을 검출하여 도장 이미지를 저장하는 방법을 연구한다. 스캔된 문서에서 도장의 외곽선 후보만을 남기고 다른 기타 구성 요소를 제거하는 전처리 과정과 도장의 특징을 이용하여 남은 요소 중에 최종 관심 영역을 선정하는 방법을 제안한다. 또한 검출된 관심 영역의 도장 정보가 텍스트와 겹친 이미지인 경우에는 템플릿 매칭을 통해 데이터베이스로부터 가장 유사한 도장을 찾아 대신 저장할 수 있게 한다. 구현된 시스템은 학교에서 일반적으로 생성되는 여러 유형의 문서들을 대상으로 검증하고 그 결과를 분석한다.

텍스트 마이닝을 이용한 스마트 도시계획 수립을 위한 전략분야 도출연구: 부산 사례를 바탕으로 (Identification of Strategic Fields for Developing Smart City in Busan Using Text Mining)

  • 채윤식;이상훈
    • 디지털융복합연구
    • /
    • 제16권11호
    • /
    • pp.1-15
    • /
    • 2018
  • 본 연구의 목적은 텍스트 마이닝 기법을 활용하여 부산 및 기타 지자체의 도시계획 보고서에 포함되어 있는 서지정보를 분석하고 새로운 스마트도시계획의 수립을 위한 전략 분야를 도출하는 것이다. 텍스트 마이닝 분석은 구조화되어 있지 않은 문서로부터 키워드를 추출하고 획득한 정보의 특성과 패턴을 발견하는 기법으로 최근 지식관리 측면에서 많이 사용되고 있다. 본 분석을 통해 초기의 부산 도시계획은 개별 산업분야 고도화에 초점이 맞춰져 있을 뿐 각 분야별 정보시스템의 연계에 대한 논의가 적은 것으로 나타났지만 최근 계획에서는 도시통합운영관리와 관련한 물리적 인프라와 ICT시스템과 관련한 내용이 다수 포함되어있는 것으로 나타났다. 특히, 타 지자체에 비해 항만/물류, 문화, 전시 분야가 특유의 서비스영역으로 도출되었지만 도시안전, 데이터공유, 신재생에너지 분야에 대한 계획은 부족한 것으로 나타났다. 본 연구는 향후 새로운 스마트 도시계획 수립을 위한 정책적 시사점을 제공할 것으로 기대한다.

산학협력 및 기술이전 촉진을 위한 텍스트마이닝과 사회 네트워크 분석 기반의 특허 분석 방법 (Text Mining and Social Network Analysis-based Patent Analysis Method for Improving Collaboration and Technology Transfer between University and Industry)

  • 이지형;김종우
    • 한국전자거래학회지
    • /
    • 제22권3호
    • /
    • pp.1-28
    • /
    • 2017
  • 지식기반 경제에서 산학협력의 중요성이 커짐에 따라 산학협력에 대한 지원과 연구들이 증가함에도 불구하고 산학협력의 특허 성과인 기술이전 및 기술료 수입은 낮은 편인데, 그 이유는 사업화 가치가 없는 특허들을 과도하게 출원하였기 때문이다. 따라서 본 연구에서는 산학협력 및 기술이전이 가능한 특허를 분석하는 방법을 제안한다. 분석을 위한 특허데이터는 WIPSON을 통하여 4개 대학, 1,061개 특허정보를 수집하여 분석에 활용하였다. 분석 방법은 대학이 보유한 산학협력단의 미국 특허를 대상으로 Quality-Strategy Matrix를 작성하고, Matrix의 Advanced Quality Technology 영역의 특허를 대상으로 텍스트마이닝과 사회네트워크 분석을 실시한 뒤, 핵심 키워드와 IPC 코드를 도출하여 대학별 핵심특허를 분석하였다. 분석결과, H 대학은 4개의 핵심특허와 2개의 핵심 IPC 코드를 도출하였으며, K 대학의 경우 4개의 핵심특허와 2개의 핵심 IPC 코드, Y 대학의 경우 6개의 핵심특허와 1개의 핵심 IPC 코드, 마지막으로 S 대학의 경우 14개의 핵심특허와 2개의 핵심 IPC 코드를 각각 도출하였다. 본 연구는 산학협력 및 기술이전이 가능한 특허와 IPC 코드를 분석하여 대학의 산학협력의 활성화에 기여하는데 그 의의가 있다.

특허 동시분류분석과 텍스트마이닝을 활용한 사물인터넷 기술융합 분석 (Analyzing Technological Convergence for IoT Business Using Patent Co-classification Analysis and Text-mining)

  • 문진희;권의준;금영정
    • 기술혁신연구
    • /
    • 제25권3호
    • /
    • pp.1-24
    • /
    • 2017
  • 최근 기술융합의 핵심현상으로 사물인터넷이 대두되면서 사물인터넷의 기술트렌드 및 기술융합에 관해 많은 연구들이 진행되고 있다. 그러나 기존 연구들의 대부분이 사물인터넷 기술 동향에 대한 정성적 연구에 그치고 있어 기술융합의 구체적 양상을 파악하기 어려운 실정이다. 따라서 본 연구에서는 특허 데이터를 기술의 대용데이터로 간주하고, 동시 분류분석과 텍스트마이닝을 바탕으로 사물인터넷 융합 네트워크를 구축하고 융합의 특성을 분석하였다. 본 연구에서는 먼저 문헌연구를 통해 사물인터넷의 융합을 일으키는 주요 기술군을 디바이스, 네트워크, 플랫폼, 서비스 네 가지로 정의한 후, "Internet of Things" 키워드를 중심으로 미국 특허청에서 수집된 923개 특허의 클래스를 네 가지 기술군에 할당하여 이들 간 관계를 파악하였다. 대부분의 클래스 및 키워드가 디바이스에 관련되어 있으므로, 본 연구에서는 융합 현상을 디바이스 융합과 전체 융합으로 나누어 기술융합 양상을 파악하였다. 디바이스 중심의 사물인터넷 기술을 분석한 결과 센서 디바이스를 비롯한 헬스케어 디바이스, 냉장 및 냉동 장치, 에너지관리 디바이스, 로봇, 임베디드 등이 주요 융합 그룹으로 도출되었다. 전체 기술을 대상으로 분석한 결과 사물인터넷 요소기술을 중심으로 스마트 헬스케어, 스마트 홈, 무인자동차 등 사물인터넷의 다양한 응용영역들이 기술융합을 이루고 있는 것으로 파악되었다. 본 연구 결과는 사물인터넷 기술융합 활성화를 위한 정책 및 전략 수립에 효과적으로 활용될 수 있을 것으로 기대된다.

텍스트 마이닝을 이용한 메이커 운동의 트렌드 분석 (Trend Analysis in Maker Movement Using Text Mining)

  • 박찬혁;김자희
    • 한국콘텐츠학회논문지
    • /
    • 제18권12호
    • /
    • pp.468-488
    • /
    • 2018
  • 메이커 운동은 필요한 물건을 직접 만드는 사람들이 모여, 창의적 만들기를 통해 지식과 경험을 공유하는 사회와 문화의 움직임이다. 그러나 지난 10년간 메이커 운동이 빠르게 성장하면서, 어디까지를 메이커 운동으로 볼 것인지에 대한 공감대가 아직 부족하다. 앞으로의 발전 방향성을 모색하기 위해서는, 지금까지 메이커 운동이 어떻게 변화해 왔는지를 조망하는 것이 필요하다. 본 연구는 메이커 운동에 대한 이슈가 일반 미디어에서 어떻게 변화됐는지를 파악하기 위하여 언론 기사들을 텍스트 기반의 빅데이터 분석 방법론을 활용하여 분석한다. 특히 시간에 따른 관심의 변화를 다각도로 분석하기 위하여 키워드 네트워크 분석과 동적 토픽 모델을 통합적으로 적용한다. 키워드 네트워크는 메이커 운동의 발전을 분석하기 위하여 단어 수준에서 시기별 주요 키워드를 도출하고, 동적 토픽 모델은 메이커 운동이 아우르는 다양한 분야 관점에서 관심도의 변화를 단어와 토픽, 문서의 세 가지 수준에서 파악할 수 있도록 도와준다. 결과적으로 주요 토픽은 창업, 메이커스페이스, 메이커 교육 등이 식별되었고, 주요 키워드는 3D프린터와 기업에서 교육으로 변화된 것을 확인할 수 있다.