• 제목/요약/키워드: Spanning Tree

검색결과 236건 처리시간 0.021초

사용자 이분그래프모형을 이용한 온라인 커뮤니티 토론 네트워크의 군집성과 극성 분석 (Cluster and Polarity Analysis of Online Discussion Communities Using User Bipartite Graph Model)

  • 김성환;탁해성;조환규
    • 인터넷정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.89-96
    • /
    • 2018
  • 온라인 커뮤니티에서는 많은 수의 참여자들이 시공간적인 제약을 받지 않고 서로간의 다양한 의견을 댓글로 교환한다. 온라인 공간은 시공간적인 제약으로부터 자유롭기 때문에 신속하고 자유로운 의사소통을 가능하게 하지만, 동시에 불필요한 언쟁과 갈등을 쉽게 유발시킬 수 있다는 문제점이 있다. 토론 과정에서 형성되는 참여자 간의 네트워크는 참여자들 간의 대립 양상을 파악하고 앞으로 일어날 분쟁을 예측하여 방지하기 위한 중요한 단서가 된다. 본 논문에서는 온라인 커뮤니티에서의 댓글 교환으로 나타나는 사용자 토론 네트워크상에서 관찰되는 집단의 극성을 분석하기 위한 이분그래프 기반의 정량적 지표를 제안한다. 제안 기법은 댓글 교환 정보를 이용하여 사용자 상호작용 네트워크 그래프를 구성하고, 구성한 그래프 상에서 최대신장트리를 구한 후 버텍스 컬러링을 통하여 사용자를 두 부분집합으로 분할한다. 분할된 사용자 집합 간의 댓글 교환 비율을 이용하여 극성 지표를 계산함으로써 주어진 토론의 참가자들이 양분화된 정도를 정량적으로 측정한다. 실험을 통해 제안 기법이 진영의 양분화를 탐지하는데 효과적임을 보임과 동시에 온라인 커뮤니티에서 발생하는 개별 토론의 참여자들이 두 진영으로 양분되어 논쟁을 벌이는 것을 확인하였다.

결합과 분배를 이용한 정합 알고리즘 (Matching Algorithms using the Union and Division)

  • 박종민;조범준
    • 한국정보통신학회논문지
    • /
    • 제8권5호
    • /
    • pp.1102-1107
    • /
    • 2004
  • 지문 인식 시스템은 지문인식 장치(fingerprint acquisition device)를 통하여 아날로그(analog) 지문으로 부터 변환된 디지털(digital) 지문에서 특이점을 추출하고 추출한 특이점들에 대한 정보를 데이터 베이스에 등록하는 오프라인(off-line) 처리와 사용자가 시스템에 접근 할 때 입력한 지문으로부터 특이점을 추출한 후 데이터베이스에 저장되어 있는 특이점들과 정합(matching) 하여 사용자의 시스템 접근 여부를 결정하는 온라인(on-line) 처리로 이루어져 있다. 정합에 있어서 가장 중요한 것은 어떤 기준점을 어떻게 설정하느냐 하는 것이다. 지금까지 삼각주나 코어를 기준점으로 잡거나, 기준점으로 설정하는 경우에는 모든 사람에게 존재하지 않는 단점이 있다. 특징점이 없는 사용자들을 처리하기 위하여 특이점들의 상호 관계를 스패닝 트리를 구성하거나, 삼각화를 하여 정합 하는 방법들이 이용되고 있다. 그러나 이러한 방법들은 시간에 대한 오버헤드가 있고 정확하게 정합 한다는 보장을 하지 못한다. 본 논문에서는 동일 등선 줄기 상에 있는 두 특이점을 잇는 선분을 기준점으로 선택함으로서 기존 정합 알고리즘과 비교하여 인식률이 높고 오인식률이 낮으며 효율성 면에서도 우수하고 정확하게 정합 하는 알고리즘을 제안한다.

WebPR :빈발 순회패턴 탐사에 기반한 동적 웹페이지 추천 알고리즘 (WebPR : A Dynamic Web Page Recommendation Algorithm Based on Mining Frequent Traversal Patterns)

  • 윤선희;김삼근;이창훈
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.187-198
    • /
    • 2004
  • 월드 와이드 웹(World-Wide Web)은 가장 커다란 분산된 정보저장소로서 계속하여 빠른 속도로 성장해왔다. 그러나 비록 웹이 빠른 속도로 성장하고 있다 할지라도, 웹의 정보를 읽고 이해하는 데는 본질적으로 한계가 있다. 웹 사용자 입장에서 보면 웹의 정보 폭발, 꾸준하게 변화하는 환경, 사용자 요구에 대한 이해 부족 둥으로 오히려 혼란을 겪을 수 있다. 웹의 이러한 환경에서 사용자의 순회패턴(traversal patterns)을 탐사하는 것은 시스템 설계나 정보서비스 제공 측면에서 중요한 문제이다. 순회패턴 탐사에 관한 기존의 연구들은 세션(sessions)에 나타나는 페이지들간의 연관성 정보를 충분히 활용하지 못한다. 본 논문에서는 세션에 나타나는 페이지들간의 연관성 정보를 활용하여 빈발 k-페이지집합을 탐사하고, 이를 기반으로 하여 추천 페이지집합을 생성함으로써 효율적인 웹 정보서비스를 제공할 수 있는 Web Page Recommend(WebPR) 알고리즘들을 제안한다. 제안한 WebPR 알고리즘은 웹 사이트를 방문한 사용자에게 추천 페이지집합을 포함하는 새로운 페이지뷰(pageview)를 제공함으로써 궁극적으로 찾고자하는 목표 페이지에 효과적으로 접근할 수 있도록 해준다. 기존 연구들과의 가장 큰 차이점은 페이지들간의 연관성 정보를 활용하는 방법들을 일관성 있게 고려하고 있다는 점과 가장 효율적인 트리모델을 제안한다는 점이다. 두개의 실제 웹로그(Weblog) 데이터에 대한 실험은 제안한 방법이 기존의 방법들보다 성능이 우수함을 보여준다.

화학 데이타베이스에서 부분구조 검색을 위한 인덱스 구조 (An Index Structure for Substructure Searching In Chemical Databases)

  • 이환구;차재혁
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제31권6호
    • /
    • pp.641-649
    • /
    • 2004
  • 약물의 화학적 구조와 그 약물의 약리작용간의 연관성은, 'Medicinal Chemistry' 분야에서 활발히 연구된다. 이는 화학구조를 기반으로 하여 신약을 설계하려는 시도로서, 약학자는 신약 개발 시 만들고자 하는 약물과 비슷한 화학구조를 가지고 있는 기존 약물들에는 어떠한 것들이 있는지 조사하며, 특정 화학구조가 어떤 약물들에서 나타나는지 신속히 검색하기를 원한다. 이처럼 어떤 화차구조에서, 특정한 부분구조가 존재하는지를 검사하는 것을 부분구조검색(Substructure Searching)이라 하며, 이는 그래프 이론에서 NP-complete인 동형성 판정(Subgraph Isomorphism) 문제로 귀결된다. 검색 시간을 단축시키고자 여러 다른 전근방법들이 연구되었는데, 1990년대에는 구조에 대한 인덱스를 미리 만들어 RDBMS에 저장한 후, 검색시 이론 이용하여 성능을 높이는 방법으로 미국 특허를 획득한 RS3 시스템(http://www.acelrys.com/rs3)이 현재 상용화되어 쓰이고 있다. 본 논문에서는 RS3 시스템의 문제점을 규명하고, 이의 개선방안으로서 새로운 인덱스를 제안한다 RS3 시스템은 각 원자를 중심으로 다른 원자와의 구조를 문자연로 표현하고, 부분구조검색 쿼리를 부분문자열 검색을 실행함으로써 수행하는데, 이의 화학구조를 기술하는 인덱스에는 동일 원자, 동릴 결합에 대한 정렬이 불가능하여 재현율(Recall)과 정도(Precision)가 낮다. 이론 개선하기 위하여 본 논문에서는 2차원의 화학구조를 나누어 1차원의 구조 단편으로 만들고 이를 문자열로 기술하는 방안을 제시하며 구체적인 방법으로 한 인자를 중심으로 최소비용신장트리를 구성한 다음 레벨별로 경로를 나누어 기술하는 방안을 제안하며, 이와 같은 방법의 새로운 인덱스로 재현율과 정도가 급격히 향상됨을 보인다.

생물학적 데이터 서열들에서 빈번한 최대길이 연속 서열 마이닝 (Mining Maximal Frequent Contiguous Sequences in Biological Data Sequences)

  • 강태호;유재수
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.155-162
    • /
    • 2008
  • DNA 염기 서열이나 단백질 아미노산 서열과 같은 생물학적 서열 데이터들은 일반적으로 많은 수의 항목들을 가지고 있다. 생물학적 데이터 서열들에는 보통 빈번하게 발생하는 수 백개의 항목으로 이루어진 연속된 서열들이 존재한다. 이들 서열들에서 빈번하게 발생하는 연속 서열을 검색하는 것은 생물학적 서열 분석에서 중요한 부분을 차지하고 있다. 이전에는 순차 패턴을 효과적으로 발견하고자 하는 많은 연구들이 수행되었으며 대부분의 기존 순차패턴 마이닝 기법들은 Apriori 알고리즘을 기반으로 한다. PrefixSpan 알고리즘은 Apriori 기반의 가장 효율적인 순차패턴 마이닝 기법이다. 하지만 이 알고리즘은 길이-1인 빈발 패턴들로 부터 서열 패턴을 확장해나가는 방식이다. 따라서 길이가 긴 연속 서열을 포함하는 생물학적 데이터서열들에 대한 검색방법으로는 적합하지 않다. 최근에는 기존의 PrefixSpan방식을 이용하면서도 반복적인 처리과정을 줄인 MacosVSpan이 제안되었다. 하지만 이 알고리즘 또한 길이가 긴 생물학적 데이터 서열들로부터 빈번하게 발생하는 연속 서열들을 검색하기에는 효율적이지 않다. 본 논문에서는 많은 양의 생물학적 데이터 서열들로부터 빈번한 연속서열을 고정길이 확장 트리를 이용하여 효과적으로 찾아내는 방법을 제안한다. 그리고 다양한 환경에서 실험을 통해 제안하는 방식이 MacosVSpan알고리즘에 비해 검색성능이 보다 우수함을 보인다.

네트워크 분석에 기반한 항암화학요법으로 유발된 말초신경병증의 최적 경혈 조합 (Optimal Combination of Acupoints Based on Network Analysis for Chemotherapy-Induced Peripheral Neuropathy)

  • 김민우;김중일;이진현;조동찬;강수빈;이지원;박태용;고연석
    • 한방재활의학과학회지
    • /
    • 제32권1호
    • /
    • pp.107-124
    • /
    • 2022
  • Objectives This study aimed to identify optimal combinations of acupoints used to treat chemotherapy-induced peripheral neuropathy (CIPN). Methods We searched four international databases (MEDLINE, EMBASE, the Allied and Complementary Medicine Databases [AMED], and China National Knowledge Infrastructure [CNKI]) and five Korean databases (DBpia, Research Information Sharing Service [RISS], Korean Studies Information Service System [KISS], Oriental Medicine Advanced Searching Integrated System [OASIS], and KoreaMed) to identify randomized controlled trials (RCTs) that used acupuncture to treat CIPN. Network analysis was performed on the acupoints used in more than three included articles. We constructed a network by calculating the Jaccard similarity coefficient between acupoints and applied minimum spanning tree. Then, modularity analysis, degree centrality (Cd), and betweenness centrality (Cb) were used to analyze properties of the acupoints. Results A total of 25 articles were included. 24 acupoints were extracted from 25 articles. The combinations of acupoints having the highest Jaccard similarity coefficient were {EX-UE9, EX-LE10} and {ST36, SP6}. In the modularity analysis, acupoints were classified to six modules. ST40, EX-UE11, and KI6 had the highest Cd value while ST40, GB34 had the highest Cb value. Conclusions This study found the systematic framework of acupoint combinations used in CIPN studies. This study is expected to provide new perspectives of CIPN treatment to therapists. A RCT is in progress of using the network of this study as a guideline. If significant results are derived from the RCT, it will be possible to lay the groundwork to consider acupuncture for CIPN treatment.