• 제목/요약/키워드: long tail theory

검색결과 6건 처리시간 0.02초

데이터 활용률 제고를 위한 기술 용어의 상호 네트워크 생성과 통제 (Generating and Controlling an Interlinking Network of Technical Terms to Enhance Data Utilization)

  • 정도헌
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.157-182
    • /
    • 2018
  • 빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.

3GPP LTE/SAE 네트워크에서의 인증 시그널링 부하에 대한 평가 (Evaluation of Authentication Signaling Load in 3GPP LTE/SAE Networks)

  • 강성용;한찬규;최형기
    • 정보보호학회논문지
    • /
    • 제22권2호
    • /
    • pp.213-224
    • /
    • 2012
  • 통합된 코어 망 구조(core network architecture)와 다양한 무선 가입자 행동들은 3GPP in Release 8에서 제안된 EPC(Evolved Packet Core Network)에서 상당한 시그널링 부하 증가를 가져온다. 따라서 인증 시그널링 분석(authentication signaling analysis)은 체감품질(quality-of-experience)을 충족시키면서 인증 시그널링 부하와 지연을 줄이는 통찰력을 갖게 해준다. 본 논문에서는 갱신 과정 이론(renewal process theory)에 기반을 둔 분석적 모델링을 통해 EPS 구조에서의 시그널링 부하에 대해 평가하였다. 갱신 과정 이론은 특정 랜덤 과정(random process)에 상관없이 잘 작동 한다 (예. 포아송(Poisson)). 본 논문은 발신 발생 속도(call arrival rate), 이동성(mobility), 가입자들의 선호도와 운영정책의 관점에서 가입자들의 다양한 패턴을 고려하였다. 매개변수들과 성능지표들 사이의 상호관계를 나타내기 위해 수치적인 결과를 사용하였다. 수직적 핸드오버(vertical handover) 성능의 민감도와 heavy-tail process의 영향에 대해서도 검토하였다.

Extreme value modeling of structural load effects with non-identical distribution using clustering

  • Zhou, Junyong;Ruan, Xin;Shi, Xuefei;Pan, Chudong
    • Structural Engineering and Mechanics
    • /
    • 제74권1호
    • /
    • pp.55-67
    • /
    • 2020
  • The common practice to predict the characteristic structural load effects (LEs) in long reference periods is to employ the extreme value theory (EVT) for building limit distributions. However, most applications ignore that LEs are driven by multiple loading events and thus do not have the identical distribution, a prerequisite for EVT. In this study, we propose the composite extreme value modeling approach using clustering to (a) cluster initial blended samples into finite identical distributed subsamples using the finite mixture model, expectation-maximization algorithm, and the Akaike information criterion; (b) combine limit distributions of subsamples into a composite prediction equation using the generalized Pareto distribution based on a joint threshold. The proposed approach was validated both through numerical examples with known solutions and engineering applications of bridge traffic LEs on a long-span bridge. The results indicate that a joint threshold largely benefits the composite extreme value modeling, many appropriate tail approaching models can be used, and the equation form is simply the sum of the weighted models. In numerical examples, the proposed approach using clustering generated accurate extrema prediction of any reference period compared with the known solutions, whereas the common practice of employing EVT without clustering on the mixture data showed large deviations. Real-world bridge traffic LEs are driven by multi-events and present multipeak distributions, and the proposed approach is more capable of capturing the tendency of tailed LEs than the conventional approach. The proposed approach is expected to have wide applications to general problems such as samples that are driven by multiple events and that do not have the identical distribution.

지식 공유의 파레토 비율 및 불평등 정도와 가상 지식 협업: 위키피디아 행위 데이터 분석 (Pareto Ratio and Inequality Level of Knowledge Sharing in Virtual Knowledge Collaboration: Analysis of Behaviors on Wikipedia)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.19-43
    • /
    • 2014
  • 전체 결과의 80%가 전체 원인의 20%에 의해 일어난다는 파레토 법칙(Pareto principle)은 상위 20%의 핵심 고객에 대한 우선적인 마케팅을 비롯하여 기업 경영의 많은 부분에서 적용되어 왔다. 파레토 법칙과는 대조적으로, 80%의 사소한 다수가 20%의 핵심적인 소수보다 우월한 가치를 창출한다는 롱테일 법칙(Long Tail theory)은 ICT(Information and Communication Technology)의 발전과 함께 새로운 경영 패러다임으로 주목 받아오고 있다. 본 연구의 목적은 경영 현장에서 양대 흐름을 형성해온 이러한 법칙들이 변화무쌍한 글로벌 가상화 환경에서 기업의 핵심적인 성공 요인이라고 할 수 있는 가상 지식 협업에는 어떻게 관련되는지를 규명하는 것이다. 이를 위해, 대표적인 가상 지식 협업 커뮤니티인 위키피디아에서 품질 최상위 등급인 피쳐드 아티클(Featured Article) 레벨로 승급된 2,978개의 아티클에 대한 협업 행위를 분석하였다. 즉, 각 아티클 그룹에서 편집 횟수 기준 상위 20%에 속하는 참여자들의 총 편집 횟수가 전체 편집 횟수에서 차지하는 비율인 파레토 비율(Pareto ratio)이 지식 협업 효율성과 어떤 관계를 가지고 있는지를 도출하였다. 그리고, 이러한 연구를 편집 참여를 통한 지식 공유에 대한 전체적인 불평등 정도를 나타내는 지니 계수(Gini coefficient)의 영향 및 그룹의 작업 특성을 반영하도록 확장하였다. 결과적으로, 지식 공유의 파레토 비율과 지니 계수가 증가하면 지식 협업 효율성도 높아지지만, 이러한 변수들이 일정 수준 이상으로 증가하면 오히려 지식 협업 효율성이 낮아지는 역 U자(inverted U-shaped) 관계가 있음을 확인하였다. 그리고, 이러한 관계는 인지적 노력을 상대적으로 더 많이 요구하는 학문적인 특성의 작업에서 더 민감하게 작용하는 것으로 보인다.

웹 2.0 환경에서 사회적 영향이 사용자의 인지적 평가와 몰입, 사용수준에 미치는 영향 (The Effect of Social Influence on Users' Cognition, Flow, and Actual Usage in Web 2.0)

  • 문윤지;김민선;김우곤
    • 한국산학기술학회논문지
    • /
    • 제11권12호
    • /
    • pp.4752-4759
    • /
    • 2010
  • 본 연구는 기술수용모형과 몰입 이론에 근거해서 웹 2.0 환경에서 사회적 영향요소가 개인의 인지와 몰입, 그리고 실제 사용성에 미치는 상호영향관계를 파악하고자 하였다. 혁신적인 정보기술을 수용함에 있어 사용자는 정보 기술을 특별한 추가 노력 없이 사용방법을 습득하여 자신의 업무나 목적에 유용하게 활용할 수 있을지 그 용이성과 유용성을 인지적으로 평가하게 된다. 또한 웹 2.0의 대표적 형태 가운데 하나인 UCC(user-created-contents)와 같은 정보기술에 있어서는 업무의 유용성과 더불어 사용자가 얼마만큼 즐겁게 웹 사이트를 활용할 수 있는지 그 몰입(flow) 역시 사용자의 향후 활용 수준에 영향을 주게 된다. 따라서 UCC 영역에서 사용자의 활용수준에 영향을 주는 요소로 용이성, 유용성과 같은 인지적 평가 요소와 몰입의 요소를 동시에 고려하고자 하였다. 한편, 본 연구는 일반 사용자에 의해 생산되는 컨텐츠가 주류를 이루는 롱테일 현상으로 일컬어지는 웹 2.0 환경에서는 이러한 사용자의 인지와 몰입이 사회적 영향에 민감할 수 있는 바, 사회적 영향을 요소 역시 연구모형에 포함시켜 연구모형을 분석하였다. 분석결과 사회적 영향은 인지된 유용성과 용이성 모두에 긍정적인 영향을 미치고 있었으며, 몰입에도 유의한 영향을 미치는 것이 밝혀졌다. 또한 개인의 인지적 평가와 몰입이 UCC 사용성에 미치는 영향에 있어서도 유의성과 용이성, 몰입이 모두 긍정적으로 사용자의 사용수준을 높이고 있음이 밝혀졌다.

온라인 커뮤니티 간 공존: 생태학적 관점의 에이전트 기반 시뮬레이션 (The Coexistance of Online Communities: An Agent-Based Simulation from an Ecological Perspective)

  • ;한정필
    • 경영정보학연구
    • /
    • 제19권2호
    • /
    • pp.115-136
    • /
    • 2017
  • 온라인 커뮤니티는 우리 일상생활에서 큰 비중을 차지하고 있다. 수없이 많은 온라인 커뮤니티가 존재하지만, 그 가운데 소수의 커뮤니티만이 다수의 사용자를 끌어들이는 데 성공하고 압도적인 대다수의 커뮤니티는 생존하기 위해 분투하는 롱테일 현상(long tail phenomenon)이 나타나고 있다. 다양한 온라인 커뮤니티가 공존할 수 있고, 실제로 공존하게 하기 위해서는 사용자를 지속적으로 끌어들이고 커뮤니티를 성공시키는 데 중요한 역할을 하는 요인이 무엇인지 이해할 필요가 있다. 공존 문제는 조직생태학 관련 문헌에서 심도 있게 다뤄져 왔다. 그러나 온라인 커뮤니티와 전통적인 조직 사이에 유사점과 함께 차이점도 있다는 점을 감안해 조직 이론을 온라인 세계에 직접 적용할때 유의해야 한다. 본 연구는 Davids et al.(2007)이 제시한 로드맵에 따라 에이전트 기반 모델링 및 시뮬레이션을 실시하여, 선행 연구를 토대로 새로운 이론을 개발하고자 한다. 서로 공존하는 커뮤니티 두 곳을 설정하여 연구를 실시한 결과, 커뮤니티의 규모와 참여 비용이 커뮤니티 발전에 상당한 영향을 미친다는 사실을 알 수 있었다. 커뮤니티가 클수록 자주 접속하는 적극적인 사용자가 더 많이 유입될 수 있다. 한편 참여 비용이 낮을수록 가입자들이 게시물을 읽고 게재하는 활동이 활성화된다. 이와 함께 관심사 분포가 커뮤니티의 주제 트렌드에 중요한 영향을 미친다는 사실도 발견했다. 단일 주제에 집중하는 집단의 경우, 주제가 초기에 광범위했는지 협소했는지 여부와 무관하게 커뮤니티는 신속하게 해당 주제 쪽으로 모여들 수 있다. 이 같은 시뮬레이션 모델은 연구문헌에 이론적인 시사점을 제시하는 동시에, 온라인 커뮤니티 운영자들에게도 실질적인 지침을 제공해 준다.