• 제목/요약/키워드: hub site

검색결과 74건 처리시간 0.019초

폭소노미 사이트를 위한 랭킹 프레임워크 설계: 시맨틱 그래프기반 접근 (A Folksonomy Ranking Framework: A Semantic Graph-based Approach)

  • 박현정;노상규
    • Asia pacific journal of information systems
    • /
    • 제21권2호
    • /
    • pp.89-116
    • /
    • 2011
  • In collaborative tagging systems such as Delicious.com and Flickr.com, users assign keywords or tags to their uploaded resources, such as bookmarks and pictures, for their future use or sharing purposes. The collection of resources and tags generated by a user is called a personomy, and the collection of all personomies constitutes the folksonomy. The most significant need of the folksonomy users Is to efficiently find useful resources or experts on specific topics. An excellent ranking algorithm would assign higher ranking to more useful resources or experts. What resources are considered useful In a folksonomic system? Does a standard superior to frequency or freshness exist? The resource recommended by more users with mere expertise should be worthy of attention. This ranking paradigm can be implemented through a graph-based ranking algorithm. Two well-known representatives of such a paradigm are Page Rank by Google and HITS(Hypertext Induced Topic Selection) by Kleinberg. Both Page Rank and HITS assign a higher evaluation score to pages linked to more higher-scored pages. HITS differs from PageRank in that it utilizes two kinds of scores: authority and hub scores. The ranking objects of these pages are limited to Web pages, whereas the ranking objects of a folksonomic system are somewhat heterogeneous(i.e., users, resources, and tags). Therefore, uniform application of the voting notion of PageRank and HITS based on the links to a folksonomy would be unreasonable, In a folksonomic system, each link corresponding to a property can have an opposite direction, depending on whether the property is an active or a passive voice. The current research stems from the Idea that a graph-based ranking algorithm could be applied to the folksonomic system using the concept of mutual Interactions between entitles, rather than the voting notion of PageRank or HITS. The concept of mutual interactions, proposed for ranking the Semantic Web resources, enables the calculation of importance scores of various resources unaffected by link directions. The weights of a property representing the mutual interaction between classes are assigned depending on the relative significance of the property to the resource importance of each class. This class-oriented approach is based on the fact that, in the Semantic Web, there are many heterogeneous classes; thus, applying a different appraisal standard for each class is more reasonable. This is similar to the evaluation method of humans, where different items are assigned specific weights, which are then summed up to determine the weighted average. We can check for missing properties more easily with this approach than with other predicate-oriented approaches. A user of a tagging system usually assigns more than one tags to the same resource, and there can be more than one tags with the same subjectivity and objectivity. In the case that many users assign similar tags to the same resource, grading the users differently depending on the assignment order becomes necessary. This idea comes from the studies in psychology wherein expertise involves the ability to select the most relevant information for achieving a goal. An expert should be someone who not only has a large collection of documents annotated with a particular tag, but also tends to add documents of high quality to his/her collections. Such documents are identified by the number, as well as the expertise, of users who have the same documents in their collections. In other words, there is a relationship of mutual reinforcement between the expertise of a user and the quality of a document. In addition, there is a need to rank entities related more closely to a certain entity. Considering the property of social media that ensures the popularity of a topic is temporary, recent data should have more weight than old data. We propose a comprehensive folksonomy ranking framework in which all these considerations are dealt with and that can be easily customized to each folksonomy site for ranking purposes. To examine the validity of our ranking algorithm and show the mechanism of adjusting property, time, and expertise weights, we first use a dataset designed for analyzing the effect of each ranking factor independently. We then show the ranking results of a real folksonomy site, with the ranking factors combined. Because the ground truth of a given dataset is not known when it comes to ranking, we inject simulated data whose ranking results can be predicted into the real dataset and compare the ranking results of our algorithm with that of a previous HITS-based algorithm. Our semantic ranking algorithm based on the concept of mutual interaction seems to be preferable to the HITS-based algorithm as a flexible folksonomy ranking framework. Some concrete points of difference are as follows. First, with the time concept applied to the property weights, our algorithm shows superior performance in lowering the scores of older data and raising the scores of newer data. Second, applying the time concept to the expertise weights, as well as to the property weights, our algorithm controls the conflicting influence of expertise weights and enhances overall consistency of time-valued ranking. The expertise weights of the previous study can act as an obstacle to the time-valued ranking because the number of followers increases as time goes on. Third, many new properties and classes can be included in our framework. The previous HITS-based algorithm, based on the voting notion, loses ground in the situation where the domain consists of more than two classes, or where other important properties, such as "sent through twitter" or "registered as a friend," are added to the domain. Forth, there is a big difference in the calculation time and memory use between the two kinds of algorithms. While the matrix multiplication of two matrices, has to be executed twice for the previous HITS-based algorithm, this is unnecessary with our algorithm. In our ranking framework, various folksonomy ranking policies can be expressed with the ranking factors combined and our approach can work, even if the folksonomy site is not implemented with Semantic Web languages. Above all, the time weight proposed in this paper will be applicable to various domains, including social media, where time value is considered important.

도시공원 입지특성에 따른 그린네트워크 활성화 연구 - 부산광역시 도심권을 대상으로 - (A Study on the Location of Urban Parks for Green-Network Revitalization - Based on Downtown of Busan -)

  • 김승환;이규홍;박승범
    • 한국조경학회지
    • /
    • 제38권2호
    • /
    • pp.75-93
    • /
    • 2010
  • 부산은 해안구릉지의 지형특성으로 인하여 공원의 입지가 이용가치가 낮은 산지 주변으로 다수의 공원이 지정되어 있으며, 지역 간의 균형적 입지 측면에서도 문제를 안고 있다. 본 연구에서는 도심생활권 내 도시공원에 대한 환경특성 분석과 더불어 주변시가지와의 상호 관계적 특성에 따라 유형을 구분하고, 그린네트워크 활성화를 위한 유형별 도시공원의 관리방안을 모색하였다. 이를 위해 내륙권역과 해안권역으로 구분하고, 녹지연계적 관점에서 결절부 녹지대에 해당하는 내륙권역의 표고 150~300m, 해안권역의 100~150m 내외의 산지 및 구릉지에 입지하는 도시공원을 분석한 결과, 시가지와 도시공원의 형태가 관입되거나, 지대(地帶)적 중첩의 영향력이 크게 나타나고 있다. 도시공원이 이루는 녹지대는 시가지의 형상과 도시기능에 의해 녹지연계의 방향성과 영향력이 결정적으로 작용하고 있다. 이러한 현황을 바탕으로 도시공원을 유형화하고, 유형별로 미조성 도시공원에 대한 이용성 증진 방안, 녹지연계를 통한 효과적인 그린네트워크 활성화방안을 검토하였다. 완사면 녹지대를 이루는 도시공원은 비교적 양호한 접근성과 뚜렷한 인식성을 지니고 있으며, 중심산지에서 연계된 녹지대가 수렴되는 도시하천과 해안지대에서의 도시기능의 활력과 개방성 확보가 그린네트워크 활성화의 중요한 요인으로 분석되었다. 또한 고지대생활권에서 녹지대에 분포하는 한정적 가용지와 배후녹지로 연계되는 주요 연결로를 중심으로 일상생활영역에서의 그린웨이를 활성화하고, 주요 도로와 도시공원의 주진입부가 교차하는 지역에 지역 커뮤니티의 거점을 형성하는 것이 그린네트워크 활성화의 주요방안으로 제시하였다.

다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 미치는 영향 연구 (The Effect of Meta-Features of Multiclass Datasets on the Performance of Classification Algorithms)

  • 김정훈;김민용;권오병
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.23-45
    • /
    • 2020
  • 기업의 경쟁력 확보를 위해 판별 알고리즘을 활용한 의사결정 역량제고가 필요하다. 하지만 대부분 특정 문제영역에는 적합한 판별 알고리즘이 어떤 것인지에 대한 지식은 많지 않아 대부분 시행착오 형식으로 최적 알고리즘을 탐색한다. 즉, 데이터셋의 특성에 따라 어떠한 분류알고리즘을 채택하는 것이 적합한지를 판단하는 것은 전문성과 노력이 소요되는 과업이었다. 이는 메타특징(Meta-Feature)으로 불리는 데이터셋의 특성과 판별 알고리즘 성능과의 연관성에 대한 연구가 아직 충분히 이루어지지 않았기 때문이며, 더구나 다중 클래스(Multi-Class)의 특성을 반영하는 메타특징에 대한 연구 또한 거의 이루어진 바 없다. 이에 본 연구의 목적은 다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 유의한 영향을 미치는지에 대한 실증 분석을 하는 것이다. 이를 위해 본 연구에서는 다중 클래스 데이터셋의 메타특징을 데이터셋의 구조와 데이터셋의 복잡도라는 두 요인으로 분류하고, 그 안에서 총 7가지 대표 메타특징을 선택하였다. 또한, 본 연구에서는 기존 연구에서 사용하던 IR(Imbalanced Ratio) 대신 시장집중도 측정 지표인 허핀달-허쉬만 지수(Herfindahl-Hirschman Index, HHI)를 메타특징에 포함하였으며, 역ReLU 실루엣 점수(Reverse ReLU Silhouette Score)도 새롭게 제안하였다. UCI Machine Learning Repository에서 제공하는 복수의 벤치마크 데이터셋으로 다양한 변환 데이터셋을 생성한 후에 대표적인 여러 판별 알고리즘에 적용하여 성능 비교 및 가설 검증을 수행하였다. 그 결과 대부분의 메타특징과 판별 성능 사이의 유의한 관련성이 확인되었으며, 일부 예외적인 부분에 대한 고찰을 하였다. 본 연구의 실험 결과는 향후 메타특징에 따른 분류알고리즘 추천 시스템에 활용할 것이다.

싱가포르 창업생태계 연구: Isenberg(2010) 프레임워크의 지역적 변용을 통한 질적 연구를 중심으로 (A Study on Singapore Startup Ecosystem using Regional Transformation of Isenberg(2010))

  • 김소연;조민경;이무원
    • 벤처창업연구
    • /
    • 제15권2호
    • /
    • pp.47-65
    • /
    • 2020
  • 4차 산업 혁명의 시대가 가시화됨에 따라 새로운 기술을 활용한 혁신적인 비즈니스 모델들이 부상하고 있으며 스타트업은 파괴적인 혁신에 대응할 수 있는 민첩성과 새로운 기술에의 개방을 기반으로 기회의 풍요를 누리고 있다. 하지만 지속가능한 창업 생태계를 조성하는 데에 있어 가장 중요한 것은 창업 그 자체가 아닌, 연구-창업-투자-상장 및 대기업으로의 도약- 재투자로 이어지는 스타트업의 선순환을 구축하는 것이다. 이를 위해서는 창업이 행해진 거점 지역에 조성된 환경이 중요한데, 이러한 물질적, 비물질적 환경 요인들은 '창업생태계'라는 단어로 포괄되어 일컬어진다. 이러한 지역 중점의 창업생태계 연구는 해당 지역 내의 요소들 간의 상호 작용이 어떻게 새로운 벤처의 경쟁력을 높이는 데에 기여하고 이들을 지원하는 지역 환경을 만드는 지에 중점을 두고 진행된다. 본 연구는 창업환경 및 기업 환경 평가에 있어 아시아 국가 1,2위에 꾸준히 언급되는 싱가포르를 지역적 맥락으로 설정하여, 현지 창업생태계를 구성하는 요소들의 상호작용과 생태계 참여자들의 관계성에 대한 연구를 통해 한국의 창업생태계에의 시사점을 제공하고자 하였다. 이 과정에서 Isenberg(2010)가 제시한 창업생태계의 6가지 요소- 정책, 금융, 문화, 지원, 인적자원, 시장-가 창업생태계 요소와 관련된 선행연구를 잘 포괄한다는 점에서 창업생태계를 분석하는 데에 가장 적합한 프레임워크임을 대전제로 두고, 연구의 표적 지역인 싱가포르에 적합하도록 일부 요소들에 집중한 지역적 변용 모델을 구축하고자 하였다. 이에 싱가포르의 정치적 특성상 정책이라는 요소가 금융에 막대한 영향을 끼칠 수밖에 없다는 것, 스마트 네이션(Smart Nation) 정책의 기조가 기업가 정신과 관련된 대학 교육에 영향을 미치고 있다는 것, 그리고 싱가포르의 창업 인프라 내에서 형성되는 기업가 네트워크와 글로벌 연결성이 싱가포르 스타트업의 성과에 유의한 영향을 준다는 것을 고려하여 정책(Policy), 문화(Culture), 그리고 시장(Market)이라는 요소들을 더욱 주요하게 바라봐야 할 필요가 있다고 판단하였다. 또한, 창업생태계 요소들의 내부적인 상호작용을 파악하기 위해서는 창업생태계 참여자들을 대상으로 한 질적 연구가 필수적이므로 현지에 직접 방문하여 반구조화된 설문을 진행하였다. 이렇듯 본 연구는 싱가포르 창업생태계의 정책, 문화, 시장 요소에 집중한 질적 연구를 바탕으로 현지의 창업생태계 현황을 조사하였고, 한국과의 비교를 통해 스타트업 관련 규제, 대학의 역할, 창업 인프라 측면의 시사점을 제공하고자 하였다. 이는 향후 진행될 창업생태계 연구뿐만 아니라, 창업 인프라의 조성, 창업생태계 활성화 방안 마련, 그리고 대학의 창업교육 방향성 설정에 기여할 수 있을 것이다.