• 제목/요약/키워드: Jaccard

검색결과 89건 처리시간 0.029초

아동이 지각한 사회적 지지와 사회적 능력 (Preschool Children's Social Competency and Perceived Social Support)

  • 윤정진;정옥분
    • 아동학회지
    • /
    • 제18권2호
    • /
    • pp.311-331
    • /
    • 1997
  • This study investigated the relationship between preschool children's social competence and perceived social support. The subjects were 85 children enrolled in 10 kindergartens and nurseries located in Seoul. Social support was assessed by children themselves with a social support dialogue Cask, "My Family and Friends," developed by Reid, Lamdegman, and Jaccard (1989). This task consists of 12 dialogues based on Vygotskian principles. Social competency was assessed by teachers with a slightly modified version of Song's Iowa Social Competency Scale (ISCS). The data were analyzed by frequencies percentiles, mean, one-way ANOVAs, and Pearson's correlations. Results showed that (1) Children perceived parents to be the best multi-purpose social providers: mothers for emotional support and fathers for instrumental support. (2) Children with unemployed mothers perceived higher maternal emotional, informational, and instrumental support than children with employed mothers. (3) Middle-class children perceived higher friendship support than upper-or lower-class children. (4) Friendship support was the one variable most significantly related to children's social competence.

  • PDF

Mitigation of Adverse Effects of Malicious Users on Cooperative Spectrum Sensing by Using Hausdorff Distance in Cognitive Radio Networks

  • Khan, Muhammad Sajjad;Koo, Insoo
    • Journal of information and communication convergence engineering
    • /
    • 제13권2호
    • /
    • pp.74-80
    • /
    • 2015
  • In cognitive radios, spectrum sensing plays an important role in accurately detecting the presence or absence of a licensed user. However, the intervention of malicious users (MUs) degrades the performance of spectrum sensing. Such users manipulate the local results and send falsified data to the data fusion center; this process is called spectrum sensing data falsification (SSDF). Thus, MUs degrade the spectrum sensing performance and increase uncertainty issues. In this paper, we propose a method based on the Hausdorff distance and a similarity measure matrix to measure the difference between the normal user evidence and the malicious user evidence. In addition, we use the Dempster-Shafer theory to combine the sets of evidence from each normal user evidence. We compare the proposed method with the k-means and Jaccard distance methods for malicious user detection. Simulation results show that the proposed method is effective against an SSDF attack.

Min-Max Hash를 활용한 다중 집합 기반의 유사도 측정 (Min-Max Hash for Similarity Measurement based on Multiset)

  • 윤진욱;김병욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.36-39
    • /
    • 2019
  • 데이터 마이닝에서 클러스터링은 서로 유사한 특징을 갖는 데이터들을 동일한 클래스로 분류하는 방법이다. 클러스터링에는 다양한 방법이 존재하지만 대표적으로 집합으로 표현된 데이터들의 유사도를 측정하기 위해서는 자카드 유사도(Jaccard Similarity)를 이용한다. 자카드 유사도는 서로 다른 집합 간의 공통된 부분을 상대적으로 평가하여 유사도를 측정하는 방법이다. 그러나 최근에는 데이터를 저장할 수 있는 기술과 매체의 발전으로 표현할 수 있는 데이터의 영역과 범위는 발전되고 있기 때문에 많은 연산과 시간의 비용이 발생하게 된다. 이를 해결하기 위해서 두 데이터의 표본의 유사도를 통해 실제 데이터들의 유사도를 추정할 수 있는 Min-Hash 가 제안되었다. 본 논문에서는 이를 활용하여 집합의 영역을 다중 집합(Multiset)으로 확장하여 중복되는 값을 가질 수 있는 두 데이터 간의 유사도를 효율적으로 추정할 수 있는 Min-Max Hash 를 제안한다.

건선 영역 분할기법 비교분석 (Comparative Analysis of Segmentation Methods in Psoriasis Area)

  • 유현종;이지원;문초이;김은빈;백유상;장상훈;이언석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.657-659
    • /
    • 2019
  • 본 논문에서는 피부 이미지에서 건선 병변만을 가장 효과적으로 분할 할 수 있는 분할기법 선별을 목표로 한다. Interactive graph cuts (IGC)와 Level set method (LSM)를 사용하여 건선 영역을 분할한 후 Jaccard Index (JI)와 Dice Similarity Coefficient (DSC)을 사용하여 건선 영역에 효과적인 분할 방법을 제안한다.

Development of a Personalized Similarity Measure using Genetic Algorithms for Collaborative Filtering

  • Lee, Soojung
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권12호
    • /
    • pp.219-226
    • /
    • 2018
  • Collaborative filtering has been most popular approach to recommend items in online recommender systems. However, collaborative filtering is known to suffer from data sparsity problem. As a simple way to overcome this problem in literature, Jaccard index has been adopted to combine with the existing similarity measures. We analyze performance of such combination in various data environments. We also find optimal weights of factors in the combination using a genetic algorithm to formulate a similarity measure. Furthermore, optimal weights are searched for each user independently, in order to reflect each user's different rating behavior. Performance of the resulting personalized similarity measure is examined using two datasets with different data characteristics. It presents overall superiority to previous measures in terms of recommendation and prediction qualities regardless of the characteristics of the data environment.

Compound Loss Function of semantic segmentation models for imbalanced construction data

  • Chern, Wei-Chih;Kim, Hongjo;Asari, Vijayan;Nguyen, Tam
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.808-813
    • /
    • 2022
  • This study presents the problems of data imbalance, varying difficulties across target objects, and small objects in construction object segmentation for far-field monitoring and utilize compound loss functions to address it. Construction site scenes of assembling scaffolds were analyzed to test the effectiveness of compound loss functions for five construction object classes---workers, hardhats, harnesses, straps, hooks. The challenging problem was mitigated by employing a focal and Jaccard loss terms in the original loss function of LinkNet segmentation model. The findings indicates the importance of the loss function design for model performance on construction site scenes for far-field monitoring.

  • PDF

유사도 알고리즘을 활용한 시맨틱 프로세스 검색방안 (Semantic Process Retrieval with Similarity Algorithms)

  • 이홍주
    • Asia pacific journal of information systems
    • /
    • 제18권1호
    • /
    • pp.79-96
    • /
    • 2008
  • One of the roles of the Semantic Web services is to execute dynamic intra-organizational services including the integration and interoperation of business processes. Since different organizations design their processes differently, the retrieval of similar semantic business processes is necessary in order to support inter-organizational collaborations. Most approaches for finding services that have certain features and support certain business processes have relied on some type of logical reasoning and exact matching. This paper presents our approach of using imprecise matching for expanding results from an exact matching engine to query the OWL(Web Ontology Language) MIT Process Handbook. MIT Process Handbook is an electronic repository of best-practice business processes. The Handbook is intended to help people: (1) redesigning organizational processes, (2) inventing new processes, and (3) sharing ideas about organizational practices. In order to use the MIT Process Handbook for process retrieval experiments, we had to export it into an OWL-based format. We model the Process Handbook meta-model in OWL and export the processes in the Handbook as instances of the meta-model. Next, we need to find a sizable number of queries and their corresponding correct answers in the Process Handbook. Many previous studies devised artificial dataset composed of randomly generated numbers without real meaning and used subjective ratings for correct answers and similarity values between processes. To generate a semantic-preserving test data set, we create 20 variants for each target process that are syntactically different but semantically equivalent using mutation operators. These variants represent the correct answers of the target process. We devise diverse similarity algorithms based on values of process attributes and structures of business processes. We use simple similarity algorithms for text retrieval such as TF-IDF and Levenshtein edit distance to devise our approaches, and utilize tree edit distance measure because semantic processes are appeared to have a graph structure. Also, we design similarity algorithms considering similarity of process structure such as part process, goal, and exception. Since we can identify relationships between semantic process and its subcomponents, this information can be utilized for calculating similarities between processes. Dice's coefficient and Jaccard similarity measures are utilized to calculate portion of overlaps between processes in diverse ways. We perform retrieval experiments to compare the performance of the devised similarity algorithms. We measure the retrieval performance in terms of precision, recall and F measure? the harmonic mean of precision and recall. The tree edit distance shows the poorest performance in terms of all measures. TF-IDF and the method incorporating TF-IDF measure and Levenshtein edit distance show better performances than other devised methods. These two measures are focused on similarity between name and descriptions of process. In addition, we calculate rank correlation coefficient, Kendall's tau b, between the number of process mutations and ranking of similarity values among the mutation sets. In this experiment, similarity measures based on process structure, such as Dice's, Jaccard, and derivatives of these measures, show greater coefficient than measures based on values of process attributes. However, the Lev-TFIDF-JaccardAll measure considering process structure and attributes' values together shows reasonably better performances in these two experiments. For retrieving semantic process, we can think that it's better to consider diverse aspects of process similarity such as process structure and values of process attributes. We generate semantic process data and its dataset for retrieval experiment from MIT Process Handbook repository. We suggest imprecise query algorithms that expand retrieval results from exact matching engine such as SPARQL, and compare the retrieval performances of the similarity algorithms. For the limitations and future work, we need to perform experiments with other dataset from other domain. And, since there are many similarity values from diverse measures, we may find better ways to identify relevant processes by applying these values simultaneously.

보호지역의 식물종 보전 상보성 평가 (Complimentary Assessment for Conserving Vegetation on Protected Areas in South Korea)

  • 박진한;최혜영;모용원
    • 한국환경생태학회지
    • /
    • 제34권5호
    • /
    • pp.436-445
    • /
    • 2020
  • 아이치 생물다양성 목표11을 달성하기 위하여, 국내 보호지역은 양적으로 꾸준히 증가되어왔으며, 추가 지정이 필요한 잠재 보호지역에 대한 연구도 진행되어왔다. 하지만 효과적인 생물다양성 보전을 위한 보호지역의 상보성에 대한 평가는 미흡하다. 본 연구에서는 제3차 전국자연환경조사의 식물종을 대상으로 종분포모형을 이용하여 잠재서식지역을 도출하고, 기존 보호지역과 잠재보호지역 내 잠재서식지역이 포함되는 종의 풍부도를 유사도 지수인 Jaccard, Sorenson, Bray-curtis를 이용하여 비교분석하였다. 연구결과로 기존 보호지역과 잠재보호지역 대부분이 상보성이 낮아 유사한 식물종을 보전하는 것으로 나타났다. 국립수목원 완충지역이 상보성이 높아 보호지역으로서의 가치가 높다고 할 수 있다. 잠재서식지역이 포함되는 경우가 적은 식물종을 보호하기 위해서는 기존 또는 잠재 보호지역 외 지역에 추가로 보호지역을 선정할 필요가 있음을 확인할 수 있었다. 본 연구는 개별 보호지역이 보호지역으로서 고유한 생태계 또는 생물종 보전이 가능한지 각 보호지역의 생태적 대표성을 확인하고, 공간적으로 추가 보호가 필요한 지역을 탐색하는 방법을 제안했다는 점에서 의의가 있으며, 향후 동물종까지 포함한 상보성 평가를 통한 보호지역의 질적 개선과 계속적으로 조사되는 전국자연환경조사 자료를 이용한 보호지역의 효과성평가 연구 등으로 발전시킬 수 있을 것으로 판단된다.

Microsatellite 마커를 이용한 사과 품종 간 유전적 유연관계 분석 (Analysis of Genetic Relationship of Apple Varieties using Microsatellite Markers)

  • 홍지화;권용삼;최근진
    • 생명과학회지
    • /
    • 제23권6호
    • /
    • pp.721-727
    • /
    • 2013
  • 본 연구는 microsatellite 마커를 이용하여 국립종자원 서부지원에 수집된 사과 42품종에 대한 품종 간 유전적 유연관계를 분석하였다. 사과 품종식별에 적합한 마커를 선정하기 위하여 8개 품종을 대상으로 총 305개의 마커를 분석하였다. 8개 품종 간에 다형성이 높고, 반복간 재현성이 있으며 밴드패턴이 선명한 26개의 마커를 최종 선발하여 42품종을 대상으로 분석하였을 때 총 165개의 대립유전자가 분석되었다. 대립유전자의 수의 분포는 2~12개를 나타내었으며, 마커당 평균 대립유전자의 수는 6.4개로 조사되었다. PIC 값은 0.461~0.849의 범위에 속하였으며 평균값은 0.665로 나타났다. 165개의 대립유전자를 Jaccard 방법에 의해 유사도를 산출하고 비가중 산술방식에 의해 집괴 분석한 결과 공시품종의 유전적 거리는 0.27~1.00의 범위를 나타내었고, 총 42품종 중 41품종은 microsatellite 마커의 유전자형에 의해 구분되었다. 본 연구결과는 사과 품종의 식별을 위한 분자생물학적 자료로 유용하게 활용될 것으로 사료된다.

염포산 산림식생의 군락 구조 및 공간 분포의 경시적 변화 (Changes Over Time in the Community Structure and Spatial Distribution of Forest Vegetation on Mt. Yeompo, Ulsan City, South Korea)

  • 오정학;김준수;조현제
    • 한국산림과학회지
    • /
    • 제109권2호
    • /
    • pp.145-156
    • /
    • 2020
  • 울산광역시의 대표적인 고립된 도시숲인 염포산을 대상으로 2000년과 2018년에 산림식생에 대한 식물사회학적 식생조사를 수행하여 그 구조, 조성 및 공간 분포 변화 경향을 비교하였다. 분석 결과, 총피도(/100㎡)는 거의 변화가 없었으나 자연식생에서는 약 9%의 증가율을 보였다. 구성종의 중요치는 그 순위에 있어서는 다소간의 변화가 있었으며 난대성 수종인 비목나무와 오염내성이 강한 때죽나무가 각각 835%, 269%의 매우 높은 증가율을 보였다. 종풍부도(S)와 종다양도(H')는 각각 약 22%, 약 8%의 감소율을 보였는데 주로 하층 식생 발달에 따라 임상 식생 구성종이 자연 감소한 결과로 판단되며 모두 인공식생이 자연식생에 비해 다소 높은 감소율을 나타내었다. 생활형 조성 체계는 2000년과 2018년 모두 'MM-R5-D4-e'로 동일하게 나타났다. 전체 산림식생의 유사도(Jaccard 계수)는 약 75%로 종구성적 특성이 거의 동질적으로 나타났다. 지표종은 2000년 16종에서 2018년 7종으로 9종이 감소하였으며 대부분 교란에 민감한 반지중식물(H), 지중식물(G) 그리고 일년생식물(Th) 등 초본식물이었다. 상관식생 유형 간 공간 분포 면적은 큰 변화가 없었으며, 산림경관 요소인 패치(patch)의 개수는 2000년 537개에서 2018년 721개로 약 25%의 증가율을 보인 반면, 그 평균 크기는 2000년 1.28 ha에서 2018년 1.03 ha로 약 20%의 감소율을 보였다.