• 제목/요약/키워드: semantic distance

검색결과 83건 처리시간 0.021초

Semantic-based Mashup Platform for Contents Convergence

  • Yongju Lee;Hongzhou Duan;Yuxiang Sun
    • International journal of advanced smart convergence
    • /
    • 제12권2호
    • /
    • pp.34-46
    • /
    • 2023
  • A growing number of large scale knowledge graphs raises several issues how knowledge graph data can be organized, discovered, and integrated efficiently. We present a novel semantic-based mashup platform for contents convergence which consists of acquisition, RDF storage, ontology learning, and mashup subsystems. This platform servers a basis for developing other more sophisticated applications required in the area of knowledge big data. Moreover, this paper proposes an entity matching method using graph convolutional network techniques as a preliminary work for automatic classification and discovery on knowledge big data. Using real DBP15K and SRPRS datasets, the performance of our method is compared with some existing entity matching methods. The experimental results show that the proposed method outperforms existing methods due to its ability to increase accuracy and reduce training time.

IPTV 환경에서 효율적인 웹 탐색을 위한 시맨틱 주밍 기법 (The Semantic Zooming Method for Efficient Web Browsing on Internet-connected Digital Television)

  • 정지혜;이혜정;이종호;김연배
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2008년도 학술대회 1부
    • /
    • pp.579-583
    • /
    • 2008
  • 기존 PC용 웹 페이지는 키보드와 마우스, 근거리 디스플레이를 이용하는 환경에 맞추어 많은 정보 제공을 목적으로 복잡한 구성과 작은 폰트로 디자인되어 있다. 따라서, 일정 거리 이상의 시청 거리, 사용자의 기밀한 주의를 요구하지 않는 컨텐츠 제공, 제한적 기능의 리모트 컨트롤러를 사용하여 제어하는 TV에서 동일한 웹 페이지를 사용자에게 제공하기에는 적합하지 않다. 이러한 TV 환경에서 웹 페이지를 효율적으로 브라우징하기 위해 시맨틱 주밍 기법을 적용한 브라우징 방식을 디자인하였다. 기존의 웹 페이지를 분석하여 구성된 컨텐츠를 기반으로 semantic block 을 추출하고, 기존의 레이아웃과 스타일 정보를 분석한 후 현재 환경에 최적의 형태로 컨텐츠를 요약하고 레이아웃, 스타일을 변경하여 재구성한다. 이렇게 재구성된 웹 페이지는 줌 인터페이스를 사용하여 사용자에게 정보의 양을 조정하여 보여준다. 즉, 사용자가 관심 있는 semantic block 을 선택하여 줌-인을 하면 해당 블록이 커지며 더 자세한 컨텐츠로 이루어진 내용을 볼 수 있고, 줌-아웃을 하면 해당 블록이 작아지면서 요약된 컨텐츠로 이루어진 내용을 볼 수 있다. TV 와 같이 큰 디스플레이의 경우 PC 보다 스크롤과 같은 조작을 하기 위해서는 더 많은 노력이 요구됨으로 사용자의 편의를 위해 가로 스크롤은 제거하고 세로 스크롤은 최소화하는 방식으로 채택하였다. 복잡하게 구성된 웹 페이지를 사용자가 원하는 컨텐츠에 쉽게 접근할 수 있도록 요약된 컨텐츠로 재구성하고, TV 환경에 최적화된 레이아웃과 스타일을 제공하여 가독성과 심미성을 향상되도록 하였다.

  • PDF

Bag of Visual Words Method based on PLSA and Chi-Square Model for Object Category

  • Zhao, Yongwei;Peng, Tianqiang;Li, Bicheng;Ke, Shengcai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권7호
    • /
    • pp.2633-2648
    • /
    • 2015
  • The problem of visual words' synonymy and ambiguity always exist in the conventional bag of visual words (BoVW) model based object category methods. Besides, the noisy visual words, so-called "visual stop-words" will degrade the semantic resolution of visual dictionary. In view of this, a novel bag of visual words method based on PLSA and chi-square model for object category is proposed. Firstly, Probabilistic Latent Semantic Analysis (PLSA) is used to analyze the semantic co-occurrence probability of visual words, infer the latent semantic topics in images, and get the latent topic distributions induced by the words. Secondly, the KL divergence is adopt to measure the semantic distance between visual words, which can get semantically related homoionym. Then, adaptive soft-assignment strategy is combined to realize the soft mapping between SIFT features and some homoionym. Finally, the chi-square model is introduced to eliminate the "visual stop-words" and reconstruct the visual vocabulary histograms. Moreover, SVM (Support Vector Machine) is applied to accomplish object classification. Experimental results indicated that the synonymy and ambiguity problems of visual words can be overcome effectively. The distinguish ability of visual semantic resolution as well as the object classification performance are substantially boosted compared with the traditional methods.

청소년들의 부모에 대한 심리적 거리 및 관련 변인에 관한 연구 - 부산 지방을 중심으로 - (A Study of the juveniles' Psychological Distance to Their Parents and Related Variables)

  • 노영남
    • 대한가정학회지
    • /
    • 제20권4호
    • /
    • pp.205-223
    • /
    • 1982
  • This study was devised to investigate the juveniles' psychological distance to their parents and related variables. 456 respondents, consisted of 116 middle school boys, 101 high school boys, 114 middle school girls and 125 high school girls, were sampled. The psychological distance was measured by the semantic differential method, and the statistical data were verified by the analysis of variance through computer system. The main results are found as follows. 1. The average mark of the juveniles' psychological distance to their parents was 54.73(78.19%)/70(100%) and the mark of high school girls was highest and high school boys lowest. 2. The variables influencing on the juveniles' psychological distance to their parents were varied buy the groups. 1) Middle school boys; home atmosphere(p<.001), social and economical status of home (S.E.S; p<.01), number of intimate friends(p<.05), rearing attitudes of parents(p<.05). 2) High school boys; home atmosphere(p<.001), age of father(p<.05), protection of mother(p<.05) 3) Middle school girls; home atmosphere(p<.001), rearing attitudes of parents (p<.001), S.E.S of home(p<.001).

  • PDF

시맨틱 웹 기반의 분산 시스템을 위한 질의 변환 및 인덱싱 기법 (Query Rewriting and Indexing Schemes for Distributed Systems based on the Semantic Web)

  • 채광주;김연희;임해철
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제14권7호
    • /
    • pp.718-722
    • /
    • 2008
  • 시맨틱 웹의 기반이 되는 온톨로지는 기술 언어로 OWL이 발표되면서, 웹 리소스의 의미를 더욱 다양하게 기술할 수 있는 강한 표현력을 갖추어 가고 있다. 그리고, 시맨틱 웹의 개념이 널리 인식되면서 정보의 양이 더욱 많아지고 온톨로지가 지역적으로 분산되어 구축됨에 따라, 분산 환경에서 원하는 데이타를 포함하고 있는 지역 저장소를 빠르게 검색하는 것이 전체 시스템의 성능에 중요한 영향을 미치게 되었다. 따라서 본 논문에서는 첫째, 분산된 온톨로지 환경에서 사용자가 원하는 데이타가 위치하고 있는 지역 저장소를 빠르게 검색하기 위한 인덱스 구조를 제안한다. 둘째, 분산 환경을 지원할 수 있는 OWL의 다양한 표현을 이용하여 질의를 확장하기 위한 질의 변환 기법을 제안한다. 본 논문에서 제안한 기법을 통해 OWL의 다양한 표현을 활용하는 것이 가능하고, 시맨틱 웹 환경의 모든 질의 유형에 대해 데이타가 존재하는 지역 저장소를 빠르게 파악할 수 있다.

가중치를 이용한 통계 기반 한국어 동형이의어 분별 모델 (A Korean Homonym Disambiguation Model Based on Statistics Using Weights)

  • 김준수;최호섭;옥철영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권11호
    • /
    • pp.1112-1123
    • /
    • 2003
  • 본 논문은 한국어 정보처리에서 발생하는 어휘 중의성 문제 중 한국어에서 그 심각성이 큰 동형이의어 중의성을 해결하기 위하여, 사전 뜻풀이 말뭉치에서 구축한 의미정보(Semantic Information)와 이를 이용한 기존의 통계기반 동형이의어 분별 모델에 대한 실험 결과를 분석하여, 정확률 향상을 위한 새로운 동형이의어 NPH(New Prior Probability of Homonym sense) 가중치 및 인접 어절에 대한 거리 가중치 적용 모델을 제안한다. 사전 뜻풀이 말뭉치의 상위 고빈도 동형이의어 200개 중 중의성이 높은 46개(명사 30개, 동사 16개)를 선별하고, 21세기 세종 계획에서 제공하는 350만 어절 품사 부착 말뭉치에서 이들 동형이의어를 포함하는 47,977개의 문장을 추출하여 실험을 하였다. 기존의 통계기반 동형이의어 분별 모델에서는 72.08%(명사78.12%, 동사 62.45%)의 정확률을 나타냈으나, NPH 가중치를 부여한 실험 결과 정확률이 평균 1.70% 향상되었으며, NPH와 거리 가중치를 함께 이용한 결과 평균 2.01% 정확률이 향상되었다.

Formal Representation and Query for Digital Contents Data

  • Khamis, Khamis Abdul-Latif;Song, Huazhu;Zhong, Xian
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.261-276
    • /
    • 2020
  • Digital contents services are one of the topics that have been intensively studied in the media industry, where various semantic and ontology techniques are applied. However, query execution for ontology data is still inefficient, lack of sufficient extensible definitions for node relationships, and there is no specific semantic method fit for media data representation. In order to make the machine understand digital contents (DCs) data well, we analyze DCs data, including static data and dynamic data, and use ontology to specify and classify objects and the events of the particular objects. Then the formal representation method is proposed which not only redefines DCs data based on the technology of OWL/RDF, but is also combined with media segmentation methods. At the same time, to speed up the access mechanism of DCs data stored under the persistent database, an ontology-based DCs query solution is proposed, which uses the specified distance vector associated to a surveillance of semantic label (annotation) to detect and track a moving or static object.

Applying Metricized Knowledge Abstraction Hierarchy for Securely Personalized Context-Aware Cooperative Query

  • Kwon Oh-Byung;Shin Myung-Geun;Kim In-Jun
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.354-360
    • /
    • 2006
  • The purpose of this paper is to propose a securely personalized context-aware cooperative query that supports a multi-level data abstraction hierarchy and conceptual distance metric among data values, while considering privacy concerns around user context awareness. The conceptual distance expresses a semantic similarity among data values with a quantitative measure, and thus the conceptual distance enables query results to be ranked. To show the feasibility of the methodology proposed in this paper we have implemented a prototype system in the area of site search in a large-scale shopping mall.

  • PDF

Biaffine Average Attention 모델을 이용한 의미역 결정 (Semantic Role Labeling using Biaffine Average Attention Model)

  • 남충현;장경식
    • 한국정보통신학회논문지
    • /
    • 제26권5호
    • /
    • pp.662-667
    • /
    • 2022
  • 의미역 결정 작업은 서술어와 문장 내 행위자, 피행위자, 장소, 시간 등 서술어와 관련 있는 논항들을 추출하는 작업이다. 기존 의미역 결정 방법은 문장의 언어학적 특징 추출을 위한 파이프라인을 구축하는데, 파이프라인 내 각 추출 작업들의 오류가 의미역 결정 작업의 성능에 영향을 미치기 때문에 현재는 End-to-End 방법의 신경망 모델을 이용한 방법들이 제안되고 있다. 본 논문에서는 의미역 결정 작업을 위해 Biaffine Average Attention 구조를 이용한 신경망 모델을 제안한다. 제안하는 모델은 기존 연구에서 제안된 특정 시점에 대한 레이블 예측을 위해 주변 시점 정보를 이용하는 LSTM 모델 대신 문장 내 서술어와 논항의 거리에 상관없이 문장 전체 정보에 집중할 수 있는 Biaffine Average Attention 구조로 이루어져 있다. 제안하는 모델의 성능 평가를 위해 F1 점수를 이용하여 기존 연구에서 제안한 BERT 기반의 모델들과 비교하였으며, 76.21%의 성능으로 비교 모델보다 높은 성능을 보였음을 확인하였다.

지식기반 웹 문서 필터링 (Knowledge-Based Web Document Filtering)

  • 황상규;김상모;변영태
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.51-53
    • /
    • 1999
  • 인터넷에서 검색 가능한 정보의 양은 폭발적으로 증가하고 있으며, 그에 따라 웹 기반 정보검색시스템은 사용자가 원하는 정보만을 필터링하여 이용자의 정보검색 수행과정에 부담을 덜어줄 필요가 있다. 본 연구에서는 웹 정보검색에 익숙치 못한 초보 이용자들이 실제 웹 정보검색을 수행하는데 있어 발생할 수 있는 문제점을 살펴보고, 초보 이용자들의 보다 편리한 웹 정보검색을 도와줄 수 있도록 하기 위하여 WordNet을 활용한 지식베이스와 SDCC(Semantic Distance for Common Category)를 이용한 웹 문서 필터링 알고리즘을 개발하고 그 효율성을 확인하였다.

  • PDF