• 제목/요약/키워드: Semantic Computing

검색결과 254건 처리시간 0.03초

Rete 알고리즘의 병렬 및 분산 처리에 관한 기존 연구 분석 (An Analysis of Existing Studies on Parallel and Distributed Processing of the Rete Algorithm)

  • 김재훈
    • 한국정보기술학회논문지
    • /
    • 제17권7호
    • /
    • pp.31-45
    • /
    • 2019
  • 현재 지능적 서비스의 핵심 기술은 딥러닝 즉 신경망, 그리고 GPU 병렬 컴퓨팅 및 빅 데이터와 같은 병렬 분산 처리 기술이다. 하지만 미래의 전 세계적으로 공유된 온톨로지를 통한 지능적 서비스 및 지식 공유 서비스에서는 지식의 표현 및 추론을 위하여 신경망보다 더 나은 방법이 있다. 그것은 시맨틱 웹의 표준 규칙 언어인 RIF 혹은 SWRL의 IF-THEN의 지식 표현이며, 이러한 규칙을 rete 알고리즘을 이용하여 효율적으로 추론할 수 있다. 하지만 단일 컴퓨터에서 동작하는 rete 알고리즘의 처리 규칙 수가 100,000개가 될 경우 그 성능이 수 십 분으로 매우 안 좋아지며, 분명한 한계가 존재한다. 따라서 본 논문에서는 rete 알고리즘의 병렬 및 분산 처리에 대한 과거로부터 현재까지의 연구 내용을 정리 분석하며, 이를 통해 효율적인 rete 알고리즘의 구현을 위해 어떤 측면들이 고려되어야 하는지를 살펴본다.

이요인 이론 기반 텍스트 마이닝을 통한 한·중 스마트홈 앱 서비스 사용자 평가 차이에 대한 연구: 신뢰성 중심 (A Study on the Evaluation Differences of Korean and Chinese Users in Smart Home App Services through Text Mining based on the Two-Factor Theory: Focus on Trustness)

  • 조욱녕;임규건
    • 한국IT서비스학회지
    • /
    • 제22권3호
    • /
    • pp.141-165
    • /
    • 2023
  • With the advent of the fourth industrial revolution, technologies such as the Internet of Things, artificial intelligence and cloud computing are developing rapidly, and smart homes enabled by these technologies are rapidly gaining popularity. To gain a competitive advantage in the global market, companies must understand the differences in consumer needs in different countries and cultures and develop corresponding business strategies. Therefore, this study conducts a comparative analysis of consumer reviews of smart homes in South Korea and China. This study collected online reviews of SmartThings, ThinQ, Msmarthom, and MiHome, the four most commonly used smart home apps in Korea and China. The collected review data is divided into satisfied reviews and dissatisfied reviews according to the ratings, and topics are extracted for each review dataset using LDA topic modeling. Next, the extracted topics are classified according to five evaluation factors of Perceived Usefulness, Reachability, Interoperability,Trustness, and Product Brand proposed by previous studies. Then, by comparing the importance of each evaluation factor in the two datasets of satisfaction and dissatisfaction, we find out the factors that affect consumer satisfaction and dissatisfaction, and compare the differences between users in Korea and China. We found Trustness and Reachability are very important factors. Finally, through language network analysis, the relationship between dissatisfied factors is analyzed from a more microscopic level, and improvement plans are proposed to the companies according to the analysis results.

A Novel Two-Stage Training Method for Unbiased Scene Graph Generation via Distribution Alignment

  • Dongdong Jia;Meili Zhou;Wei WEI;Dong Wang;Zongwen Bai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권12호
    • /
    • pp.3383-3397
    • /
    • 2023
  • Scene graphs serve as semantic abstractions of images and play a crucial role in enhancing visual comprehension and reasoning. However, the performance of Scene Graph Generation is often compromised when working with biased data in real-world situations. While many existing systems focus on a single stage of learning for both feature extraction and classification, some employ Class-Balancing strategies, such as Re-weighting, Data Resampling, and Transfer Learning from head to tail. In this paper, we propose a novel approach that decouples the feature extraction and classification phases of the scene graph generation process. For feature extraction, we leverage a transformer-based architecture and design an adaptive calibration function specifically for predicate classification. This function enables us to dynamically adjust the classification scores for each predicate category. Additionally, we introduce a Distribution Alignment technique that effectively balances the class distribution after the feature extraction phase reaches a stable state, thereby facilitating the retraining of the classification head. Importantly, our Distribution Alignment strategy is model-independent and does not require additional supervision, making it applicable to a wide range of SGG models. Using the scene graph diagnostic toolkit on Visual Genome and several popular models, we achieved significant improvements over the previous state-of-the-art methods with our model. Compared to the TDE model, our model improved mR@100 by 70.5% for PredCls, by 84.0% for SGCls, and by 97.6% for SGDet tasks.

데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법 (A Distributed SPARQL Query Processing Scheme Considering Data Locality and Query Execution Path)

  • 김병훈;김대윤;고건식;노연우;임종태;복경수;이병엽;유재수
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.275-283
    • /
    • 2017
  • 시맨틱 웹 서비스의 증가로 인해 RDF 데이터가 대용량화되고 있다. 대용량 RDF 데이터를 효율적으로 활용하기 위하여 다양한 분산 저장 및 질의 처리기법들이 연구되고 있다. 본 논문에서는 대용량 RDF 데이터의 데이터 지역성 및 질의 수행 경로를 고려한 분산 SPARQL 질의 처리 기법을 제안한다. 제안하는 기법은 질의 처리 시의 조인 비용 및 통신비용을 감소시키기 위해 분산 저장된 RDF 데이터의 지역성 및 질의 수행 경로를 고려한다. 분산 환경에서 SPARQL 질의를 처리할 때 데이터 지역성을 고려하여 WHERE절을 기준으로 해당 질의를 여러 개의 서브 질의로 분할한다. 제안하는 기법은 분할된 서브 질의들을 인덱스를 통해 연관 노드들끼리 그룹화 하여 처리함으로써 데이터 통신비용을 감소시킬 수 있다. 또한 그룹 화된 서브 질의 처리 시 불필요한 조인 및 대기 시간을 감소시키기 위해 데이터 파싱 비용, 노드별 데이터 통신량 및 대기 시간 등을 고려한 효율적인 질의 수행 경로를 생성한다. 다양한 성능평가를 통해 제안하는 기법이 기존 기법보다 우수함을 보인다.

데이터 본질 기반의 데이터 분류 방법론 (A Data Taxonomy Methodology based on Their Origin)

  • 최미영;문창주;백두권;권주흠;이영무
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권2호
    • /
    • pp.163-176
    • /
    • 2010
  • 조직의 데이터를 효과적으로 관리하는 대표적 방법은 기존 데이터의 공유와 재사용을 촉진하여 데이터의 중복 생산을 방지하는 것이다. 데이터 공유와 재사용의 촉진을 위해서 기존 데이터의 체계적 구조화와 효율적인 검색이 지원되어야 한다. 이러한 점이 고려되지 않은 조직간 단절된 데이터 개발은 데이터 중복을 양산하고 데이터의 품질을 저하시킨다. 데이터 분류는 관리하는 데이터에 대한 체계적 정리로 원하는 데이터 요소의 빠른 검색을 가능하게 한다. 본 논문에서는 데이터 공유, 재사용과 통합을 극대화하고 MDR과 시멘틱 웹에서 효과적으로 사용될 수 있는 본질기반 데이터 분류 방법론을 제안한다. 본질기반 데이터 분류 방법론은 데이터 본질을 기반으로 데이터 분류 구조를 구성하여 업무분류에 독립적인 데이터 분류가 가능하다. 또한 제시된 데이터 분류 구조를 지원하는 데이터 분류 절차를 제시하여 다양한 데이터 요소들을 데이터 분류 구조에 따라 배치하는 방법을 보인다. 사례연구에서는 제안된 데이터 분류 구조와 데이터 분류절차가 효과적으로 실제에 적용 될수 있음을 보였다.

국소 문맥과 공기 정보를 이용한 비교사 학습 방식의 명사 의미 중의성 해소 (Unsupervised Noun Sense Disambiguation using Local Context and Co-occurrence)

  • 이승우;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권7호
    • /
    • pp.769-783
    • /
    • 2000
  • 본 논문에서는 한국어 명사의 중의성 해소를 위해, 원시 말뭉치로부터 얻을 수 있는 지식원으로서 국소문맥을 정의하고 추출하는 방법을 제시한다. 동일한 국소 문맥을 갖는 서로 다른 명사는 그 의미가 유사하다는 직관을 바탕으로 대상 명사의 중의성 해소를 위해 대상명사를 포함하는 국소문맥과 동일한 국소문맥을 갖는 단어를 단서로 사용함으로써 학습 자료의 활용도를 높일 수 있고 빈도수가 적은 단어의 의미 중의성도 해결할 수 있으며, 용언의 확장을 통해 자료 부족 현상을 줄일 수 있다. 대상 명사는 동일한 국소문맥에 의한 단서들과의 최대 유사도 계산을 통해 그 의미가 결정된다. 두 단어간의 유사도는 WordNet으로부터 차용한 의미 계층 구조에서 두 단어가 가지는 개념 사이의 거리에 의해 계산된다. 최대 유사도를 계산하는 과정에서는 단서들의 중의성을 점차 줄여 나감으로써 유사도 계산의 속도를 향상시킬 수 있다. 대상 명사가 둘 이상의 국소문맥을 가질 때에는 각 국소문맥의 종류에 따른 가중치를 부여하여 국소문맥의 종류에 따른 의미제약의 차이를 구현하였다. 또 하나의 지식원으로서 사전 정의와 예문으로부터 공기정보를 얻고, 이를 국소문맥을 보완하기 위한 지식으로 사용하여 최선의 의미를 선택할 수 있도록 하였다. 실험을 통해, 제안하는 방법은 국소 문맥의 적용률이 높고, 공기 정보는 국소 문맥과 상호 보완적으로 사용되어 정확도를 높일 수 있음을 보였다. 본 방법을 실험한 결과, 사용된 단어의 의미 중의성이 크면서도, 기존의 의미 부착 말뭉치를 이용한 교사 학습 방식의 성능보다도 높은 정확도(89.8%)를 얻을 수 있었다.

  • PDF

정책기반 RFID 데이터 관리 이벤트 정의 언어 (A Policy-driven RFID Data Management Event Definition Language)

  • 송지혜;김광훈
    • 인터넷정보학회논문지
    • /
    • 제12권1호
    • /
    • pp.55-70
    • /
    • 2011
  • 본 논문 에서는 기존의 대표적인 RFID 미들웨어 표준인 RFID 응용 인터페이스 표준규격1)으로 적용가능한 정책 기반의 RFID 데이터 관리 이벤트 정의 언어를 제안한다. 즉, RFID 응용인터페이스는 RFID 미들웨어의 핵심 구성요소인 데이터관리 기능, 장치관리 기능, 장치인터페이스 기능, 정보보호관리 기능을 응용 프로그램에게 제공하기 위한 표준인터페이스이며, 본 논문에서 제안하는 언어는 그 중 RFID 미들웨어의 데이터관리 기능, 즉 이벤트관리 기능을 지원하기 위한 추상화된 인터페이스를 제공하는데 그 목적이 있다. 특히, 이벤트 제약조건을 정의하기 위한 정책의 개념은 RF 리더들로부터 읽혀지는 대용량의 태그데이터를 정제 또는 여과시키기 위한 이벤트 제약조건들을 정의하는 수단으로서 RFID 미들웨어의 기능에 대한 기술적 전문지식이 부족한 응용프로그램 개발자들이 자신의 응용영역을 쉽게 표현할 수 있을 뿐 만 아니라 고수준의 추상화된 인터페이스를 제공할 수 있는 매우 효과적인 수단이라고 할 수 있다. 결과적으로, 본 논문에서는 RFID 응용인터페이스의 상세표준규격으로 제정 될 수 있는 일명 rXPDL, XML기반의 RFID 데이터 관리 이벤트 정책 정의 언어 (rXPDL: XML-based RFID Data Management Event Policy Definition Language)를 정의하며, 이는 곧 정책기반 RFID 데이터 관리 응용인터페이스 정의 언어로서 국내외 표준 규격의 기반이 될 것으로 기대한다. 또한, rXPDL의 상세표준규격들은 유비쿼터스센서네트워크 미들웨어의 데이터 관리를 위한 표준규격으로서의 확장을 기대할 수도 있다.

LOD 클라우드에서의 연결정책 기반 동일개체 심층검색 및 정제 시스템 구현 (Implementation of Policy based In-depth Searching for Identical Entities and Cleansing System in LOD Cloud)

  • 김광민;손용락
    • 인터넷정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.67-77
    • /
    • 2018
  • 본 연구에서는 동일연결트리플들을 생성하는 대신 각 LOD마다 연결정책을 수립, 공개하고 검색 시점에서 참조하는 방식으로 개체간의 동일성을 파악하는 방안과 이러한 연결정책을 명세하기 위한 어휘를 제안하였다. 또한, 연졀정책이 운영되는 환경에서 여러 LOD들에 걸친 심층검색이 실질적으로 진행되는 것을 확인하기 위하여 PISC(Policy based In-depth Searching and Cleansing)을 구현하였으며 이를 Github에 공개하였다. LOD 클라우드는 여러 LOD들의 자발적인 참여로 이루어짐에 따라 검색된 개체들의 동일성에 대한 평가가 필요하다. 이에, PISC는 개체간 동일성 평가를 통하여 사용자가 요구한 동일수준 이상의 개체들로 정제된 검색결과를 제공한다. 검색결과로는 RDF로 모델링된 개체별 상세 검색내용과 이에 대한 의미적 구조인 온톨로지를 함께 제공된다. PISC에 대한 실험은 DBpedia의 5개 LOD를 대상으로 진행하였으며 소스와 타겟 RDF 트리플 목적어의 유사도를 0.9 정도로 요구할 경우 검색결과가 적절한 확장률과 포함률을 가지는 것으로 확인하였다. 또한, 연결정책에는 3개 이상의 타겟LOD를 명세할 경우 동일성이 충분히 검증된 개체들을 확보할 수 있는 것으로 확인하였다.

레이저레이더 시뮬레이션을 위한 3차원 데이터 모델의 성능 테스트 (Performance Tests of 3D Data Models for Laser Radar Simulation)

  • 김근한;김혜영;전철민
    • 대한공간정보학회지
    • /
    • 제17권3호
    • /
    • pp.97-107
    • /
    • 2009
  • 레이저레이더 탐색기를 장착한 유도무기를 개발하고 실험하기 위하여 실제로 레이저레이더 탐색기가 장착된 유도무기를 사용하기는 현실적으로 어렵다. 따라서 레이저레이더 탐색기를 사용하여 표적을 촬영한 것처럼 시뮬레이션 할 수 있는 컴퓨팅 환경을 구축해야 하며, 이를 위해서는 지표의 지형, 지물에 대한 3차원 모델이 필요하다. 또한 레이저레이더 시뮬레이션은 대용량 데이터를 다뤄야 하고 벽면의 재질이나 반사도와 같은 속성을 저장, 검색, 분석하여야 한다. 그러나 현재 사용되고 있는 대부분의 3차원 모델은 파일 기반의 데이터 구조를 가지고 있으며 토폴로지 구조를 가지고 있지 않고, 가시화에 중점을 두고 있다. 따라서 본 연구에서 테스트하고자 하는 레이저레이더 시뮬레이션에는 연산 속도나 가시화 성능 문제로 인하여 기존의 3차원 모델을 적용하기에는 한계가 있다. 이와 같은 문제를 해결하기 위해 본 연구에서는 공간 데이터베이스의 사용과 이를 위한 3차원 데이터 모델링 기법을 제시하였으며 이를 레이저레이더 시뮬레이션에 적용하였다. 기존에 연구되었던 3차원 모델은 서로 다른 목적에 맞도록 모델링 되었기 때문에 어떠한 모델이 레이저레이더 시뮬레이션에 가장 적합한 모델인지 알 수 없다. 따라서 본 연구에서는 레이저레이더 시뮬레이션을 위한 네 가지 종류의 3차원 데이터 모델을 정의하고 각각의 모델들에 대하여 성능 테스트를 수행하여 테스트 결과를 획득하였다. 네 가지 모델 중 레이저레이더 시뮬레이션에 가장 적합하다고 판단되는 Body-Face 모델을 선정하였다.

  • PDF

온톨로지 기반의 서비스 상호운용을 위한 협업 시스템 (An Ontology-based Collaboration System for Service Interoperability)

  • 황치곤;문석재;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.210-217
    • /
    • 2013
  • 기업의 업무 환경 변화에 따른 정보 시스템 간의 협업 개발은 기존 업무 서비스의 중복 및 유지보수 비용의 증가라는 문제가 발생한다. 이에 따라 웹 서비스는 동일한 비즈니스 도메인 내 서비스의 중복을 방지하고 이미 활용 중인 서비스를 위한 분산 컴퓨팅의 표준으로 제안되었으나, 웹 서비스가 필요로 하는 데이터가 규격화되어 있지 않기 때문에 사용자는 다양한 비즈니스 목적에 부합하는 서비스를 찾기 어렵다. 따라서 본 논문에서는 서비스 운용을 위한 온톨로지를 기반으로 한 협업 시스템을 구축한다. 온톨로지는 협업 처리를 위한 분산 시스템 환경 하에서 상호 의존적으로 존재하는 서비스를 찾아 융합 서비스를 지원할 수 있다. 협업 시스템의 역할은 온톨로지를 기반으로 서비스의 개발, 등록 및 호출하는데 사용 한다. 로컬 시스템은 서비스 프로파일을 통해 협업 지원을 요청한다. 협업 시스템은 해당 서비스 프로파일을 참조하여 개발을 지원하고, 온톨로지를 통해 실 데이터 간의 의미적 연관관계를 표현하며, 서비스에 포함된 인스턴스들에 대한 관계를 추론한다. 이를 바탕으로 여행 예약 서비스를 위한 협업 시스템에 적용한다. 그 결과로 협업 시스템에서 발생하는 데이터 충돌 문제를 해결하여 서비스를 효율적으로 관리할 수 있으며, 시스템 간의 매핑이 감소됨을 검증한다.