• 제목/요약/키워드: 데이터유사성

검색결과 1,578건 처리시간 0.034초

데이타 유사성 척도를 이용한 생산정보 데이타베이스의 분산 구조 설계 (A Database Design Method using a Data Similarity Metric: Its Application on Manufacturing Database)

  • 최태광;이준연;이국철;이춘열;김주현;이한표
    • 산업공학
    • /
    • 제8권3호
    • /
    • pp.269-278
    • /
    • 1995
  • 본 논문은 분산환경하에서 생산정보, 데이터 분석의 일 방안으로서 데이터의 관리 주체와 데이터들간의 유사성에 기초한 분산 기준을 제시한다. 제안된 분산기준은 데이터베이스 설계의 초기과정에서 네트워크 환경의 각 노드에서의 트랜젝션의 발생 수와 데이터 이용량의 예측이 용이하지 않은 경우에도 적용 가능하다는 점에서 가치를 지닌다. 제시된 설계 기준을 이용하여 생산정보 데이터베이스의 분산 모형을 설계, 제시한다.

  • PDF

콘텐트 노드의 유사성 제어를 통한 그래프 구조 데이터 검색의 다양성 향상 (Improving Diversity of Keyword Search on Graph-structured Data by Controlling Similarity of Content Nodes)

  • 박창섭
    • 한국콘텐츠학회논문지
    • /
    • 제20권3호
    • /
    • pp.18-30
    • /
    • 2020
  • 최근 소셜 네트워크, 시맨틱 웹 등 여러 분야에서 그래프 구조 데이터가 널리 사용됨에 따라 대량의 그래프 데이터에 대한 효과적이고 효율적인 검색 방법의 필요성이 커지고 있다. 기존 키워드 기반 검색 방법들은 대부분 주어진 질의에 대한 연관도만을 고려하여 결과를 구한다. 그러나 이런 방법은 질의 연관도는 높지만 콘텐트 노드들을 공유하는 유사한 결과들이 함께 선택될 가능성이 높다. 이런 문제점을 개선하기 위해 본 논문에서는 키워드 질의에 대한 답 트리에 포함된 콘텐트 노드들의 유사성을 제어하여 콘텐트 노드가 다양한 답 트리들을 구하는 top-k 검색 방법을 제안한다. 다양한 답 트리 집합의 기준을 정의하고, 다양한 top-k 결과 집합을 구하기 위한 두 가지 방법으로 점진적 나열 알고리즘과 A 탐색 기법을 이용한 휴리스틱 탐색 알고리즘을 설계한다. 또 휴리스틱 탐색의 성능을 높이기 위한 개선 방법을 제시한다. 실 데이터를 이용한 성능 실험 결과를 통해, 본 논문에서 제안한 휴리스틱 탐색 방법이 질의 연관성뿐만 아니라 콘텐트 노드들의 상이도가 높은 다양한 답 트리들을 효율적으로 구할 수 있음을 보인다.

대규모 이미지 데이터베이스에서 고차원 색인 구조를 이용한 효율적인 내용 기반 검색 시스템 (An Efficient Content-based Retrieval System using High-Dimensional Index Structure Image Database)

  • 이동호;박주홍;정진완;김형
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권1호
    • /
    • pp.52-65
    • /
    • 1999
  • 이미지나 비디오, 오디오와 같이 멀티미디어 데이터들은 기존의 단순한 텍스트 기반의 데이터에 비하여 대용량적인 특성과 비정형적인 특성을 가지고 있어서 검색시 많은 어려움이 따른다. 본 논문에서는 대규모의 이미지 데이터베이스에서 효율적이고 신속하게 사용자가 원하는 이미지를 검색할수 있는 내용 기반 검색 시스템을 제시한다. 이를 위해서 본 논문에서는 최근 여러 장점으로 인하여 신호 분석이나 이미지 압축 분야에 많이 사용되는 웨이브릿 변환을 이용하여 이미지 데이터로부터 내용 기반 검색에 사용되는 특징 벡터를 효율적으로 추출하는 기법과 유사성 측정 방법을 제안한다. 그리고, 이러한 특징 추출방법과 유사성 측정 방법을 이용하여 내용 기반 질의 및 검색을 수행할 경우, 검색 조건을 만족하는 객체인데 실수로 검색해내지 못하는 경우인 false dismissals 이 발생하지 않음을 보인다. 또한 대규모 이미지 데이터베이스에서 신속한 내용 기반 검색을 지원하기 위하여 고차원 데이터에 대한 효율적인 색인을 제공하는 X-tree를 이용한 이미지 색인 방법을 보이며 이것이 기존의 순차 검색이나 R*-tree를 이용한 색인 방법보다 신속하게 이미지 데이터들을 검색할 수 있다는 것을 다양한 실험을 통해 보인다. 마지막으로 QBIC에서 제안한 검색 적합성 측정 방법을 이용하여 본 논문에서 제안하는 내용 기반 이미지 검색시스템의 검색 적합성을 보인다.

데이터 변형성 기반 유사성 연결을 위한 단어 추천 알고리즘 (Words Recommendation Algorithm for Similarity Connection based on Data Transmutability)

  • 김분희
    • 한국전자통신학회논문지
    • /
    • 제8권11호
    • /
    • pp.1719-1724
    • /
    • 2013
  • 기존의 데이터 처리 방식과는 다른 접근이 필요한 빅데이터는 데이터의 분량, 데이터의 변화 속도, 데이터의 다양성의 특징을 가진 비정형 데이터이다. 트위터의 트윗(tweet)이 국내만 보더라도 하루 500만건이 넘는 상황이다. 이렇게 많은 데이터는 저렴해진 저장시스템과 분석정보에 대한 수요 증대로 인해 연구가치가 높아지고 있다. 본 논문에서는 이러한 기술에서 요구되는 요소 기술로써 데이터 변형성의 특징을 기반으로 우선순위기반 단어 추천 알고리즘을 제안한다.

모션캡쳐 DB를 이용한 휴머노이드 로봇의 상체 동작 재생성 (Regeneration of Upper-body Motion of Humanoid Robot Using Human Motion Capture Data)

  • 김승수;김창환;박종현;유범재
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 제37회 하계학술대회 논문집 D
    • /
    • pp.1935-1936
    • /
    • 2006
  • 인간과 의사소통 및 상호작용함에 있어 휴머노이드 로봇은 그 외형이 인간에게 친숙해야 할 뿐만 아니라 그 행동역시 인간과 유사해야 한다. 인간의 상체 동작과 유사한 동작은 인간과의 의사소통에 있어 매우 중요하다. 인간의 동작과 유사한 동작을 수학적인 식을 통하여 생성해 내기는 매우 힘들다. 수학적 모델을 개발하려는 노력과는 달리 최근에는 모션캡쳐 장비로부터 동작데이터를 획득하고, 그 데이터를 휴머노이드 로봇에 입력하는 연구가 진행되어왔다. 하지만, 로봇과 인간이 의사소통함에 있어서 필요한 모든 데이터를 모션캡쳐 장비로 획득하여 저장해 놓기는 불가능 하다. 또한, 동작을 통하여 의미를 전달하는 의사소통의 경우에 상대방과 분위기에 따라 동작의 방향이나 크기를 달리할 필요가 있다. 이 논문에서는 의미가 있는 동작을 모션캡쳐 장비로부터 획득하고, 휴머노이드 로봇에 맞게 변환한 다음, 그 데이터를 상황에 맞게 실시간으로 변형하는 방법을 제안한다. 제안한 방법을 몇가지 동작에 적용하여 그 실효성을 검정하였다.

  • PDF

딥러닝을 이용한 법률 분야 한국어 의미 유사판단에 관한 연구 (Deep Learning Based Semantic Similarity for Korean Legal Field)

  • 김성원;박광렬
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권2호
    • /
    • pp.93-100
    • /
    • 2022
  • 기존의 데이터 검색 방법으로는 키워드 중심의 검색 방법이 주로 사용되나, 이는 전문적인 용어가 많이 쓰이는 법률 분야의 검색 방법으로는 적합하지 않다. 이에 대해 본 논문에서는 법률 분야의 효과적인 데이터 검색 방안을 제안한다. 법률 도메인의 자연어처리 분야에서 문장 간의 유사성을 판단하는 데 최적화된 임베딩 방법에 관하여 서술한다. 법률문장을 TF-IDF를 이용하여 키워드 기반으로 임베딩하거나 Universal Sentence Encoder를 이용하여 의미 기반으로 임베딩을 한 후, BERT모델을 결합하여 법률 분야에서 문장 간 유사성을 검사하여 데이터를 검색하는 최적의 방안을 제안한다.

유사도와 유클리디안 계산패턴을 이용한 CBR 패턴연구 (A Study on the CBR Pattern using Similarity and the Euclidean Calculation Pattern)

  • 윤종찬;김학철;김종진;윤성대
    • 한국정보통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.875-885
    • /
    • 2010
  • 사례기반추론(CBR:Case-Based Reasoning)은 기존 데이터와 사례 데이터들의 관계성을 추론하는 기법으로 유사도(Similarity)와 유클리디안(Euclidean) 거리 계산 방법이 가장 많이 사용되고 있다. 그러나 이 방법들은 기존 데이터와 사례 데이터를 모두 비교하기 때문에 데이터 검색과 필터링에 많은 시간이 소요되는 단점이 있다. 따라서 이를 해결하기 위한 다양한 연구들이 진행되고 있다. 본 논문에서는 기존의 유사도와 유클리디안 계산과정에서 발견된 패턴을 활용한 SE(Speed Euclidean-distance) 계산방법을 제안한다. SE 계산방법은 새로운 사례입력에 발견된 패턴과 가중치를 적용하여 빠른 데이터 추출과 수행시간 단축으로 시간적 공간적 제약사항에 대한 연산 속도를 향상시키고 불필요한 연산 수행을 배제하는 것이다. 실험을 통해 유사도나 유클리디안 방법으로 데이터를 추출하는 기존의 방법보다 제안하는 방법이 다양한 컴퓨터 환경과 처리 속도에서 성능이 향상됨을 확인할 수 있었다.

제한적 인지 데이터에 기초한 에이전트 움직임-데이터 궤적의 인간다움 (Human-likeness of an Agent's Movement-Data Loci based on Realistically Limited Perception Data)

  • 한창희;김원일
    • 전자공학회논문지CI
    • /
    • 제47권4호
    • /
    • pp.1-10
    • /
    • 2010
  • 본 논문의 목적은 제한적 인지에 기초한 가상인간 에이전트의 움직임-데이터 궤적이 인간과 유사하다는 것을 보이는 것이다. 이 움직임-데이터 궤적의 인간 유사성을 결정하기 위해서, 우리는 두 파라미터들 -사실적으로 제한된 인지(RLP: Realistically Limited Perception) 데이터와 점증적 움직임 경로 데이터의 생성 (IMPG: Incremental Movement-Path Generation)- 사이의 상호작용을 활용한다. 즉, 어떻게 전자인 인간사고 혹은 그 구성요소의 모의 파라미터(즉 RLP 데이터)가 후자인 인간 움직임-데이터 궤적의 모의 파라미터(즉 IMPG 데이터)를 지배하는지를 에이전트 움직임-데이터 궤적에서 고찰하는 것이다. 지도 제작 DB는 인지와 움직임 경로-데이터 생성 사이의 인터페이스이므로, 에이전트에게 항해를 위해 필요한 선결 요소이다. Hill과 동료들에 의해 RLP에 의한 지도 DB 제작은 연구되었지만, 이러한 기존의 연구들은 단지 렌더링 카메라의 시점 데이터의 변화에 의해서만 수행되었다. 이에 비해 본 논문에서는 Hill의 지도 DB 제작 모듈을 에이전트 시스템에 통합하여 예기치 않은 적 출현을 수반한 정찰 임무 상에서 두 파라미터 데이터간의 상호작용을 고찰하였다. 인간 피실험자와 에이전트에 의해 생성된 움직임 데이터의 궤적들이 서로 비교되었다. 비록 에이전트 움직임-데이터 궤적의 인간유사성이 두개의 파라미터 데이터들(즉 RLP와 IMPG)과 단지 30명의 피실험자들로 얻어진 파일럿실험(pilot-test)의 결과이지만, 본 연구의 에이전트 시스템은 인간과 유사한 움직임-데이터를 생성하기 위한 최소한의 기능적인 테스트베드(functional testbed)가 될 수 있음을 입증하였다.

딥러닝을 활용한 전시 정원 디자인 유사성 인지 모형 연구 (Development of Deep Recognition of Similarity in Show Garden Design Based on Deep Learning)

  • 조우윤;권진욱
    • 한국조경학회지
    • /
    • 제52권2호
    • /
    • pp.96-109
    • /
    • 2024
  • 본 연구는 딥러닝 모델 중 VGG-16 및 ResNet50 모델을 활용하여 전시 정원의 유사성 평가 방법을 제시하는 것에 목적이 있다. VGG-16과 ResNet50 모델을 기반으로 전시 정원 유사성 판단을 위한 모형을 개발하였고, 이를 DRG(deep recognition of similarity in show garden design)모형이라 한다. 평가를 위한 방법으로 GAP와 피어슨 상관계수를 활용한 알고리즘을 사용하여 모형을 구축하고 1순위(Top1), 3순위(Top3), 5순위(Top5)에서 원본 이미지와 유사한 이미지를 도출하는 총 개수 비교로 유사성의 정확도를 분석하였다. DRG 모형에 활용된 이미지 데이터는 국외 쇼몽가든페스티벌 전시 정원 총 278개 작품과 국내 정원박람회인 서울정원박람회 27개 작품 및 코리아가든쇼 전시정원 이미지 17개 작품이다. DRG모형을 활용하여 동일 집단과 타 집단간의 이미지 분석을 진행하였고, 이를 기반으로 전시 정원 유사성의 가이드라인을 제시하였다. 첫째, 전체 이미지 유사성 분석은 ResNet50 모델을 기반으로 하여 데이터 증강 기법을 적용하는 것이 유사성 도출에 적합하였다. 둘째, 내부 구조와 외곽형태에 중점을 둔 이미지 분석에서는 형태에 집중하기 위한 일정한 크기의 필터(16cm × 16cm)를 적용하여 이미지를 생성하고 VGG-16 모델을 적용하여 유사성을 비교하는 방법이 효과적임을 알 수 있었다. 이때, 이미지 크기는 448 × 448 픽셀이 효과적이며, 유채색의 원본 이미지를 기본으로 설정함을 제안하였다. 이러한 연구 결과를 토대로 전시 정원 유사성 판단에 대한 정량적 방법을 제안하고, 향후 다양한 분야와의 융합 연구를 통해 정원 문화의 지속적인 발전에 기여할 것으로 기대한다.

이동 경로 데이터에 기반한 이동 객체의 시공간 위치 예측 기법 (A Spatiotemporal Location Prediction Method of Moving Objects Based on Path Data)

  • 윤태복;박교현;이지형
    • 한국지능시스템학회논문지
    • /
    • 제16권5호
    • /
    • pp.568-574
    • /
    • 2006
  • 사용자에게 적응된 서비스를 제공하기 위하여 환경으로부터 얻어지는 다양한 형태의 데이터를 이용한 다양한 방법이 연구되고 있다. 그 중 과거 이동 경로 자료는 사용자의 현재 이동 위치를 예측하고 이와 관련된 서비스를 제공하는데 유용하게 사용될 수 있다. 본 논문에서는 사용자의 과거 이동 경로의 분석을 통하여 이동중인 사용자의 시공간 위치예측 기술을 제안한다. 환경으로부터 발생한 사용자의 이동 경로를 수집하고, 수집된 데이터에서 이동 경로 선택(Path Selection) 방법을 이용한다. 이동 경로 선택 방법은 이동 중에 발생한 경로의 거리, 시간, 방향의 요소와 동적정합법을 사용하여 유사성(Similarity)을 측정하며 유사성이 가장 높은 경로를 선택한다. 선택된 경로는 시간에 따른 공간 정보 및 위치에 따른 시간 예측 서비스를 위하여 사용가능 하며, 실험을 통하여 유사성이 높은 이동 경로를 선택하는 모습을 확인하였다.