• 제목/요약/키워드: 구조적 질의어

검색결과 120건 처리시간 0.023초

멀티모달 개념계층모델을 이용한 만화비디오 컨텐츠 학습을 통한 등장인물 기반 비디오 자막 생성 (Character-based Subtitle Generation by Learning of Multimodal Concept Hierarchy from Cartoon Videos)

  • 김경민;하정우;이범진;장병탁
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.451-458
    • /
    • 2015
  • 기존 멀티모달 학습 기법의 대부분은 데이터에 포함된 컨텐츠 모델링을 통한 지식획득보다는 이미지나 비디오 검색 및 태깅 등 구체적 문제 해결에 집중되어 있었다. 본 논문에서는 멀티모달 개념계층모델을 이용하여 만화 비디오로부터 컨텐츠를 학습하는 기법을 제안하고 학습된 모델로부터 등장인물의 특성을 고려한 자막을 생성하는 방법을 제시한다. 멀티모달 개념계층 모델은 개념변수층과 단어와 이미지 패치의 고차 패턴을 표현하는 멀티모달 하이퍼네트워크층으로 구성되며 이러한 모델구조를 통해 각각의 개념변수는 단어와 이미지패치 변수들의 확률분포로 표현된다. 제안하는 모델은 비디오의 자막과 화면 이미지로부터 등장 인물의 특성을 개념으로서 학습하며 이는 순차적 베이지안 학습으로 설명된다. 그리고 학습된 개념을 기반으로 텍스트 질의가 주어질 때 등장인물의 특성을 고려한 비디오 자막을 생성한다. 실험을 위해 총 268분 상영시간의 유아용 비디오 '뽀로로'로부터 등장인물들의 개념이 학습되고 학습된 모델로부터 각각의 등장인물의 특성을 고려한 자막 문장을 생성했으며 이를 기존의 멀티모달 학습모델과 비교했다. 실험결과는 멀티모달 개념계층모델은 다른 모델들에 비해 더 정확한 자막 문장이 생성됨을 보여준다. 또한 동일한 질의어에 대해서도 등장인물의 특성을 반영하는 다양한 문장이 생성됨을 확인하였다.

대추의 성숙중에 일어나는 연화현상에 관한 연구

  • 손미애;김광수
    • 한국식품저장유통학회:학술대회논문집
    • /
    • 한국식품저장유통학회 1994년도 정기총회 및 제4차 학술발표회
    • /
    • pp.23-24
    • /
    • 1994
  • 본 연구는 성숙과의 저장중에 세포벽분해효소가 세포벽을 분해해서 물성의 변화를 유발함으로 일어나는 과실의 연과가 품질과 저장성의 저하 뿐만 아니라 영양적, 경제적 손실을 초래한다는 점을 고려하여 대추의 성숙중에 일어나는 연화현상을 연구하고자 성숙에 따른 경도, 세포벽분해효소의 활성, 세포벽 다당류 pectin질, 비섬유성 중성당 및 조직의 변화를 조사하였다. 경도는 대추의 숙성에 따라 감소하였고, polygalacturonase와 $\beta$-galactosidase의 활성은 각각 변색기와 완숙기에 나타난 이후 급격히 증가하였다. 세포벽 다당류인 pectin질과 알칼리 지용성 hemicellulose는 완숙기가지 증가햐였으나 cellulose는 완숙기에 산가용성 hemicellulose와 cellulose를 제외한 세포벽 다당류의 함량은 다소 감소하였다. 대추의 세포벽 비섬유성 중성당으로 rhamnose, arabinose, xylose, mannose, galactose, glucose가 동정되었고, 성숙동안에 pectin질에서는 arabinose, mannose, galactose와 총 비섬유성 중성당의 함량이 감소하였고, 산가용성 hemicellulose에서는 xylose와 mannose가 뚜렸하게 증가하였으나 중성당은 변화없었으며, 알칼리 가용성 hemicellulose에서는 성숙에 따른 변화가 거의 없었다. pectin질의 경우 수용성 pectin, EDTA 용해성 pectin 및 총 pectin은 성숙중에 증가하는 경향이있으나 불용성 pectin은 감소하는 경향이였으며 과숙기에는 불용성 psctin EDTA용해성 pectin 및 총 pectin의 함량은 모두 현저히 감소하였다. 대추의 성숙중 조직에서는 pectin질로 구성된 중충의 붕괴현상이 뚜렸하게 나타났다.발이 절실히 필요한 실정이다. 이러한 배경으로 본 강연에서는 효소적갈변 저해제의 개발과 그들의 식품가공에의 적용 현환 및 화장품, 의약품으로의 응용에 대해 설명하고자 한다.L주에 비해 S주는 수정후 용과가 더 심하다. 9) 화분관의 행동은 수정력과 완전히 일치된다. 즉 L-selfing, $L{\times}L$, S-selfing, $S{\times}S$등의 부적법 수분에서는 화분관은 화주의 미중에서 정지되지만 $L{\times}S$, $S{\times}L$,에서는 수분 약 40-50분 후이면 화분관은 자방까지 도달된다. 10) S주는 웅본으로 오인되어 있지만 인위적법수분을 하면 수정력이나 화분관의 행동은 L주에서와 동일하다. 11) S화분은 완전하지만 L화분은 약 70%가 내용공허한 Adortive pollen 이다. 12) L화분중 나머지 30%도 S화분에 비해서 염색도가 낮은것이 많고 S화분 같이 농염되는 것은 극히 소수이다. 13) 본장물은 분화가 고도로 진행된 전형적인 이형예작물이여 마치 Dimorphism 에서 Dioecious 에로 이행되는 수가 있다는 것을 표시하는 증거가 되는 것 같다. 다소 높은 산소농도 3%~5% 이산화탄소 농도 5~8%에서 저장하는 것이 효과적일 것으로 판단되었다.철쭉군목으로 대표되나 군단이 하의 군목들은 다소 차이를 보이는 것으로 나타났다. 중간상인이론의 수정이 필요하다고 본다.가\ulcorner 본 논문에서는 표면적 형태에도 불구하고 [-wh]의미의 겹의문사는 병렬적 관계의 합성어가 아니라 내부구조를 지니지 않은 단순한 단어(minimal $X^{0}$ elements)로 가정한다. 즉, [+wh] 의미의 겹의문사는 동일한 구성요 소를 지닌 병렬적 합성어([

  • PDF

과학기술 핵심개체 인식기술 통합에 관한 연구 (A Study on the Integration of Recognition Technology for Scientific Core Entities)

  • 최윤수;정창후;조현양
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.89-104
    • /
    • 2011
  • 대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

단일머신 환경에서의 논리적 프로그래밍 방식 기반 대용량 RDFS 추론 기법 (Scalable RDFS Reasoning using Logic Programming Approach in a Single Machine)

  • 바트셀렘 작바랄;김제민;이완곤;박영택
    • 정보과학회 논문지
    • /
    • 제41권10호
    • /
    • pp.762-773
    • /
    • 2014
  • 시맨틱 웹상에서 RDFS로 표현된 데이터의 사용 증가로 인하여, 대용량 데이터의 추론에 대한 많은 요구가 생겨나고 있다. 많은 연구자들은 대용량 온톨로지 추론을 수행하기 위해서 하둡과 같은 고가의 분산 프레임워크를 활용한다. 그러나, 적절한 사이즈의 RDFS 트리플 추론을 위해서는 굳이 고가의 분산 환경 시스템을 사용하지 않고 단일 머신에서도 논리적 프로그래밍을 이용하면 분산 환경과 유사한 추론 성능을 얻을 수 있다. 본 논문에서는 단일 머신에 논리적 프로그래밍 방식을 적용한 대용량 RDFS 추론 기법을 제안하였고 다중 머신을 기반으로 한 분산 환경 시스템과 비교하여 2억개 정도의 트리플에 대한 RDFS 추론 시스템을 적용한 경우 분산환경과 비슷한 성능을 보이는 것을 실험적으로 증명하였다. 효율적인 추론을 위해 온톨로지 모델을 세부적으로 분리한 메타데이터 구조와 대용량 트리플의 색인 방안을 제안하고 이를 위해서 전체 트리플을 하나의 모델로 로딩하는 것이 아니라 각각 온톨로지 추론 규칙에 따라 적절한 트리플 집합을 선택하였다. 또한 논리 프로그래밍이 제공하는 Unification 알고리즘 기반의 트리플 매칭, 검색, Conjunctive 질의어 처리 기반을 활용하는 온톨로지 추론 방식을 제안한다. 제안된 기법이 적용된 추론 엔진을 LUBM1500(트리플 수 2억개) 에 대해서 실험한 결과 166K/sec의 추론 성능을 얻었는데 이는 8개의 노드(8 코아/노드)환경에서 맵-리듀스로 수행한 WebPIE의 185K/sec의 추론 속도와 유사함을 실험적으로 증명하였다. 따라서 단일 머신에서 수행되는 본 연구 결과는 트리플의 수가 2억개 정도까지는 분산환경시스템을 활용하지 않고도 분산환경 시스템과 비교해서 비슷한 성능을 보이는 것을 확인할 수 있었다.

상접한 공간 객체의 무결성 지원을 위한 공간 연산 트리거의 설계 및 구현 (Design and Implementation of a Spatial-Operation-Trigger for Supporting the Integrity of Meet-Spatial-Objects)

  • 안준순;조숙경;정보흥;이재동;배해영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권2호
    • /
    • pp.127-140
    • /
    • 2002
  • 공간 데이타베이스 시스템에서 데이타베이스의 일관성 유지를 위해 의미적 무결성을 지원해야 한다. 실세계의 경계(boundary) 레이어에서 경계는 주위의 공간 객체들과 항상 접해 있어야만 하는 상접(meet)한 성질과 두개 이상의 다른 공간 객체가 동일한 이름을 가질 수 없는 성질을 가진다. 이 성질은 실세계에서 묵시적으로 인지되는 개념이다. 따라서 공간 객체의 갱신으로 인해 레이어에 대한 묵시적인 개념이 위배될 경우 무결성 유지가 필요하다. 따라서 본 논문에서는 이 레이어에 대한 공간 객체의 무결성을 유지하기 위한 공간 연산 트리거를 제안한다. 제안한 기법은 SQL-3를 기반으로 공간 연산 트리거 정의어를 정의하고, 레이어에 대한 무결성 제약조건이 위배될 때 수행되며, 공간 연산 트리거 수행 전략으로 동일 레이어에 대한 공간과 비공간 데이타 트리거로 나누어 수행되고, 다른 레이어에 대한 비공간 데이타 트리거를 수행하는 기법이다. 공간 연산 트리거 관리기는 사용자에게 의해 정의된 공간 연산 트리거 정의어는 공간 연산 트리거 처리기를 통해 파스트리를 생성하여 카탈로그 관리기를 통하여 데이타베이스에 저장되며, 갱신 질의시 공간 연산 트리거 수행 처리기를 통해 공간 데이타베이스의 일관성을 유지시켜주는 구조를 가지고 있다. 공간 연산 트리거는 상접성을 유지해야 하는 공간 객체들의 의미적 무결성을 위해 공간과 비공간 데이타에 대하여 3 단계 수행으로 공간 객체에 대한 의미적 무결성 유지와 자동 보정으로 사용자 편의성을 제공한다.

적응형 웹 서핑 지원을 위한 에이전트 시스템 (An Agent System for Supporting Adaptive Web Surfing)

  • 국형준
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.399-406
    • /
    • 2002
  • 본 연구는 웹 서핑 지원을 위한 적응형 사용자 에이전트의 설계를 위해 사용자 데이터 수집, 데이터 처리를 통한 사용자 프로파일 구축 및 개선, 그리고 사용자 프로파일의 적용을 통한 적응 등 세 가지 이슈를 집중 연구하였다. 그 결과 웹 상에서 작동하는 적응형 사용자 에이전트를 위한 기능 정의 및 주요 구성 요소들을 설계하고 세부 모형을 구현하였다. 내부적으로는 두 개의 독립된 에이전트의 협동 체제에 의해 작업 목표를 성취한다. 이들은 각각 IIA(Interactive Interface Agent) 및 UPA(User Profiling Agent)이다. 사용자 인터페이스를 관장하는 IIA는 사용자에게 현재 웹 문서의 대강을 파악하고 나아가서 검색 질의어를 선택할 수 있게 하는 키워드 색인(Keyword Index)과, 계층 구조 방식의 사용자 검색 과정을 나타내는 제안 링크(Suggest Link)를 제공함으로서 사용자 친숙한 인터페이스 환경을 제시한다. UPA는 사용자에 관한 정적 정보와 브라우징 행위에서 나타나는 동적 정보를 사용자 프로파일에 반영한다. 특히, 사용자 관심을 반영하는 관심 벡터(Interest Vector)의 개념을 정립하고 근접도(similarity) 평가에 의해 이들을 갱신하고 추가함으로써 사용자 관심을 동적으로 프로파일링하는 체계를 제시하였다.

한국어 음성인식 성능향상을 위한 문맥의존 음향모델에 관한 연구 (A Study-on Context-Dependent Acoustic Models to Improve the Performance of the Korea Speech Recognition)

  • 황철준;오세진;김범국;정호열;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.9-15
    • /
    • 2001
  • 본 연구에서는 한국어 음성인식 성능향상을 위한 문맥의존 음향 모델을 개선하기 위하여 한국어 음성학적 지식과 결정트리를 접목한 음소결정트리 기반 상태분할 알고리즘으로 한국어에 적합한 문맥의존 음향 모델에 관해 고찰한다. HMM (Hidden Markov Model)의 각 상태를 네트워크로 연결하여 문맥의존 음향모델로 표현하는 HM-Net(Hidden Markov Network)이 있는데 이는 SSS(Successive State Splitting) 알고리즘으로 작성한다. 이 방법은 음향 모델의 상태공유관계와 모델의구조를 결정하는데 효율적이지만 모델을 학습할때 문맥환경에 따라 출현하지 않는 문맥이 존재하는 문제점이 있다 본 연구에서는 이러한 문제점을 해결하기 위해 2진 결정트리와 SSS 알고리즘의 장점을 결합하여 문맥방향 상태분할을 수행할 때 각 노드에서 한국어 음성학적 지식으로 구성된 음소 질의어에 따라 상태분할 하는 방법으로서 PDT-SSS(Phonetic Decision Tree-based SSS) 알고리즘을 적용한다. 적용한 방법으로 작성한 문맥의존 음향 모델의 유효성을 확인하기 위해 국어공학센터 (KLE)m이 452 단어와 항공편 예약관련 200문장(YNU 200)에 대해 화자독립 음소, 단어 및 연속음성인식 실험을 수행하였다. 인식실험결과, 문맥 의존 음향모델에 대한 화자독립 음소, 단어 및 연속음성 인식실험에서 기존의 단일 HMM 모델보다 향상된 인식률을 보여, 한국어에 적합한 문맥의존 음향 모델을 작성하는데 한국어 음성학적 지식과 음소결정트리 기반 상태분할 알고리즘이 유효함을 확인하였다.

  • PDF

적응형 사용자 프로파일기법과 검색 결과에 대한 실시간 필터링을 이용한 개인화 정보검색 시스템 (PIRS : Personalized Information Retrieval System using Adaptive User Profiling and Real-time Filtering for Search Results)

  • 전호철;최중민
    • 지능정보연구
    • /
    • 제16권4호
    • /
    • pp.21-41
    • /
    • 2010
  • 본 논문은 다양한 사용자의 개인적 검색요구를 충족시키지 못하는 기존 검색시스템의 문제점을 해결하기 위해 사용자의 묵시적 피드백을 이용한 적응형 사용자 기호정보 기반의 개인화 검색을 실현하고, 검색결과에 대한 실시간 필터링을 통해 사용자에게 적합한 검색 결과를 제공하는 시스템을 제안한다. 기존의 검색 시스템들은 검색의도의 불확실성 때문에 사용자의 검색실패율이 높다. 검색 의도의 불확실성은 동일한 사용자가 "java"와 같은 다의어에 대해 동일한 질의어를 사용하더라도 다른 검색 결과를 원할 수 있다는 것이며, 단어의 수가 적을수록 불확실성은 가중될 것이다. 실시간 필터링은 사용자의 도메인 지정여부에 따라 주어진 도메인에 해당하는 웹문서들만 추출하거나, 적절한 도메인을 추론하고 해당하는 웹문서들만 검색 결과로 보여주는 것으로, 일반적인 디렉토리 검색과 유사하지만 모든 웹문서에 대해 이루어진다는 것과 실시간으로 분류된다는 것이 다르다. 실시간 필터링을 개인화에 활용함으로써 검색 결과의 수를 줄이고 검색만족도를 개선했다. 본 논문에서 생성한 기호정보파일은 계층적 구조로 이루어지며, 상황정보의 반영이 가능하기 때문에 의도의 불확실성을 해결 할 수 있다. 또한 사용자의 도메인별 웹문서 검색 동작을 효과적으로 추적(track) 할 수 있으며, 사용자의 기호 변화를 적절하게 알아낼 수 있다. 각 사용자 식별을 위해 IP address를 사용했으며, 기호정보파일은 사용자의 검색 행동에 대한 관찰을 기반으로 지속적으로 갱신된다. 또한 사용자의 검색결과에 대한 행동 관찰을 통해, 사용자 기호를 인지하고, 기호정보를 동적으로 반영했으며, 검색결과에 대한 만족도를 측정했다. 기호정보파일과 반영비율은 사용자가 검색을 수행할 때 시스템에 의해 생성되거나 갱신된다. 실험결과 적응형 사용자 기호정보파일과 실시간 필터링을 함께 사용함으로써, 상위 10개의 검색결과 중 평균 4.7개의 결과들에 대해 만족하는 것으로 나타났으며, 이는 구글의 결과에 비해 약 23.2% 향상된 만족도를 나타내었다.

FCA 기반 계층적 구조를 이용한 문서 통합 기법 (Methods for Integration of Documents using Hierarchical Structure based on the Formal Concept Analysis)

  • 김태환;전호철;최종민
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.63-77
    • /
    • 2011
  • 월드와이드웹(World Wide Web)은 인터넷에 연결된 컴퓨터를 통해 사람들이 정보를 공유할 수 있는 매우 큰 분산된 정보 공간이다. 웹은 1991년에 시작되어 개인 홈페이지, 온라인 도서관, 가상 박물관 등 다양한 정보 자원들을 웹으로 표현하면서 성장하였다. 이러한 웹은 현재 5천억 페이지 이상 존재할 것이라고 추정한다. 대용량 정보에서 정보를 효과적이며 효율적으로 검색하는 기술을 적용할 수 있다. 현재 존재하는 몇몇 검색 도구들은 초 단위로 gigabyte 크기의 웹을 검사하여 사용자에게 검색 정보를 제공한다. 그러나 검색의 효율성은 검색 시간과는 다른 문제이다. 현재 검색 도구들은 사용자의 질의에 적합한 정보가 적음에도 불구하고 많은 문서들을 사용자에게 검색해준다. 그러므로 대부분의 적합한 문서들은 검색 상위에 존재하지 않는다. 또한 현재 검색 도구들은 사용자가 찾은 문서와 관련된 문서를 찾을 수 없다. 현재 많은 검색 시스템들의 가장 중요한 문제는 검색의 질을 증가 시키는 것이다. 그것은 검색된 결과로 관련 있는 문서를 증가시키고, 관련 없는 문서를 감소시켜 사용자에게 제공하는 것이다. 이러한 문제를 해결하기 위해 CiteSeer는 월드와이드웹에 존재하는 논문에 대해 한정하여 ACI(Autonomous Citation Indexing)기법을 제안하였다. "Citaion Index"는 연구자가 자신의 논문에 다른 논문을 인용한 정보를 기술하는데 이렇게 기술된 논문과 자신의 논문을 연결하여 색인한다. "Citation Index"는 논문 검색이나 논문 분석 등에 매우 유용하다. 그러나 "Citation Index"는 논문의 저자가 다른 논문을 인용한 논문에 대해서만 자신의 논문을 연결하여 색인했기 때문에 논문의 저자가 다른 논문을 인용하지 않은 논문에 대해서는 관련 있는 논문이라 할지 라도 저자의 논문과 연결하여 색인할 수 없다. 또한 인용되지 않은 다른 논문과 연결하여 색인할 수 없기 때문에 확장성이 용이하지 못하다. 이러한 문제를 해결하기 위해 본 논문에서는 검색된 문서에서 단락별 명사와 동사 및 목적어를 추출하여 해당 동사가 명사 및 목적어를 취할 수 있는 가능한 값을 고려하여 하나의 문서를 formal context 형태로 변환한다. 이 표를 이용하여 문서의 계층적 그래프를 구성하고, 문서의 그래프를 이용하여 문서 간 그래프를 통합한다. 이렇게 만들어진 문서의 그래프들은 그래프의 구조를 보고 각각의 문서의 영역을 구하고 그 영역에 포함관계를 계산하여 문서와 문서간의 관계를 표시할 수 있다. 또한 검색된 문서를 트리 형식으로 보여주어 사용자가 원하는 정보를 보다 쉽게 검색할 수 있는 문서의 구조적 통합 방법에 대해 제안한다. 제안한 방법은 루씬 검색엔진이 가지고 있는 순위 계산 공식을 이용하여 문서가 가지는 중요한 단어를 문서의 참조 관계에 적용하여 비교하였다. 제안한 방법이 루씬 검색엔진보다15% 정도 높은 성능을 나타내었다.

다중 해시 조인의 파이프라인 처리에서 분할 조율을 통한 부하 균형 유지 방법 (A Load Balancing Method using Partition Tuning for Pipelined Multi-way Hash Join)

  • 문진규;진성일;조성현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제29권3호
    • /
    • pp.180-192
    • /
    • 2002
  • Shared nothing 다중 프로세서 환경에서 조인 어트리뷰트의 자료 불균형(data skew)이 파이프라인 해시 조인 연산의 성능에 주는 영향을 연구하고, 자료 불균형을 대비하여 적재부하를 Round-robin 방식으로 정적 분할하는 방법과 자료분포도를 이용하여 동적 분할하는 두 가지 파이프라인 해시 조인 알고리즘을 제안한다. 해시 기반 조인을 사용하면 여러 개의 조인을 파이프라인 방식으로 처리할 수 있다. 다중 조인은 파이프라인 방식 처리는 조인 중간 결과를 디스크를 통하지 않고 다른 프로세서에게 직접 전달하므로 효율적이다. Shared nothing 다중 프로세서 구조는 대용량 데이타베이스를 처리하는데 확장성은 좋으나 자료 불균형 분포에 매우 민감하다. 파이프라인 해시 조인 알고리즘이 동적 부하 균형 유지 메커니즘을 갖고 있지 않다면 자료 불균형은 성능에 매우 심각한 영향을 줄 수 있다. 본 논문은 자료 불균형의 영향과 제안된 두 가지 기법을 비교하기 위하여 파이프라인 세그먼트의 실행 모형, 비용 모형, 그리고 시뮬레이터를 개발한다. 다양한 파라미터로 모의 실험을 한 결과에 의하면 자료 불균형은 조인 선택도와 릴레이션 크기에 비례하여 시스템 성능을 떨어뜨림을 보여준다. 그러나 제안된 파이프라인 해시 조인 알고리즘은 다수의 버켓 사용과 분할의 조율을 통해 자료 불균형도가 심한 경우에도 좋은 성능을 갖게 한다.