• 제목/요약/키워드: hash value

검색결과 114건 처리시간 0.027초

하둡 성능 향상을 위한 VPT 개발 연구 (A Development Study of The VPT for the improvement of Hadoop performance)

  • 양일등;김성열
    • 한국정보통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.2029-2036
    • /
    • 2015
  • 하둡 MR(MapReduce)는 매퍼(Mapper)의 출력을 리듀서(Reducer)의 입력으로 전달하기 위해 파티션 함수(Partition Function)을 사용한다. 파티션 함수는 키에서 해쉬 값을 계산한 후 리듀서 개수로 나머지 연산을 수행하여 대상 리듀서를 결정한다. 기존 파티션 함수는 키의 편중도에 민감하여 잡이 균등하게 배분될 수 없었다. 잡이 균등하게 배분되지 못하면 특정 리듀서들의 처리 수행 시간이 길어져 전체 분산 처리 수행 성능에 영향을 주게 된다. 이에 본 논문은 VPT(Virtual Partition Table)을 제안하고 편중도가 심한 데이터에 VPT을 적용하여 실험을 수행 하였다. 적용된 VPT는 기존 파티션 함수와 대비하여 평균 3초 정도 성능향상이 발생하였으며, 데이터 처리량이 증가할수록 성능 향상 폭이 증가할 것으로 예상된다.

공문서의 기계가독형(Machine Readable) 전환 방법 제언 (Suggestions on how to convert official documents to Machine Readable)

  • 임진희
    • 기록학연구
    • /
    • 제67호
    • /
    • pp.99-138
    • /
    • 2021
  • 빅데이터 시대에 정형데이터 뿐만 아니라 비정형데이터를 분석하는 것이 중요한 과제로 대두되고 있다. 정부기관이 생산하는 공문서도 텍스트 기반의 대형 비정형데이터로 빅데이터 분석의 대상이 된다. 기관 내부의 업무효율, 지식관리, 기록관리 등의 관점에서 공문서 빅데이터를 분석하여 유용한 시사점을 도출해 나가야 할 것이다. 그러나, 현재 공공기관이 보유 중인 공문서의 상당수가 개방포맷이 아니어서 빅데이터 분석을 하려면 비트스트림에서 텍스트를 추출하는 전처리 과정이 요구된다. 또한, 문서파일 내에 맥락 메타데이터가 충분히 저장되어 있지 못하여 품질 높은 분석을 하려면 별도의 메타데이터 확보 노력이 필요하다. 결론적으로 현재의 공문서는 기계가독(machine readable) 수준이 낮아 빅데이터 분석에 비용이 많이 들게 된다. 이 연구에서는 향후 공문서가 기계가독 수준을 높이기 위해서는 공문서의 개방포맷화, 기안문 서식의 표준태그화, 자기 기술(self-descriptive) 메타데이터 확보, 문서 텍스트 태깅 등이 선행될 필요가 있다는 점을 제안한다. 첫째, 문서가 스스로를 설명하기 위해 추가되어야 하는 메타데이터 항목들을 제시하고 이 메타데이터들이 기계가독형이 되도록 문서파일에 저장하는 방법을 제안한다. 둘째, 문서 내용 분석 시 자연어 처리에만 의존하지 않고 행정 맥락에 따라 중요한 키워드를 미리 국제표준 태그로 마킹하여 기계가독형이 되도록 하는 방안을 제안한다.

빠른 검색을 위한 음원 시그니처 인덱싱 방법 (Music Source Signature Indexing Method for Quick Search)

  • 김상균;이경식
    • 방송공학회논문지
    • /
    • 제26권3호
    • /
    • pp.321-326
    • /
    • 2021
  • 블록체인은 자본 거래나 보안 데이터의 안전한 전송을 위한 플랫폼으로 그 가치가 높아지고 있다. 아울러 블록체인은 동영상, 음악, 사진과 같은 대용량의 데이터를 안전하게 저장하고, 거래 내용이나 서비스 이용 명세 등을 안전하게 관리할 수 있는 새로운 플랫폼으로서의 가능성을 가지고 있다. 블록 내 대용량 미디어 데이터를 저장할 수 없기에 분산저장 시스템(IPFS)과 음원 시그니처 데이터의 해시 정보를 이용하여 블록 내 음원 정보를 저장하고, 저장된 음원 데이터를 검색하는 속도에 관한 연구가 진행되었다. 본 논문에서는 기존 연구가 제시했던 검색 속도를 향상시킬 수 있는 블룸필터를 이용한 음원 시그니처 인덱싱 방법을 제안한다. 실험 결과 기존 검색성능(O(n))보다 향상된 검색 성능 (O(1))을 달성할 수 있음을 확인할 수 있었다.

RFID를 이용한 IPTV 사용자의 경량화 인증 프로토콜 (A Low-weight Authentication Protocol using RFID for IPTV Users)

  • 정윤수;김용태;박길철;이상호
    • 정보보호학회논문지
    • /
    • 제19권2호
    • /
    • pp.105-115
    • /
    • 2009
  • 최근에는 초고속인터넷망을 통하여 이용자의 요청에 따라 양방 항으로 다양한 멀티미디어 콘텐츠를 제공하는 통신방송 융합서비스인 IPTV 서비스가 증가하고 있다. 그러나 이동성이 잦은 사용자가 IPTV 서비스를 제공받기 위해서는 사용자의 IPTV 서비스 가입 유무가 필수적이지만 현재 이동 사용자에게 제공되는 IPTV 서비스는 이동 사용자의 인증을 안전하게 제공하지 못하고 있다. 이 논문에서는 IPTV 서비스를 제공받는 이동 사용자를 안전하게 인식하기 위해 IPTV STB에 RFID를 부착하여 이동 사용자를 인증할 수 있는 경량화 된 사용자 인증 프로토콜을 제안한다. 제안된 프로토콜은 이동 사용자의 인증과정에서 임의로 생성된 랜덤수를 태그가 IPTV STB로 전달하면 IPTV STB는 전달받은 랜덤수와 자신의 ID로 해쉬 함수에 의해 해쉬된 결과 값을 태그에게 전달하도록 하여 무선 구간에서 자주 발생하는 reply 공격과 man-in-the-middle 공격을 예방하고 있다.

서비스 플랫폼 기반 이중강화적용 블록체인 응용 거래모델 제안 (Transaction Model Suggestion by using Two Enforcements with a Blockchain based on a Service Platform)

  • 이관목;김용환;배기태
    • 스마트미디어저널
    • /
    • 제9권4호
    • /
    • pp.91-96
    • /
    • 2020
  • 블록체인은 거래의 기록인 트랜잭션을 관리하는 중앙서버 없이 분산네트워크에 참여하고 있는 모든 노드가 그 거래의 내용을 각자 관리하는 기술이다. 특정 기간의 거래 기록을 담고 있는 블록은 이전 블록에 대한 해쉬 값을 참조하여 블록체인에 연결되고, 새로운 블록이 추가된 체인은 다시 모든 노드와 공유한다. 기존의 인증서를 이용한 트랜잭션이 핀테크를 거쳐, 가까운 미래에는 블록체인을 이용하는 응용의 등장이 예상된다. 본 연구에서는 기존 모델의 문제점 등을 분석하고, 앞으로 도래될 블록체인을 적용한 거래모델을 제안한다. 다양한 응용 중에, 본 연구에서는 4차 산업혁명을 이끌 주제 중에서 에너지 판매시장을 목표로 거래모델을 전개한다. 제안한 모델의 분석결과, 기존의 방법보다 안전한 에너지 판매 거래의 가능성을 확신할 수 있었다.

Design of CCTV Enclosure Record Management System based on Blockchain

  • Yu, Kwan Woo;Lee, Byung Mun;Kang, Un Gu
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.141-149
    • /
    • 2022
  • 본 연구에서는 공공 CCTV 함체 관리를 위한 블록체인 기반 함체기록 관리 시스템을 설계하였다. CCTV 영상 기록은 함체를 거쳐 관제센터까지 전송되기 때문에 영상기록의 변조 및 훼손 방지를 위한 함체 관리가 매우 중요하다. 최근 CCTV 함체 관리를 위해 실시간 원격 모니터링 및 개폐 상태 관리 기능을 갖춘 스마트 함체 모니터링 시스템을 사용하고 있으나 CCTV 영상기록의 안전성 확보에는 한계가 있다. 우리가 제안한 시스템은 함체기록을 블록체인에 분산 저장하여 해시값 비교를 통해 위조를 탐지하고 위조된 함체기록을 복구할 수 있다. 또한 관리서버가 수신하는 함체기록의 무결성을 확인할 수 있도록 무결성 검증 API를 제공하여 함체기록의 무결성을 보장한다. 제안 시스템의 효용성을 검증하기 위해 실험을 통해 무결성 검증 정확도와 소요시간을 측정하였다. 실험 결과 함체기록의 무결성(정확도: 100%)을 확인하였고, 검증 소요시간(평균: 73ms)이 모니터링에 영향을 미치지 않을 것으로 확인하였다.

분산 AIoT 환경에서 합성곱신경망 기반 계층적 IoT Edge 자원 할당 및 관리 기법 (Hierarchical IoT Edge Resource Allocation and Management Techniques based on Synthetic Neural Networks in Distributed AIoT Environments)

  • 정윤수
    • 산업과 과학
    • /
    • 제2권3호
    • /
    • pp.8-14
    • /
    • 2023
  • 대다수의 IoT 기기들은 이미 AIoT를 사용하고 있지만, AI 애플리케이션을 구축하기 위해서는 아직 해결해야 할 문제가 많이 남아 있다. 본 연구에서는 IoT 에지 자원을 보다 효과적으로 분산하기 위해 머신러닝 기반의 IoT 에지 자원 관리 기법을 제안한다, 제안 기법은 머신러닝을 이용하여 IoT 에지 자원 동향을 파악함으로써 IoT 자원의 할당을 지속적으로 개선하며, 최적화된 IoT 자원은 머신러닝 컨볼루션을 활용하여 항상 변화하는 IoT 에지 자원을 안정적으로 유지한다, 제안 기법은 각각의 머신러닝 기반 IoT 에지 자원을 이전 패턴의 자원과 함께 해시값으로 저장함으로써 분산된 AIoT 맥락에서 공격 패턴으로 자원을 효과적으로 검증한다. 실험 결과에서는 IoT Edge 리소스의 무결성을 검증하기 위해서 이질적인 계산 하드웨어가 있는 복잡한 환경에서 잘 동작하는지 세 가지 다른 테스트 시나리오에서 에너지 효율성을 평가하였다.

블록체인을 활용한 국가연구개발사업 연구지원시스템 개선 방안 연구 (A Study on the Improvement of Research Support System for National R&D Projects Using Blockchain)

  • 이동환;박승욱
    • 한국산업정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.47-60
    • /
    • 2023
  • 본 연구는 국가 R&D 관리의 효율성을 개선하여 행정 부담을 최소화하고, 연구자·서비스 중심으로의 투명한 연구환경을 조성하기 위하여, 국가연구개발사업 연구지원시스템에 컨소시엄 블록체인을 데이터베이스로 활용하는 방안을 제시하였다. 구체적으로 데이터를 특성에 따라 분류하여, 첫째, 무결성과 투명성이 요구되는 데이터는 블록체인에 저장하는 방안, 둘째, 기밀성과 수정 및 삭제가 요구되는 데이터는 데이터베이스에 저장하는 방안, 셋째, 기밀성·무결성·투명성이 동시에 요구되는 데이터는 원본은 데이터베이스에 저장하고, 해당 데이터의 해시값은 블록체인에 별도로 저장하는 방안을 제안하였다. 블록체인 연구지원시스템을 활용하면 시스템의 안정적인 운영과 연구관리 전문기관 간 신속한 정보 공유가 가능하여, 행정 업무 부담 완화, 프로세스의 투명성 제고, 정보의 비대칭성 해소, 데이터 무결성·가용성·기밀성 확보 등의 효과를 창출할 수 있다.

MapReduce 환경에서 재그룹핑을 이용한 Locality Sensitive Hashing 기반의 K-Nearest Neighbor 그래프 생성 알고리즘의 개선 (An Improvement in K-NN Graph Construction using re-grouping with Locality Sensitive Hashing on MapReduce)

  • 이인희;오혜성;김형주
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권11호
    • /
    • pp.681-688
    • /
    • 2015
  • k-Nearest Neighbor(k-NN)그래프는 모든 노드에 대한 k-NN 정보를 나타내는 데이터 구조로써, 협업 필터링, 유사도 탐색과 여러 정보검색 및 추천 시스템에서 k-NN그래프를 활용하고 있다. 이러한 장점에도 불구하고 brute-force방법의 k-NN그래프 생성 방법은 $O(n^2)$의 시간복잡도를 갖기 때문에 빅데이터 셋에 대해서는 처리가 곤란하다. 따라서, 고차원, 희소 데이터에 효율적인 Locality Sensitive Hashing 기법을 (key, value)기반의 분산환경인 MapReduce환경에서 사용하여 k-NN그래프를 생성하는 알고리즘이 연구되고 있다. Locality Sensitive Hashing 기법을 사용하여 사용자를 이웃후보 그룹으로 만들고 후보내의 쌍에 대해서만 brute-force하게 유사도를 계산하는 two-stage 방법을 MapReduce환경에서 사용하였다. 특히, 그래프 생성과정 중 유사도 계산하는 부분이 가장 많은 시간이 소요되므로 후보 그룹을 어떻게 만드는 것인지가 중요하다. 기존의 방법은 사이즈가 큰 후보그룹을 방지하는데 한계점이 있다. 본 논문에서는 효율적인 k-NN 그래프 생성을 위하여 사이즈가 큰 후보그룹을 재구성하는 알고리즘을 제시하였다. 실험을 통해 본 논문에서 제안한 알고리즘이 그래프의 정확성, Scan Rate측면에서 좋은 성능을 보임을 확인하였다.

클러스터 웹 서버 상에서 히스토그램 변환을 이용한 내용 기반 부하 분산 기법 (A Content-Aware toad Balancing Technique Based on Histogram Transformation in a Cluster Web Server)

  • 홍기호;권춘자;최황규
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.69-84
    • /
    • 2005
  • 최근 인터넷 사용자의 기하급수적 증가에 따라 저렴한 가격의 고성능 대용량 클러스터 웹 서버 시스템에 관심이 증대되고 있다. 클러스터 웹 서버 시스템은 저렴한 비용. 높은 확장성과 가용성 등의 장점과 더불어 대규모 사용자에 대한 성능의 극대화를 목적으로 연구 개발되고 있으며, 최근에는 성능 향상을 위한 내용 기반의 부하 분산 기법에 관심이 모아지고 있다. 본 논문에서는 이러한 클러스터 웹 서버 상에서 사용자의 접근 빈도와 파일의 크기를 고려하여 각 서버 노드에 부하를 균등하게 할당하는 새로운 내용 기반의 부하 분산 기법을 제안한다. 제안된 기법은 웹 서버 로그의 각 URL 항목에 해시 함수를 적용하여 얻어지는 해시 값에 그 빈도와 전송된 파일의 크기를 고려한 누적 히스토그램을 생성한다. 사용자 요청은 (해시 값-서버 노드) 매핑에 의한 히스토그램 변환 과정을 통하여 각 서버 노드에 균등하게 할당된다. 제안된 기법은 누적 히스토그램을 주기적으로 갱신함으로써 동적으로 클러스터 웹 서버 시스템의 부하를 고르게 분산시킬 수 있으며, 또한 서버 노드의 캐시를 활용함으로써 전체 클러스터 시스템의 성능을 향상시킬 수 있다. 시뮬레이션을 통한 성능 분석에서 제안된 기법은 전통적인 라운드 로빈 방법보다는 월등히 우수함을 보이고, 기존의 내용 기반 WARD 방법보다는 약 $10\%$ 정도의 우수한 성능을 나타낸다.

  • PDF