• 제목/요약/키워드: 가변길이 그램

검색결과 17건 처리시간 0.026초

가변길이 그램의 역리스트 생성을 이용한 효율적인 유사 문자열 검색 기법 (An Efficient String Similarity Search Technique based on Generating Inverted Lists of Variable-Length Grams)

  • 김종익
    • 정보과학회 논문지
    • /
    • 제43권11호
    • /
    • pp.1275-1280
    • /
    • 2016
  • 유사 문자열 검색을 위해 기존의 기법들은 우선 후보 문자열 집합을 생성한 후에 후보 문자열을 검증하는 방법을 사용한다. 이때, 유사 문자열 검색의 성능을 결정짓는 가장 중요한 요소는 후보 생성 방법이다. 기존의 기법들은 질의 문자열로부터 고정길이 q-그램들을 선택하고, 선택된 q-그램에 해당하는 역리스트를 이용해 후보 문자열을 생성한다. 본 논문에서는 질의 문자열 내의 가변길이 그램들을 사용하여 후보 문자열을 생성할 수 있는 기법과 질의 문자열로부터 최적의 가변길이 그램들의 조합을 선택하는 동적 프로그래밍 알고리즘을 제안한다. 실험을 통해 제안하는 기법이 기존의 기법들 보다 유사 문자열 검색의 성능을 향상시킴을 보인다.

장면 전환 검출을 위한 가변길이 프레임 생략법에 대한 연구 (A study on the variable length frame skip method for shot change detection)

  • 이상화;김영봉
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.257-260
    • /
    • 2002
  • 히스토그램을 이용한 장면 전환 검출 기법은 순차적으로 접근하여 모든 프레임의 히스토그램을 구하고 각 히스토그램의 차를 이용하여 장면 전환 지정을 검출한다. 그러나, 이 방법은 장면 전환이 비교적 적게 일어나는 동영상 데이터에는 비효율적이므로 고정된 간격으로 프레임을 생략하거나, 가중치를 조절하여 가변적으로 프레임을 생략하는 히스토그램 비교법이 개발되어 왔다. 본 논문에서는 교육용 비디오를 위한 개선된 가변길이 프레임 생략법을 제안할 것이다. 이를 위해서 여러 가지 가중치를 사용하여 실험을 통한 좋은 가중치를 제시하고자 한다.

  • PDF

가변길이 SIMD구조 쉐이더 명령어 및 컴파일러 설계 (Design of Compiler & Variable-Length Instructions for SIMD Structured Shader)

  • 곽재창;박태룡
    • 한국정보통신학회논문지
    • /
    • 제14권12호
    • /
    • pp.2691-2697
    • /
    • 2010
  • 본 논문에서는 3차원 그래픽 쉐이더 3.0 API를 지원하는 쉐이더 명령어 및 컴파일러를 설계하고 그 결과를 평가한다. 기존의 명령어와는 달리 가변길이의 명령어 구조를 제안하고 명령어의 길이를 줄여 SIMD(Single Instruction Multiple Data)구조의 그래픽 프로세서의 하드웨어 크기를 줄일 수 있다. 가변길이 및 2 페이즈 구조의 명령어를 지원하며 ESSL(ES Shading Language) 수준에서 쉐이더 프로그램이 가능한 쉐이더 컴파일러의 설계를 수행하였다. 명령어와 컴파일러 설계 결과를 검증하기 위하여 크로노스그룹에서 제안하는 Conformance Test를 수행하였다. 그 결과로 제공하는 기본 GL 쉐이더의 기능 16개를 비교하여 보았을 때 전체 평균 37%가 줄어드는 것을 알 수 있다.

OpenGL ES 2.0 API 기반 가변길이 명령어 설계 (Design of a Variable-Length Instruction based on a OpenGL ES 2.0 API)

  • 이광엽
    • 전기전자학회논문지
    • /
    • 제12권2호
    • /
    • pp.118-123
    • /
    • 2008
  • 최근 Khronos에서 OpenGL ES 2.0 API 표준을 배포 하면서 임베디드 시스템의 그래픽 프로세서에서 능률적인 쉐이더 프로그램이 가능하게 되었다. 그 결과 모바일 기기에서도 OpenGL ES 2.0을 지원하는 그래픽 프로세서를 요구하게 되었다. OpenGL ES 2.0을 지원하기 위해서 명령어의 길이의 증가가 요구되고, 이는 메모리 용량의 증가를 초래한다. 본 논문에서는 효율적으로 명령어를 사용하는 새로운 명령어를 제안한다. 이 명령어는 가변 길이 방법과 유닛구조를 채택한 명령어 구조이다. 제안된 명령어 구조는 OpenGL ES 2.0 API를 지원하고 명령어 필드 낭비를 줄일 수 있도록 최대 4개의 32비트 유닛 명령어가 가변적으로 조합되어 수행된다.

  • PDF

가변 길이 프레임 생략 방법을 이용한 장면 전환 검출 (Shot Change Detection using Variable Length Frame Skip Method)

  • 권오덕;최창규;장용석;김승호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.268-270
    • /
    • 2001
  • 히스토그램을 이용한 장면 전환 검출 기법은 순차적으로 접근하여 모든 프레임의 히스토그램을 구하고 각 히스토그램의 차를 이용하여 장면 전환을 검출한다. 하지만, 장면 전환이 비교적 적게 나타나는 부분에서는 모든 프레임을 비교한다는 것은 비효율적이다. 본 논문에서는 모든 프레임을 순차적으로 비교하지 않고 가중치를 조절하여 장면 전환이 거의 발생하지 않는 경우는 많은 프레임을, 장면 전환이 많은 곳에서는 적은 프레임을 생략하여 히스토그램을 비교하는 방법을 제안한다. 이 방법은 생략하는 프레임 수를 조절하기 때문에 순차적으로 처리하는 것보다 빠른 처리 시간을 보일 수 있다.

  • PDF

커널 레벨 가변 길이 블록 파일 시스템 (Design and Implementation of Kernel-Level File System Using Variable-Length Blocks)

  • 유영준;고영웅
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.16-17
    • /
    • 2016
  • 일반적인 에디터 프로그램과 운영체제를 사용하여 데이터를 편집할 경우, 일부 수정에도 모든 데이터를 다시 저장하고 있다. 본 논문에서는 이러한 기존 파일시스템의 문제점을 개선하기 위해 가변 길이 블록의 개념을 커널 레벨에 적용하여 효율적으로 수정된 데이터를 다시 쓸 수 있도록 하였다. 가변 블록은 데이터 삭제가 발생 했을 경우 나머지 블록은 그대로 유지하고 수정된 블록만 다시 저장하며, 삭제된 데이터로 인해 생기는 빈 공간의 그대로 유지하는 방법을 말한다. 이 개념을 기존 리눅스에서 사용하는 ext4파일 시스템에 적용하여 시스템을 구축, 실험하였으며 결과적으로 쓰기 연산을 비롯해 CPU사용량에서 크게 성능을 향상시켰다.

HMM에 기반한 한국어 개체명 인식 (HMM-based Korean Named Entity Recognition)

  • 황이규;윤보현
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.229-236
    • /
    • 2003
  • 개체명 인식은 질의응답 시스템이나 정보 추출 시스템에서 필수 불가결한 과정이다. 이 논문에서는 HMM 기반의 복합 명사 구성 원리를 이용한 한국어 개체명 인식 방법에 대해 설명한다. 한국어에서 많은 개체명들이 하나 이상의 단어로 구성되어 있다. 또한, 하나의 개체명을 구성하는 단어들 사이와 개체명과 개체명 주위의 단어 사이에도 문맥적 관계를 가지고 있다. 본 논문에서는 단어들을 개체명 독립 단어, 개체명 구성 단어, 개체명 인접 단어로 분류하고, 개체명 관련 단어 유형과 품사를 기반으로 HMM을 학습하였다. 본 논문에서 제안하는 개체명 인식 시스템은 가변길이의 개체명을 인식하기 위해 트라이그램 모델을 사용하였다. 트라이그램 모델을 이용한 HMM은 데이터 부족 문제를 가지고 있으며, 이를 해결하기 위해 다단계 백-오프를 이용하였다. 경제 분야 신문기사를 이용한 실험 결과 F-measure 97.6%의 결과를 얻었다.

다수 유전자 프로그램의 최적 결합을 위한 확률적 탐색 방법 (A Probabilistic Search Method for Optimal Combination of Multiple Genetic Programs)

  • 정제균;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.244-246
    • /
    • 2000
  • 유전자 프로그래밍은 고정적인 구조가 아닌 가변 길이의 트리 구조를 가지고 있어서 여러 세대를 통하여 다양한 개체들을 만들어 낸다. 이러한 특징은 위원회 머신(committee machines)을 구축하는데 있어서 자연스럽고 또한 효과적인 알고리즘일 수 있다.하지만 해결해야 할 요소 중 하나는 다수의 개체들에서 결합할 개체의 선택과 개체의 수를 결정하기 위한 방법이다. 본 논문에서는 효과적인 개체들의 결합이 되기 위한 새로운 탐색방법을 소개한다. 이 방법은 확률적인 진화 탐색을 바탕으로 하고 있다. 제안된 방법을 여러 가지 분류 문제에 적용하였으며 실험을 통하여 탐색의 특성과 일반화 성능을 분석하였다.

  • PDF

개체명 구성 원리를 이용한 교사학습 기반의 한국어 개체명 인식 (Korean Named Entity Recognition Based on Supervised Learning Using Named Entily Construction Principles)

  • 황이규;이현숙;정의석;윤보현;박상규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.111-117
    • /
    • 2002
  • 개체명 인식은 질의응답(QA), 정보 주줄(IE), 텍스트 마이닝 시스템의 성능 향상에 중요한 역할을 담당한다. 이 논문에서는 교사학습 기반의 한국어 개체명 인식에 대해 설명한다. 한국어에서 많은 개체명들이 하나 이상의 단어로 구성되어 있으며, 개체명을 구성하는 단어 사이에는 의존 관계가 존재하고, 개체명과 개체명 주위의 단어 사이에도 문맥적 의존관계를 가지고 있다. 본 논문에서는 가변길이의 개체명과 주변 문맥의 학습을 위해 트라이그램을 이용한 HMM을 사용하였으며, 자료 부족 문제를 해소하기 위해 어휘 기반이 아닌 부개체 유형 기반의 학습을 수행하였다. 학습된 개체명 인식 시스템을 이용하여 경제 분야의 신문 기사에 대한 실험 결과, 84.4%의 정확률과 90.9%의 재현률을 보였다.

  • PDF

가변길이 명령어 모드를 갖는 Embedded Microprocessor의 설계 (A Design of an Embedded Microprocessor with Variable Length Instruction Mode)

  • 박기현;오민석;이광엽;한진호;김영수;배영환;조한진
    • 대한전자공학회논문지SD
    • /
    • 제41권4호
    • /
    • pp.83-90
    • /
    • 2004
  • 본 논문은 메모리 크기의 제약을 많이 받는 내장형 마이크로프로세서의 문제를 해결하기 위해 32-bit 명령어와 24-bit, 16-bit 명령어를 혼합 사용하여 3가지 명령어 모드를 갖는 새로운 명령어 셋(X32V ISA)을 제안하였으며, 이를 기반으로 32-bit 5 stage pipeline RISC 마이크로프로세서를 설계하였다. 이를 검증하기 위해서 X32V ISA 전용 시뮬레이터를 이용하여 멀티미디어 프로그램의 프로그램 코드 사이즈를 산출하였다. 그 결과로 Light mode와 Ultra light mode는 Default mode에 비해 각각 최소 8%, 27%의 프로그램 코드 사이즈 감소를 확인하였으며, Xilinx FPGA를 이용하여 33MHz 동작 환경에서 X32V ISA의 모든 명령어 수행을 검증하였다.