• 제목/요약/키워드: string processing

검색결과 140건 처리시간 0.026초

노드의 연결성을 이용한 패스 표현의 효과적인 처리 (Efficient Evaluation of Path Expressions Using Connectivity of Nodes)

  • 이태경
    • 정보처리학회논문지D
    • /
    • 제9D권3호
    • /
    • pp.337-344
    • /
    • 2002
  • 최근에 그래프 타입의 자료에 대한 연구가 이루어지고 있다. 그 이유는 그래프가 지리정보시스템, 네트워크, WWW, 멀티미디어 프리젠테이션 등과 같은 영역의 문제들을 자연스럽게 표현할 수 있으며 자료 변화의 순서가 중요한 영역의 문제들도 자연스럽게 표현할 수 있기 때문이다. 이 논문에서는 방향 비순환 그래프로 표현되는 멀티미디어 프리젠테이션 그래프의 경로를 효과적으로 검색 처리하는 코드 시스템인 노드 코드 시스템을 제안한다. 노드 코스 시스템은 그래프의 각 노드마다 유일한 2진 문자열을 부여한다. 두 노드의 노드 코드를 비교하여 그래프 운행 없이 두 노드가 연결되어 있는지를 확인할 수 있다. 전통적인 그래프 운행을 이용한 방법보다 노드 코드 시스템의 이 특성을 이용하면 두 노드 사이의 경로의 건설을 효과적으로 할 수 있다. 노드 코드 시스템을 이용하여 경로를 건설할 수 있는 알고리즘을 제시한다.

대용량 XML 문서에서 효율적인 갱신을 위한 비트-패턴 기반의 XML 레이블링 기법 (XML Labeling Scheme based on Bit-Pattern for Efficient Updates of Large Volume of XML Documents)

  • 서동민;박용훈;임종태;김명호;유재수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권1호
    • /
    • pp.130-134
    • /
    • 2010
  • 기존에 제안된 XML 레이블링 기법은 XML 문서 변경 시, 문서 내 노드들의 구조 관계를 정확하게 유지하기 위해 재레이블링을 수행하거나 한 노드의 레이블이 많은 정보를 표현할 수 있는 레이블링 기법을 사용한다. 하지만, 대용량 XML 문서 내에서의 재레이블링은 많은 비용이 요구되고, 많은 정보를 표현할 수 있는 레이블링 기법은 많은 저장 공간이 요구돼 질의 처리 성능이 저하되는 문제를 야기한다. 그래서 본 논문에서는 재레이블링을 피하고 질의 처리 성능을 향상시키기 위해 최적화된 저장 공간을 사용하는 비트-패턴 기반의 레이블링 기법을 제안한다. 제안하는 비트-패턴 기반의 레이블링 기법은 노드들의 구조관계를 하나의 비트열에 표현함으로써 기존에 제안된 레이블링 기법들에 비해 우수한 성능을 가진다.

GPU를 이용한 기타의 음 합성을 위한 효과적인 병렬 구현 (An Effective Parallel Implementation of Sound Synthesis of Guitar using GPU)

  • 강성모;김종면
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권8호
    • /
    • pp.1-8
    • /
    • 2013
  • 본 논문에서는GPU 환경에서 기타의 음합성을 위한 물리적 모델링의 효율적인 병렬구현 방법을 제안한다. 물리적 모델링을 이용하여 기타의 개방현(E2, A2, D3, G4, B3, E4)들의 기본음을 합성하기 위해 각 개방현 음 합성을 위한 적절한 필터 계수를 사용하였고, 지연 라인의 길이를 조절하였다. 또한 물리적 모델링 알고리즘을 분석한 결과 지연 라인의 길이만큼 병렬성을 갖는 것을 확인하였다. 따라서 각 개방현의 기타 음을 합성하기 위해 지연 라인의 길이만큼CUDA 코어를 할당한 후 최적의 성능을 보이도록 알고리즘을 병렬 구현하였다. 모의실험결과, GPU를 이용하여 합성한 기타 음과 원음과의 스펙트럼이 매우 유사하였고, GPU는 기존 고성능 TI DSP보다 68배, CPU보다 3배의 성능 향상을 보였다. 또한, 본 논문에서는 물리적 모델링 알고리즘을 멀티 GPU시스템에서도 구현하고 성능을 분석하였다.

Self-Attention 기반의 변분 오토인코더를 활용한 신약 디자인 (De Novo Drug Design Using Self-Attention Based Variational Autoencoder)

  • ;최종환;서상민;김경훈;박상현
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권1호
    • /
    • pp.11-18
    • /
    • 2022
  • 신약 디자인은 단백질 수용체와 같은 생물학적 표적과 상호작용할 수 있는 약물 후보물질을 식별하는 과정이다. 전통적인 신약 디자인 연구는 약물 후보 물질 탐색과 약물 개발 단계로 구성되어 있으나, 하나의 신약을 개발하기 위해서는 10년 이상의 장시간이 요구된다. 이러한 기간을 단축하고 효율적으로 신약 후보 물질을 발굴하기 위하여 심층 학습 기반의 방법들이 연구되고 있다. 많은 심층학습 기반의 모델들은 SMILES 문자열로 표현된 화합물을 재귀신경망을 통해 학습 및 생성하고 있으나, 재귀신경망은 훈련시간이 길고 복잡한 분자식의 규칙을 학습시키기 어려운 단점이 있어서 개선의 여지가 남아있다. 본 연구에서는 self-attention과 variational autoencoder를 활용하여 SMILES 문자열을 생성하는 딥러닝 모델을 제안한다. 제안된 모델은 최신 신약 디자인 모델 대비 훈련 시간을 1/26로 단축하는 것뿐만 아니라 유효한 SMILES를 더 많이 생성하는 것을 확인하였다.

설문을 통한 6차산업형 목장경영의 애로사항과 개선방안에 관한 연구 (Questionnaire Study on the Difficulties and Improvements of the 6th Industrialization Dairy Farm)

  • 이진성;남기택;박성민;손용석
    • Journal of Dairy Science and Biotechnology
    • /
    • 제34권4호
    • /
    • pp.255-262
    • /
    • 2016
  • 국내 낙농업의 위기를 타개하기 위한 방편의 하나로 6차산업형 낙농이 대두되었다. 낙농업의 6차산업화란 우유 생산과 목장형 유가공, 제품 판매와 체험/관광 등을 목장에서 수행함으로써 부가가치를 창출 취득하는 것이며, 이에 따른 인력과 시간 등의 어려움을 해결하기 위해 AMS의 도입에 관한 관심도 증가하고 있다. 이에 본 연구에서는 6차산업형 낙농목장의 애로사항과 AMS 관련 사항을 조사함으로써 이에 대한 개선 방안과 정보를 제공하기 위한 목적으로 수행되었다. 총 91개 6차산업화 목장에 대해 우편 및 방문 면담에 의한 조사를 통해 목장 현황, 6차산업과 관련된 농가들의 인식, 문제점, 요구사항 들과 AMS 도입 여부 및 관련 사항을 조사하였으며, 회수된 16개 설문지를 분석에 이용하였다. 연구 결과 6차산업화 목장의 규모와 형태는 다양하였으며, 발효유와 신선치즈를 주로 생산하였고, 소비자들이 방문하여 구매하는 형태가 가장 많았다. 6차산업형 목장에 대한 정부정책에 관해서는 부정적인 평가가 더 많았으며, 목장형 유가공을 통한 원유적체 해소에 관해서는 긍정적인 반응과 기대가 있었다. 조사 대상 농가들은 '과도한 규제', '판로확보 및 홍보', '자금 부족' 등의 어려움을 가장 크게 느끼고 있었으며, 이에 따라 대기업 수준의 규제보다는 목장형 유가공에 적합한 별도의 규제와 법, 제도를 갖추고 이에 따른 지원과 판로 개척 및 홍보에 대한 지원이 필요할 것으로 판단된다. 조사대상 중 AMS를 도입한 농가는 18.75%였고, CMS 농가 중 향후 AMS의 도입을 긍정적으로 검토하고 있는 농가는 38.46%로 나타났다. 도입 이유로는 인력과 시간 문제 해결, 관람 및 홍보 효과, 후계 문제 등으로 답한 반면, 도입에 부정적인 이유로는 유성분 및 유질 문제와 비용, A/S 등의 문제로 답하였다. 본 연구결과를 종합하면, 빠른 속도로 국내 우유자급률이 하락하고 있는 현 상황에서 정부 당국에서 낙농산업의 활성화를 달성하기 위해서는 현재와 같은 과도한 규제를 완화하고, 구체적이고 실효적인 지원책을 통해서만이 낙농의 6차산업화를 효과적으로 유도할 수 있을 것으로 판단되며, 우군 내 유용한 정보 수집과 기술 향상, 그리고 인력과 시간문제의 해결을 위해 잠재력이 높은 낙농목장을 대상으로 AMS 도입을 위한 지원책도 마련할 가치가 있을 것으로 사료된다.

규칙 구성자와 연결 구성자를 이용한 혼합형 행동 진화 모델 (Hybrid Behavior Evolution Model Using Rule and Link Descriptors)

  • 박사준
    • 지능정보연구
    • /
    • 제12권3호
    • /
    • pp.67-82
    • /
    • 2006
  • 가상 로봇의 행동 진화를 위해서 규칙 구성자와 연결 구성자를 구성하여 분류 규칙과 진화 신경망을 형성하는 혼합형 행동 진화 모델(Hybrid Behavior Evolution Model)을 제안한다. 본 모델에서는 행동 지식을 두 수준에서 표현하였다. 상위 수준에서는 규칙 구성자와 연결 구성자를 구성하여 표현력을 향상시켰다. 하위 수준에서는 행동 지식을 비트 스트링 형태의 염색체로 표현하여, 이들 염색체를 대상으로 유전자 연산을 적용하여 학습을 수행시켰다. 적합도가 최적인 염색체를 추출하여 가상 로봇을 구성하였다. 구성된 가상 로봇은 주변 상황을 인식하여 입력 정보와 규칙 정보를 이용하여 패턴을 분류하였고, 그 결과를 신경망에서 처리하여 행동하였다. 제안된 모델을 평가하기 위해서 HBES(Hybrid Behavior Evolution System)를 개발하여 가상 로봇의 먹이 수집 문제에 적용하였다. 제안한 시스템을 실험한 결과, 동일한 조건의 진화 신경망보다 학습 시간이 적게 소요되었다. 그리고, 규칙이 적합도 향상에 주는 영향을 평가하기 위해서, 학습이 완료된 염색체들에 대해서 규칙을 적용한 것과, 그렇지 않은 것을 각각 수행하여 적합도를 측정하였다. 그 결과, 규칙을 적용하지 않으면 적합도가 저하되는 것을 확인하였다. 제안된 모델은 가상 로봇의 행동 진화에 있어서 기존의 진화 신경망 방식 보다 학습 성능이 우수하고 규칙적인 행동을 수행하는 것을 확인하였다.

  • PDF

공간 분할 방법을 이용한 최적 서열정렬 알고리즘 (Optimal Sequence Alignment Algorithm Using Space Division Technique)

  • 안희국;노희영
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권5호
    • /
    • pp.397-406
    • /
    • 2007
  • 두 서열 A와 B간의 최적정렬을 찾는 문제는 동적프로그래밍 알고리즘을 사용하여 효과적으로 해결 될 수 있다. 하지만, 길이가 각각 m, n인 두 서열, $S_1$, $S_2$를 정렬하기 위해서는 O(m*n)의 시간과 공간 복잡도를 갖기 때문에 서열의 길이가 길어질 경우에는 시간과 공간 비용 문제로 인해 적용 할 수 없게 된다. 실제 계산상에 제한요소로 작용하는 공간비용 문제를 해결하기 위해 Hirschberg에 의해 제시된 선형공간 알고리즘은 이 문제를 O(n*m)의 시간복잡도와 O(n+m)의 공간복잡도로서 해결하였다. 컴퓨터 기술의 발전으로 CPU의 처리속도가 향상되고, 사용가능한 주기억장치의 공간이 확대됨에 따라, 기억공간은 더 사용하더라도 처리속도는 높일 수 있는 방법이 필요하다. 이를 위해, 본 논문에서는 공간 분할 방법을 통하여 공간 소모는 선형공간 알고리즘보다 많지만, 처리 속도는 빠른 O(n*m)의 시간과 O(n+m)의 공간비용을 갖는 알고리즘을 제안한다. 또한 분할 시 서열의 길이변화에 따른 분할 수(d) 문제를 일반화하고, 입/출구 노드 개념을 이용하여 불필요한 연산을 제거하였다. 선형공간 알고리즘이 (m+n)의 공간으로 2*m*n에 가까운 속도를 갖는데 비해, 본 알고리즘은 (m+n)*d의 공간으로 m*n에 가까운 결과를 보임을 증명과 실험결과로부터 확인한다.

부호 영역 DNA 시퀀스 기반 강인한 DNA 워터마킹 (Robust DNA Watermarking based on Coding DNA Sequence)

  • 이석환;권성근;권기룡
    • 전자공학회논문지CI
    • /
    • 제49권2호
    • /
    • pp.123-133
    • /
    • 2012
  • 본 논문에서는 DNA 시퀀스의 불법 복제 및 변이 방지와 개인 정보 침해 방지, 또는 인증을 위한 DNA 워터마킹에 대하여 논의하며, 변이에 강인하고 아미노산 보존성을 가지는 부호영역 DNA 시퀀스 기반 DNA 워터마킹 기법을 제안한다. 제안한 DNA 워터마킹은 부호 영역의 코돈 서열에서 정규 특이점에 해당되는 코돈들을 삽입 대상으로 선택되며, 워터마크된 코돈이 원본 코돈과 동일한 아미노산으로 번역되도록 워터마크가 삽입된다. DNA 염기 서열은 4개의 문자 {A,G,C,T}로 (RNA은 {A,C,G,U}) 구성된 문자열이다. 제안한 방법에서는 워터마킹 신호처리에 적합한 코돈 부호 테이블을 설계하였으며, 이 테이블에 따라 코돈 서열들을 정수열로 변환한 다음 원형 각도 형태의 실수열로 재변환한다. 여기서 코돈은 3개의 염기들로 구성되며, 64개의 코돈들은 20개의 아미노산으로 번역된다. 선택된 코돈들은 아미노산 보존성을 가지는 원형 각도 실수 범위 내에서 인접 코돈과의 원형 거리차 기준으로 워터마크에 따라 변경된다. HEXA와 ANG 시퀀스를 이용한 $in$ $silico$ 실험을 통하여 제안한 방법이 기존 방법에 비하여 아미노산 보존성을 가지면서 침묵 변이와 미스센스 변이에 보다 강인함을 확인하였다.

PHP 파일 삽입 취약성 검사를 위한 정적 분석기의 구현 (Implementation of a Static Analyzer for Detecting the PHP File Inclusion Vulnerabilities)

  • 안준선;임성채
    • 정보처리학회논문지A
    • /
    • 제18A권5호
    • /
    • pp.193-204
    • /
    • 2011
  • 인터넷 상의 웹 응용 프로그램은 불특정 다수의 사용자가 접근할 수 있기 때문에 보안상의 위험이 가중된다. 특히, 응용 프로그램의 소스코드에 보안 취약성이 있을 경우에는 침입 탐지 시스템과 같은 시스템 수준의 방어가 어렵기 때문에 이를 미리 제거하는 것이 중요하다. 본 논문에서는 웹 응용 프로그램의 대표적인 소스 코드 취약성인 PHP 파일 삽입 취약성을 자동으로 검출할 수 있는 정적 분석기의 구현에 대해 다룬다. 본 연구에서는 의미 기반의 정적 분석을 사용하여 소스 코드의 취약성을 미리 자동으로 검출하고 수정하도록 함으로써, 기존의 침입 테스트 기법이나 응용 프로그램 방화벽 사용과 다르게 보안 취약성을 안전하게 제거하면서 추가적인 실행 시간 부하를 피하고자 하였다. 이를 위하여 의미 기반 분석 방법인 요약 해석 방법론을 적용했으며, PHP 삽입 취약성에 최적화된 요약 분석 공간을 설계하여 사용함으로써 PHP의 특성인 복잡한 문자열 기반 자료 흐름을 효과적으로 처리하면서 목적으로 하는 취약성을 효과적으로 검출할 수 있었다. 프로그램의 취약성 분석 결과는 Java GUI 도구를 통해 확인할 수 있으며, 분석된 취약성 지점에서의 메모리 상태 및 계산 정보도 같은 도구를 사용해 확인할 수 있다. 구현된 분석기의 취약성 검출의 정확성과 실행 속도를 검증하기 위하여 공개된 PHP 프로그램을 사용하여 성능 실험을 수행하였으며, 이를 통해 구현된 분석기의 실용성을 확인하였다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.