• 제목/요약/키워드: 근사 정렬

검색결과 36건 처리시간 0.03초

술어-논항 튜플 기반 근사 정렬을 이용한 문장 단위 바꿔쓰기표현 유형 및 오류 분석 (Analysis of Sentential Paraphrase Patterns and Errors through Predicate-Argument Tuple-based Approximate Alignment)

  • 최성필;송사광;맹성현
    • 정보처리학회논문지B
    • /
    • 제19B권2호
    • /
    • pp.135-148
    • /
    • 2012
  • 본 논문에서는 Predicate-Argument Tuple (PAT)를 기반으로 텍스트 간 심층적 근사 정렬(Approximate Alignment)을 통한 문장 단위 바꿔쓰기표현(sentential paraphrase) 식별 모델을 제안한다. 두 문장 간의 PAT 기반 근사 정렬 결과를 바탕으로, 두 문장의 의미적 연관성을 효과적으로 표현하는 다양한 정렬 자질(alignment feature)들을 정의함으로써, 바꿔쓰기표현 식별 문제를 지도 학습(supervised learning) 기반의 자동 분류 모델로 접근하였다. 실험을 통해서 제안 모델의 가능성을 확인할 수 있었으며, 시스템의 오류 분석을 통해 제안 방법이 아직 해결하지 못하는 다양한 바꿔쓰기표현 유형들을 식별함으로써 향후 시스템의 성능 개선 방향을 도출하였다.

Spin을 이용한 근사 정렬된 우선 순위 큐 스케줄러 알고리즘의 명세 (Formal Specification for Priority Queue Schedulers with Approximate Sorting Algorithm using Spin)

  • 김병철;김태윤
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2000년도 제13회 춘계학술대회 및 임시총회 학술발표 논문집
    • /
    • pp.1144-1147
    • /
    • 2000
  • 본 논문에서는 정형 명세 도구인 Spin을 이용한 근사 정렬된 우선 순위 큐 스케줄러 알고리즘에 대한 정형 명세 방법론을 제시하였다. 최근에 제안된 패킷 스케줄링 알고리즘은 우선 순위(마감 순위, 가상 종료 시간, 시간 스템프 등)에 따라 QoS를 지원한다. 그러나 QoS를 지원하기 위한 우선 순위를 유지하는데는 많은 오버 헤드가 요구된다. 따라서 근사된 우선 순위 큐 스케줄러 알고리즘은 낮은 계산상의 오버 헤드를 통해 근사된 우선 순위 큐를 유지함으로서 정확한 우선 순위 큐를 유지하기 위한 오버 헤드와의 trade off를 고려한다. 큐는 주기적으로 회전을 하며 최소한의 포인터 오퍼레이션을 통해 근사된 우선 순위 큐를 유지한다. 이러한 스케줄러 알고리즘의 동작 과정을 정형 기법을 이용하여 패킷 스케줄링상에 기아 현상등이나 데드락 현상등의 발생여부를 검증하는 방법등의 연구가 전무한 상태이다. 정형 명세 도구인 Spin을 이용하여 제안된 알고리즘을 명세하는 방법론을 기술한다.

  • PDF

비정렬 다변수 데이터의 B-스플라인 근사화 기법 (On B-spline Approximation for Representing Scattered Multivariate Data)

  • 박상근
    • 대한기계학회논문집A
    • /
    • 제35권8호
    • /
    • pp.921-931
    • /
    • 2011
  • 본 연구는 B-스플라인 하이퍼볼륨을 사용하여 주어진 비정렬 데이터를 근사화하는 데이터 근사기법에 관한 것이다. 개발 구현을 위한 B-스플라인 하이퍼볼륨의 자료 구조가 기술되며 해당 메모리 크기의 측정을 통해 간결한 표현 모델임을 보인다. 제안하는 근사 기법은 두 가지 알고리즘으로 구성된다. 하나는 B-스플라인 하이퍼볼륨의 절점 벡터 결정에 관한 것이고, 다른 하나는 조정점 결정에 관한 것으로 최소자승 최소화 문제의 해를 구함으로써 얻게 된다. 여기서 구한 해는 데이터 복잡성에 의존하지 않는다. 본 연구 방식은 다양한 형태의 데이터 분포를 가지고 근사 정밀도, 메모리 사용량, 계산 시간 등의 근사화 성능(수준)을 평가한다. 더불어 기존 방법과의 비교를 통해 유용성을 보이며, 비구속 최적화 예제를 통하여 다양한 응용 분야로의 가능성을 보여준다.

근사 단어 검색 효율성 개선을 위한 기준 Pivot 선택방법 실험적 연구 (An Empirical Study of Base Pivot Choosing Method for Approximate Word Searching)

  • 윤태진;정우근;조환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.271-274
    • /
    • 2010
  • 한글 근사 단어 검색 시스템은 사용자의 오류를 포함한 검색 질의에 효과적으로 대응할 수 있는 방법이나 검색 속도가 매우 느려서 실제 사용에 큰 어려움이 있다. 일반적으로 DNA 검색에 사용하는 서열 정렬 기법을 사용할 경우 데이터 베이스의 모든 문자열과 비교가 이루어져야 하기 때문에 많은 검색 시간이 걸리게 된다. 이것을 해결하기 위해 우리는 편집거리가 metric space를 만족하는 성질을 이용한 한글 근사단어 검색 시스템을 사용하여 실제 서열정렬을 사용하여 비교가 필요한 후보 단어를 거르게 된다. 이 한글 근사 단어 검색 시스템에서 가장 중요한 것은 기준축의 역할을 하는 Base-Pivot의 선택 방법이다. 본 논문에서는 이 Base-Pivot의 효율적인 선택방법을 실험을 통해서 분석하도록 한다.

  • PDF

비정렬 셀 중심 방법에서 확산플럭스의 새로운 수치근사방법 (A NEW NUMERICAL APPROXIMATION OF DIFFUSION FLUX IN UNSTRUCTURED CELL-CENTERED METHOD)

  • 명현국
    • 한국전산유체공학회지
    • /
    • 제11권1호
    • /
    • pp.8-15
    • /
    • 2006
  • The existing approximations of diffusion flux in unstructured cell-centered finite volume methods are examined in detail with each other and clarified to have indefinite expressions in several respects. A new numerical approximation of diffusion flux at cell face center is then proposed, which is second-order accurate even on irregular grids and may be easily implemented in CFD code using cell-centered finite volume method with unstructured grids composed of arbitrary convex polyhedral shape.

대용량 순차 데이터베이스에서 근사 순차패턴 탐색 (Mining Approximate Sequential Patterns in a Large Sequence Database)

  • 금혜정;장중혁
    • 정보처리학회논문지D
    • /
    • 제13D권2호
    • /
    • pp.199-206
    • /
    • 2006
  • 순차패턴 탐색은 다양한 응용 분야에서 매우 중요한 데이터 마이닝 작업으로 간주된다. 그러나 기존의 순차패턴 탐색 방법들은 길이가 긴 순차패턴이나 노이즈 정보를 다수 포함한 데이터베이스에 대한 마이닝에서는 한계가 있다. 해당 방법들은 매우 짧고 사소한 패턴들은 탐색하지만 다수의 순차 정보들에서 공유되는 중요 패턴들을 분석하는데 어려움을 겪는다. 본 논문에서는 이러한 문제를 해결하기 위한 방법으로 대용량 데이터베이스에 대한 근사 순차패턴 탐색 방법을 제안한다. 근사 순차패턴은 다수의 순차 정보들에서 근사적으로 공유되는 순차패턴을 의미한다. 제안된 방법은 두 과정으로 구분된다. 하나는 유사도에 따라 분석 대상 순차 정보들을 몇 개의 군집으로 나누는 과정이며, 다른 하나는 다중 정렬 방식을 적용하여 각 군집으로부터 대표 패턴을 찾는 과정이다. 이를 위해서 다수의 순차 정보들을 하나로 표현할 수 있는 가중치 순차패턴을 제시하며, 다수의 순차 정보들은 가중치 순차패턴 형태로 통합된다. 이렇게 통합된 정보를 가진 각 가중치 순차패턴을 이용하여 여러 순차 정보와 근사한 하나의 대표 패턴을 생성한다. 끝으로, 다양한 실험을 통해서 제안된 방법의 유용성을 검증한다.

선체 변형 근사곡선을 이용한 추진축계 정렬의 유연성 평가 (The Flexibility Estimation of Alignment for Propulsion Shaft System using the Approximated Hull Deflection Curve)

  • 선진석;이용진;김의간
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제33권1호
    • /
    • pp.28-36
    • /
    • 2009
  • In this paper, based on the measured data of hull deflection, an approximated hull deflection curve is drawn using reverse analyzed hull deflection data and the estimation method for flexibility analysis of shaft alignment is proposed by use of the approximate hull deflection curve. Generally an offset value of after stern tube bearing is a datum point with an fore stern tube bearing however the shaft alignment has a tendency which is able to get higher flexibility if the shafting system has the deflection value from after stern tube bearing as reference to bottom direction according to results of on this study. By applying this result of study, the shaft alignment for next similar ships will be able to estimate how to follow the hull deflection and how to be influenced by hull deflection at shaft alignment analysis state using the approximated hull deflection curve.

비정렬 셀 중심 방법에서 대류플럭스의 수치근사벙법 평가 (EVALUATION OF NUMERICAL APPROXIMATIONS OF CONVECTION FLUX IN UNSTRUCTURED CELL-CENTERED METHOD)

  • 명현국
    • 한국전산유체공학회지
    • /
    • 제11권1호
    • /
    • pp.36-42
    • /
    • 2006
  • The existing numerical approximations of convection flux, especially the spatial higher-order difference schemes, in unstructured cell-centered finite volume methods are examined in detail with each other and evaluated with respect to the accuracy through their application to a 2-D benchmark problem. Six higher-order schemes are examined, which include two second-order upwind schemes, two central difference schemes and two hybrid schemes. It is found that the 2nd-order upwind scheme by Mathur and Murthy(1997) and the central difference scheme by Demirdzic and Muzaferija(1995) have more accurate prediction performance than the other higher-order schemes used in unstructured cell-centered finite volume methods.

전도와 전치 연산을 사용하여 정렬하는 빠르고 간단한 알고리즘 (Fast and simple algorithm for sorting by reversals and transpositions)

  • 한보형;박근수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (A)
    • /
    • pp.674-676
    • /
    • 2000
  • 최근 들어 계산분자생물학 분야에서 문자열 알고리즘과 관련된 유전자 재배열 문제가 많은 관심을 끌고 있다. 특히 이러한 문제에는 전도(reversal)나 전치(transpositon)와 같은 재배열 연산들이 사용되고 있다. 전도와 전치 두 가지 연산을 모두 사용하는 정렬은 필요한 최소 연산 회수의 3배 이내의 연산 수행만으로 가능하다고 알려져 있다. 이 논문에서는 기존의 알고리즘을 분석하고 휴리스틱을 사용함으로써 실제 연산 수행 회수를 대폭 줄일수 있음을 보였다. 또한, 기존의 알고리즘보다 간단한 새로운 알고리즘을 제시하고, 이 알고리즘과 휴리스틱을 같이 사용하는 경우 수행 시간과 근사비(approximation ratio)에 있어서 매우 효과적임을 보였다.

  • PDF

계층적 메트릭 공간(metric space) 구조의 한글 근사 단어 검색 시스템 (Korean Approximate String Searching System by Hierarchical Metric Space Structure)

  • 윤태진;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.397-400
    • /
    • 2010
  • 우리는 지난 연구에서 변형 비속어 필터링 시스템을 위하여 근사 문자열 검색 시스템을 적용하여 서열 정렬 횟수를 비약적으로 줄일 수 있었다. 다차원 데이터 구조를 이용한 한글 근사 검색 시스템은 기준축인 Base-Pivot의 숫자에 따라 검색 결과의 정확도를 높일 수 있으나 BP이 증가한 만큼 질의 단어의 좌표를 계산하기 위한 시간이 오래 걸린다. 소규모 데이터 검색에는 문제가 되지 않으나 60,000단어 이상의 데이터가 수록되는 국어사전과 같은 대규모 데이터를 검색하게 될 경우 요구되는 BP의 숫자도 증가하여 많은 연산시간을 필요로 한다. 본 논문에서는 기존의 근사 단어 검색 시스템을 계층구조화 하여 요구되는 BP 숫자를 감소 시켜 성능을 향상 시키는 방법을 제안하고자 한다. 그리고 실험을 통하여 본 아이디어의 실효성을 증명하였다. 본 아이디어는 기존의 6000개의 비속어에 대하여 약 20%정도의 성능향상을 보였다.