• 제목/요약/키워드: 시간 가중치

검색결과 791건 처리시간 0.023초

XML 문서 키워드 가중치 분석 기반 문단 추출 모델 (XML Document Keyword Weight Analysis based Paragraph Extraction Model)

  • 이종원;강인식;정회경
    • 한국정보통신학회논문지
    • /
    • 제21권11호
    • /
    • pp.2133-2138
    • /
    • 2017
  • 기존의 XML 문서나 다른 문서는 단어를 중심으로 분석이 진행되었다. 이는 형태소 분석기를 활용하여 구현이 가능하나 문서 내에 기재되어 있는 많은 단어를 분류할 뿐 문서의 핵심 내용을 파악하기에는 어려움이 있다. 사용자가 문서를 효율적으로 이해하기 위해서는 주요 단어가 포함되어 있는 문단을 추출하여 사용자에게 보여주어야 한다. 본 논문에서 제안하는 시스템은 정규화 된 XML 문서 내에 키워드를 검색하고 사용자가 입력한 키워드들이 포함되어 있는 문단을 추출하여 사용자에게 보여준다. 그리고 검색에 사용된 키워드들의 빈도수와 가중치를 사용자에게 알려주고 추출한 문단의 순서와 중복 제거 기능을 통해 사용자가 문서를 이해하는데 발생할 수 있는 오류를 최소화하였다. 제안하는 시스템은 사용자가 문서 전체를 읽지 않고 문서를 이해할 수 있게 하여 문서를 이해하는데 필요한 시간과 노력을 최소화할 수 있을 것으로 사료된다.

지역교육청 수요자 만족도조사를 위한 표본설계에 관한 연구 (A sample survey design for service satisfaction evaluation of regional education offices)

  • 허순영;장덕준
    • Journal of the Korean Data and Information Science Society
    • /
    • 제21권4호
    • /
    • pp.669-679
    • /
    • 2010
  • 지역교육청 수요자 만족도조사를 위한 표본설계는 경상남도의 2009년 경남지역교육청 고객만족도 조사의 표본크기에 기초하여 시 군별 지역교육청평가에 맞추어 설계하였다. 대도시의 구단위 지역 교육청과 달리 지방의 시 군 교육청은 학생수와 학교수, 학급당 학생수 등의 변동이 크다. 시간 비용 등을 고려하여 전체 표본크기를 작게 하면서도 각 시 군 교육청 평가에 필요한 최소표본수를 확보하도록 설계하였다. 경상남도는 10개의 시지역과 10개의 군지역을 가지고 있고, 학생수가 상대적으로 작은 군지역교육청 평가에 필요한 최소표본수를 확보하기위해 지역별 평가에 필요한 최소표본을 우선배분한 후, 나머지는 지역별 학급수에 비례배분하였고, 표본학교는 지역과 학교설립유형별로 층화하여 학급수에 비례하여 추출하였다. 표본학교 내에서 조사대상 학생은 2단집락추출하였다. 지역별 추출율의 상이함을 보정하기 위해 가중치를 산정하였다. 조사자료의 분석은 가중치를 적용하여 가중평균, 가중총합 등을 이용하며, 분산의 추정은 통계소프트웨어에서 제공하는 균형반복복제, 잭나이프, 선형화방법 등을 사용할 수 있다.

스트림 데이터 환경에서 배치 가중치를 이용하여 사용자 특성을 반영한 빈발항목 집합 탐사 (Discovering Frequent Itemsets Reflected User Characteristics Using Weighted Batch based on Data Stream)

  • 서복일;김재인;황부현
    • 한국콘텐츠학회논문지
    • /
    • 제11권1호
    • /
    • pp.56-64
    • /
    • 2011
  • 스트림데이터는 무한하고 연속적인 특성을 지니고 있기 때문에 전체 데이터를 기반으로 빈발 항목 집합을 탐사하는 것은 어렵다. 이 때문에 데이터의 특성과 사용자의 특성을 반영한 특수한 데이터마이닝 방법이 필요하다. 이 논문에서는 사용자가 최근에 발생한 데이터에 더 많은 관심이 있다는 특성을 반영하여 빈발 항목을 탐사하는 FIMWB 방법을 제안한다. FIMWB는 과거 데이터의 발생 시점과 현재 시점과의 시간 간격에 따라 가변적인 가중치를 배치에 부여하여 최신 데이터에 더 많은 관심과 중요성을 반영한다. FP-Digraph는 FIMWB를 통해 탐사된 빈발 항목으로 그래프를 구성하여 빈발 항목 집합을 탐사한다. 실험 결과로 FIMWB 방법이 불필요한 항목의 생성을 감소시키고 트리기반(FP-Tree)의 빈발 항목 집합 탐사에 비해 제안하는 FP-Digraph 방법이 스트림 데이터 환경에 더 적합함을 알 수 있다.

Geodesic Support-weight 기반 깊이정보 추출 알고리즘의 효율적인 VLSI 구조 (Efficient VLSI Architecture for Disparity Calculation based on Geodesic Support-weight)

  • 류동훈;박태근
    • 전자공학회논문지
    • /
    • 제52권9호
    • /
    • pp.45-53
    • /
    • 2015
  • 적응적 가중치 윈도우 알고리즘은 기존의 지역적 정합방법의 단점인 낮은 정합률을 보완하면서 전역적 방법에 비하여 실시간 하드웨어 설계가 용이하다는 장점을 갖고 있다. 본 논문에서는 객체를 분리하는데 더 유리한 지오데식 가중치 윈도우 알고리즘을 사용하여 실시간 처리가 가능한 시스템을 설계하였다. 효율적인 하드웨어 설계와 처리 효율을 높이기 위해 데이터 의존성에 따른 스케줄링을 분석하였고 계산시간이 가장 긴 가중치 계산을 기준으로 계산 단계를 최소화하여 병렬 처리를 적용하였다. 지수함수 연산은 에러분석을 기반으로 계단(step) 함수로 구현하여 하드웨어 자원을 줄이고 설계 효율을 높였다. 설계한 시스템은 verilogHDL로 설계되었으며 동부하이텍 0.18um 라이브러리를 사용하여 Synopsis를 통해 합성하였고 츠쿠바 영상을 기준으로 2.22%의 에러율과 260MHz(25fps)의 최대 동작주파수, 182K 게이트의 하드웨어 자원을 사용한다.

복잡한 도시장면의 고속 렌더링을 위한 기여도 컬링 기법 (A Contribution Culling Method for Fast Rendering of Complex Urban Scenes)

  • 이범종;박종승
    • 한국게임학회 논문지
    • /
    • 제7권1호
    • /
    • pp.43-52
    • /
    • 2007
  • 본 논문은 복잡하고 거대한 도시장면의 빠른 렌더링을 위한 기여도 컬링에 대한 새로운 방법을 제안한다. 시각 절두체 컬링 기술은 복잡한 장면의 빠른 렌더링에 사용된다. LOD를 지원하기 위해 영상 영역을 분할하고 가중치 쿼드트리를 생성한다. 현재 카메라 위치에서 보이는 객체들만 현재 쿼드트리의 요소가 되고 가중치는 쿼드트리의 각 객체에 할당된다. 가중치는 투사된 객체의 영상 영역에 비례하기 때문에 카메라로부터 먼 거리에 있는 큰 구조물들은 가까운 거리에 있는 작은 구조물들보다 컬링될 확률이 적다. 렌더링 시간은 보이는 객체들의 수에 독립적으로 거의 일정하다. 제안된 방법을 현재 개발 중인 새로운 대도시 구역에 적용했다. 제안된 방법은 기존의 방법과 같은 렌더링 질을 보장하며 다각형의 수를 약 9% 감소시킴을 확인하였다. 제안된 렌더링 방법은 복잡하고 거대한 장면의 고품질 실간 렌더링을 위한 응용 시스템에 효과적으로 사용될 수 있음을 확인하였다.

  • PDF

EDP들의 참조 테이블을 이용한 실용적 인 경로 설정 및 파장 할당 알고리즘 (A Practical RWA Algorithm-based on Lookup Table for Edge Disjoint Paths)

  • 김명희;방영철;정민영;이태진;추현승
    • 한국정보과학회논문지:정보통신
    • /
    • 제31권2호
    • /
    • pp.123-130
    • /
    • 2004
  • 경로 설정 및 파장 할당(Routing and Wavelength Assignment) 문제는 파장 할당 전송 기법(Wavelength Division Multiplexing)을 기반으로 하는 광 네트워크에서 중요한 분야이다. 경로 설정 및 파장 할당 문제는 선형 프로그램(Linear Programming)과 그래프 컬러링(Graph Coloring)의 조합으로 해결되거나, 경로 선택에 기반 한 그래프 알고리즘에 의해서 해결된다. 이와 같은 방법은 복잡하며 휴리스틱 알고리즘(heuristic algorithm)이 요구된다. 본 논문에서는 각각의 연결 요구에 대한 최대한의 EDPs(Edge Disjoint Paths)를 구함으로써 경로 설정 및 파장 할당 문제를 효율적으로 해결하는 새로운 방법을 제안한다. 이렇게 구한 EDPs는 참조 테이블에 저장되고 가중치 매트릭스의 갱신에 사용된다. 각 연결 요구에 대한 경로는 순서대로 가중치 매트릭스를 참조하여 결정한다. 본 논문에서 제안하는 알고리즘이 현재 실질적으로 효율적이라 알려진 BGA for EDP(Bounded Greedy Approach for EDP)보다 약 50%의 수행 시간 내에 같거나 작은 파장 수를 사용하여 연결 요구를 만족시켜주고 있음을 시뮬레이션을 통해서 확인할 수 있다.

리얼 테스트 환경 기반의 안티바이러스 소프트웨어의 품질평가 방법론 정립에 관한 연구 (A Study on Quality evaluation Methodology Establishment of Anti-Virus Software based on the Real Test Environment)

  • 맹두열;박종계;김성조
    • 한국통신학회논문지
    • /
    • 제35권3B호
    • /
    • pp.440-452
    • /
    • 2010
  • 소프트웨어 제품의 평가를 위해 국제표준 ISO/IEC 품질인증 시스템을 기반으로 국내 외 기관 및 연구소에서 품질에 대한 많은 방법론이 연구 및 적용되고 있으나, 복잡한 차원의 특수한 성질을 지닌 안티바이러스 소프트웨어를 평가하기에는 많은 문제를 동반한다. 따라서 본 논문에서는 적정 수준 이상의 요건을 갖춘 안티바이러스 소프트웨어의 품질평가 방법론을 마련하고자 평가항목 도출을 위한 프로세스와 정량화 방안을 정립하였으며 각 요인간의 상대적 중요도를 분석함으로써 가중치 정보를 객관화하였다. 정의된 정보(평가 항목, 가중치)를 기반으로 포털 사이트에서 수집한 공개용 안티바이러스 소프트웨어 70종에 대하여 리얼 테스트 환경에서 품질평가를 수행하였으며, 사용자들의 오랜 시간동안의 경험을 이용한 실증분석 결과 본 논문에서 정의한 평가항목과 가중치에 대한 정당성을 마련할 수 있었다.

가중치 기반의 순차패턴 탐사를 이용한 추천서비스에 관한 연구 (A Study of Recommending Service Using Mining Sequential Pattern based on Weight)

  • 조영성;문송철;안연식
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권6호
    • /
    • pp.711-719
    • /
    • 2014
  • 유비쿼터스 컴퓨팅 환경하에서 전자상거래 대규모가 대형화되고 취급되는 항목제품들도 다종 다양해지고 있는 것이 현실이다. 이러한 유비쿼터스 상거래 시스템은 편리하고 신속하게 제공되어야 하고 다이나믹한 환경에서 실시간성과 민첩성이 요구되고 있다. 데이터마이닝에서 추출한 지식을 적극적으로 활용하는 기법들이 전자상거래에서 구매 촉진을 증진시키는 마케팅 전략으로 활용되고 있다. 본 연구에서는 유비쿼터스 컴퓨팅 환경 하에 지능형 모바일 단말기를 이용한 추천을 위한 가중치기반 순차패턴 탐사를 이용한 추천서비스f를 제안하였다. 본 연구에서는 추천의 정확성을 향상시키고 구매력이 높은 항목제품 및 서비스를 추천하기 위해서 FRAT 세분화 기법을 이용한 가중치기반 순차패턴 탐사를 이용한 추천서비스를 제안하였다. 성능평가를 위해 현업에서 사용하는 인터넷 화장품 쇼핑몰의 데이터를 기반으로 데이터 셋을 구성하여 기존의 방법과 비교 실험을 통해 성능을 평가하여 효용성과 타당성을 입증하였다. 유비쿼터스 상거래에서 시간과 장소에 제약을 받지 않는 모바일 웹앱을 이용한 추천서비스를 위해서 이전방법보다 개선된 방법으로 추천서비스를 구현하였다.

지역적 가중치 거리맵을 이용한 3차원 영상 정합 (Three-Dimensional Image Registration using a Locally Weighted-3D Distance Map)

  • 이호;홍헬렌;신영길
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권7호
    • /
    • pp.939-948
    • /
    • 2004
  • 본 논문에서는 동일 환자에 대해 시간차를 두고 촬영한 뇌 CT-CT 혈관조영영상간 움직임을 보정하기 위한 강인하고 고속의 정합방법을 제안한다. 먼저, 두 영상에서 3차원 경계검출 기법을 이용하여 특징점을 추출하고, 기준영상에서는 이를 지역적 가중치 3차원 거리맵으로 변환한다. 부유영상을 기준영상으로 강체변환하면서 두 경계간의 상관관계가 최대인 위치를 탐색한다. 이 때, 최대위치가 더 이상 변화하지 않고 일정 이상 반복되면 해당위치를 최적위치로 하여 부유영상을 최적위치로 변환시켜 두 영상을 정합한다. 실험을 위하여 인공영상을 사용하여 정화성과 강인성을 평가하였고, 육안평가를 위하여 뇌 CT-CT 혈관조영영상을 사용하였다. 본 제안방법은 지역적 가중치 3차원 거리맵을 이용함으로써 적은 샘플링 개수에도 국부최대인 위치에 수렴하지 않고 최적위치로 강인하면서 고속으로 영상이 정합되었다

어절 내의 형태소 범주 패턴에 기반한 통계적 자동 띄어쓰기 시스템 (A Stochastic Word-Spacing System Based on Word Category-Pattern)

  • 강미영;정성원;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권11호
    • /
    • pp.965-978
    • /
    • 2006
  • 본 논문에서는 형태소 unigram과 한국어 어절을 형성하는 형태소 범주 패턴에 기반하여 어절을 인식하는 한국어 띄어쓰기 시스템을 구현하였다. 기존에 많이 연구된 통계 정보를 이용한 띄어쓰기 모델은 비교적 짧은 시간에 쉽게 구현할 수 있는 장점이 있지만, 한국어의 형태 유형론적 특성 때문에 발생하는 (ㄱ) 자료부족 문제와 (ㄴ) 메모리 크기 문제에 효과적으로 대처하지 못한다. 본 논문은 이 두 문제를 동시에 해결하기 위해 어절을 구성하고 있는 개별 형태소의 통계 정보와 그 형태소의 범주의 통계 정보를 기반으로 하여 띄어쓰기 후보 어절들을 추천한다. 임의의 후보 어절이 최종의 띄어쓰기 단위인 어절이 될 수 있는 확률은 (ㄱ) 해당 후보 어절 내의 각 형태소 확률과 (ㄴ) 해당 후보 어절을 구성하기 위해 그 형태소의 범주가 다른 형태소 범주와 함께 형성하는 패턴 내에서 차지하는 '범주가중치'를 고려하여 구한다. 해당 '범주가중치'는 (ㄱ) 말뭉치로부터 실제로 관찰된 어절의 확률과 (ㄴ) 후보 어절 내의 개별 형태소의 확률과 (ㄷ) 그 범주 가중치에 의해 추정된 어절 확률 사이의 평균 에러(error mean)가 최저가 되는 방향으로 학습하여 얻어진다.