• 제목/요약/키워드: 할당 추출

검색결과 164건 처리시간 0.023초

전화조사를 위한 시간균형할당표본추출 (Time-Balanced Quota Sampling for Telephone Survey)

  • 허명회;황진모
    • 한국조사연구학회지:조사연구
    • /
    • 제7권2호
    • /
    • pp.39-52
    • /
    • 2006
  • 우리나라 대다수 조사전문기관은 지역 성 나이대 할당표본추출에 의한 전화조사를 하고 있다. 그러나 평일에는 인구사회적 속성에 따른 개인별 재택률의 차이가 심하므로 체계적 응답자선택편향(respondent selection bias)이 우려된다. 문제 해결을 위해 조사시간대를 할당변수로 추가한 '시간균형할당표본추출'(time-balanced quota sampling) 방법과 저녁시간대 할당을 부분적으로 완화한 '시간균형준할당표본추출'(time-balanced quasi-quota sampling) 방법을 제안한다. 그리고 우리나라 통계청에서 2004년에 수집한 생활시간조사 원자료를 가상적 모집단으로 설정하여 새로운 할당추출법과 기존할당추출법에 의해 얻는 몬테칼로 표본들을 비교할 것이다.

  • PDF

IAEA사찰표본 할당계산법 비교연구

  • 김현태
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1995년도 추계학술발표회논문집(2)
    • /
    • pp.1029-1034
    • /
    • 1995
  • IAEA(International Atomic Energy Agency, 국제원자력기구)에서는 사찰활동 수행시, 비복원추출을 기술하는 초기 하분포(hypergeometric distribution) 대신 복원추출을 기술하는 이항분포(binomial distribution)를 사용하여 표본크기 (sample site)를 계산하여 최대 3가지 검증방법들에 할당한다. 본 연구에서는 사찰표본할당과 관련하여 PC사용이 요구되는 반복할당법인 초기하할당법, 개선된 이항할당법, 그리고 표준할당법과 포켓계산기에서 사용 가능한 근사 할당법인 개선된 이항할당근사법과 표준이항할당근사법을 비교 검토하였다.

  • PDF

IAEA 사찰표본할당계산법에 대한 초기하분포 적용 연구

  • 김현태;박완수;민경식;박찬식;곽은호
    • 한국원자력학회:학술대회논문집
    • /
    • 한국원자력학회 1995년도 춘계학술발표회논문집(2)
    • /
    • pp.1093-1098
    • /
    • 1995
  • IAEA(International Atomic Energy Agency, 국제원자력기구)에서는 사찰활동 수행시, 비복원추출(sampling without replacement)을 기술하는 초기하분포 대신 복원추출(sampling with replacement)을 기술하는 이항분포를 사용하여 표본크기를 계산하여 사찰방법들에 할당한다. 본 연구에서는 이항근사법이 사용되는 IAEA의 표본크기 할당계산결과와 이항근사법 대신 초기하분포를 적용한 IAEA표본크기 할당계산결과를 비교 검토하였다.

  • PDF

비할당 영역 데이터 파편의 문서 텍스트 추출 방안에 관한 연구 (A Study on Extracting the Document Text for Unallocated Areas of Data Fragments)

  • 유병영;박정흠;방제완;이상진
    • 정보보호학회논문지
    • /
    • 제20권6호
    • /
    • pp.43-51
    • /
    • 2010
  • 디지털 포렌식 관점에서 디스크의 비할당 영역의 데이터를 분석하는 것은 삭제된 데이터를 조사할 수 있다는 점에서 의미가 있다 파일 카빙(Carving) 을 이용하여 비할당 영역의 데이터를 복구할 경우 일반적으로 연속적으로 할당된 완전한 파일은 복구 기능하지만, 비연속적으로 할당되거나 완전하지 않은 형태의 단편화된 데이터 파편(Fragment)은 복구하기 어렵다. 하지만 데이터 파편은 많은 양의 정보를 포함하고 있기 때문에 이에 대한 분석이 필요하다. Microsoft Word. Excel, PowerPoint, PDF 문서 파일은 텍스트와 같은 정보들을 압축된 형태로 저장하거나 문서 내부에 특정 형식을 이용하여 저장한다. 앞서 언급한 문서 파일의 일부분이 데이터 파편에 저장되어 있을 경우 해당 데이터 파편에서 데이터의 압축 여부를 판단하거나 문서 내부 형식을 이용하여 텍스트 추출이 가능하다. 본 논문에서는 비할당 영역 데이터 파편에서 특정 문서파일의 텍스트를 추출하는 방안을 제시한다.

단어 유사도를 이용한 뉴스 토픽 추출 (News Topic Extraction based on Word Similarity)

  • 김동욱;이수원
    • 정보과학회 논문지
    • /
    • 제44권11호
    • /
    • pp.1138-1148
    • /
    • 2017
  • 토픽 추출은 문서 집합으로부터 그 문서 집합을 대표하는 토픽을 자동 추출하는 기술이며 자연어 처리의 중요한 연구 분야이다. 대표적인 토픽 추출 방법으로는 잠재 디리클레 할당과 단어 군집화 기반 토픽 추출방법이 있다. 그러나 이러한 방법의 문제점으로는 토픽 중복 문제와 토픽 혼재 문제가 있다. 토픽 중복 문제는 특정 토픽이 여러 개의 토픽으로 추출되는 문제이며, 토픽 혼재 문제는 추출된 하나의 토픽 내에 여러 토픽이 혼재되어 있는 문제이다. 이러한 문제를 해결하기 위하여 본 연구에서는 토픽 중복 문제에 대해 강건한 잠재 디리클레 할당으로 토픽을 추출하고 단어 간 유사도를 이용하여 토픽 분리 및 토픽 병합의 단계를 거쳐 최종적으로 토픽을 보정하는 방법을 제안한다. 실험 결과 제안 방법이 잠재 디리클레 할당 방법에 비해 좋은 성능을 보였다.

동적 프로세서 할당 기법을 이용한 파이프라인 해쉬 결합 알고리즘 (A Pipelined Hash Join Algorithm using Dynamic Processor Allocation)

  • 원영선;이동련;이규옥;홍만표
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제28권1_2호
    • /
    • pp.1-10
    • /
    • 2001
  • 본 논문에서는 부쉬 트리를 할당 트리로 변환한 후 결합 연산을 수행하면서 실제 실행시간을 동적으로 계산하고 그 결과에 의해 실시간에 프로세서를 할당하는 동적 프로세서 할당 기법을 이용한 파이프라인 해쉬 결합 알고리즘을 제안하였다. 프로세서를 할당하는 과정에서 초기 릴레이션의 기본 정보만을 이용하여 미리 프로세서를 할당하는 기존의 정적 프로세서 할당 기법은 정확한 실행시간을 예측할 수 없었다. 따라서 본 논문에서는 할당 트리 각 노드의 실행결과를 포함한 결합 과정 중의 정보를 다음 노드의 실행시간에 충분히 반영하는 동적 프로세서 할당 기법을 제안하였으며, 이로써 프로세서를 효율적으로 분배하고 전체적인 실행시간을 최소화하였다. 또한 전체적인 질의 실행시간을 줄이기 위하여 결합 가능성이 없는 튜플들을 제거한 후 결합 연산을 수행할 수 있도록 해쉬 필터 기법을 이용하였다. 결합 연산을 수행하기에 앞서 모든 결합 속성 값에 대해 해쉬 필터를 생성하는 정적 필터 기법은 모든 결합 연산의 중간 결과로 발생할 수 있으나 최종 결과 릴레이션의 튜플이 될 수 없는 튜플들까지도 모두 추출이 가능하다. 따라서 각각의 결합 연산 직전에 해쉬 필터를 생성하는 동적 필터 기법에 비해 결합 가능성이 없는 튜플을 최대한 제거할 수 있으며 이로써 결합 연산의 실행비용을 크게 줄일 수 있었다.

  • PDF

조사원의 업무할당 및 인구통계학적 특성에 따른 오차분석

  • 김설희
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2004년도 학술발표논문집
    • /
    • pp.29-34
    • /
    • 2004
  • 계속 반복하여 실시되는 통계조사에서 조사원은 오차를 발생시키는 주요 요인으로 간주되고 있다 조사원에 의한 오차를 측정하는 방법으로서 조사표 형태별로 조사원, 집락 및 가구 등 변수에 따라 할당하고 선계방법에 따른 추정 값에 대한 효과 및 효과의 분산을 산출하는 모델을 제시한다. 또한 실제 조사모델로부터 품질관리표본을 추출하여 이를 대상으로 리인터뷰를 실시한 결과를 조사원의 인구통계학적 특성별로 분석하고 불일치지수 등을 산출함으로써 오차를 분석하는 방법을 제시한다.

  • PDF

다단추출 표본설계의 층효율성 연구 (Measuring stratification effects for multistage sampling)

  • 김태훈;이기재;박인호
    • 응용통계연구
    • /
    • 제36권4호
    • /
    • pp.337-347
    • /
    • 2023
  • 표본설계는 개체 혹은 집락을 층으로 나눈후 층별로 독립적으로 표본추출하는 층화추출을 종종 채택한다. 층화 전략은 크게 층구분과 표본할당으로 구성되는데 이는 조사연구에서 반복적으로 고려되는 중요한 주제이다. 조사연구에서는 층화다단추출 방식의 복합표본설계를 채택하고 있지만 층효과 혹은 층효율성과 관련하여서 표본론 교재들에서 주로 단순추출에 대해서 다루어지고 있다. 본 연구는 이단추출에 대한 기존 층효율성 측도를 살펴보며 설계효과모형을 적용한 추가적인 층효율성 측도들을 제안하였다. 제안된 측도들을 활용하여 제4기 국민환경기초조사의 고등학교 대상 표본설계의 층화전략에 대해 평가하였다.

백과사전 영역에서 중심어주도패턴에 기반한 문장주제 할당 기법 (A Sentence Theme Allocation Scheme based on Head Driven Patterns in Encyclopedia Domain)

  • 강보영;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권5호
    • /
    • pp.396-405
    • /
    • 2005
  • 기존의 주제 관련 연구들은 문서에 자주 등장하는 용어를 주제로 간주하는 등 문서에서 다루는 주제에 대한 정의가 모호하다. 또한 문서를 구성하는 기본 단위인 문장의 주제가 문서 요약 및 정보 추출 등의 연구 분야에 중요하게 활용될 수 있음에도 불구하고, 이에 대한 고려 없이 문서 전체의 주제를 추출하고 할당하는 연구가 대부분이다. 따라서 본 논문에서는 문장 단위의 주제 처리에 대한 기본 연구로서, 백과사전 영역에서 효과적인 중심어주도패턴에 기반한 문장주제 할당 기법을 제안하였다. 두산동아 백과사전 인물분야 2,381문서를 대상으로 성능을 분석해본 결과, 제안된 기법이 비교기준보다 향상된 성능을 보였으며, 특히 제안된 네 가지 중심어주도 패턴 중 술어를 기반으로 구성된 중심어주도패턴 유형 4가 학습집합에 대하여 평균 $98.96\%$, 실험집합에 대하여 $88.57\%$의 성능(F-score)으로 주제할당에 가장 효과적임을 알 수 있었다.