• 제목/요약/키워드: 통계적 문제해결 과정

검색결과 80건 처리시간 0.023초

한글 문장의 자동 띄어쓰기를 위한 두 가지 통계적 모델 (Two Statistical Models for Automatic Word Spacing of Korean Sentences)

  • 이도길;이상주;임희석;임해창
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권3_4호
    • /
    • pp.358-371
    • /
    • 2003
  • 자동 띄어쓰기는 문장 내에서 잘못 띄어쓴 어절들을 올바르게 복원하는 과정으로서, 독자에게 글의 가독성을 높이고 문장의 뜻을 정확히 전달하기 위해 매우 중요하다. 기존의 통계 기반 자동 띄어쓰기 접근 방법들은 이전 띄어쓰기 상태를 고려하지 않기 때문에 잘못된 확률 정보에 의한 띄어쓰기를 할 수밖에 없었다. 본 논문에서는 기존의 통계 기반 접근 방법 의 문제점을 해결할 수 있는 두 가지 통계적 띄어쓰기 모델을 제안한다. 제안하는 모델은 자동 띄어쓰기를 품사 부착과 같은 분류 문제(classification problem)로 간주할 수 있다는 착안에 기반하며, 은닉 마르코프 모델을 일반화함으로써 확장된 문맥을 고려할 수 있고 보다 정확한 확률을 추정할 수 있도록 고안되었다. 제안하는 모델과 지금까지 가장 좋은 성능을 보이는 기존의 방법을 비교하기 위해 여러 가지 실험 조건에 따른 다양한 실험을 수행하였고, 오류에 대한 자세한 분석을 제시하고 있다 제안하는 모델을 복합 명사를 고려하는 평가 방식에 적응한 실험 결과, 98.33%의 음절 단위 정확도와 93.06%외 어절단위 정확률을 얻었다.

몬테카를로 시뮬레이션의 난수 생성에 관한 교사들의 이해에 관한 연구 (Study on Teachers' Understanding on Generating Random Number in Monte Carlo Simulation)

  • 허남구;강향임
    • 대한수학교육학회지:학교수학
    • /
    • 제17권2호
    • /
    • pp.241-255
    • /
    • 2015
  • 본 연구는 35명의 예비교사와 현직교사를 대상으로 몬테카를로 시뮬레이션의 난수 생성 아이디어에 관한 이해를 분석하여 학교현장에 교육적 함의를 제공하는데 그 목적이 있다. 연구의 분석 결과, 실험 대상의 70%가 확률 문제 해결을 위해 제시된 세 가지 유형의 난수 생성 아이디어에서 적절한 아이디어를 선택하지 못했고, 자신의 선택을 설명하는 과정에서 오류를 나타냈다. 오류 유형으로는 첫째, 연속확률분포에서 한 점 또는 경계가 선택될 확률은 확률밀도함수에 대입한 값과 같다. 둘째, 교사B의 아이디어는 조건부확률로 문제를 변형하여 표본공간을 확장한 것임에도 처음 제시된 표본공간으로만 문제를 해석하려는 오류를 나타냈다. 셋째, 두 확률변수 X, Y가 독립일 때에만 $P(X=x,\;Y=y)=p(X=x){\times}P(Y=y{\mid}X=x)$이 성립한다는 오류를 나타냈다.

인포그래픽을 활용한 초등학교 5학년 통계 프로젝트 수업의 구체화 방안 (Concrete Class Plan for a Statistical Project of 5th Graders in Elementary School Using Infographics)

  • 김지혜;송상헌
    • 한국초등수학교육학회지
    • /
    • 제23권1호
    • /
    • pp.75-92
    • /
    • 2019
  • 2015 개정 수학과 교육과정에서는 학생들에게 그래프를 지도할 때 신문, 인터넷에 있는 그래프를 소재로 활용할 것과 자료를 수집, 분류, 정리하여 그래프를 그리고 해석하는 일련의 통계적 문제 해결 과정을 겪어볼 것을 권장하고 있다. 전통적인 교과서를 통해 학생들이 배우는 그래프는 단일한 형태의 그래프들이었고, 특히 5~6학년군의 그림그래프는 수치만 커졌을 뿐 기본 개념은 3~4학년군의 내용을 반복하고 있다. 다행히 2009 개정 교육과정부터는 일부 그래프의 특성을 서로 비교하면서 상황에 적합한 그래프를 선택할 수 있도록 하고 있으며 현실 세계 사용되는 그래프는 여러 가지 그래프들이 복합된 인포그래픽 형태로 제시되는 경우가 대부분이다. 본 연구는 인포그래픽을 활용한 통계 프로젝트 수업 사례 분석을 통해 초등학교 5학년 교실에서 활용 가능한 인포그래픽 활용 통계 프로젝트 수업을 구체화하는 방안을 제안하였다.

  • PDF

통계적 사전 처리방법을 통한 MT 전달함수 추정의 향상 기법 연구 (An improvement of MT transfer function estimates using by pre-screening scheme based on the statistical distribution of electromagnetic fields)

  • 양준모;권병두;이덕기;송윤호;윤용훈
    • 한국지구물리탐사학회:학술대회논문집
    • /
    • 한국지구물리탐사학회 2005년도 공동학술대회 논문집
    • /
    • pp.273-280
    • /
    • 2005
  • MT 전달함수의 추정과정에서 로버스트 방법의 적용은 현재 전자탐사 분야에서 일반적이다. 적절하게 고안되고 적용된 로버스트 방법은 출력 채널인 전기장에 포함되어 있는 외치의 영향을 감소시킬 수 있으나, HLP(High leverage point)라 불리 우는 자기장(입력 채널)의 외치에 종종 민감하지 못하다. 이 문제를 해결하기 위해 HLP의 영향을 최소화할 수 있는 BI(Bounded Influence) 추정이 제안되었고, 전통적인 로버스트 방법보다 신뢰성 있는 전달함수를 제공하는 것으로 보고되었다. 이는 BI 추정이 M-추정을 적용함과 동시에 자기장 성분만으로 결정되는 모자행렬의 통계적인 특성을 고려하여 가중치를 부여하는 방법이기 때문이다. 본 연구에서는 전달함수 추정과정에 BI 추정을 적용하고, 이와 더불어 전처리 단계로서 전자기장의 통계적 분포를 이용해 주파수 영역에서 극단적인 전기장과 자기장 자료의 영향을 감소시키는 기법을 개발하였다. 개발된 전처리 기법은 BI 추정으로 제거될 수 없는 자료를 주파수 영역에서 효과적으로 제거하는 것으로 생각된다. 본 연구에서 개발된 기법의 효율성과 장점은 합성 자료와 현장 자료를 이용하여 도시될 것이다.

  • PDF

뉴질랜드 수학과 교육과정 분석 - 교육과정 성취기준의 연계성을 중심으로 - (Analysis on the New Zealand Mathematics Curriculum: Focused on the Connectivity between Standards into Curriculum)

  • 조성민;박지현;최인선
    • 대한수학교육학회지:학교수학
    • /
    • 제19권3호
    • /
    • pp.423-441
    • /
    • 2017
  • 2015 개정 교육과정이 역량 중심 교육과정을 표방함에 따라 역량 중심으로 교육과정을 개혁하고 이를 실천에 옮긴 뉴질랜드 교육과정은 우리나라 교육과정 연구에 시사하는 바가 크다. 본 연구에서는 뉴질랜드 교육 체제 및 교육과정의 특징을 살펴보고, 연계성의 관점에서 교육과정의 성취기준을 분석하고자 한다. 이를 위해 뉴질랜드 교육 체제 및 수학과 교육과정의 특징을 살펴보고, 뉴질랜드 교육과정과 우리나라 교육과정의 관련성을 살펴보았다. 또한 각 교과에서 진행된 연계성 분석틀을 바탕으로 연계성 분석기준을 설정하고 뉴질랜드의 교육과정 중 우리나라 고등학교 수학과 교육과정에 해당하는 수준의 성취목표를 분석하였다. 연구 결과 뉴질랜드 수학과 교육과정은 우리나라에서 이공계열로 진학하려는 학생들이 이수하는 과목의 학습내용 성취수준을 대부분 포함하고 있고, 실세계에서의 문제 해결 능력을 키울 수 있도록 통계적 탐구 활동을 강조하는 것으로 나타났다. 연계성 측면에서는 수준이 올라감에 따라 다루는 개념 또는 내용의 범위가 넓어지거나 수준이 높아지는 '심화'의 형태를 띠는 경우가 많았다.

지식정보처리역량 함양을 위한 데이터 기반 과학탐구 모형 개발 (Development of Data-Driven Science Inquiry Model and Strategy for Cultivating Knowledge-Information-Processing Competency)

  • 손미현;정대홍
    • 한국과학교육학회지
    • /
    • 제40권6호
    • /
    • pp.657-670
    • /
    • 2020
  • 지식정보화 사회가 되면서 기존과는 다른 유형의 사회 문제들이 발생하고, 이를 파악하고 해결하는데 필수적인 역량으로 지식정보처리역량을 꼽을 수 있다. 지식정보처리역량은 정보의 수집과 분석, 활용을 할 수 있는 역량으로 학문 분야에 따라 그 적용이 달라질 수 있으므로 일반 소양적인 측면과 교과 맥락적인 측면으로 나누어 교육할 수 있다. 과학에서의 지식정보처리역량 함양 교육은 이제까지는 일반 소양적인 측면에서 주로 실행됐으므로, 과학 탐구 활동을 통해 교과 맥락적인 측면에서의 교육이 필요하다. 따라서 본 연구에서는 학교 현장에서 일반적으로 적용 가능한 지식정보처리함양을 위한 데이터 기반 과학탐구 모형과 수업전략을 개발하였다. 모형과 수업전략은 설계·개발 연구방법론에 따라 문헌연구를 바탕으로 모형과 수업전략을 1차 개발하고 전문가의 조언을 듣는 내적 타당화 과정과 실제 현장에 적용하는 외적 타당화 과정을 통해 수정, 개선하여 완성하였다. 자원기반학습 이론을 바탕으로 과학탐구 모형, 데이터 과학의 특징, 통계적 문제 해결력 모형에 대한 문헌 연구를 실시하였고, 전문가 5인의 자문을 받아 CVI, IRA 값을 구하고 면담을 통해 모형과 전략을 개선하였으며 두 번의 외적 타당화 과정을 거치며 현장 적용성 높은 모형과 전략을 완성하였다. 본 연구에서 개발한 모형은 탐색적 과학 데이터 분석 탐구모형(Exploratory Scientific Data Analysis Inquiry Model, 이하 ESDA 탐구모형)으로 학교의 상황에서 실행가능한 도구를 먼저 선택하고 데이터를 수집하며, 그 후 분석 과정에서 질문을 찾고, 이를 새로운 가설로 설정하여 또 다른 탐구를 진행하는 형태를 갖는다. 수업 전략은 최종 7가지 원리로 세분화 되었는데, 도구 탐색의 원리, 실생활 데이터 수집의 원리, 데이터 변형의 원리, 데이터 해석의 원리, 문제 구체화의 원리, 문제 해결의 원리, 표현과 공유의 원리이다. 각 원리는 탐구 모형과 연계되어 있으며, 교수 전략 뿐 아니라 탐구를 수행할 수 있는 환경 구성의 조건을 포함하고 있어 현장 적용성을 높이고자 하였다. 본 연구는 일반적인 대규모의 학생을 대상으로 양적 연구를 실시하지 못했다는 한계가 있으나 지식정보처리 역량을 과학탐구의 관점에서 접근하여 실제적 모형과 전략을 개발했다는 점에서 의의가 있다.

Belief Propagation 기반 스테레오 정합을 위한 정합 파라미터의 추정방식 제안 (Estimating the Regularizing Parameters for Belief Propagation Based Stereo Matching Algorithm)

  • 오광희;임선영;한희일
    • 대한전자공학회논문지SP
    • /
    • 제47권1호
    • /
    • pp.112-119
    • /
    • 2010
  • 본 논문에서는 스테레오 이미지로부터 디스패리티 맵을 추출하기 위한 확률모델을 제시하고 이의 해를 구하는 과정은 에너지 기반 스테레오 정합과 일치함을 이론적으로 증명한다. 정합되는 화소 간의 차와 인근 화소에 해당되는 디스패리티의 차는 exponential 확률분포에 근사하다는 사실을 실험적으로 확인하고 이에 근거하여 이들의 정합 파라미터를 최적화하는 식을 유도하고 이를 실험적으로 구하는 방법을 제시한다. 에너지 기반 스테레오 정합 알고리즘의 성능은 기본적으로 정합 파라미터의 크기에 매우 민감하므로 이미지에 따라 적절한 값을 사전에 구하여 적용하여야 한다. 제안한 방식은 초기에 임의의 파라미터로 디스패리티 맵을 구한 후에 이의 통계적 특성을 이용하여 정합 파라미터를 추정하고 추정된 파라미터를 적용하여 디스패리티 맵을 재차 구하는 과정을 반복함으로써 최적의 파라미터에 적응적으로 수렴하도록 조정한다. 따라서, 이미지에 따라 사전에 정합 파라미터를 구하여야 하는 문제를 해결할 수 있다. Middlebury 웹사이트에서 제공한 다양한 스테레오 이미지를 이용하여 제안한 방식으로 구한 파라미터가 최적의 값으로 수렴하는지를 조사하고 이의 수렴 속도와 성능 개선 효과 등을 확인한다.

대용량 DB를 사용한 지문인식 시스템 (A Fingerprint Identification System using Large Database)

  • 차정희;서정만
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.203-211
    • /
    • 2005
  • 본 논문에서는 대용량 DB에서 개인을 인식하는 새로운 자동 지문인식 시스템을 제안한다. 시스템은 전처리, 분류, 매칭의 3단계로 구성되는데, 분류단계에서는 방향성 이미지 분포의 통계적인 접근 방법에 기반한 새로운 분류기법을 제안하였고, 정합단계에서는 기존 알고리즘보다 더 빠르고 정확한, 개선된 특징점 후보쌍 추출 알고리즘을 제안하였다. 정확성을 위해 정합 단계에서 세선화된 이미지로부터 지문의 특징점을 추출하고 특징점의 연결정보를 사용한 정합과정을 소개한다. 특징점 정합과정에서 연결정보를 사용하는 것은 간단하지만 정확한 방법이며, 두 지문의 비교단계에서 빠르게 기준 특징점 쌍을 선택하는 문제를 해결해 준다. 알고리즘은 지문의 회전과 이동에 무관하다. 제안한 시스템은 반도체 칩방식 입력장치로부터 획득한 1000개의 지문영상으로 실험하였으며, 실험결과는 제안한 방법이 기존방법보다 오인식율은 줄어들고 정확도는 증가하였음을 보여준다.

  • PDF

SpatioTemporal GIS를 활용한 도시공간모형 적용에 관한 연구 / 인구분포모델링을 중심으로

  • 남광우;이성호;김영섭;최철옹
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2002년도 춘계학술대회논문집
    • /
    • pp.127-141
    • /
    • 2002
  • GIS환경에서 도시모형(urban model)의 적용을 목적으로 사회·경제적 데이터(socio-economic data)를 활용하는 과정은 도시현상이 갖는 복잡성과 변동성으로 인해 하나의 특정시간에서의 상황을 그대로 저장한 형태인 스냅샷 모형(snapshot model)만으로는 효율적인 공간분석의 실행이 불가능하다. 또한 도시모형을 적용하는 과정에서 GIS의 대상이 되는 공간, 속성, 시간의 정의는 분석목적에 따라 다르게 정의되어질 수 있으며 이에 따라 상이한 결과가 도출될 수 있다. 본 연구는 30년 간의 부산시 인구분포의 동적 변화과정 관측을 위해 시간개념을 결합한 Temporal GIS를 구축하고 이를 활용하여 인구밀도모형 및 접근성모형을 적용하는 과정을 통해 보다 효율적이고 다양한 결과를 제시할 수 있는 GIS 활용방안을 제시하고자 하였다. 흔히 공간현상의 계량화와 통계적 기법의 적용을 위한 데이터 처리과정은 많은 오차와 오류를 유발할 수 있다. 이러한 문제의 해결을 위해서는 우선적으로 분석목적에 맞는 데이터의 정의(Data Definition), 적용하고자 하는 모형(Model)의 유용성 검증, 적절한 분석단위의 설정, 결과해석의 객관적 접근 등이 요구된다. 이와 더불어 변동성 파악을 위한 시계열 자료의 효율적 처리를 위한 방법론이 마련되어져야 한다. 즉, GIS환경에서의 도시모형의 적용에 따른 효율성과 효과성의 극대화를 위해서는 분석목적에 맞는 데이터모델의 설정과 공간DB의 구축방법이 이루어져야 하며 분석가능한 데이터의 유형에 대한 충분한 고려와 적용과정에서 분석결과에 중대한 영향을 미칠 수 있는 요소들을 미리 검증하여 결정하는 순환적 의사결정과정이 필요하다., 표준패턴을 음표와 비음표의 두개의 그룹으로 나누어 인식함으로써 DP 매칭의 처리 속도를 개선시켰고, 국소적인 변형이 있는 패턴과 특징의 수가 다른 패턴의 경우에도 좋은 인식률을 얻었다.r interferon alfa concentrated solution can be established according to the monograph of EP suggesting the revision of Minimum requirements for biological productss of e-procurement, e-placement, e-payment are also investigated.. monocytogenes, E. coli 및 S. enteritidis에 대한 키토산의 최소저해농도는 각각 0.1461 mg/mL, 0.2419 mg/mL, 0.0980 mg/mL 및 0.0490 mg/mL로 측정되었다. 또한 2%(v/v) 초산 자체의 최소저해농도를 측정한 결과, B. cereus, L. mosocytogenes, E. eoli에 대해서는 control과 비교시 유의적인 항균효과는 나타나지 않았다. 반면에 S. enteritidis의 경우는 배양시간 4시간까지는 항균활성을 나타내었지만, 8시간 이후부터는 S. enteritidis의 성장이 control 보다 높아져 배양시간 20시간에서는 control 보다 약 2배 이상 균주의 성장을 촉진시켰다.차에 따른 개별화 학습을 가능하게 할 뿐만 아니라 능동적인 참여를 유도하여 학습효율을 높일 수 있을 것으로 기대된다.향은 패션마케팅의 정의와 적용범위를 축소시킬 수 있는 위험을 내재한 것으로 보여진다. 그런가 하면, 많이 다루어진 주제라

  • PDF

연료 공급 및 저장 제약 하에서의 Long-Term Profit-Based Unit Commitment Problem 최적화를 위한 Explicit Column Generation 알고리즘

  • 이경식;송상화
    • 한국경영과학회:학술대회논문집
    • /
    • 한국경영과학회 2006년도 추계학술대회
    • /
    • pp.75-89
    • /
    • 2006
  • 한국전력산업의 탈규제화의 영향으로 각 개별 발전회사들은 자사의 이익을 최대화하기 위한발전계획 수립에 큰 관심을 가지게 되었다. 발전계획은 주어진 연료제약 하에 발전수익과 유지보수비용을 고려하여 시간대별 발전기의 기동, 정지 및 발전출력을 결정하는 문제로서Profit-Based Unit Commitment (PBUC) 문제로 알려져 있다. PBUC 문제는 문제 자체의 복잡성과 비선형 제약식의 특성으로 인하여 과거 연구는 대부분 비선형 제약식 처리를 위한 Lagrangian Relaxation (LR) 기반 휴리스틱 접근법에 초점이 맞추어져 왔다. 하지만, 실제현업 적용에 있어 계산시간이 많이 소요되고 알고리즘의 구현에 많은 기간이 소요되어 실용성은 낮은 것으로 보고되었다. 특히 연료도입 및 저장제약을 고려하기 위한 1년 단위 장기 발전계획 수립은 문제의 범위가 더욱 넓어짐으로 인하여 복잡성이 매우 크게 증가하고, 이에 따라 기존 접근법에 한계가 있어 왔다. 이에 본 연구에서는 국내가스발전소의 사례를 중심으로 발전패턴개념의 도입 및 다양한 발전패턴 생성을 통한 Explicit Column Generation 기반 최적화 접근법을 제안한다. 발전패턴은 Column Generation 접근법의 각 Column에 해당하는 각주별 발전기 기동정지계획을 의미한다. 즉, 미리 유효한 발전패턴의 Pool을 최대한 확보한 후 Explicit Column Generation Formulation을 통하여 주별 최적의 발전패턴을 찾아내는 알고리즘으로 구성이 된다. 본 알고리즘은 실제 가스발전소의 장기 발전계획 수립과정에 적용되어 효과적으로 운용되고 있으며 연간 수십억원의 추가적인 이익을 실현할 것으로 분석되었다. 본 알고리즘을 확장 적용할 경우 PBUC 문제 해결을 위한 새로운 해법으로도 그 효용성이 클 것으로 예상된다.자료이기 때문에 통계적 활용의 범위가 방대하다. 특히 개인, 가구, 사업체 등 사회 활동의 주체들이 어떻게 변화하는지를 추적할 수 있는 자료를 생산함으로써 다양한 인과적 통계분석을 할 수 있다. 행정자료를 활용한 인구센서스의 이러한 특징은 국가의 교육정책, 노동정책, 복지정책 등 다양한 정책을 정확한 자료를 근거로 수립할 수 있는 기반을 제공한다(Gaasemyr, 1999). 이와 더불어 행정자료 기반의 인구센서스는 비용이 적게 드는 장점이 있다. 예를 들어 덴마크나 핀란드에서는 조사로 자료를 생산하던 때의 1/20 정도 비용으로 행정자료로 인구센서스의 모든 자료를 생산하고 있다. 특히, 최근 모든 행정자료들이 정보통신기술에 의해 데이터베이스 형태로 바뀌고, 인터넷을 근간으로 한 컴퓨터네트워크가 발달함에 따라 각 부처별로 행정을 위해 축적한 자료를 정보통신기술로 연계${cdot}$통합하면 막대한 조사비용을 들이지 않더라도 인구센서스자료를 적은 비용으로 생산할 수 있는 근간이 마련되었다. 이렇듯 행정자료 기반의 인구센서스가 많은 장점을 가졌지만, 그렇다고 모든 국가가 당장 행정자료로 인구센서스를 대체할 수 있는 것은 아니다. 행정자료로 인구센서스통계를 생산하기 위해서는 각 행정부서별로 사용하는 행정자료들을 연계${cdot}$통합할 수 있도록 국가사회전반에 걸쳐 행정 체제가 갖추어져야 하기 때문이다. 특히 모든 국민 개개인에 관한 기본정보, 개인들이 거주하며 생활하는 단위인 개별 주거단위에 관한 정보가 행정부에 등록되어 있고, 잘 정비되어 있어야 하며, 정보의 형태 또한 서로 연계가 가능하도록 표준화되어있어야 한다. 이와 더불어, 현재 인구센서스에서 표본조사를 통해 부가적으로 생산하는 경제활동통계를 생산하기 위해서는 개인이 속한 사업체를 파악할 수 있도록 모든 사업체가 등록되어

  • PDF