• 제목/요약/키워드: 통계추론

검색결과 359건 처리시간 0.027초

Wikipedia에서 온톨로지 개념 인식을 위한 핵심어 추출 (Term Extraction for Ontology Concept Recognition in Wikipedia)

  • 고병규;김판구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 춘계학술발표대회
    • /
    • pp.344-347
    • /
    • 2010
  • 최근 주목받고 있는 의미적 정보처리의 지식베이스인 온톨로지는 정형화된 표현을 통해 정확한 지식 처리와 추론관계를 명시해야 하기 때문에 온톨로지 확장에 대한 중요성 역시 강조되고 있다. 온톨로지 확장을 위한 기존의 방법들은 전문가를 통한 수작업 형태이거나 보편화된 사전이나 시소러스 집단의 분석을 통한 통계의 확률분포를 이용하는 반자동화된 방법들이 있다. 이에 본 논문에서는 Wikipedia에서 특정 도메인 문서들만을 수집한 후 중요문장 추출과정을 통해 해당 문서 내의 핵심어를 파악하여 이를 온톨로지의 개념 인식을 위한 정보로 활용할 수 있는 방안을 제시하고자 한다.

연결 데이터 환경에서 접근제어를 위한 RBAC 모델 (A RBAC Model for Access Control in Linked Data Environments)

  • 이종현;김장원;정동원;백두권
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.181-184
    • /
    • 2010
  • 이 논문에서는 Linking Open Data 프로젝트를 기반으로 개발된 어플리케이션들의 접근제어를 위하여 기존 RBAC 모델을 연결 데이터에 적용 가능하도록 확장한 모델을 제안한다. 제안 모델은 온톨로지의 구조에 RBAC 모델에 적용할 수 있도록 RBAC 모델에 사용자를 위한 제약조건을 온톨로지로 표현하였으며, 지능형 엔진을 통해 사용자에게 적합한 권한을 추론한다. 사용자에 적합한 접근권한을 주기 위해 FOAF, flickr, 트위터 등의 데이터가 연결되어있는 연결 데이터로부터 사용자 프로파일을 확장할 수 있는 정보를 획득할 수 있으며, 이를 기존 정보에 확장하여 사용자의 권한을 부여한다. 본 논문에서 제안한 모델의 실효성을 검증하기 위하여 DBpedia Mobile을 위한 접근제어 시스템을 설계하였으며 안드로이드 SDK 환경에 프로토타입을 구현하여 제안 모델을 연결 데이터 환경의 어플리케이션에 적용 가능함을 보였다.

개인 맞춤형 게임 추천 시스템 (Personalized game recommendation system)

  • 김주현;김여은;김아람;박진희;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1202-1203
    • /
    • 2023
  • 본 논문은 스팀(Steam) 게임 플랫폼을 기반으로 약 1000개의 게임 데이터를 활용하여 사용자들에게 알맞은 게임을 추천해주는 시스템을 제안한다. 게임 선택에 영향을 주는 요인들을 언어 객체로 설정하여 규칙 기반 추론 시스템을 구현했다. 선호도 정보는 게임 선택의 기준이 되는 세 가지 요소에 대한 질문에 답하는 방식으로 수집된다. 게임 추천 결과를 시각화하여 신규 유저를 게임에 유입하고 몰입을 촉진하고자 한다.

국내 벤처기업의 성장요인 분석 (Growth Factors for Small Innovative Firms in Korea)

  • 정진하
    • KDI Journal of Economic Policy
    • /
    • 제27권1호
    • /
    • pp.123-156
    • /
    • 2005
  • 최근 대기업과 중소기업 간의 양극화가 심화되면서 중소기업의 경쟁력 강화가 중요한 경제 현안으로 대두하였다. 이와 관련하여 중소기업의 혁신을 주도해나가야 할 벤처기업에 대한 사회적 관심이 고조되고 있다. 또한 본격적인 벤처기업 지원정책이 시행된 지 10년 가까운 시간이 흐르면서 벤처생태계는 전략과제를 추론해볼 수 있을 만큼의 충분한 진화과정을 경험했다. 이러한 상황을 감안할 때 지금이 벤처생태계가 안고 있는 과제 및 벤처기업 지원정책의 바람직한 방향을 점검할 적절한 시점이라고 판단된다. 본 연구는 이러한 상황인식하에 향후 벤처기업 지원정책에 대한 정책적 시사점을 도출할 목적으로 벤처기업의 성장요인에 관한 실증분석을 하였다. 실증분석 결과 연구개발집약도가 높은 기업, 업력이 낮은 기업, 규모가 큰 기업, 정책자금 활용도가 높은 기업, 수도권에 위치한 기업의 경우 성장이 빠르게 나타난다. 벤처기업에 관한 국내 통계자료의 축적이 아직 미흡하고 통계자료의 신뢰도가 그리 높지 않기 때문에 본 연구는 분석의 한계를 지니고 있다. 향후 벤처기업정책 입안에 대한 연구의 기여도를 높이기 위해서는 통계자료의 체계적 축적이 필요하며, 보다 심도 있는 연구들이 뒤따라야 할 것이다.

  • PDF

자유도의 교수학적 분석 (A Didactical Analysis on the Degree of Freedom)

  • 김창일;전영주
    • 한국학교수학회논문집
    • /
    • 제23권3호
    • /
    • pp.239-257
    • /
    • 2020
  • 본 연구는 자유도에 대한 교수학적 논의를 통해 통계 교육과정과 학교수학에서의 통계 교육에 도움을 주고자 함이다. 이를 위해 학문적 지식으로의 자유도, 교과서를 중심으로 한 교육과정에서의 자유도, 그리고 자유도에 대한 학생들 이해 정도를 분석하였다. 그 결과 첫째, 자유도를 교육과정에 포함시킬 것인가에 대한 논의가 요구된다. 둘째, 현행 교과서 설명 방식에 대한 재고가 필요하다. 셋째, 자유도 개념 이해를 돕기 위한 교수학적 분석이 있어야 한다. 넷째, 현행 교과서 학습 환경은 자유도 개념 학습에 한계가 있는 것으로 나타났다. 다섯째, 표본평균, 표본분산, 표본표준편차 등 표집분포에 대한 교수학적 점검이 요구된다. 그리고 교육과정에서의 추론 통계 교육의 강조와 t분포의 교육과정 도입에 대한 신중한 고려가 요구된다는 시사점을 도출하였다.

상수도의 1일 홍수량의 시간적 변화의 특성에 관한 연구 (The Characteristics of the Urban Water Use Trend With Time for a Day)

  • 이경훈;이삼노;문병석
    • 물과 미래
    • /
    • 제27권4호
    • /
    • pp.135-143
    • /
    • 1994
  • 본 연구에서는 상수도 급수량의 시간적 변화형태를 조사하고, 수요량의 시간적인 변화량에 통계학적 개념을 이용하여 수요량의 시간적 변화에 관한 확률적 분산모형에 관하여 검정 결정하였다. 연구대상의 지역으로 광주시를 선정하고, 자료로는 2시간 간격으로 측정된 배수지의 수위와 1일 상수도 생산량을 이용하였다. 급수계통의 모형에 통제용적과 연속방정식을 적용하여 2시간별로 변화되는 수요량을 결정하고, 매월 단위로 정리하여 수요수량의 변화를 알 수 있도록 하였다. 2시간별 수요수량은 1일 총 급수량에 대한 백분율로 환산하여 지수화하였으며, 시간별로 변화되는 각각의 급수량은 통계학적으로 추론될 수 있는지 알 수 있도록 분산모형에 관하여 검정을 하였다. 검정결과를 이용하면 시간별 확률 급수량의 산정이나 급수량의 통계학적 해석을 통하여 상수도 시설의 운용에 이용할 수 있는 것으로 판단되었다.

  • PDF

일대다 튜토링 수학 협동학습이 고등학생의 인지적·정의적 영역에 미치는 영향 (Effects of One-to-Many Tutoring Mathematics Cooperative Learning on the Cognitive and Affective Domains of High School Students)

  • 유기종
    • 한국수학교육학회지시리즈E:수학교육논문집
    • /
    • 제34권2호
    • /
    • pp.161-177
    • /
    • 2020
  • 본 연구는 고등학생을 대상으로 실험집단과 비교집단을 구성하고, 일대다(一對多) 튜토링 협동학습을 실시하였다. 집단 간 점수 차이와 집단별 사전·사후 점수 차이에 대한 유의성 검증은 비모수 통계기법을 사용하였으며, 학생들의 정의적 영역을 살펴보기 위하여 개방형 설문조사 2회와 개별 면담하였다. 실험집단과 비교집단 간 점수 차이는 통계적으로 유의하지 않았지만, 세 집단의 사전·사후 수학 점수 차이 검증 결과는 실험집단만 통계적으로 유의한 차이가 있었다. 그리고 학생교사는 일반학생을 가르치는 동안 자신을 성찰하고 자기효능감이 향상되었으며, 일반학생은 학생교사에게 도움을 받음으로써 수업에 대한 재미와 관심을 더 두게 되고 자신감이 향상되었다. 수학 교과 역량 측면은 의사소통, 문제해결, 추론, 태도 및 실천 역량이 향상되었음을 알 수 있었다.

평균-분산 가속화 실패시간 모형에서 벌점화 변수선택 (Penalized variable selection in mean-variance accelerated failure time models)

  • 권지훈;하일도
    • 응용통계연구
    • /
    • 제34권3호
    • /
    • pp.411-425
    • /
    • 2021
  • 가속화 실패시간모형은 로그 생존시간과 공변량간의 선형적 관계를 묘사해 준다. 가속화 실패시간모형에서 생존시간의 평균뿐만 아니라 변동성에도 영향을 미치는 공변량 효과를 추론하는 것은 흥미가 있다. 이를 위해 생존시간의 평균뿐만 아니라 분산을 모형화 하는 것이 필요하며, 이러한 모형을 평균-분산 가속화 실패시간모형이라 부른다. 본 논문에서는 벌점 가능도함수를 이용하여 평균-분산 가속화 실패시간모형에서 회귀모수에 대한 변수선택 절차를 제안한다. 여기서 벌점함수로서 LASSO, ALASSO, SCAD 그리고 HL (계층가능도)와 같은 네 가지 벌점함수를 연구한다. 제안된 변수선택 절차를 통해 중요한 공변량의 선택 뿐만 아니라 회귀모수의 추정을 동시에 제공할 수 있다. 제안된 방법의 성능은 모의실험을 통해 평가하고, 하나의 임상 예제자료를 통해 제안된 방법을 예증하고자 한다.

층화모집단 평균에 대한 붓스트랩 추론 (On Statistical Inference of Stratified Population Mean with Bootstrap)

  • 허태영;이두리;조중재
    • Communications for Statistical Applications and Methods
    • /
    • 제19권3호
    • /
    • pp.405-414
    • /
    • 2012
  • 층화확률추출은 모집단을 어떤 층화기준에 의해 여러 층으로 분할한 다음 각 층으로부터 독립적으로 표본을 임의추출하는 방법으로 여러 가지 장점을 가지고 있어 실제 조사에서 많이 활용되고 있다. 본 연구에서는 대규모 표본조사에서 많이 사용하고 있는 층화확률추출을 사용하여 추출된 표본을 통해 모평균에 대한 붓스트랩 추정량과 신뢰구간 및 가설검정 등 통계적 추론에 대하여 연구하였다. 층화모집단에서의 모평균의 추정량과 관련된 극한 분포이론들을 기초로 붓스트랩 일치성을 근거로 층화 모평균에 대해 표준 붓스트랩 방법, 백분위수 붓스트랩 방법, 스튜던트화 붓스트랩 방법을 활용한 신뢰구간과 붓스트랩 가설검정 방법을 제안하였으며, 모의실험을 통해 신뢰구간 추정 방법들의 유효성을 확인하였다.

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보 워크샵 (DNA Chip Bioinformatics)
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF