• 제목/요약/키워드: Classical Database

검색결과 49건 처리시간 0.024초

CHILDES 코퍼스를 기반으로 한 아동의 영어 굴절형태소 발달 연구 (A Study on the Development of English Inflectional Morphemes Based on the CHILDES Corpus)

  • 민명숙;전종섭;이선영
    • 인지과학
    • /
    • 제24권3호
    • /
    • pp.203-235
    • /
    • 2013
  • 본 연구의 목적은 선행 연구에서 보고된 영어 모국어 아동의 굴절형태소 습득 과정을 대규모 언어습득 데이터베이스를 활용하여 검증하는 것이다. 이를 위해, 우리는 CHILDES(Child Language Data Exchange System) 데이터베이스에 등장하는 1-7세 영국 및 미국 아동 1,630명이 발화한 470만 어절 말뭉치를 대상으로 굴절형태소의 발달 과정을 분석하였다. 본 논문에서는 동사의 현재분사 -ing, 과거형 -(e)d, 형용사의 비교/최상급 -er/est 등의 형태소에 대해 어휘 유형(Type)과 사례(Token) 빈도, 전체 사례(Token)에 대한 유형(Type) 비율인 TTR(Type per Token Ratio), 어휘 다양성 척도인 Lexical Diversity(D) 값을 구하여 이를 국가 및 연령별로 비교, 분석하였다. 그 결과, 굴절형태소별로 연령과 D 값의 상관관계가 다르게 나타났다. 특히, 현재분사 -ing와 D 값 사이에는 주목할 만한 상관관계가 나타나지 않은 반면, 과거형 -(e)d의 경우 양의 상관관계 경향성이 보였고, 비교/최상급 -er/-est는 유의미한 상관관계를 보였다. 이는 현재진행형이 과거형보다 먼저 습득된다고 보고한 Brown(1973)의 견해를 지지한다. 다음으로, 과잉일반화에 따른 오류 표현이 2-3세 사이에 많이 나타나면서 U자형 발달 양상을 보였다. 과잉일반화도 현재분사보다 과거형에서 많이 나타났는데, 이것 또한 현재분사가 과거형보다 일찍 습득된다는 주장을 지지한다. 영국과 미국 아동의 연령별 굴절형태소 사용 양상을 비교한 결과, 미국 아동의 D 값이 영국 아동보다 높았다. 이는 미국 아동이 영국 아동보다 더 많은 어휘 유형에 대해 굴절형태소를 사용했음을 의미한다. 본 연구는 소수의 아동을 대상으로 수행된 선행 연구의 다양한 논점을 대규모 데이터베이스로 검증하고, CHILDES 코퍼스를 효율적으로 분석하는 연구 방법론을 제안했다는 점에서 의의가 있다.

  • PDF

베이지안 기법에 의거한 중대형 방사선원의 분실 시 일반인에 대한 방사선 위험도의 평가 (Radiological Risk Assessment for the Public Under the Loss of Medium and Large Sources Using Bayesian Methodology)

  • 김주연;장한기;이재기
    • Journal of Radiation Protection and Research
    • /
    • 제30권2호
    • /
    • pp.91-97
    • /
    • 2005
  • 베이지안 기법은 객관적 자료 이외에 주관적 지식도 평가에 반영하는 특성으로 인해 최근 PRA에서 널리 사용되고 있다. 본 연구에서는 비파괴검사 장비 분실에 대한 방사선 위험도를 평가하기 위해 베이지안 기법을 활용하였다. U.S. NRC에서 제시한 선원분실 피폭 시나리오를 국내 실정에 맞게 재구성하였고 안전인자의 사고발생 확률에 국한하여 적용하였다. 사고발생 확률수정의 경우 Jeffreys사전분포를 사용한 결과가 모호사전분포를 사용한 결과보다 5 % 베이즈 하한치가 더 낮아서 방사선 사고와 같은 낮은 사고발생 확률을 가지는 시스템에 대한 위험도 평가에 적합하다. 위험도의 결과를 보면 일반인의 연간 예상되는 평균선량은 베이지안 기법이 고전적인 기법에 의거한 평가보다 높은 선량을 나타내는데 이는 수정된 안전인자 확률의 평균이 고전적 확률 참보다 높게 평가된 것에 기인한다. 국내의 경우 방사선 위험도 평가를 위한 자료구축이 미비한 바 베이지안 기법은 위험도 평가에 유용한 대안으로 활용할 수 있으며 이러한 연구는 위험도 정보-기반 규제에 기여할 것이다.

Recurrent Neural Network Models for Prediction of the inside Temperature and Humidity in Greenhouse

  • Jung, Dae-Hyun;Kim, Hak-Jin;Park, Soo Hyun;Kim, Joon Yong
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.135-135
    • /
    • 2017
  • Greenhouse have been developed to provide the plants with good environmental conditions for cultivation crop, two major factors of which are the inside air temperature and humidity. The inside temperature are influenced by the heating systems, ventilators and for systems among others, which in turn are geverned by some type of controller. Likewise, humidity environment is the result of complex mass exchanges between the inside air and the several elements of the greenhouse and the outside boundaries. Most of the existing models are based on the energy balance method and heat balance equation for modelling the heat and mass fluxes and generating dynamic elements. However, greenhouse are classified as complex system, and need to make a sophisticated modeling. Furthermore, there is a difficulty in using classical control methods for complex process system due to the process are non linear and multi-output(MIMO) systems. In order to predict the time evolution of conditions in certain greenhouse as a function, we present here to use of recurrent neural networks(RNN) which has been used to implement the direct dynamics of the inside temperature and inside humidity of greenhouse. For the training, we used algorithm of a backpropagation Through Time (BPTT). Because the environmental parameters are shared by all time steps in the network, the gradient at each output depends not only on the calculations of the current time step, but also the previous time steps. The training data was emulated to 13 input variables during March 1 to 7, and the model was tested with database file of March 8. The RMSE of results of the temperature modeling was $0.976^{\circ}C$, and the RMSE of humidity simulation was 4.11%, which will be given to prove the performance of RNN in prediction of the greenhouse environment.

  • PDF

질병 검색 서비스를 위한 디렉토리 시스템 설계 및 구현 (Design and Implementation of a Directory System for Disease Retrieval Services)

  • 여명호;이윤경;노규종;박형순;김학신;박준호;강태호;김학용;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.709-714
    • /
    • 2009
  • 생명 공학 분야의 연구는 대용량의 데이터 처리를 요구한다. 과거 실험을 통해 접근하던 방식에서 벗어나 최근 IT 기술의 결합을 통해 다양한 실험 데이터를 공유하고, 연계함으로써 연구를 가속화하고 있다. 질병에 대한 연구는 생명 공학의 큰 테마 중 하나이다. 질병 데이터를 분류하고, 웹을 통해 데이터를 제공하는 다양한 서비스가 존재한다. 하지만, 기존 서비스들은 각기 다른 분류 방법을 가지고 있으며, 고차원 처리를 요구하는 신규 서비스와 연계하기 위한 인프라의 부재는 생명 공학 연구의 발전을 저해하는 요소로 작용하기도 한다. 본 논문에서는 이종의 질병 데이터베이스를 통합하기 위한 데이터 구조를 제안하고, 신규 서비스와 연계하기 위한 인프라로서 질병 디렉토리 시스템을 설계하고 구현한다.

  • PDF

New Galaxy Catalog of the Virgo Cluster

  • Kim, Suk;Rey, Soo-Chang;Jerjen, Helmut;Lisker, Thorsten;Sung, Eon-Chang;Lee, Youngdae;Chung, Jiwon;Pak, Mina;Yi, Wonhyeong;Lee, Woong
    • 천문학회보
    • /
    • 제39권2호
    • /
    • pp.50-50
    • /
    • 2014
  • We present a new catalog of galaxies in the wider region of the Virgo cluster, based on the Sloan Digital Sky Survey (SDSS) Data Release 7. The Extended Virgo Cluster Catalog (EVCC) covers an area of 725 deg2 or 60.1 Mpc2. It is 5.2 times larger than the footprint of the classical Virgo Cluster Catalog (VCC) and reaches out to 3.5 times the virial radius of the Virgo cluster. We selected 1324 spectroscopically targeted galaxies with radial velocities less than 3000 km s-1. In addition, 265 galaxies that have been missed in the SDSS spectroscopic survey but have available redshifts in the NASA Extragalactic Database are also included. Our selection process secured a total of 1589 galaxies of which 676 galaxies are not included in the VCC. The certain and possible cluster members are defined by means of redshift comparison with a cluster infall model. We employed two independent and complementary galaxy classification schemes: the traditional morphological classification based on the visual inspection of optical images and a characterization of galaxies from their spectroscopic features. SDSS u, g, r, i, and z passband photometry of all EVCC galaxies was performed using Source Extractor. We compare the EVCC galaxies with the VCC in terms of morphology, spatial distribution, and luminosity function. The EVCC defines a comprehensive galaxy sample covering a wider range in galaxy density that is significantly different from the inner region of the Virgo cluster. It will be the foundation for forthcoming galaxy evolution studies in the extended Virgo cluster region, complementing ongoing and planned Virgo cluster surveys at various wavelengths.

  • PDF

데일리 렌즈 데이터를 사용한 데이터마이닝 기법 비교 (Comparison of data mining methods with daily lens data)

  • 석경하;이태우
    • Journal of the Korean Data and Information Science Society
    • /
    • 제24권6호
    • /
    • pp.1341-1348
    • /
    • 2013
  • 데이터베이스 마케팅과 시장예측 등의 분야에서 분류문제를 해결하기 위해 다양한 데이터마이닝 기법들이 적용되고 있다. 본 연구에서는 데일리 렌즈 고객들의 거래 데이터를 기반으로 의사결정나무, 로지스틱 회귀모형과 같은 기존의 통계적 분류기법과 최근에 개발된 배깅, 부스팅, 라소, 랜덤 포리스트 그리고 지지벡터기계의 분류 성능을 비교하고자 한다. 비교 실험을 위해 데이터 정제, 탐색, 파생변수 생성, 그리고 변수 선택과정을 거쳤다. 실험결과 정분류율 측면에서는 지지벡터기계가 다른 모형보다 근소하게 높았지만 표준편차가 크게 나왔다. 정분류율과 표준편차의 관점에서는 랜덤 포리스트가 가장 좋은 결과를 보였다. 그러나 모형의 해석, 간명성 그리고 학습에 걸리는 시간을 고려하였을 때 라소모형이 적합하다는 결론을 내렸다.

통합 RFID 미들웨어의 응답시간 개선을 위한 효과적인 캐쉬 구조 설계 (An Efficient Cache Mechanism for Improving Response Times in Integrated RFID Middleware)

  • 김정길;이준환;박경랑;김신덕
    • 정보처리학회논문지A
    • /
    • 제15A권1호
    • /
    • pp.17-26
    • /
    • 2008
  • 본 논문에서는 WSN(wireless sensor networks)과 RFID(radio frequency identification) 시스템을 통합하여 이용할 수 있는 통합 RFID 미들웨어에서의 효과적인 캐슁 기법을 제시한다. 통합 RFID 미들웨어가 운영되는 환경은 연결된 RFID리더로부터 대규모의 데이터가 입력되고, 다수의 무선 센서로부터 끊임없이 데이터가 입력되는 상황을 가정하고 있으며 또한 특정 목적을 위해 과거에 센서로부터 입력되어 분산 저장되어 있는 히스토리 데이터도 활용될 수 있음을 가정하고 있다. 따라서 캐슁 기능을 구비한 특정 미들웨어 레이어에서 센서 노드로부터 수신되는 연속 데이터와 분산 저장되어 있는 히스토리 데이터에 대한 신속한 질의 및 응답을 위한 효율적 데이터 처리가 절실히 요구된다. 이를 위하여 본 논문에서 제안되는 캐슁 기법은 기존의 캐슁 기법 기반으로 통합 RFID 미들웨어에 특화하여 데이터 처리의 효율을 높이기 위하여 두가지 방법을 제시하고 있으며, 이는 처리 데이터의 유형에 따라 DSC(data stream cache)와 HDC(history data cache) 로 구분된다. 제안된 캐슁 기법은 다양한 파라미터를 이용한 실험을 통하여 신속한 질의 및 응답이 이루어짐을 보여주고 있다.

The Operational Comparison of SPOT GCP Acquisition and Accuracy Evaluation

  • Kim, Kam-Lae;Kim, Uk-Nam;Chun, Ho-Woun;Lee, Ho-Nam
    • Korean Journal of Geomatics
    • /
    • 제1권1호
    • /
    • pp.1-5
    • /
    • 2001
  • This paper presents an investigation into the operational comparison of SPOT triangulation to build GCP library by analytical plotter and DPW (digital photogrammetric workstation). GCP database derived from current SPOT images can be used to other image sensors of satellite, if any reasons, such as lack of topographic maps or GCPs. But, general formulation of a photogrammetric process for GCP measurement has to take care of the scene interpretation problem. There are two classical methods depending on whether an analytical plotter or DPW is being used. Regardless of the method used, the measurement of GCPs is the weakest point in the automation of photogrammetric orientation procedures. To make an operational comparison, five models of SPOT panchromatic images (level 1A) and negative films (level 1AP) were used. Ten images and film products were used for the five GRS areas. Photogrammetric measurements were carried out in a manual mode on P2 analytical plotter and LH Systems DPW770. We presented an approach for exterior orientation of SPOT images, which was based on the use of approximately eighty national geodetic control points as GCPs which located on the summit of the mountain. Using sixteen well-spaced geodetic control points per model, all segments consistently showed RMS error just below the pixel at the check points in analytical instrument. In the case of DPW, half of the ground controls could not found or distinguished exactly when we displayed the image on the computer monitor. Experiment results showed that the RMS errors with DPW test was fluctuated case by case. And the magnitudes of the errors were reached more than three pixels due to the lack of image interpretation capability. It showed that the geodetic control points is not suitable as the ground control points in DPW for modeling the SPOT image.

  • PDF

Study of galaxies in extensive area of the Virgo cluster

  • Kim, Suk;Rey, Soo-Chang;Sung, Eon-Chang;Jerjen, Helmut;Lisker, Thorsten;Lee, Youngdae;Chung, Jiwon;Lee, Woong;Chung, Aeree;Yoon, Hyein
    • 천문학회보
    • /
    • 제41권1호
    • /
    • pp.35.1-35.1
    • /
    • 2016
  • Nearby galaxy clusters and their surrounding regions represent the current endpoint of evolution galaxy cluster evolution. We present a new catalog of 1589 galaxies, what we call Extended Virgo Cluster Catalog (EVCC), in wider area of the Virgo cluster based on the Sloan Digital Sky Survey (SDSS) Data Release 7. The EVCC covers an area 5.2 times larger than the footprint of the classical Virgo Cluster Catalog, and reaches out to 3.5 times the virial radius of the Virgo cluster. The EVCC contains fundamental information such as membership, morphology, and photometric parameters of galaxies. The EVCC defines a comprehensive galaxy sample covering a wider range in galaxy density that is significantly different from the inner region of the Virgo cluster. It will be the foundation for forthcoming galaxy evolution studies in the extended Virgo cluster region, complementing ongoing and planned Virgo cluster surveys at various wavelengths. We also present the large scale structures in the field around the Virgo cluster. We identified seven galaxy filaments and one possible sheet in three dimensions of super-galactic coordinates based on the HyperLEDA database. By examining spatial distribution and Hubble diagram of galaxies, we found that six filaments are directly associated with the main body of the Virgo cluster. On the other hand, one filament and one sheet are structures located at background of the main body of Virgo cluster. The EVCC and the filament structures will be the foundation for forthcoming studies of galaxy evolution in various environments as well as buildup of the galaxy cluster at z ~ 0, complementing ongoing and planned Virgo cluster surveys at various wavelengths.

  • PDF

Progress and Prospect of Rice Biotechnology in Korea

  • Tae Young, Chung
    • 한국잠사학회:학술대회논문집
    • /
    • 한국잠사학회 1997년도 Progress and Future Development of Sericultural Science and Technology 40th Anniversary Commemoration Symposium
    • /
    • pp.23-49
    • /
    • 1997
  • This is a progress report of rice biotechnology including development of gene transformation system, gene cloning and molecular mapping in rice. The scope of the research was focused on the connection between conventional breeding and biotech-researches. Plant transformation via Agrobacterium or particle bombardment was developed to introduce one or several genes to recommended rice cultivars. Two chimeric genes containing a maize ribosome inactivating protein gene (RIP) and a gerbicide resistant gene (bar) were introduced to Nipponbare, a Japonica cultivar, and transmitted to Korean cultivars. The homozygous progenies of herbicide resistant transgenic plant showed good fertility and agronomic characters. To explore the genetic resourses in rice, over 8,000 cDNA clones from immature rice seed have been isolated and sequenced. About 13% of clones were identified as enzymes related to metabolic pathway. Among them, twenty clones have high homology with genes encoding enzymes in the photorespiratory carbon cycle reaction. Up to now about 100 clones were fully sequenced and registered at EMBL and GenBank. For the mapping of quantitative tarits loci (QTL) and eternal recombinant inbred population with 164 F13 lines (MGRI) was developed from a cross between Milyang 23 and Gihobyeo, Korean rice cultivars. After construction of fully saturated RFLP and AFLP map, quantitative traits using MGRI population were analyzed and integrated into the molecular map. Eighty seven loci were determined with 27 QTL characters including yield and yield components on rice chromosomes. Map based cloning was also tried to isolate semi-dwarf (sd-1) gene in rice. A DNA probe, RG 109, the most tightly linked to sd-1 gene was used to screen from bacterial artifical chromosome (BAC) libraries and five over lapping clones presumably containing sd-1 gene were isolated. Rice genetic database including results of biotech reasearch and classical genetics is provided at Korea Rice Genome Server which is accessible with world wide web (www) browser. The server provides rice cDNA sequences and map informations linked with phenotypic images.